导读:本文包含了多样性增量论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:增量,多样性,小体,位点,磷酸化,向量,蛋白质。
多样性增量论文文献综述
胡世赛[1](2018)在《多样性增量特征选择技术的应用》一文中研究指出采用机器学习算法对基因组或蛋白质的靶序列或靶位点进行分类识别,是生物信息学的主要研究内容之一。随着所研究问题的复杂度的增加,在解决此类问题时,往往面临样本少而特征维数高的境况。高维特征在分类过程中存在着对样本的过拟合,进而导致结果的泛化能力降低以及精度反常的现象。因此,应用特征选择技术进行数据分析和特征优化越来越受到人们的关注。因为这些技术可以实现提取研究对象的基本特征和提高模型的识别精度。特征选择技术的核心是在保证识别精度损失最小的前提下,从特征集中筛选出一个最优的特征子集。特征子集中的特征应该具备两个基本特点,一是特征与类别间的相关性大,二是特征之间的冗余性小。在近几年机器学习领域中,特征选择技术成为了最为活跃的研究内容之一。我们组在研究蛋白质柔性位点识别问题时,提出一个新的特征选择技术,称为多样性增量特征选择技术(feature selection technique based on increment of diversity,FSID)。为了进一步检验和完善FSID方法,本文,我们应用FSID方法,分别研究了在基因组和蛋白质两个层面中,最为活跃的两个重要热点问题:基因组核小体定位序列识别和蛋白质磷酸化位点识别。得到如下主要结论:1.以酵母基因组中核小体定位序列为样本,以DNA序列6-mer组分为参数,采用我们提出的多样性增量特征选择技术,筛选出8个6-mer作为分类特征。进一步,采用支持向量机算法,10折交叉检验的总精度达到98.2%。结果表明,核小体定位序列和连接序列核苷k-mer组分的特异化分布,是影响酵母核小体定位的主要因素。FSID方法极大地减少了分类酵母核小体定位序列和连接序列所需的特征数,极大地提升了模型的鲁棒性和泛化能力。2.以蛋白质磷酸化位点为样本,给出一种激酶无关的磷酸化位点识别模型,称为FSID_PhSite。以磷酸化序列片段的k间隔氨基酸组分和位置保守氨基酸组分为参数,应用多样性增量特征选择技术进行特征筛选,将选出的特征输入到支持向量机算法进行识别。在正负样本数之比为1:1的情形下,对磷酸化丝氨酸、苏氨酸和酪氨酸在独立测试集检验,识别精度分别达到84.34%、82.32%和68.89%。结果优于现有的激酶无关磷酸化位点识别模型。3.此外,论文还基于非均匀指数(Heterogeneity Index,HI),研究了酵母基因组核小体定位序列的周期性特征。众所周知,核小体定位序列存在二核苷(AA/TT/TA)的10bp周期信号,以往的周期性研究多采用傅里叶分析。本文,对碱基采用W-S约化后,计算序列的HI值。结果表明,酵母基因组核小体定位序列的二核苷10bp周期信号较弱,而3bp周期性却很强。进一步的分析表明,约有70%的酵母基因组核小体定位于编码序列,这是酵母核小体定位序列存在强的3bp周期性的原因所在。(本文来源于《内蒙古工业大学》期刊2018-06-01)
周云鹏[2](2016)在《广义多样性增量结合关键位点对核小体定位预测作用的研究》一文中研究指出研究核小体在基因组上精确位置的定位,对于深入理解多种生物学过程具有十分重要的意义。基于已有的海量实验数据,结合数理统计和机器学习方法,发展核小体的预测模型,是当下生物信息学的热点研究领域。核小体定位理论虽然取得了一定进展,但是依然无法精准确定核小体的位置。我们需要进一步借助于实验手段,提高核小体定位的精确度。论文提出了广义多样性增量及关键位点算法,并围绕广义多样性增量、关键位点结合支持向量机提出了DNA的预测模型。主要研究内容如下:(1) 提出核心DNA中关键位点的概念,并基于核心DNA中的k-mer频数信息,结合支持向量机,提出了基于关键位点的核小体定位模型。模型对酵母核心DNA和连接DNA进行了分类预测,关键位点结合ID-SVM模型预测准确度达到了72.56%。(2) 在多样性增量的基础上提出了广义多样性增量,并结合核心DNA中k-mer频率信息,提出了广义多样性增量结合关键位点的核小体定位预测模型。模型对酵母核心DNA和连接DNA序列进行分类预测,实验表明该模型具有良好的预测效果,gID-SVM预测准确度达到了85.35%,关键位点结合gID-SVM模型预测准确度达到了82.53%。(3) 将预测模型应用于其他物种中,结合关键位点和广义多样性增量对鸡类的亲和度高的DNA序列和亲和度低的DNA进行了预测,实验的预测结果良好,关键位点结合ID-SVM模型准确率为89.03%,gID-SVM预测准确度为93.13%,关键位点结合gID-SVM模型预测准确度为90.80%。进而比较了酵母和鸡的核心DNA的关键位点,得到生物普遍性、不同物种间的核小体关键位点规律类似、除关键位点外的其他核心DNA位点决定了物种性状的多样性的重要规律。(本文来源于《内蒙古大学》期刊2016-06-04)
李琴,张瑾,骈聪,陈园园,李强[3](2014)在《基于位置关联权重矩阵及序列组分的多样性增量识别剪接位点》一文中研究指出前体mRNA的剪接是真核基因表达的关键阶段,识别剪接位点对基因表达也起着至关重要的作用。作者用紧邻与非紧邻的位置关联权重矩阵及组成分的多样性增量得到的五维特征向量来表示序列,应用支持向量机对供体位点和受体位点进行识别。采用5-fold交叉检验,得到供体和受体位点的马修斯相关系数分别为0.924和0.947,ROC曲线下面积分别为99.08%和99.54%。与一些传统方法相比,这一方法考虑了位点之间的相关性和序列的生物信息,表现出特征少、精度高等优点。(本文来源于《生物物理学报》期刊2014年05期)
赵秀娟,裴智勇,刘佳,蔡禄[4](2010)在《多样性增量结合支持向量机方法预测酵母核小体定位》一文中研究指出作为目前遗传学热点领域表观遗传学的重要研究课题,核小体定位参与多种生物学过程并起着非常关键的作用,因此用理论方法预测核小体定位具有重要的生物学意义。该工作以酵母基因组为研究对象,根据其核心DNA与连接DNA序列的组分特征差异,分别统计其核苷酸k联体出现的频数,计算其多样性增量,并以此为特征值输入支持向量机构建模型。对酵母核小体核心DNA和连接DNA序列进行分类预测,整体准确率和相关系数分别达到93.10%和0.862。此方法在人类和果蝇的核小体核心DNA和连接DNA序列分类预测中也取得了较为理想的效果。将模型用于预测核小体在基因组上的位置取得初步成功。(本文来源于《生物物理学报》期刊2010年05期)
高智红[5](2010)在《应用多样性增量方法识别人类基因组microRNA前体序列》一文中研究指出microRNA是一类约为21-26个碱基长度的非编码单链RNA。microRNA在细胞生长和发育的过程中起着多种调节作用,参与生命过程中一系列的重要进程,包括发育、造血、器官形成、凋亡、细胞增殖、甚至肿瘤发生。microRNA对癌症、心脏病、艾滋病等各种疾病都有一定的影响。根据最近研究显示,RNA最初转录物(pri-RNA)分子经过RNaseⅢDrosha剪切,成为70-90个碱基大小、具有发夹结构的microRNA的前体(pre-microRNA),再由Exportin-5将pre-microRNA从细胞核运输到细胞质中,经Dicer酶加工生成microRNA o pre-microRNA最显着的特点就是具有发夹结构。pre-microRNA特殊的发夹结构不仅能够使pre-microRNA与Exportin-5结合从而输出到细胞质,而且还是其与Dicer酶作用的必要结构。这两点就使得发夹结构对于microRNA和pre-microRNA都非常重要。根据microRNAs前体序列的碱基保守特征和二级结构特征,应用多样性增量方法(ID方法)和支持向量机(SVM)分析,以内含子区(intron)、外显子区(exon)、基因间区(intergenic)叁类序列分别作为负集,对人类的pre-miRNAs进行分析和预测。当以intergenic区和intron区序列为训练负集时,其以二级结构叁联体、四联体和五联体(3-mer、4-mer、5-mer)为特征参量的敏感性、特异性、整体精度都在89%以上,相关系数在0.7以上。(本文来源于《内蒙古大学》期刊2010-05-23)
陈丽萍,吕军[6](2009)在《利用多样性增量位置得分函数预测人类5'非翻译区剪接位点》一文中研究指出5’非翻译区中的剪接位点两侧不存在由编码区到非编码区的状态转换,所以通常的识别剪接位点的算法在非翻译区的性能不太理想.本文把多样性增量的位置得分函数应用到5’非翻译区剪接位点的识别中.对于供体端,正负集样本数之比为1∶17,识别敏感性为66.91%,阳性预报值为68.54%,总精度为96.45%,ROC曲线下面积为97.23%;对于受体端,正负集样本数之比为1:24,识别敏感性为77.19%,阳性预报值为29.37%,总精度为91.78%,ROC曲线下面积为93.91%.这一结果要好于已有相似算法.(本文来源于《内蒙古工业大学学报(自然科学版)》期刊2009年04期)
高智红,张利绒[7](2009)在《基于多样性增量方法预测前体microRNA》一文中研究指出光声成像技术是近年来发展的新型无损医学成像方法。当脉冲激光照射到生物组织中时,组织吸收激光能量引起温升,温升导致热膨胀而产生光声信号。该信号携带了组(本文来源于《生物物理学报》期刊2009年S1期)
高智红,张利绒[8](2009)在《基于多样性增量方法预测前体microRNA》一文中研究指出光声成像技术是近年来发展的新型无损医学成像方法。当脉冲激光照射到生物组织中时,组织吸收激光能量引起温升,温升导致热膨胀而产生光声信号。该信号携带了组(本文来源于《第十一次中国生物物理学术大会暨第九届全国会员代表大会摘要集》期刊2009-07-12)
张颖,罗辽复,吕军[9](2008)在《使用多样性增量预测磷酸化位点》一文中研究指出磷酸化是蛋白质最重要的翻译后修饰之一.应用基于多样性增量的二次判别分析(Increment of Diversity with Quadratic Discriminant analysis,IDQD)方法对CK2,PKA和PKC叁种类型磷酸化位点进行预测,k-fold交叉检验的正确率分别为86%,90%和85%,独立测试集检验的正确率分别为86%,88%和84%.所得结果高于包括支持向量机在内的现有预测方法.(本文来源于《内蒙古大学学报(自然科学版)》期刊2008年01期)
多样性增量论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
研究核小体在基因组上精确位置的定位,对于深入理解多种生物学过程具有十分重要的意义。基于已有的海量实验数据,结合数理统计和机器学习方法,发展核小体的预测模型,是当下生物信息学的热点研究领域。核小体定位理论虽然取得了一定进展,但是依然无法精准确定核小体的位置。我们需要进一步借助于实验手段,提高核小体定位的精确度。论文提出了广义多样性增量及关键位点算法,并围绕广义多样性增量、关键位点结合支持向量机提出了DNA的预测模型。主要研究内容如下:(1) 提出核心DNA中关键位点的概念,并基于核心DNA中的k-mer频数信息,结合支持向量机,提出了基于关键位点的核小体定位模型。模型对酵母核心DNA和连接DNA进行了分类预测,关键位点结合ID-SVM模型预测准确度达到了72.56%。(2) 在多样性增量的基础上提出了广义多样性增量,并结合核心DNA中k-mer频率信息,提出了广义多样性增量结合关键位点的核小体定位预测模型。模型对酵母核心DNA和连接DNA序列进行分类预测,实验表明该模型具有良好的预测效果,gID-SVM预测准确度达到了85.35%,关键位点结合gID-SVM模型预测准确度达到了82.53%。(3) 将预测模型应用于其他物种中,结合关键位点和广义多样性增量对鸡类的亲和度高的DNA序列和亲和度低的DNA进行了预测,实验的预测结果良好,关键位点结合ID-SVM模型准确率为89.03%,gID-SVM预测准确度为93.13%,关键位点结合gID-SVM模型预测准确度为90.80%。进而比较了酵母和鸡的核心DNA的关键位点,得到生物普遍性、不同物种间的核小体关键位点规律类似、除关键位点外的其他核心DNA位点决定了物种性状的多样性的重要规律。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
多样性增量论文参考文献
[1].胡世赛.多样性增量特征选择技术的应用[D].内蒙古工业大学.2018
[2].周云鹏.广义多样性增量结合关键位点对核小体定位预测作用的研究[D].内蒙古大学.2016
[3].李琴,张瑾,骈聪,陈园园,李强.基于位置关联权重矩阵及序列组分的多样性增量识别剪接位点[J].生物物理学报.2014
[4].赵秀娟,裴智勇,刘佳,蔡禄.多样性增量结合支持向量机方法预测酵母核小体定位[J].生物物理学报.2010
[5].高智红.应用多样性增量方法识别人类基因组microRNA前体序列[D].内蒙古大学.2010
[6].陈丽萍,吕军.利用多样性增量位置得分函数预测人类5'非翻译区剪接位点[J].内蒙古工业大学学报(自然科学版).2009
[7].高智红,张利绒.基于多样性增量方法预测前体microRNA[J].生物物理学报.2009
[8].高智红,张利绒.基于多样性增量方法预测前体microRNA[C].第十一次中国生物物理学术大会暨第九届全国会员代表大会摘要集.2009
[9].张颖,罗辽复,吕军.使用多样性增量预测磷酸化位点[J].内蒙古大学学报(自然科学版).2008