系统发育谱论文-李东晗

系统发育谱论文-李东晗

导读:本文包含了系统发育谱论文开题报告文献综述及选题提纲参考文献,主要关键词:系统发育谱,权重,层次聚类,K均值聚类

系统发育谱论文文献综述

李东晗[1](2011)在《对于系统发育谱法聚类算法的改进》一文中研究指出随着高效、自动化的测序技术的出现,生物信息学的中心课题,已经从对基因的测序,转移至对已测序基因的分析,主要是对基因功能的研究及注释。由于同源性方法的自身缺陷问题及精度问题,人们开始逐渐重视非同源性方法。非同源性方法主要是通过序列的属性对归类,进而进行功能预测。系统发育谱法在众多非同源性方法应用中应用最为广泛。系统发育谱法于1999年由Pellegrini提出,随后众多学者从基因参照组选择、系统发育谱构建、谱相似性分析这叁方面对其改进。本文在这些基础之上,先构建基于权重的系统发育谱,之后交替使用层次聚类法与K均值聚类法进行相似性分析。在谱相似性分析阶段,提出两点改进:一是提出一种新的距离,用于层次聚类法的聚类阶段。二是从层次聚类法中提取更多信息,为K均值聚类法提供初始信息,更充分的利用层次聚类法的结果,使得K均值聚类法的结果更准确。目前在聚类算法中,主要应用的是欧式距离。因为我们所处理的样本大都属于欧式空间,所以采用欧式距离聚类可以得到不错的效果。本文所采用的距离,是一种非欧空间距离。相比欧式距离,它强化了已知信息对样本距离的影响。它不仅考虑样本之间的距离,还考量了样本与参照系样本的距离。使用这种新的距离,可以使我们优先处理与已知参照系相近的样本。K均值聚类法的缺陷在于初始条件选取的敏感性:初始聚类数K与初始聚类目标的选取,会对最后的聚类结果产生很大影响。目前对K均值算法的改进主要在初始信息的选取上。前人采用层次聚类与K均值聚类结合使用的方法,目的是利用层次法为K均值聚类法提供初始聚类数K。本文在此基础上,从层次聚类法的结果中提取更多有用信息,给出K均值聚类法的初始聚类目标。最后,本文用Escherichia coli K12基因组作为试验样本,对这些改进进行试验验证。由试验结果可知,相比与原先的结果,新的算法准确性更高。(本文来源于《东北师范大学》期刊2011-03-01)

沈庆航,徐加豹,江明锋,钟金城[2](2011)在《系统发育谱法研究牛蛋白质相互作用网络》一文中研究指出旨在对牛蛋白质相互作用网络进行研究,除了为牛的后基因组学提供研究基础外,其研究成果还可运用到牛的生产实践中。本研究通过系统发育谱法,利用线虫、酵母和人的蛋白相互作用数据对牛的蛋白相互作用进行预测。结果,得到了一个包含2 953个蛋白、3 034对相互作用关系的牛蛋白相互作用网络。分析表明该网络具有scale-free属性,同时对预测出的ENSBTAP00000011562等23个未知功能蛋白进行了诠释。通过结合已有的生物学知识和蛋白的已知功能信息对脂代谢相关蛋白的局部网络进行分析,进一步认识了脂代谢相关机理,为改进牛奶质量和提高牛奶产量提供了有效信息。(本文来源于《畜牧兽医学报》期刊2011年01期)

马雅楠,孙平平,魏雅卓,陆林英,崔颖[3](2009)在《改进的系统发育谱算法在蛋白质功能注释中的应用》一文中研究指出系统发育谱方法是目前研究较多的一种基于非同源性的生物大分子功能注释方法。针对现有算法存在的一些缺陷,从两个方面对该方法做了改进:一是构造基于权重的系统发育谱;二是采用改进的聚类算法对发育谱的相似性进行分析。从NCBI上下载100条Escherichia coli K12蛋白质作为实验数据,分别使用改进的算法和经典的层次聚类算法、K均值聚类算法对相似谱进行分析。结果显示,提出的改进算法在对相似谱聚类的精确度上明显优于后两种聚类算法。(本文来源于《生物信息学》期刊2009年01期)

黄萍,孙平平,马雅楠,张爽,藏露[4](2009)在《系统发育谱构建方法研究》一文中研究指出随着后基因组时代的到来,系统发育谱方法作为一种非同源性的功能注释方法,已经被成功的应用到基因组功能预测、蛋白质相互作用预测等一些重要领域的研究中去。本文阐述了系统发育谱法的基本原理,详细地介绍了现有的几种系统发育谱的构建方法,并提出了利用ortholog来构建基因的系统发育谱的思想。(本文来源于《生物信息学》期刊2009年01期)

马志强,马雅楠,孙平平,魏雅卓,陆林英[5](2008)在《基于统计建模的系统发育谱方法研究》一文中研究指出系统发育谱算法作为一种有效的大规模基因组功能注释方法,已经被成功的应用到原核生物基因组的功能注释中去。通过对系统发育谱方法中的一个关键环节——相似谱的聚类进行分析,提出了一种基于统计建模的方法来对相似的系统发育谱进行聚类。实验表明,该方法在保证较高的覆盖率的同时,还有效的提高了算法的整体速度,且当参与建模的系统发育谱的数目越大时,算法的精确度越高。(本文来源于《生物信息学》期刊2008年04期)

孙静松,李明浩,蒋广龙,姚建庄,万平[6](2008)在《系统发育谱(Phylogenetic Profile)生成软件》一文中研究指出系统发育谱生成软件(Phylogenetic Profile Generator,PPG)采用Microsoft Visual Basic和Perl两种语言编写,将构建系统发育谱所涉及的全部过程进行集成,用户只需提供原始的蛋白或核酸序列,软件即可生成所需的系统发育谱,并提供文本和XML两种形式的输出结果。软件具有Windows和Linux两个版本,可提供免费下载。软件下载地址:http://life.cnu.edu.cn/kexu-eyjshow.php?id=56(本文来源于《生物信息学》期刊2008年03期)

马志强,孙平平,马雅楠,魏雅卓,陆林英[7](2008)在《改进的K-mean聚类算法在基因系统发育谱分析中的应用》一文中研究指出简要介绍了系统发育谱法的原理,着重阐述了K-mean聚类算法在对基因系统发育谱分析中的改进,并与传统的K-mean聚类算法进行比较。实验结果表明,改进的K-mean聚类算法在运用系统发育谱法进行基因功能注释上是快而有效的,可以快速收敛到近似最优解。(本文来源于《生物信息学》期刊2008年02期)

马雅楠[8](2008)在《改进的系统发育谱方法在蛋白质功能预测中的应用》一文中研究指出后基因组时代的到来,生物信息学的研究重心日益从基因组测序工作转移到对已测序基因组的功能进行注释。传统的基于同源性的注释方法由于自身存在的缺陷在精确度方面已经不能满足人们的需要。非同源性的功能注释方法渐渐受到人们的重视。有别于同源性方法中对基因或蛋白质间相似性的考虑,非同源性方法则是根据基因或蛋白质之间的进化上的相关性来预测它们之间的功能关联。在众多非同源性方法中,系统发育谱方法是应用得最为广泛的一种,同时也是最具研究价值的一种。系统发育谱方法最早是由Pellegrini等人于1999年提出的。该方法从刚一提出就引起人们的广泛关注。在此后的几年时间里,众多研究学者对这种方法做出了不同程度的改进。这些改进包括了系统发育谱的叁个步骤,即参照基因组的选择、系统发育谱的构建以及谱的相似性分析。尽管如此,该方法到目前为止还有许多不足之处,如参照基因组的选取还没有一定的标准,对相似谱的聚类也还没有有效地利用现有的经典聚类算法。针对这些不足,对系统发育谱算法提出了两点改进:一是为构造基于权重的系统发育谱,从而间接减少了对于参照基因组选择的过分依赖;二是在对构造好的发育谱进行相似性分析时,结合使用两种应用最为广泛的经典聚类算法——层次聚类算法和K均值聚类算法。通过两种方法的取长补短来达到更好的聚类效果。(本文来源于《东北师范大学》期刊2008-05-01)

孙平平[9](2008)在《基于改进K-means聚类的系统发育谱方法在基因功能注释中的应用》一文中研究指出随着后基因组时代的到来,生物信息学的研究重心已经从序列的测序转移到对已测序的全基因组进行功能注释。随着大规模测序工具的高速发展,大通量的全基因组得到测序。仅仅依靠传统的实验方法来对这些新测序的数据进行功能分析已经远远不能满足当前的要求。因此,如何研究出基于计算的功能注释方法以代替传统的实验方法来预测这些海量数据背后隐藏的生物学功能,已经刻不容缓的成为当前生物信息学的一个重要研究课题。目前,基于计算的基因功能注释方法主要分为两大类:基于同源性的注释方法和基于非同源性的注释方法。系统发育谱方法是基于非同源性方法中常用的一种。本文通过在现有系统发育谱方法中对参照物种的选择方式进行分析,采用了构造基于权重的系统发育谱的思想,从而在保障有效的反映基因间的进化信息的同时,避免了传统的参照物种选择方法所带来的巨大的工作量。此外,本文对经典K均值聚类算法进行改进,并将改进后的聚类算法应用到对基因系统发育谱的相似性分析中去。实验结果证明,基于权值的系统发育谱的构建以及改进的聚类算法的应用能够有效的提高算法的整体性能。文章最后通过KEGG数据库做了进一步的验证,结果证明了本文的改进是行之有效的。(本文来源于《东北师范大学》期刊2008-05-01)

系统发育谱论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

旨在对牛蛋白质相互作用网络进行研究,除了为牛的后基因组学提供研究基础外,其研究成果还可运用到牛的生产实践中。本研究通过系统发育谱法,利用线虫、酵母和人的蛋白相互作用数据对牛的蛋白相互作用进行预测。结果,得到了一个包含2 953个蛋白、3 034对相互作用关系的牛蛋白相互作用网络。分析表明该网络具有scale-free属性,同时对预测出的ENSBTAP00000011562等23个未知功能蛋白进行了诠释。通过结合已有的生物学知识和蛋白的已知功能信息对脂代谢相关蛋白的局部网络进行分析,进一步认识了脂代谢相关机理,为改进牛奶质量和提高牛奶产量提供了有效信息。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

系统发育谱论文参考文献

[1].李东晗.对于系统发育谱法聚类算法的改进[D].东北师范大学.2011

[2].沈庆航,徐加豹,江明锋,钟金城.系统发育谱法研究牛蛋白质相互作用网络[J].畜牧兽医学报.2011

[3].马雅楠,孙平平,魏雅卓,陆林英,崔颖.改进的系统发育谱算法在蛋白质功能注释中的应用[J].生物信息学.2009

[4].黄萍,孙平平,马雅楠,张爽,藏露.系统发育谱构建方法研究[J].生物信息学.2009

[5].马志强,马雅楠,孙平平,魏雅卓,陆林英.基于统计建模的系统发育谱方法研究[J].生物信息学.2008

[6].孙静松,李明浩,蒋广龙,姚建庄,万平.系统发育谱(PhylogeneticProfile)生成软件[J].生物信息学.2008

[7].马志强,孙平平,马雅楠,魏雅卓,陆林英.改进的K-mean聚类算法在基因系统发育谱分析中的应用[J].生物信息学.2008

[8].马雅楠.改进的系统发育谱方法在蛋白质功能预测中的应用[D].东北师范大学.2008

[9].孙平平.基于改进K-means聚类的系统发育谱方法在基因功能注释中的应用[D].东北师范大学.2008

标签:;  ;  ;  ;  

系统发育谱论文-李东晗
下载Doc文档

猜你喜欢