基于κ长子串的DNA序列进化树分析

基于κ长子串的DNA序列进化树分析

论文摘要

目前,对于生物大数据的分类方法前人已经做了很多的研究。生物序列研究中传统比对方法(Alignment)所产生的巨大时间与空间复杂度,以及计算过程中多种打分矩阵的选择问题,都对序列的比较提出了难题。为了克服比对方法的上述缺点,研究者已经做出了很多贡献,许多非比对方法(Alignment-free)涌现出来,在很多特定生物基因组数据集上解决了序列比较的一些问题,但非比对方法对生物序列的研究在一定程度上依赖于研究数据。当前非比对方法的测试数据集中序列数量普遍较少,本文以κ-词为研究对象,提出了针对较大数据集的DNA序列分析非比对方法,具体是指所研究的序列数量超过200的数据集。在哺乳动物全基因组线粒体DNA序列的比较研究中该分类方法得到很好的进化分类结果。在众多的生物序列分析方法里,生物序列的κ-词信息是一个重要的序列特征。本文以欧拉回路个数限定序列被唯一生成时的k值。本文对于一个给定的长度k,研究了两两序列之间κ-词的数量关系。提出一个由序列间κ-词组成的相同程度构成的相似性度量。这个度量揭示了DNA序列中κ-词的整体性质。使用本文方法分别对数量为31、70与236的不同哺乳动物线粒体DNA序列生成进化树,都与标准生物学分类相符合。我们的方法好于其他三个使用该31数据集的方法。本文方法显示出优于前人使用该70数据集的方法。对于236条DNA序列的数据集还没有非比对方法对它进行测试,我们的方法得到的结果更优于比对方法。实现本文方法的算法时间复杂度与空间复杂度都被大大节省。

论文目录

  • 摘要
  • Abstract
  • 引言
  • 1 进化分析概论
  •   1.1 研究背景与研究意义
  •   1.2 研究现状
  • 2 序列处理分析方法
  •   2.1 定义k长子片段
  •   2.2 最佳k值的选取
  •   2.3 基因组数据集
  • 3 差异比较方法
  •   3.1 定义与方法
  •   3.2 该算法的复杂度分析
  •   3.3 差异算法伪代码
  • 4 进化树分析
  •   4.1 对31 条哺乳动物mtDNA序列的分析
  •   4.2 对70 条哺乳动物mtDNA序列的分析
  •   4.3 对236 条哺乳动物mtDNA序列的分析
  • 结论
  • 参考文献
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 张景慧

    导师: 杨希武

    关键词: 生物序列比较,相似性度量,进化树,非比对方法

    来源: 辽宁师范大学

    年度: 2019

    分类: 基础科学

    专业: 生物学

    单位: 辽宁师范大学

    基金: 国家自然科学基金青年项目,基于加权有向多重图的DNA序列比较的非比对方法研究,(项目编号:61401186)

    分类号: Q523

    总页数: 45

    文件大小: 2865K

    下载量: 34

    相关论文文献

    • [1].炼厂气标准气体气相色谱比对方法的研究(下)[J]. 低温与特气 2017(02)
    • [2].利用薄膜描记比对方法改善颅内肿瘤靶区勾画的初步评价[J]. 肿瘤基础与临床 2015(04)
    • [3].相近不确定度计量标准装置实验室间量值比对方法[J]. 内蒙古科技与经济 2015(03)
    • [4].炼厂气标准气体气相色谱比对方法的研究(上)[J]. 低温与特气 2017(01)
    • [5].刑法上相同商标的认定标准及比对方法[J]. 人民司法 2019(29)
    • [6].面向低轨卫星的多通道数据实时比对方法研究[J]. 航天制造技术 2017(02)
    • [7].手工比对在指纹自动识别系统查档破案中的应用[J]. 法制博览 2015(31)
    • [8].数字化指纹处理与比对方法的研究[J]. 中国西部科技 2010(33)
    • [9].不同型号血液分析仪的比对方法及应用[J]. 临床和实验医学杂志 2011(17)
    • [10].基于个性特征的实时人脸比对方法[J]. 计算机工程与设计 2008(16)
    • [11].确定等价电子杨盘基的等概率比对方法[J]. 物理学报 2008(10)
    • [12].枪弹头痕迹自动比对方法的研究[J]. 数学的实践与认识 2010(15)
    • [13].枪弹头痕迹自动比对方法的研究[J]. 数学的实践与认识 2010(15)
    • [14].高准确度大力值比对方法的研究[J]. 计量技术 2008(12)
    • [15].Profile-profile比对方法用于发现远距离同源模板[J]. 生物信息学 2013(01)
    • [16].基于特征峰识别的弹头痕迹自动比对方法[J]. 数学的实践与认识 2010(15)
    • [17].确定等价电子杨盘基的等概率比对方法[J]. 商丘师范学院学报 2009(06)
    • [18].基于稳健统计分析的全站仪比对方法[J]. 计测技术 2014(04)
    • [19].基于人脸特征相似度分数似然比的人脸比对方法[J]. 刑事技术 2019(01)
    • [20].基于特征分析的IPTV直播节目一致性比对方法研究及实现[J]. 中国新通信 2020(15)
    • [21].不同血液分析仪间检测结果一致性的比对[J]. 中国医疗前沿 2013(19)
    • [22].13°车轮冲击试验机比对方法的研究[J]. 山东工业技术 2015(13)
    • [23].蛋白质序列比对方法的研究进展[J]. 成都电子机械高等专科学校学报 2012(04)
    • [24].古文献版本考究中的图像文字自动比对方法设计与应用研究[J]. 河南图书馆学刊 2018(09)
    • [25].13°车轮冲击试验机比对方法的研究[J]. 工程与试验 2015(02)
    • [26].呼吸机检测技术能力比对方法研究[J]. 医疗卫生装备 2016(05)
    • [27].手工比对在指纹自动识别系统查档破案中的应用[J]. 广州市公安管理干部学院学报 2013(03)
    • [28].基于Map Reduce的多序列星比对方法在肿瘤研究中的应用[J]. 癌症进展 2016(06)
    • [29].生物网络比对的模型与算法[J]. 软件学报 2010(09)
    • [30].一种新的微波功率比对方法[J]. 计量技术 2020(05)

    标签:;  ;  ;  ;  

    基于κ长子串的DNA序列进化树分析
    下载Doc文档

    猜你喜欢