病毒蛋白质编码基因预测算法的研究

病毒蛋白质编码基因预测算法的研究

论文摘要

对病毒基因组的深入研究在许多方面都有很大帮助,特别是在治疗由病毒感染引起的人类疾病方面。随着病毒数据的快速积累,需要更加有效的基因识别方法来处理和挖掘这些数据。在本文中,我们提出了一个新的病毒基因预测和注释系统——Vgas,它结合了序列组成和序列相似性比对的方法,可以在基因组序列中自动查找病毒基因并实现基因功能注释。通过测试从Refseq下载的5705个病毒基因组,与现有的程序GeneMarkS,Prodigal和Glimmer做对比,Vgas证明了其优越性,具有最高的平均精确度和召回率(两个指数均比其他程序高1%以上),特别是对于基因组规模较小的病毒物种(≤10kb),它表现出显著的性能(精确度高6%,召回率高2%)。此外,Vgas提供了一个注释功能,用于根据BLASTp比对提供预测基因的功能信息,而且我们还根据这个信息找出了86个refseq数据库缺失的基因数据。另外,测试证明,当Vgas与GeneMarkS、Prodigal结合使用时,可以获得比三个单独程序中的每一个都更好的预测结果,使用这几种不同软件程序的协作预测将是基因预测的更好的方案。现在,Vgas可在http://cefg.uestc.cn/vgas/免费使用。然而Vgas在处理噬菌体数据和双链DNA病毒时效果较差,相比之下精准度和召回率都较低,考虑到这个局限性,我们又尝试使用深度学习方法进行病毒基因识别,本次试验应用了卷积神经网络,设计了共8层网络结构,在使用Uniprot构建的数据集上五重交叉验证进行测试,F值达到了98%,此模型深入研究有机会可以得到弥补当前Vgas不足的新系统。

论文目录

  • 摘要
  • abstract
  • 第一章 绪论
  •   1.1 研究背景
  •   1.2 病毒基因预测及注释
  •   1.3 深度学习以及在生物信息中的应用
  •   1.4 本文结构
  • 第二章 病毒基因识别及自动注释系统Vgas
  •   2.1 先前工作
  •   2.2 Z曲线理论与特征提取
  •     2.2.1 Z曲线理论
  •     2.2.2 特征参数提取
  •   2.3 测试数据来源
  •   2.4 Vgas程序的基本框架
  •   2.5 Vgas结果评估
  •     2.5.1 不同长度基因组结果分析
  •     2.5.2 噬菌体基因组分析
  •     2.5.3 不同载体基因组结果分析
  •     2.5.4 高精度数据集测试
  •     2.5.5 结论
  •   2.6 Vgas注释功能评估
  •   2.7 新基因的发现
  •   2.8 Vgas的网络服务
  •   2.9 本章小结
  • 第三章 深度学习在病毒基因识别中的实践
  •   3.1 引言
  •   3.2 深度学习相关知识
  •     3.2.1 卷积神经网络
  •     3.2.2 循环神经网络
  •     3.2.3 激活函数
  •     3.2.4 损失函数和优化算法
  •     3.2.5 正则化
  •   3.3 数据集构建
  •   3.4 网络结构
  •     3.4.1 输入层
  •     3.4.2 卷积层
  •     3.4.3 连接层
  •     3.4.4 Softmax层以及损失函数的计算
  •   3.5 结果分析与讨论
  •   3.6 小结
  • 第四章 总结与展望
  •   4.1 全文总结
  •   4.2 未来工作的展望
  • 致谢
  • 参考文献
  • 攻读硕士学位期间取得的成果
  • 文章来源

    类型: 硕士论文

    作者: 高依舟

    导师: 郭锋彪

    关键词: 病毒基因识别,功能注释,新基因,联合预测,深度学习

    来源: 电子科技大学

    年度: 2019

    分类: 基础科学,医药卫生科技

    专业: 生物学,生物学,基础医学

    单位: 电子科技大学

    分类号: R373;Q811.4

    总页数: 53

    文件大小: 2913K

    下载量: 53

    相关论文文献

    • [1].奇异的生命体——巨型病毒[J]. 大自然探索 2017(07)
    • [2].核酶在病毒基因治疗中的研究进展[J]. 中国生物制品学杂志 2009(11)
    • [3].摸清病毒“航班网络”预测疫情爆发[J]. 人人健康 2018(21)
    • [4].马赛病毒上海分离株的分离和全基因组分析[J]. 病毒学报 2018(05)
    • [5].猪繁殖与呼吸综合征病毒Nsp9基因第642位氨基酸突变对病毒复制的影响[J]. 中国兽医杂志 2018(03)
    • [6].以聚乙烯亚胺及其衍生物为骨架在非病毒基因治疗中的研究[J]. 中医临床研究 2015(28)
    • [7].病毒以及人类病毒感染[J]. 时事报告 2020(02)
    • [8].正确认识EB病毒及EB病毒相关疾病[J]. 临床内科杂志 2019(06)
    • [9].病毒自起源理论的研究进展[J]. 生物化工 2019(03)
    • [10].血清EB病毒基因、癌胚抗原联合铁蛋白检测在鼻咽癌诊断中的临床价值[J]. 中国医学创新 2018(23)
    • [11].张晓玲等阐述非病毒基因输送体系研究进展[J]. 广东农业科学 2012(05)
    • [12].脑靶向非病毒基因递释系统的研究进展[J]. 国际药学研究杂志 2010(01)
    • [13].阿米巴巨大病毒及其潜在致病性研究进展[J]. 微生物与感染 2018(01)
    • [14].探讨血清EB病毒基因、癌胚抗原、铁蛋白联合检测在鼻咽癌诊断中的临床应用价值[J]. 临床检验杂志(电子版) 2018(01)
    • [15].高致病性禽流感H5N1病毒基因改造引发争议案例剖析[J]. 军事医学 2013(08)
    • [16].拉米夫定治疗慢性乙型肝炎过程中病毒基因变异的监测[J]. 包头医学 2009(02)
    • [17].病毒的调控靶点eIF4E[J]. 中国癌症防治杂志 2018(01)
    • [18].网络信息传输过程病毒跟踪优化检测研究[J]. 计算机仿真 2018(03)
    • [19].氯喹抑制寨卡病毒在vero细胞中感染复制的实验研究[J]. 热带医学杂志 2019(04)
    • [20].生物科学中病毒的应用分析[J]. 智富时代 2018(08)
    • [21].猪繁殖与呼吸综合征病毒3'-UTR碱基缺失对病毒复制影响的初步研究[J]. 中国预防兽医学报 2019(08)
    • [22].基于主动模式的勒索病毒防御体系研究[J]. 信息与电脑(理论版) 2019(15)
    • [23].蛙病毒同源蛋白RGV-27R和ADRV-85L的表达及其免疫原性分析[J]. 病毒学报 2019(06)
    • [24].广州地区424例乙型肝炎患者病毒基因亚型分布与乙型肝炎疾病谱的关系探讨[J]. 实用肝脏病杂志 2016(05)
    • [25].番木瓜病毒病的研究进展[J]. 分子植物育种 2019(11)
    • [26].大鲵蛙病毒编码96L蛋白(ADRV-96L)的腺苷三磷酸酶活性和促进细胞生长作用[J]. 微生物学通报 2018(05)
    • [27].鸭坦布苏病毒SYBR Green qPCR检测方法的建立[J]. 畜牧与兽医 2018(09)
    • [28].寨卡病毒荧光定量PCR检测方法的建立与验证[J]. 中国输血杂志 2019(02)
    • [29].寨卡病毒致病机理和疫苗研究进展[J]. 中国兽医学报 2018(08)
    • [30].乙型肝炎病毒感染与原发性肝癌的相关性临床研究[J]. 中外女性健康研究 2017(04)

    标签:;  ;  ;  ;  ;  

    病毒蛋白质编码基因预测算法的研究
    下载Doc文档

    猜你喜欢