基于基因组数据的鸡胚培养H3N2流感病毒的动态适应性进化研究

基于基因组数据的鸡胚培养H3N2流感病毒的动态适应性进化研究

论文摘要

由各类流感病毒导致的流感疾病已经逐渐成为全世界范围内最主要的健康威胁之一,H3N2流感病毒就是其中的典型代表,它能引发肺炎和呼吸道衰竭,甚至最终导致死亡,给人类健康带来日益严峻的挑战。由于H3N2流感病毒的疫苗株在不同的宿主媒介中培养扩增时会出现不同程度的适应性进化,尤其是在鸡胚中培养时会经历更加显著的适应性进化,导致疫苗功效下降,所以本文结合计算生物学和机器学习的方法,尝试对H3N2流感病毒的动态适应性进化进行探索。首先,我们对GISAID数据库中筛选出的69362条病毒基因序列数据,应用GTR(General Time Reversible)模型和极大似然法构建它们的基因种系树,再应用突变映射(Mutation Mapping)方法模拟种系树末枝上的密码子突变历史。我们以不同的密码子位点上适应性进化强度为基准,通过富集检验(Enrichment Test)和趋同检验(Convergent Test)找出了18个在鸡胚(egg)培养中会经历强适应性进化的密码子位点。由于实际数据中可能有部分鸡胚培养的病毒样本因为各种原因被标注为“Unknown”培养标签信息,导致一些鸡胚培养中出现的适应性进化模式的相关信息的丢失;同时,鸡胚培养病毒样本在整个病毒数据集中只占很小的比例(1.2%)。为了更全面地研究H3N2流感病毒在鸡胚中的动态适应性性进化,我们尝试利用XGboost算法、Adaboost算法以及非平衡数据采样技术,对H3N2流感病毒标签数据这个非平衡数据进行分类预测。结果显示,我们的预测方法对2016年之后的病毒数据集的分类效果显著好于对2016年之前的病毒数据的分类效果。进一步,我们的结果也提示,鸡胚中培养的病毒株正在经历越来越强的适应性进化。另外,考虑到病毒株在鸡胚培养中经历的适应性进化强度越高,导致的疫苗功效下降程度也就越大,我们通过高斯混合聚类方法探索了所有鸡胚培养病毒数据内部可能存在的不同类型的簇群,这些簇群代表了不一样的适应性进化模式。在此基础上,为了更好地挖掘出了鸡胚培养H3N2流感病毒在不同年份间的动态适应性进化模式,我们应用一种基于Gibbs抽样的关联规则分析,提出一种新的聚类思路,成功地找到了不同类型适应性进化簇群对应的密码子位点和相应的模式,为了进一步提高疫苗效果提供了有价值的信息。

论文目录

  • 中文摘要
  • 英文摘要
  • 第一章 引言
  •   1.1 研究背景
  •   1.2 计算生物学与机器学习
  •   1.3 本文主要工作
  • 第二章 基于GTR模型和突变映射的密码子位点选择
  •   2.1 GTR模型
  •     2.1.1 序列进化中的连续马氏过程
  •     2.1.2 核酸变换模型
  •   2.2 基于极大似然法的种系树构建
  •     2.2.1 基因种系树
  •     2.2.2 基因种系树的似然函数计算
  •     2.2.3 搜索算法与建树工具
  •   2.3 突变映射
  •     2.3.1 根节点和内点的状态抽样
  •     2.3.2 枝上的突变过程模拟
  •   2.4 富集检验和趋同检验
  •   2.5 研究结果
  •     2.5.1 数据预处理
  •     2.5.2 密码子位点的筛选
  • 第三章 基于集成学习的H3N2流感病毒标签数据分析
  •   3.1 决策树模型
  •     3.1.1 C4.5模型
  •     3.1.2 CART模型
  •   3.2 集成学习
  •     3.2.1 Adaboost算法
  •     3.2.2 XGboost算法
  •   3.3 H3N2流感病毒标签数据的学习预测结果
  • 第四章 鸡胚培养的H3N2流感病毒聚类
  •   4.1 数据降维
  •     4.1.1 拉普拉斯特征映射
  •     4.1.2 核主成分分析
  •   4.2 高斯混合聚类
  •   4.3 基于关联规则的聚类
  •   4.4 H3N2流感病毒的聚类结果
  • 第五章 讨论与展望
  • 参考文献
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 汪骏秋

    导师: 周达

    关键词: 流感病毒,鸡胚培养,动态适应性进化,计算生物学,机器学习

    来源: 厦门大学

    年度: 2019

    分类: 基础科学,医药卫生科技,信息科技

    专业: 生物学,基础医学,自动化技术

    单位: 厦门大学

    分类号: TP181;R373.13

    总页数: 72

    文件大小: 3314K

    下载量: 24

    相关论文文献

    • [1].此次甲型H1N1流感病毒的特点[J]. 科技档案 2009(02)
    • [2].甲型H1N1流感的传播途径是什么[J]. 科技档案 2009(02)
    • [3].流感病毒防治新进展[J]. 中华医院感染学杂志 2020(02)
    • [4].A型流感病毒分型基因芯片在流感病毒各亚型监测中的应用[J]. 中国动物检疫 2020(05)
    • [5].D型流感病毒概述[J]. 贵州畜牧兽医 2020(02)
    • [6].中西医抗流感病毒研究进展[J]. 中国中西医结合杂志 2019(01)
    • [7].2015~2018年乌鲁木齐市B型流感病毒流行特征分析[J]. 医学信息 2019(06)
    • [8].B型流感病毒研究进展[J]. 生物工程学报 2018(06)
    • [9].B型流感病毒相关研究进展[J]. 疾病监测 2017(02)
    • [10].贵州省2013—2016年B型流感病毒流行特征分析[J]. 中国感染控制杂志 2017(04)
    • [11].比较感染流感病毒H7N9、H5N1和2009年H1N1大流行的住院患者[J]. 中国感染与化疗杂志 2015(03)
    • [12].流感病毒对人类和畜牧业健康的影响[J]. 中国农业科学 2015(15)
    • [13].新冠病毒与流感病毒的七个区别[J]. 致富天地 2020(03)
    • [14].俄罗斯科学家创造出杀死流感病毒的新材料[J]. 疯狂英语(读写版) 2020(05)
    • [15].认识流感病毒 探索生命奥秘[J]. 科学大观园 2019(06)
    • [16].你了解流感病毒吗[J]. 初中生学习指导 2019(35)
    • [17].流感高发 关于流感病毒你应该知道的N个真相[J]. 科学大观园 2018(03)
    • [18].接种流感疫苗须因人而异[J]. 家庭医学(下半月) 2016(12)
    • [19].流行性感冒的预防与治疗方法探讨[J]. 人人健康 2016(24)
    • [20].流感病毒的检测研究[J]. 人人健康 2016(20)
    • [21].巧克力人星星的心[J]. 童话王国 2017(06)
    • [22].治不好的“感冒”[J]. 儿童故事画报 2017(34)
    • [23].用转基因蛋白质抑制流感病毒[J]. 科学大观园 2012(16)
    • [24].揭秘流感病毒[J]. 百科知识 2013(06)
    • [25].非理性比流感病毒更可怕[J]. 杂文选刊(下旬版) 2009(06)
    • [26].细说流感病毒[J]. 科学世界 2009(06)
    • [27].流感病毒人体游记[J]. 中华养生保健 2010(02)
    • [28].谜一样的流感病毒[J]. 少年科学 2010(12)
    • [29].流感病毒传播能力相关遗传机制的深度解析[J]. 中国预防兽医学报 2019(11)
    • [30].甲型H1N1流感病毒及其疫苗研究热点[J]. 甘肃畜牧兽医 2019(02)

    标签:;  ;  ;  ;  ;  

    基于基因组数据的鸡胚培养H3N2流感病毒的动态适应性进化研究
    下载Doc文档

    猜你喜欢