基于群体进化的蛋白质结构从头预测构象优化方法研究

基于群体进化的蛋白质结构从头预测构象优化方法研究

论文摘要

蛋白质广泛分布于生物体的各种组织当中,在生物的生命过程中扮演着不可或缺的角色。为更好的了解蛋白质在生物体内所执行的功能,进而揭示由于蛋白质结构改变导致的疾病发病机理,最终达到有针对性进行治疗的目的,获得蛋白质的三维空间结构是最直接、有效的途径。信息技术的发展及其与生物学科的交叉为蛋白质三维结构的获取提供了周期短、成本低的计算方法。直接从蛋白质的氨基酸序列出发,设计有效的算法,利用计算机获得蛋白质的三维空间结构,是生物信息学中的热点研究问题,本文研究内容主要针对蛋白质结构从头预测构象优化方法。预测得到的蛋白质三维结构、由序列比对提取的蛋白质同源结构距离谱信息、残基接触信息、二级结构信息等等,都能够反映由于氨基酸突变对蛋白质结构的影响,进而评估氨基酸突变对于蛋白质功能的影响,本文针对癌症驱动突变预测问题也进行了初步研究。本文在基于种群的进化算法框架下,基于抽象凸估计技术,提出了用于蛋白质结构预测的抽象凸下界估计信息引导的构象空间搜索方法;为了构建更紧的下界估计信息以进一步提高采样效率,提出了Lipschitz下界估计信息引导的构象特征空间采样方法;为了更好的保留采样过程中得到的优质构象解,提出了多模态构象空间采样方法;针对单氨基酸癌症驱动突变预测问题,提出了基于氨基酸序列和蛋白质结构信息的单氨基酸突变危害性评估及预测方法。本文的主要工作和成果如下:1.针对蛋白质结构从头预测中构象空间的搜索问题,在进化算法框架下提出了一种抽象凸下界估计信息引导的构象空间搜索方法。首先利用特征提取技术将高维构象空间转到特征空间以降低空间维数;其次,根据抽象凸理论建立下界估计空间,通过不断收紧的下界估计信息用来指导进化算法的搜索;此外,将片段组装和蒙特卡洛方法相结合以在构象空间中采样得到一系列亚稳态构象。测试结果表明了所提方法的有效性。2.为了进一步提高构象空间搜索效率,在基于种群的进化算法框架下,提出了一种用于蛋白质结构预测的插件式方法:Lipschitz下界估计信息引导的构象空间搜索方法。首先采用超速形状识别技术建立特征空间;然后,基于Lipschitz估计理论将特征空间转化为Lipschitz下界估计空间用于指导进化算法在构象空间中的采样;Lipschitz下界估计信息的使用减少了能量函数评价的次数,从而提高算法搜索效率。测试结果表明所提方法可以快速、有效地获得精度较高的近天然态蛋白质结构。3.蛋白质结构预测可以看作是一个多模态优化问题,为了更好的保留采样过程中得到的优质构象解,提出了多模态构象空间采样方法。在给定种群中,在基于超速形状识别技术的模态识别协议下,首先生成给定数量的模态;在种群进化过程中,基于种群拥挤度识别的差分进化算法用于模态保持;同时,基于抽象凸下界估计技术构造局部下降方向,进一步提高在低能量区域的采样能力。通过多模进化采样,可以得到若干个包含一系列与能量成比例的构象簇,在这些簇中可以直接提取诱饵构象。测试结果表明所提方法具有较强的采样能力,能够有效地获得近天然态构象。4.针对单氨基酸癌症驱动突变预测问题,提出了一种基于氨基酸序列和蛋白质结构信息的单氨基酸突变危害性评估及预测方法。首先,提取了从氨基酸到蛋白质三维结构的22种不同特征,作为随机森林分类器的输入信息;其次,采用搜集到的癌症相关单氨基酸突变数据集和无害单氨基酸突变数据集对分类器进行训练;然后,用独立测试集测试分类器的性能,并与其它方法进行比较;最后,案例分析表明了所提方法的有效性。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  •   1.1 研究背景和意义
  •   1.2 国内外研究现状
  •   1.3 研究内容
  •   1.4 创新点
  •   1.5 论文结构与安排
  • 第二章 蛋白质结构预测基本知识
  •   2.1 蛋白质结构
  •     2.1.1 一级结构
  •     2.1.2 二级结构
  •     2.1.3 三级结构
  •     2.1.4 四级结构
  •   2.2 蛋白质结构数据库
  •   2.3 蛋白质结构预测方法
  •   2.4 关键技术概述
  •     2.4.1 能量模型
  •     2.4.2 片段组装技术
  •     2.4.3 构象特征提取技术
  •     2.4.4 局部全局优化技术
  •     2.4.5 抽象凸估计技术
  •     2.4.6 多模态优化技术
  •   2.5 PyRosetta
  •   2.6 评价指标
  •   2.7 本章小结
  • 第三章 抽象凸下界估计信息引导的构象空间搜索方法
  •   3.1 引言
  •   3.2 算法设计与分析
  •     3.2.1 抽象凸下界估计模型的构建与求解
  •     3.2.2 对比验证算法
  •     3.2.3 ACUE算法描述
  •     3.2.4 复杂度分析
  •   3.3 测试结果与讨论
  •     3.3.1 测试蛋白与实验设置
  •     3.3.2 测试结果分析与讨论
  •     3.3.3 结论与展望
  •   3.4 本章小结
  • 第四章 Lipschitz下界估计信息引导的构象空间搜索方法
  •   4.1 引言
  •   4.2 算法设计与分析
  •     4.2.1 Lipschitz下界估计模型的构建与求解
  •     4.2.2 算法描述
  •     4.2.3 复杂度分析
  •   4.3 测试结果与讨论
  •     4.3.1 测试蛋白与实验设置
  •     4.3.2 LUE应用于Rosetta-MMC
  •     4.3.3 LUE应用于LEDE
  •   4.4 本章小结
  • 第五章 蛋白质结构从头预测多模态构象空间搜索方法
  •   5.1 引言
  •   5.2 算法设计与分析
  •     5.2.1 MDE算法描述
  •     5.2.2 MDE模态生成方法
  •     5.2.3 MDE模态保持和增强
  •     5.2.4 复杂度分析
  •   5.3 测试结果与讨论
  •     5.3.1 测试蛋白与实验设置
  •     5.3.2 测试结果总体分析
  •     5.3.3 采样能力分析
  •     5.3.4 MDE特性分析
  •     5.3.5 收敛性分析
  •     5.3.6 与其它state-of-the-art方法对比分析
  •   5.4 本章小结
  • 第六章 基于序列和结构的癌症驱动突变预测方法
  •   6.1 引言
  •   6.2 基于序列和结构的癌症驱动突变预测方法AssVar
  •     6.2.1 突变信息特征设计
  •     6.2.2 预测方法及实现
  •     6.2.3 性能评价指标
  •   6.3 实验与测试结果分析
  •     6.3.1 训练及测试数据集信息提取
  •     6.3.2 5倍交叉验证结果
  •     6.3.3 测试结果分析与讨论
  •     6.3.4 案例研究
  •   6.4 本章小结
  • 第七章 结论与展望
  •   7.1 结论
  •   7.2 展望
  • 参考文献
  • 致谢
  • 作者简介
  •   1 作者简历
  •   2 攻读博士学位期间发表的学术论文
  •   3 参与的科研项目
  •   4 获奖情况
  •   5 授权发明专利
  •   6 公开发明专利
  •   7 登记软件著作权
  • 学位论文数据集
  • 文章来源

    类型: 博士论文

    作者: 郝小虎

    导师: 张贵军

    关键词: 蛋白质结构预测,抽象凸下界估计,进化算法,多模态优化,驱动突变

    来源: 浙江工业大学

    年度: 2019

    分类: 基础科学

    专业: 生物学

    单位: 浙江工业大学

    基金: 国家自然科学基金委(项目编号61773346)

    分类号: Q51

    DOI: 10.27463/d.cnki.gzgyu.2019.000024

    总页数: 116

    文件大小: 5051K

    下载量: 98

    相关论文文献

    • [1].基于双群体进化规划的动态优化算法[J]. 计算机仿真 2008(09)
    • [2].自适应混沌PSO算法在WSN覆盖优化中的应用[J]. 通信技术 2018(10)
    • [3].番茄黄化曲叶病毒的鉴定与群体进化分析[J]. 植物保护 2016(01)
    • [4].基于群体进化的高铁民航客运票价优化模型[J]. 系统工程 2015(05)
    • [5].微分方程在描述两群体进化过程中的应用[J]. 动物学研究 2009(01)
    • [6].多目标优化的进化环境模型及实现[J]. 计算机学报 2014(12)
    • [7].一种基于进化策略的化学方程式配平新方法[J]. 数学的实践与认识 2009(02)
    • [8].试述近代中国社团运动兴起的原因[J]. 山东社会科学 2015(S1)
    • [9].一种具有自我更新机制的量子粒子群优化算法[J]. 计算机工程与应用 2015(22)
    • [10].后危机时代破解“信用评级悖论”的博弈分析[J]. 广西社会科学 2012(04)
    • [11].浅谈中泰鬼神文化的异同[J]. 文教资料 2017(24)
    • [12].我国新农村成人教育体系再认识[J]. 新课程(教育学术版) 2009(08)
    • [13].中国特有森林树种华山松的群体进化历史研究[J]. 西北植物学报 2019(01)
    • [14].动物基因组学重测序的应用研究进展[J]. 畜牧兽医学报 2016(10)
    • [15].河南汉族人群16个Y-SNP位点遗传多态性[J]. 法医学杂志 2015(01)
    • [16].引入学习机制的自适应遗传算法设计与实现[J]. 计算机工程与应用 2010(36)
    • [17].从中国消费市场新趋势看眼镜消费群体进化之路[J]. 中国眼镜科技杂志 2017(01)
    • [18].植物杂交后代中基因偏分离的产生原因及其进化意义[J]. 遗传 2016(09)
    • [19].单核苷酸多态性在林木中的研究进展[J]. 遗传 2008(10)
    • [20].进化导致人类丢失第六感[J]. 科学大观园 2013(21)

    标签:;  ;  ;  ;  ;  

    基于群体进化的蛋白质结构从头预测构象优化方法研究
    下载Doc文档

    猜你喜欢