论文摘要
蛋白质广泛分布于生物体的各种组织当中,在生物的生命过程中扮演着不可或缺的角色。为更好的了解蛋白质在生物体内所执行的功能,进而揭示由于蛋白质结构改变导致的疾病发病机理,最终达到有针对性进行治疗的目的,获得蛋白质的三维空间结构是最直接、有效的途径。信息技术的发展及其与生物学科的交叉为蛋白质三维结构的获取提供了周期短、成本低的计算方法。直接从蛋白质的氨基酸序列出发,设计有效的算法,利用计算机获得蛋白质的三维空间结构,是生物信息学中的热点研究问题,本文研究内容主要针对蛋白质结构从头预测构象优化方法。预测得到的蛋白质三维结构、由序列比对提取的蛋白质同源结构距离谱信息、残基接触信息、二级结构信息等等,都能够反映由于氨基酸突变对蛋白质结构的影响,进而评估氨基酸突变对于蛋白质功能的影响,本文针对癌症驱动突变预测问题也进行了初步研究。本文在基于种群的进化算法框架下,基于抽象凸估计技术,提出了用于蛋白质结构预测的抽象凸下界估计信息引导的构象空间搜索方法;为了构建更紧的下界估计信息以进一步提高采样效率,提出了Lipschitz下界估计信息引导的构象特征空间采样方法;为了更好的保留采样过程中得到的优质构象解,提出了多模态构象空间采样方法;针对单氨基酸癌症驱动突变预测问题,提出了基于氨基酸序列和蛋白质结构信息的单氨基酸突变危害性评估及预测方法。本文的主要工作和成果如下:1.针对蛋白质结构从头预测中构象空间的搜索问题,在进化算法框架下提出了一种抽象凸下界估计信息引导的构象空间搜索方法。首先利用特征提取技术将高维构象空间转到特征空间以降低空间维数;其次,根据抽象凸理论建立下界估计空间,通过不断收紧的下界估计信息用来指导进化算法的搜索;此外,将片段组装和蒙特卡洛方法相结合以在构象空间中采样得到一系列亚稳态构象。测试结果表明了所提方法的有效性。2.为了进一步提高构象空间搜索效率,在基于种群的进化算法框架下,提出了一种用于蛋白质结构预测的插件式方法:Lipschitz下界估计信息引导的构象空间搜索方法。首先采用超速形状识别技术建立特征空间;然后,基于Lipschitz估计理论将特征空间转化为Lipschitz下界估计空间用于指导进化算法在构象空间中的采样;Lipschitz下界估计信息的使用减少了能量函数评价的次数,从而提高算法搜索效率。测试结果表明所提方法可以快速、有效地获得精度较高的近天然态蛋白质结构。3.蛋白质结构预测可以看作是一个多模态优化问题,为了更好的保留采样过程中得到的优质构象解,提出了多模态构象空间采样方法。在给定种群中,在基于超速形状识别技术的模态识别协议下,首先生成给定数量的模态;在种群进化过程中,基于种群拥挤度识别的差分进化算法用于模态保持;同时,基于抽象凸下界估计技术构造局部下降方向,进一步提高在低能量区域的采样能力。通过多模进化采样,可以得到若干个包含一系列与能量成比例的构象簇,在这些簇中可以直接提取诱饵构象。测试结果表明所提方法具有较强的采样能力,能够有效地获得近天然态构象。4.针对单氨基酸癌症驱动突变预测问题,提出了一种基于氨基酸序列和蛋白质结构信息的单氨基酸突变危害性评估及预测方法。首先,提取了从氨基酸到蛋白质三维结构的22种不同特征,作为随机森林分类器的输入信息;其次,采用搜集到的癌症相关单氨基酸突变数据集和无害单氨基酸突变数据集对分类器进行训练;然后,用独立测试集测试分类器的性能,并与其它方法进行比较;最后,案例分析表明了所提方法的有效性。
论文目录
文章来源
类型: 博士论文
作者: 郝小虎
导师: 张贵军
关键词: 蛋白质结构预测,抽象凸下界估计,进化算法,多模态优化,驱动突变
来源: 浙江工业大学
年度: 2019
分类: 基础科学
专业: 生物学
单位: 浙江工业大学
基金: 国家自然科学基金委(项目编号61773346)
分类号: Q51
DOI: 10.27463/d.cnki.gzgyu.2019.000024
总页数: 116
文件大小: 5051K
下载量: 98
相关论文文献
- [1].基于双群体进化规划的动态优化算法[J]. 计算机仿真 2008(09)
- [2].自适应混沌PSO算法在WSN覆盖优化中的应用[J]. 通信技术 2018(10)
- [3].番茄黄化曲叶病毒的鉴定与群体进化分析[J]. 植物保护 2016(01)
- [4].基于群体进化的高铁民航客运票价优化模型[J]. 系统工程 2015(05)
- [5].微分方程在描述两群体进化过程中的应用[J]. 动物学研究 2009(01)
- [6].多目标优化的进化环境模型及实现[J]. 计算机学报 2014(12)
- [7].一种基于进化策略的化学方程式配平新方法[J]. 数学的实践与认识 2009(02)
- [8].试述近代中国社团运动兴起的原因[J]. 山东社会科学 2015(S1)
- [9].一种具有自我更新机制的量子粒子群优化算法[J]. 计算机工程与应用 2015(22)
- [10].后危机时代破解“信用评级悖论”的博弈分析[J]. 广西社会科学 2012(04)
- [11].浅谈中泰鬼神文化的异同[J]. 文教资料 2017(24)
- [12].我国新农村成人教育体系再认识[J]. 新课程(教育学术版) 2009(08)
- [13].中国特有森林树种华山松的群体进化历史研究[J]. 西北植物学报 2019(01)
- [14].动物基因组学重测序的应用研究进展[J]. 畜牧兽医学报 2016(10)
- [15].河南汉族人群16个Y-SNP位点遗传多态性[J]. 法医学杂志 2015(01)
- [16].引入学习机制的自适应遗传算法设计与实现[J]. 计算机工程与应用 2010(36)
- [17].从中国消费市场新趋势看眼镜消费群体进化之路[J]. 中国眼镜科技杂志 2017(01)
- [18].植物杂交后代中基因偏分离的产生原因及其进化意义[J]. 遗传 2016(09)
- [19].单核苷酸多态性在林木中的研究进展[J]. 遗传 2008(10)
- [20].进化导致人类丢失第六感[J]. 科学大观园 2013(21)