基于序列分段近邻编码的蛋白质热点残基预测方法研究

基于序列分段近邻编码的蛋白质热点残基预测方法研究

论文摘要

在蛋白质与蛋白质相互作用时,其结合自由能仅由一小部分氨基酸残基贡献,这部分关键残基被称为热点残基。蛋白质功能的实现往往依赖热点残基,热点残基大部分聚集在蛋白质相互作用界面的中心位置,对蛋白质与蛋白质的结合起着至关重要的作用。因此,加深对热点残基的理解对于生命科学的发展具有积极的贡献。当前,科研工作者们主要依靠丙氨酸突变扫描技术来判定热点残基,但是这种方法成本较高又耗时耗力,只能在小范围应用。所以急需要更准确、更高效的方法来识别蛋白质界面热点残基。本文提出了序列分段近邻编码方法,并基于随机森林(Random Forest)分类算法来构建预测模型,从而鉴别蛋白质相互作用界面中的热点残基。首先从ASEdb数据库中抽取训练集,然后提取了 10个氨基酸理化属性、16个与突出指数(PI)和深度指数(DI)相关的特征以及25个与溶剂可及表面积(ASA)相关的特征。本文改进了蛋白质编码方式,对蛋白质热点残基的预测方式提供了新思路。不同于以往蛋白质序列的自相关描述符编码、三联体组合信息编码等方式,本文考虑到与热点残基临近的氨基酸以及有一定间隔的氨基酸对热点残基的影响,调整热点残基所在区间的滑动窗口长度,并将蛋白质序列平均分割成3、4、5段,由此建立预测模型,通过交叉验证最终选取了最佳的设置参数。为了验证预测模型的可靠性,本文从BID数据库中提取出独立测试集,来验证提出的模型。最后,将本文的预测模型与现有的热点残基预测方法进行了对比,这些模型在热点残基预测研究方面具有重要意义,其中包括APIS、Robetta、FOLDEF、KFC以及MINERVA模型。在使用相同训练集构建的模型之中,本文的模型在相同测试集上,明显地提升了对蛋白质界面热点残基的预测能力,表明了本文方法的可靠性。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  •   1.1 生物信息学概述
  •   1.2 蛋白质相互作用以及热点残基概述
  •     1.2.1 蛋白质--蛋白质界面热点残基简介及研究意义
  •     1.2.2 蛋白质--蛋白质相互作用界面的热点残基鉴别方法
  •   1.3 本文内容及安排
  •     1.3.1 本文的研究内容
  •     1.3.2 本文的结构安排
  •     1.3.3 本文的主要创新点
  • 第二章 机器学习与特征选择方法介绍
  •   2.1 机器学习概述
  •   2.2 特征选择
  •     2.2.1 特征选择概述
  •     2.2.2 特征选择方法的分类
  •   2.3 随机森林算法
  •   2.4 预测模型的检验方法
  •   2.5 本章小结
  • 第三章 基于序列分段自相关编码的蛋白质热点残基预测
  •   3.1 实验相关的数据集
  •     3.1.1 相关数据库的介绍
  •     3.1.2 本文所使用的数据集
  •   3.2 蛋白质特征提取
  •     3.2.1 氨基酸理化属性特征
  •     3.2.2 蛋白质结构信息特征
  •   3.3 蛋自质特征选择
  •   3.4 蛋白质序列分段近邻特征编码
  •     3.4.1 蛋白质特征编码方法介绍
  •     3.4.2 蛋白质序列滑动窗口介绍
  •     3.4.3 蛋白质序列分段近邻特征编码
  •   3.5 预测模型的构建
  •   3.6 预测模型的性能评价
  •   3.7 实验结果与分析
  •     3.7.1 交叉验证
  •     3.7.2 与其他方法的比较
  •     3.7.3 实例分析
  •   3.8 本章小结
  • 第四章 总结与展望
  •   4.1 工作总结
  •   4.2 工作展望
  • 参考文献
  • 附录
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 沈彤

    导师: 陈鹏

    关键词: 蛋白质相互作用,热点残基,序列分段近邻编码,滑动窗口,随机森林

    来源: 安徽大学

    年度: 2019

    分类: 基础科学

    专业: 生物学

    单位: 安徽大学

    分类号: Q51

    总页数: 57

    文件大小: 2774K

    下载量: 27

    相关论文文献

    • [1].皂苷-蛋白质相互作用的研究进展[J]. 中国食品学报 2020(04)
    • [2].蛋白质相互作用数据库[J]. 中国生物化学与分子生物学报 2017(08)
    • [3].基于多特征融合预测蛋白质相互作用界面[J]. 中南民族大学学报(自然科学版) 2017(03)
    • [4].基于蛋白质相互作用网络分析右归丸治疗肾阳虚证的疗效机制[J]. 中国中医药信息杂志 2016(02)
    • [5].基于蛋白质相互作用“热点”区域的小分子药物设计研究进展[J]. 生物物理学报 2015(02)
    • [6].蛋白质相互作用的研究方法及进展分析[J]. 文理导航(中旬) 2018(01)
    • [7].大规模蛋白质相互作用组实验技术及其应用[J]. 生命的化学 2013(05)
    • [8].茶多酚-蛋白质相互作用的研究进展[J]. 食品工业科技 2019(08)
    • [9].蛋白质相互作用时序网络模型及动态性质分析[J]. 湖南理工学院学报(自然科学版) 2018(01)
    • [10].水稻组织特异性蛋白质相互作用网络构建方法[J]. 哈尔滨工业大学学报 2018(11)
    • [11].基于空间映射的蛋白质相互作用网络链接预测算法[J]. 计算机科学 2016(S1)
    • [12].动态加权蛋白质相互作用网络构建及其应用研究[J]. 自动化学报 2015(11)
    • [13].双分子荧光互补在蛋白质相互作用中的应用[J]. 湖北医药学院学报 2014(02)
    • [14].蛋白质相互作用网络演化模型研究进展[J]. 计算机应用 2013(03)
    • [15].通过液质联用鉴定蛋白质相互作用方法的建立[J]. 首都医科大学学报 2013(03)
    • [16].基于组合特征集成的蛋白质相互作用位点预测[J]. 济南大学学报(自然科学版) 2012(01)
    • [17].蛋白质相互作用网络分析的图聚类方法研究进展[J]. 计算机工程与科学 2012(01)
    • [18].荧光共振能量转移动态检测蛋白质相互作用的研究进展[J]. 济宁医学院学报 2012(01)
    • [19].糖-蛋白质相互作用在酶固定及蛋白质识别与分离中的应用[J]. 中国生物工程杂志 2012(04)
    • [20].蛋白质相互作用网络研究的引文分析[J]. 中华医学图书情报杂志 2012(04)
    • [21].蛋白质相互作用预测方法研究进展[J]. 计算机光盘软件与应用 2012(18)
    • [22].蛋白质相互作用研究进展[J]. 生物学通报 2012(11)
    • [23].基于图聚类的蛋白质相互作用网络功能模块探测[J]. 食品与生物技术学报 2011(01)
    • [24].随机抽样对蛋白质相互作用网络度分布的影响[J]. 生物信息学 2011(03)
    • [25].蛋白质相互作用网络的相似子网搜索问题研究[J]. 计算机工程与应用 2010(03)
    • [26].一类蛋白质相互作用网络比对的线性规划算法[J]. 生物物理学报 2010(01)
    • [27].基于多窗口不同特征的蛋白质相互作用位点预测[J]. 安徽大学学报(自然科学版) 2010(05)
    • [28].数据来源对蛋白质相互作用网络度分布的影响[J]. 生物数学学报 2010(04)
    • [29].蛋白质相互作用网络进化分析研究进展[J]. 生物化学与生物物理进展 2009(01)
    • [30].蛋白质相互作用网络的几种聚类方法综述[J]. 国防科技大学学报 2009(04)

    标签:;  ;  ;  ;  ;  

    基于序列分段近邻编码的蛋白质热点残基预测方法研究
    下载Doc文档

    猜你喜欢