基于网络嵌入的蛋白质复合物识别研究

基于网络嵌入的蛋白质复合物识别研究

论文摘要

从蛋白质-蛋白质相互作用(Protein-protein Interaction,PPI)网络中识别蛋白质复合物是目前蛋白质组学中最重要的任务之一。大部分传统的利用计算方法的蛋白质复合物识别方法都是通过在PPI网络中挖掘稠密子图作为最终识别的蛋白质复合物。由于PPI网络存在假阳性率和假阴性率的缺点,研究人员开始试图利用生物信息来提高预测蛋白质复合物的质量。然而,如何将不同类型的生物信息整合到复合物识别过程中对研究人员来说仍然是一个挑战。近年来,网络嵌入方法由于良好的信息保持效果被广泛应用于各种网络学习任务中。因此,本文提出了基于生物属性网络嵌入方法的蛋白质复合物识别算法GANE。GANE算法首先利用网络嵌入获得蛋白质的向量表示并重新计算蛋白质对之间的相互作用强度,后续基于蛋白质复合物的结构特性进行聚类识别出最终的蛋白质复合物。GANE算法提供了一个统一的框架将各种生物信息整合到识别过程中。在GANE算法的基础上,为了克服现有网络嵌入方法存在的无法同时保存网络全局、局部结构信息和节点属性信息的缺点。本文提出一种新型网络嵌入算法,并将该算法应用于本文提出的蛋白质复合物识别算法GLONE中。同样地,GLONE算法利用这种新型网络嵌入方法学习出蛋白质的向量表示并重新计算蛋白质对之间的相互作用强度,后续利用一种特殊的聚类方法识别出其中的蛋白质复合物。本文在五个国际上公开的蛋白质相互作用网络数据集上,与蛋白质复合物识别领域中六个经典的识别算法进行了一系列对比实验来验证本文提出的GANE算法以及GLONE算法的有效性。最终的实验结果表明GANE算法以及GLONE算法相比其他六种识别算法具有更高的准确性。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  •   1.1 蛋白质复合物识别概述
  •   1.2 国内外蛋白质复合物识别现状
  •     1.2.1 基于单纯PPI结构信息的蛋白质复合物识别方法
  •     1.2.2 融合生物信息资源的蛋白质复合物识别方法
  •   1.3 论文的研究内容
  •   1.4 论文的组织结构
  • 2 网络嵌入
  •   2.1 网络嵌入相关研究
  •     2.1.1 网络嵌入的任务
  •     2.1.2 基于网络结构的网络嵌入方法
  •     2.1.3 基于网络结构和外部信息的网络嵌入方法
  •   2.2 本章小结
  • 3 基于生物属性网络嵌入的蛋白质复合物识别算法
  •   3.1 基因本体数据
  •   3.2 GANE模型
  •     3.2.1 蛋白质的向量表示学习
  •     3.2.2 基于Core-Attachment结构信息聚类
  •   3.3 实验及结果分析
  •     3.3.1 实验数据
  •     3.3.2 评价标准
  •     3.3.3 性能评估
  •     3.3.4 参数调研
  •   3.4 本章小结
  • 4 基于全局信息网络嵌入的蛋白质复合物识别算法
  •   4.1 GLONE模型
  •     4.1.1 基于新型网络嵌入方法的蛋白质向量表示学习
  •     4.1.2 基于种子扩散机制聚类
  •   4.2 实验及结果分析
  •     4.2.1 实验数据
  •     4.2.2 评价指标
  •     4.2.3 性能评估
  •     4.2.4 参数调研
  •   4.3 本章小结
  • 结论
  • 参考文献
  • 攻读硕士学位期间发表学术论文情况
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 李堃

    导师: 徐博

    关键词: 蛋白质复合物识别,网络嵌入,蛋白质相互作用网络

    来源: 大连理工大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 生物学,计算机软件及计算机应用

    单位: 大连理工大学

    分类号: TP301.6;Q51

    DOI: 10.26991/d.cnki.gdllu.2019.000071

    总页数: 62

    文件大小: 4266K

    下载量: 39

    相关论文文献

    • [1].蛋白质复合物识别算法综述[J]. 长沙大学学报 2017(05)
    • [2].一种新的基于多数据源的蛋白质复合物识别算法[J]. 计算机与应用化学 2014(04)
    • [3].植物蛋白质复合物替代凡纳滨对虾饲料中鱼粉的研究[J]. 动物营养学报 2014(06)
    • [4].食疗菜里的硒客[J]. 食品与生活 2020(02)
    • [5].基于加权网络和局部适应度的蛋白质复合物识别算法[J]. 计算机应用研究 2018(08)
    • [6].基于遗传算法的蛋白质复合物识别算法[J]. 计算机科学与探索 2018(05)
    • [7].安捷伦将“思想领袖奖”授予Brandon Ruotolo和Kristina Hakansson博士[J]. 食品安全导刊 2018(16)
    • [8].蛋白质合成中的核糖核酸蛋白质复合物[J]. 生命科学 2010(02)
    • [9].蛋白质表面模块划分及其在结合位点预测中的应用[J]. 物理化学学报 2012(11)
    • [10].Blue Native PAGE电泳[J]. 生物产业技术 2008(05)
    • [11].CAPRI第32~37轮竞赛中蛋白质复合物结构的预测和评估[J]. 北京工业大学学报 2017(12)
    • [12].两优培九剑叶衰老过程光合膜功能及蛋白质复合物的变化[J]. 作物学报 2013(11)
    • [13].高CO_2浓度对春兰叶片叶绿素·叶绿素蛋白质复合物含量的影响[J]. 安徽农业科学 2011(24)
    • [14].水稻叶色突变体812HS蛋白质复合物和叶绿素合成特性的研究[J]. 江苏农业科学 2016(10)
    • [15].你的心头也有星辰大海——带你领略呼吸的奥秘[J]. 科学通报 2017(35)
    • [16].毛细管电泳-质谱联用技术及其在蛋白质组学中的应用[J]. 色谱 2020(10)
    • [17].姜老师信箱[J]. 中国生物工程杂志 2011(08)
    • [18].电喷雾质谱的非共价键蛋白质复合物研究[J]. 分析科学学报 2008(04)
    • [19].随机游走模型识别蛋白质网络复合物算法[J]. 上海电机学院学报 2014(06)
    • [20].SpiC/SsaM蛋白质复合物的原核表达及纯化[J]. 兰州大学学报(自然科学版) 2008(06)
    • [21].BN-PAGE在分析蛋白质中的应用[J]. 畜牧与饲料科学 2009(03)
    • [22].体外展示技术[J]. 生物医学工程学杂志 2009(06)
    • [23].AAA-蛋白家族在恶性肿瘤中功能的相关研究进展[J]. 中外医学研究 2020(09)
    • [24].微量元素与衰老和发病学说—孔氏学说(多因—元论综合调节学说)——微量元素与衰老、延缓衰老、癌肿、心血管疾病的发生机制与防治关键[J]. 国外医学(医学地理分册) 2011(03)
    • [25].化学热点:水分子中氧释放的秘密[J]. 科学观察 2013(01)
    • [26].最小生成树算法应用于蛋白质复合物识别实验设计[J]. 实验技术与管理 2020(05)
    • [27].2013年诺贝尔奖[J]. 求知导刊 2013(02)
    • [28].识读知识之间的关联,发展理性判断能力——评析2018年全国理综卷Ⅰ第2题[J]. 教学考试 2018(51)
    • [29].癌症免疫应答相关性研究[J]. 中国肿瘤临床与康复 2019(01)
    • [30].特别推荐[J]. 科学养鱼 2015(03)

    标签:;  ;  ;  

    基于网络嵌入的蛋白质复合物识别研究
    下载Doc文档

    猜你喜欢