数据驱动的蛋白质互作用网络中复合体检测算法研究

数据驱动的蛋白质互作用网络中复合体检测算法研究

论文摘要

作为生物信息学的研究热点之一,蛋白质相互作用网络中的复合体检测不仅对于关系数据分析、网络结构特征分析、生命活动探索等问题具有重要的科学研究意义,同时在蛋白质功能注释、疾病分析和药物设计等领域发挥着重要的应用价值.蛋白质相互作用网络中的复合体检测计算方法研究中,已有研究成果更多地从方法层面进行子图挖掘工作.随着复杂网络特征分析的发展和复合体特点的深入了解,蛋白质相互作用网络的小世界、无标度等复杂拓扑特征以及蛋白质复合体重叠性、小规模等特点,对蛋白质复合体检测算法提出了更多的挑战和要求,有待更加深入的研究.本文以数据为驱动来开展蛋白质相互作用网络中的复合体检测问题的研究.以数据为基础,针对蛋白质相互作用网络特征以及复合体特点,从不同的角度研究有效检测蛋白质复合体的算法,主要工作如下:(1)针对蛋白质复合体所具有的重叠性和小规模特点,提出了基于流模拟的复合体检测算法.该算法以网络流理论为基础,基于结点直接邻域信息给出了基于结构等价性的边容量和结点重要性度量方法,进而给出了流动源点的选择方法;从网络局部连边关系出发模拟了网络中的流动过程,使网络连通区域均能够获得来自不同源点的流量信息;参考信息传播中的线性阈值模型,设计了簇的判定条件.实验结果表明,该算法能够同时发现重叠簇和小规模簇,能够有效地进行蛋白质复合体检测,为流模拟思想在复合体检测算法设计中的实现提供了新的思路.(2)针对复合体的重叠特性,以及蛋白质相互作用网络中用于描述连边趋势的同配性特征,提出了基于网络同配性的复合体检测算法.该算法将结点重要性度量推广到结点的二阶邻域;通过引入网络同配性,实现了聚类过程中的多候选结点添加;为了评估重叠复合体预测结果的准确性,提出了一种簇之间重叠关系准确率评价指标.该算法建立了网络特征分析与网络模块发掘之间的联系.实验结果表明,基于网络同配性设计的复合体检测算法能够有效地进行重叠复合体检测.(3)针对复合体呈现出的中心稠密外围稀疏的结构特点,利用蛋白质相互作用网络中丰富的局部结构信息,提出了多信息融合的种子扩展复合体检测算法.该算法利用线性组合模型将多个网络结构信息进行加权融合,进而将结点重要性度量推广到结点的k-阶邻域子图;将概率模型用于种子选择,提高结构信息的有效利用,实现算法多样性;综合利用簇内密度与外围连边密度信息来刻画复合体中心稠密外围稀疏的结构特点.实验结果表明,新的种子扩展算法具有很好的复合体预测性能.(4)针对蛋白质相互作用网络所具有的小世界、无标度、聚集性等网络特征,提出了基于多网络特征的复合体检测算法.该算法通过相关性分析将网络特征引入到k-阶邻域子图内的结点重要性度量;结合无标度幂律分布和结点度信息,构建和分析了中心稠密外围稀疏的簇描述模型.多个网络特征信息的使用进一步增强了网络特征分析与网络模块发掘之间的联系.实验结果表明,所提出的算法能够很好地对蛋白质复合体进行检测.本文针对蛋白质相互作用网络特征以及复合体特点,结合复合体检测算法存在的缺陷与不足,提出了相应的复合体检测算法.研究工作既丰富了网络数据的分析方法,促进了计算机科学与生物学的结合与发展,又可以为关键蛋白质识别、功能注释、疾病分析等问题提供应用上的支持.

论文目录

  • 中文摘要
  • 英文摘要
  • 第一章 绪论
  •   1.1 研究背景及意义
  •   1.2 国内外研究现状
  •     1.2.1 基于划分的复合体检测算法
  •     1.2.2 基于流模拟的复合体检测算法
  •     1.2.3 基于种子扩展的复合体检测算法
  •     1.2.4 其他蛋白质复合体检测算法
  •   1.3 本文的研究思路与主要贡献
  •   1.4 本文的研究内容与组织结构
  • 第二章 基于流模拟的复合体检测算法
  •   2.1 研究动机
  •   2.2 相关术语
  •   2.3 基于流模拟的算法F-GCL
  •     2.3.1 边关联强度计算
  •     2.3.2 源点选择
  •     2.3.3 簇的发现
  •     2.3.4 算法描述及复杂度分析
  •   2.4 实验与结果分析
  •     2.4.1 数据与评价指标
  •     2.4.2 结果分析
  •   2.5 本章小结
  • 第三章 基于网络同配性的复合体检测算法
  •   3.1 研究动机
  •   3.2 相关术语
  •   3.3 基于网络同配性的算法PCDBA
  •     3.3.1 基于二阶邻域信息的种子选择
  •     3.3.2 多候选结点的簇扩展
  •     3.3.3 算法描述及复杂度分析
  •   3.4 实验与结果分析
  •     3.4.1 数据与评价指标
  •     3.4.2 算法参数分析
  •     3.4.3 聚集系数度量方法有效性
  •     3.4.4 与其它复合体检测算法的比较
  •   3.5 本章小结
  • 第四章 多信息融合的种子扩展复合体检测算法
  •   4.1 研究动机
  •   4.2 相关术语
  •   4.3 多信息融合的中心扩展算法SEGC
  •     4.3.1 多信息融合的结点加权
  •     4.3.2 基于概率模型的种子选择
  •     4.3.3 多信息融合的簇扩展
  •     4.3.4 算法描述及复杂度分析
  •   4.4 实验与结果分析
  •     4.4.1 数据与评价指标
  •     4.4.2 算法参数分析
  •     4.4.3 多信息融合与概率模型的有效性
  •     4.4.4 与其它复合体检测算法的比较
  •     4.4.5 算法稳定性分析
  •     4.4.6 预测的复合体实例
  •   4.5 本章小结
  • 第五章 基于多网络特征的复合体检测算法
  •   5.1 研究动机
  •   5.2 相关术语
  •   5.3 基于多网络特征的算法HGCA
  •     5.3.1 基于多网络特征的种子结点选择
  •     5.3.2 簇的描述模型
  •     5.3.3 算法描述及复杂度分析
  •   5.4 实验与结果分析
  •     5.4.1 数据与评价指标
  •     5.4.2 算法参数分析
  •     5.4.3 种子选择方法的有效性
  •     5.4.4 与其它复合体检测算法的比较
  •   5.5 本章小结
  • 第六章 总结与展望
  • 参考文献
  • 攻读博士学位期间取得的研究成果
  • 致谢
  • 个人简况及联系方式
  • 文章来源

    类型: 博士论文

    作者: 王杰

    导师: 梁吉业

    关键词: 蛋白质相互作用网络,复合体检测,图聚类,流模拟,种子扩展方法,网络拓扑信息,网络特征

    来源: 山西大学

    年度: 2019

    分类: 基础科学

    专业: 数学,生物学

    单位: 山西大学

    分类号: Q51;O157.5

    总页数: 133

    文件大小: 5257K

    下载量: 71

    相关论文文献

    • [1].国内小句复合体研究综述[J]. 外语艺术教育研究 2009(04)
    • [2].国际社会自发性协调与机制复合体研究——以可持续发展标准领域的机制为例[J]. 国际关系研究 2019(06)
    • [3].不同语篇体裁中投射型小句复合体浅析[J]. 长江大学学报(社科版) 2013(07)
    • [4].胞泌复合体在植物中的功能研究进展[J]. 植物学报 2019(05)
    • [5].限定性视角下的小句复合体与复句之差异研究[J]. 外语教学 2015(04)
    • [6].线粒体呼吸链复合体Ⅰ[J]. 中国细胞生物学学报 2014(08)
    • [7].高分子立构复合体的研究进展[J]. 青岛科技大学学报(自然科学版) 2016(03)
    • [8].东北亚“安全复合体”观点的多维透视[J]. 理论月刊 2011(05)
    • [9].派酶-土壤-黑麦草根系复合体抗剪强度试验研究[J]. 中国农学通报 2010(24)
    • [10].社会复合体:杭州“和谐创业”模式的新型组织结构[J]. 城市发展研究 2009(12)
    • [11].根土复合体原位剪切试验装置研发及应用[J]. 公路交通科技(应用技术版) 2017(07)
    • [12].低价、稀缺复合体 争议下的余杭“首席”——金顺·锦绣时代看房[J]. 楼市 2010(14)
    • [13].土壤胶散复合体的研究进展[J]. 吉林农业科学 2011(01)
    • [14].英汉扩展小句复合体的语义对比[J]. 佳木斯教育学院学报 2010(05)
    • [15].英汉扩展小句复合体的语义对比[J]. 佳木斯教育学院学报 2010(06)
    • [16].三角纤维软骨复合体损伤的诊治进展[J]. 外科研究与新技术 2017(02)
    • [17].退化草地复合体力学特性与影响因素研究[J]. 农业机械学报 2016(04)
    • [18].拓扑学视角下的小句复合体研究[J]. 现代外语 2016(03)
    • [19].腐殖酸-高岭土复合体形成机制及对三氯乙烯的吸附[J]. 环境科学 2015(01)
    • [20].关于投射型小句复合体的两个疑问[J]. 青春岁月 2011(06)
    • [21].极性复合体与紧密连接[J]. 医学研究杂志 2017(06)
    • [22].根土复合体的抗剪特性研究[J]. 灌溉排水学报 2016(03)
    • [23].小句复合体理论框架内的语篇分析[J]. 桂林航天工业高等专科学校学报 2011(01)
    • [24].河流底泥胶散复合体研究进展[J]. 吉林农业科学 2010(03)
    • [25].南亚安全复合体的变化与前景[J]. 东南亚南亚研究 2009(03)
    • [26].快剪条件下沙柳和白沙蒿根~土复合体抗剪特性初探[J]. 内蒙古水利 2008(05)
    • [27].膝关节后外侧复合体损伤的研究进展[J]. 内蒙古医学杂志 2020(05)
    • [28].石英砂-腐殖酸-Cupriavidus gilardii CR3复合体对铜离子的吸附特性及机理研究[J]. 安徽农业科学 2017(09)
    • [29].多花木蓝根-土复合体抗剪强度试验研究[J]. 长江科学院院报 2014(04)
    • [30].符号重构视角下的图像复合体功能分析——以英语沙龙杂志为例[J]. 外国语文 2014(01)

    标签:;  ;  ;  ;  ;  ;  ;  

    数据驱动的蛋白质互作用网络中复合体检测算法研究
    下载Doc文档

    猜你喜欢