基于多尺度网络的高维生物医学数据整合与定量分析

基于多尺度网络的高维生物医学数据整合与定量分析

论文摘要

随着高通量生物技术的快速发展,使得生物医学领域产生了大量不同类型的组学数据。如何整合不同来源、不同尺度的高维组学数据去分析和研究复杂生物系统的生命活动规律和复杂疾病的内在机制是目前生物医学研究的一个热点和难点。本博士论文通过集成异源、多尺度的高通量组学数据,运用新的数学模型和优化算法,将复杂生物系统构建成多尺度生物网络模型。基于构建的多尺度生物网络模型,综合运用张量计算、线性控制、图论和统计学等理论,分别从单层网络、多层网络和时序多层网络三个不同的网络层次研究了多尺度网络的拓扑性质、网络中心性和网络控制等,以此来解决一些重要的科学问题。本论文的主要创新性工作有以下四个方面:1.基于共表达网络的数学建模与定量分析预测基因异构体的生物学功能。本文通过共表达网络的数学建模与定量分析,主要探索以下两个重要的科学问题:(i)对来源于同一个基因的不同基因异构体,识别出哪些异构体在功能上是类似的,哪些异构体在功能上是具有显著差异的;(ii)对来源于同一个基因的不同异构体的生物学功能进行预测。具体的分析思路和结果概述如下:首先,基于外显子表达谱数据,本文提出了两个新颖的矩阵相关性方法(MINet和RVNet方法)去构建共表达网络。具体来说,MINet方法是基于互信息矩阵的统计假设检验方法,而RVNet方法则将矩阵RV相关系数应用于定量评估两个基因(或异构体)的共表达关系。数值实验揭示,MINet方法在样本量充足和两个基因(或异构体)外显子数目相差非常大时具有较高的预测精度,而RVNet方法在小样本的情形下具有较好的性能。进一步,基于两个方法在构建共表达网络方面的优势,本文整合MINet和RVNet方法到一个统一的框架,命名为Iso-Net方法。其次,以人类骨髓分化过程中起重要作用的12个转录因子的109个基因异构体作为研究对象,运用Iso-Net方法构建了基因-异构体共表达网络。通过定义网络节点间的Jaccard相似系数等定量指标,本文一共识别了7个转录因子中总计21个特殊的基因异构体,它们在相应的细胞系中与同一个基因的其他异构体在共表达关系上具有显著的差异。同时,基于共表达网络中每个基因异构体连边的基因集合,通过GO功能富集分析对来源于同一个基因的不同异构体的生物学功能进行了预测。总之,数值实验结果揭示,本文的研究成果提供了一个通用框架去分析和预测基因异构体的生物学功能,对生物学家后续的实验分析和功能验证具有重要的指导意义。2.在张量计算框架下识别多层网络中的关键节点。基于多层网络的4阶邻接张量表示,本文提出了一个新的中心性指标:张量奇异向量中心性,用于定量评估多层网络中节点的重要性。首先,本文设计了一个张量迭代计算的算法去获得四个中心性指标,分别命名为节点的Hub和Authority中心性和网络层的Hub和Authority中心性,它们能够从不同的角度去评价多层网络的节点和层的重要性。其次,本文从理论上严格证明了,在一定的条件下,这四个中心性指标分别收敛于多层网络邻接张量的四个奇异向量。进一步,通过整合这四个指标,本文提出了张量奇异向量中心性去评价多层网络中节点的重要性。将上述指标运用于两个实际的癌症(胃癌和结肠癌)多层网络,以此来识别与两个癌症相关的关键致癌基因。实验结果表明,与现有的方法进行比较,本文提出的方法具有较高的预测精度和鲁棒性。这些研究成果提供了一个基于张量计算的中心性指标,为探究复杂疾病的致病基因和药物靶标的筛选提供了新的思路和工具。3.多尺度网络的可控性和控制能量研究。可控性理论在复杂生物网络中的广泛应用已经证实,研究生物网络的可控性可以从系统的角度揭示生物机制、识别药物靶点等许多关键的生理或医学问题,这对改善人类生活至关重要。本文分别从单层网络和多层网络两个不同的网络层次研究了多尺度网络的可控性和控制能量,其主要理论分析和数值模拟结果概述如下:对于单层网络,利用矩阵代数理论和图论的相关方法,本文首先研究了复杂网络控制能量标准的边界估计问题。通过理论推导揭示了控制不稳定的正规网络比控制相同规模的稳定正规网络消耗的能量代价要少。其次,结合理论分析和数值模拟发现,网络控制能量消耗与节点度呈现负相关关系,即控制节点集的度之和越大,实现完全可控所需要的能量消耗就越少。最后,基于上述结论,本文提出了一个多目标优化模型来实现网络的完全可控,该方法既保证了控制节点数目尽可能少,同时也要求控制所需的能量消耗尽可能的低。对于多层网络,本文系统地探讨了层间耦合强度和耦合方式对多层网络可控性和控制能量的影响。首先,结合理论推导和数值模拟分析揭示,层间耦合强度和控制能量呈近似线性关系,而耦合强度与网络可控性标准是一个分段函数关系。其次,通过数值实验分析揭示,层间度大的节点相连,是控制能量消耗最少的层间耦合方式,但却是网络可控性最低的层间耦合方式。这些研究结果为选择层间耦合强度和耦合方式以实现多层网络可控性最大化和控制能量成本最小化提供了有意义的理论和实践指导。4.整合时间和空间尺度的时序多层网络建模与定量分析。在实际生活中,大多数现实和工程系统,特别复杂生物网络系统,都是随着时间和空间尺度的变化而动态变化的。为了整合不同尺度的多维异构数据去分析复杂生物系统的生命活动规律和复杂疾病的内在机制,本文提出了一个一般化的网络模型:时序多层网络,它将网络拓扑结构随时间和空间变化的规律整合到一个统一框架来系统描述,提供了一个更加自然和合理的模型去描述现实世界的复杂系统。进一步地,本文引入5阶张量框架来表示时序多层网络,它简洁地表示了时序多层网络复杂的拓扑结构。在5阶张量表示的模型框架下,本文提出了一些重要的网络拓扑指标,包括重叠度、节点网络熵、度中心性相关系数和链路重叠等,以此来定量评估网络中节点和连边的异质性以及时序多层网络中层间的交互和依存关系。特别地,本文提出了两个基于张量迭代计算的方法去定义网络的两个中心性指标:TM-特征向量中心性和TM-PageRank中心性,以此来定量评估时序多层网络中节点的重要性,它们综合考虑了不同时间点和不同网络层中邻居节点的影响力。运用多元线性代数和矩阵分析的理论,本文严格证明了上述迭代公式的收敛性。将上述指标运用于两个实际的时序多层生物(流感和心脏病)网络,数值实验结果揭示,本文提出的中心性方法具有较高的预测精度、分辨率和收敛速度。

论文目录

  • 论文创新点
  • 摘要
  • ABSTRACT
  • 1 引言
  •   1.1 多维生物医学大数据简述
  •     1.1.1 生物医学大数据的特征
  •     1.1.2 多维高通量组学数据
  •   1.2 基于网络的生物医学研究简述
  •     1.2.1 网络生物学
  •     1.2.2 多尺度生物网络的数学模型
  •   1.3 生物网络系统的可控性研究简述
  •     1.3.1 线性系统的可控性理论
  •     1.3.2 多尺度生物网络的可控性研究
  •   1.4 张量理论及其在生物医学中的应用
  •     1.4.1 基于张量的应用研究简述
  •     1.4.2 张量理论及其在多尺度生物网络研究中的应用
  •   1.5 本文的主要研究工作及组织结构
  • 2 基于共表达网络的数学建模和定量分析预测基因异构体的生物学功能
  •   2.1 研究思路概述
  •   2.2 基于外显子组学数据构建共表达网络
  •     2.2.1 Iso-Net方法综述
  •     2.2.2 MINet方法的数学模型
  •     2.2.3 RVNet方法的数学模型
  •   2.3 共表达网络构建方法的性能评估
  •     2.3.1 模拟数据集的生成
  •     2.3.2 预测精度评估
  •     2.3.3 IsoNet方法:一个统一框架对于整合MINet和 RVNet方法
  •   2.4 基于共表达网络的定量分析预测基因异构体的生物学功能
  •     2.4.1 人类骨髓分化数据的收集与处理
  •     2.4.2 12个重要转录因子的基因异构体功能预测
  •   2.5 本章小结
  • 3 在张量计算框架下识别多层生物网络的关键节点
  •   3.1 研究思路概述
  •   3.2 多层癌症网络的构建
  •   3.3 多层网络的张量奇异向量中心性
  •     3.3.1 单层网络的HITS中心性
  •     3.3.2 基于张量计算的四个中心性指标及其收敛性分析
  •     3.3.3 张量奇异向量中心性的算法设计
  •   3.4数值实验
  •     3.4.1 预测精度评估
  •     3.4.2 收敛速度和运行时间分析
  •     3.4.3 鲁棒性分析
  •   3.5 本章小结
  • 4 多尺度生物网络的可控性和控制能量研究
  •   4.1 研究思路概述
  •   4.2 单层网络的控制能量评估和控制策略设计
  •     4.2.1 预备知识
  •     4.2.2 控制能量标准的边界估计
  •     4.2.3 节点度对控制能量的影响
  •     4.2.4 多目标优化的控制策略设计
  •   4.3 多层网络的可控性和控制能量研究
  •     4.3.1 预备知识
  •     4.3.2 层间耦合强度和耦合方式对可控性的影响
  •     4.3.3 层间耦合强度和耦合方式对控制能量的影响
  •   4.4 本章小结
  • 5 整合时间和空间尺度的时序多层生物网络建模及其定量分析
  •   5.1 研究思路概述
  •   5.2 时序多层网络的数学模型
  •   5.3 时序多层网络的张量表示和定量指标
  •     5.3.1 节点的重叠度和网络熵
  •     5.3.2 层间的度中心性相关系数和链路重叠
  •   5.4 时序多层网络的迭代优化中心性
  •     5.4.1 TM-特征向量中心性
  •     5.4.2 TM-PageRank中心性
  •   5.5 数值实验
  •     5.5.1 基于分辨率熵的性能评价
  •     5.5.2 关键基因的功能富集分析
  •     5.5.3 两种迭代优化中心性方法的收敛速度分析
  •   5.6 本章小结
  • 6 总结与展望
  •   6.1 全文总结
  •   6.2 进一步研究工作的展望
  • 附录 A 12个转录因子异构体功能分析的相关图形汇总
  • 附录 B 两个实际时序多层生物网络简述117参考文献
  • 参考文献
  • 攻博期间发表的科研成果目录
  • 致谢
  • 文章来源

    类型: 博士论文

    作者: 王定杰

    导师: 邹秀芬

    关键词: 生物医学,多维组学数据,多尺度网络,基因异构体,网络控制,网络中心性

    来源: 武汉大学

    年度: 2019

    分类: 基础科学,医药卫生科技

    专业: 数学,生物学,生物医学工程

    单位: 武汉大学

    分类号: R318;O157.5

    总页数: 148

    文件大小: 12480K

    下载量: 47

    相关论文文献

    • [1].基于物联网的智能家居系统网络层设计[J]. 沈阳建筑大学学报(自然科学版) 2017(04)
    • [2].考虑实时状态的网络层转发策略[J]. 计算机应用研究 2020(10)
    • [3].网络层设备性能测试方法概述[J]. 计算机科学 2015(S1)
    • [4].基于JXTA技术的P2P覆盖网络层的研究[J]. 长春大学学报 2014(04)
    • [5].面向智能电网的物联网网络层关键技术[J]. 吉林电力 2012(06)
    • [6].基于内容中心网络的5G高速移动通信网络架构研究[J]. 科技资讯 2019(14)
    • [7].异质依存网络衰退特征与关键节点辨识[J]. 自动化学报 2018(05)
    • [8].高密度多功能综合网络层结构[J]. 电子机械工程 2015(05)
    • [9].ZigBee网络层的设计与实现[J]. 无线电工程 2008(11)
    • [10].网络整体运行情况的分析及优化[J]. 人类工效学 2018(06)
    • [11].无线Ad hoc网络的安全性机制[J]. 保密科学技术 2018(06)
    • [12].一种加强网络服务器安全防护的方法[J]. 网信军民融合 2018(12)
    • [13].5G网络切片安全技术与发展分析[J]. 移动通信 2019(10)
    • [14].基于超网络的航空网络建模与特性分析[J]. 航空计算技术 2018(01)
    • [15].基于跨层级视角的网络惯例治理机理研究[J]. 管理评论 2018(08)
    • [16].未许可区块链的网络层内容[J]. 无线电通信技术 2018(06)
    • [17].5G网络切片管理架构设计探讨[J]. 移动通信 2018(10)
    • [18].虚拟化网络功能分解问题研究[J]. 电信快报 2019(09)
    • [19].基于MIMO OTA的多天线设备网络层性能测试[J]. 移动通信 2018(06)
    • [20].LINUX环境下的防火墙网络安全设计与实现[J]. 数码世界 2018(06)
    • [21].承钢网络中的安全风险与防范措施[J]. 承钢技术 2008(03)
    • [22].基于多层复杂网络理论的海洋货运网络的抗毁性研究[J]. 海洋通报 2018(06)
    • [23].浅析通信网络技术与智慧工地网络层建设[J]. 数字技术与应用 2019(04)
    • [24].浅谈网络空间测绘技术及其应用前景[J]. 网络安全技术与应用 2018(08)
    • [25].浅谈5G传输网络建设问题与解决对策[J]. 信息系统工程 2019(08)
    • [26].新时期5G网络的分析及思考[J]. 中国新通信 2018(03)
    • [27].从对抗视角审视网络空间[J]. 信息通信 2018(11)
    • [28].基于改进的区域候选网络的行人检测[J]. 南昌航空大学学报(自然科学版) 2018(02)
    • [29].TiWi-SL:2.4GHz WLAN解决方案[J]. 世界电子元器件 2012(04)
    • [30].社交密度对免疫效果的影响[J]. 广西物理 2020(Z1)

    标签:;  ;  ;  ;  ;  ;  

    基于多尺度网络的高维生物医学数据整合与定量分析
    下载Doc文档

    猜你喜欢