基于稀疏表示的基因调控网络重构方法研究

基于稀疏表示的基因调控网络重构方法研究

论文摘要

进入21世纪以来,以高通量测序为代表的生物技术已经能够从生物系统水平上检测基因表达信号,这些生物数字信号的不断积累为数学、统计以及信号处理等领域的科研人员提供了新的研究素材和机遇。基于基因表达信号的分析逆向推测基因之间的表达调控关系,也就是基因调控网络重构,是计算生物学中的一项重要研究课题。在本文中,从基因调控调控网络的稀疏结构特性出发,利用信号处理领域中的稀疏表示理论,分析基因表达信号并重构基因调控网络。按照此思路,我们开发出了若干种基因调控网络重构方法。大体上讲,本文的研究工作和成果概括为下三个方面:(1)针对基因调控稀疏表示模型中的稀疏度超参数估计问题,将之转化为稀疏表示模型的选择问题。然后,通过赋予稀疏表示模型与其稀疏度呈正相关的先验概率,利用贝叶斯信息准则计算不同稀疏表示模型的后验概率,最后综合比较分析,选择误差最小、稀疏度最高的作为最优模型。这种利用稀疏度预估计思路的基因调控网络重构方法被命名为BicGSR。在模拟基因表达数据、真实的原核生物E.coli基因表达数据和真实的真核生物S.cerevisiae基因表达数据上,和多种当前的基因调控网络重构方法的对比实验表明,所提出的BicGSR方法相对其他方法具有较高的基因调控网络重构精度。特别地,BicLASSO不同于现有的固定稀疏度方法naLASSO,通过自适应地稀疏度估计,提高了基因调控网络重构准确度,说明了所提出的稀疏度预估计方法是有效的。(2)针对基因调控的稀疏表示模型中某些转录因子和基因的观测数据缺失问题,提出了基于稀疏字典学习的基因调控网络重构方法OURM。首先,它利用字典学习方法,通过分析基因表达值矩阵学习蕴含于基因表达值之下的隐含基因表达调控因子。然后,根据转录因子-隐含调控因子和隐含调控因子-基因的两种相互作用关系,逐对推测转录因子-基因的调控作用置信度。(3)针对基因表达数据的高噪声、小样本问题和基因表达调控机制的高度非线性特性,通过采用数据重采样策略、改进转录因子-基因调控作用置信度的计算方法,提高了基于字典学习的基因调控网络重构准确度,所提出方法命名为dlGRN。在模拟基因表达数据、真实原核生物大肠杆菌E.coli基因表达数据、真实真核生物S.cerevisiae基因表达数据和真实人类肺癌基因表达数据上,进行基因调控网络重构实验,实验结果说明了所提出方法相对当前基因调控网络重构方法在准确度和鲁棒性上的提高。此外,还进行了生物湿实验,验证了dlGRN预测的一对调控关系TFAP2C→EGFR。在siRNA诱导的TFAP2C基因表达敲减实验中,靶基因EGFR的在实验组中的表达值显著低于(p-值<0.01)对照组,说明转录因子TFAP2C调控基因EGFR表达的可能性很大。最后,还通过将DNA甲基化值替换dlGRN方法中的转录因子表达值替,分析肺癌组织中基因受DNA甲基化影响,发现人类肺癌组织中,大约60%基因的表达同DNA甲基化显著相关(p值<0.05),与现有生物结论吻合。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  •   1.1 论文研究背景及意义
  •     1.1.1 研究背景
  •     1.1.2 研究意义
  •   1.2 基因调控网络重构研究的发展和现状
  •     1.2.1 起源和发展
  •     1.2.2 标准数据库
  •     1.2.3 代表性方法
  •     1.2.4 当前存在的一些问题
  •   1.3 论文主要研究内容
  •   1.4 论文组织结构
  • 2 基于稀疏表示的基因调控网络重构相关工作
  •   2.1 基因调控网络相关生物学知识
  •     2.1.1 基因及其表达与调控网络
  •     2.1.2 基因调控网络重构
  •   2.2 稀疏表示理论简介
  •     2.2.1 稀疏表示理论的基本概念和数学模型
  •     2.2.2 基于稀疏表示的字典学习
  •   2.3 基于稀疏表示的基因调控网络重构
  •     2.3.1 基因调控网络的稀疏结构
  •     2.3.2 基因调控网络重构与稀疏表示
  •   2.4 本章小结
  • 3 基于稀疏度预估计的基因调控网络重构方法
  •   3.1 引言
  •   3.2 BicGSR方法
  •     3.2.1 BicGSR方法概述
  •     3.2.2 基因调控的稀疏线性回归模型
  •     3.2.3 贝叶斯信息准则与mBIC
  •     3.2.4 稀疏度估计
  •     3.2.5 实验数据集
  •     3.2.6 性能评估指标
  •   3.3 BicGSR实验结果分析
  •     3.3.1 模拟数据I上的实验结果
  •     3.3.2 模拟数据II上的实验结果
  •     3.3.3 真实模式生物基因表达数据上的实验结果
  •     3.3.4 不同重构算法运行时间比较
  •     3.3.5 mBIC对网络重构性能的提升
  •     3.3.6 稀疏度对网络重构新能的影响
  •   3.4 讨论和结论
  •   3.5 本章小结
  • 4 基于字典学习的基因调控网络重构方法
  •   4.1 引言
  •   4.2 OURM方法
  •     4.2.1 全局基因调控系统
  •     4.2.2 隐含调控因子学习
  •     4.2.3 基因调控关系推断
  •     4.2.4 重构性能评估指标
  •     4.2.5 软件获取
  •   4.3 OURM实验结果分析
  •     4.3.1 模拟数据I上的实验结果
  •     4.3.2 模拟数据II上的实验结果
  •     4.3.3 真实的模式生物数据上的实验结果
  •   4.4 讨论和结论
  •   4.5 本章小结
  • 5 融合字典学习和重采样的肺癌基因调控网络重构方法
  •   5.1 引言
  •   5.2 dlGRN方法
  •     5.2.1 dlGRN方法概览
  •     5.2.2 全局基因调控网络模型
  •     5.2.3 调控关系置信度计算
  •     5.2.4 小样本问题的解决思路
  •     5.2.5 性能评估指标
  •     5.2.6 五种数据集
  •     5.2.7 肿瘤细胞培养
  •     5.2.8 RNA提取和实时定量PCR
  •     5.2.9 软件获取
  •   5.3 dlGRN实验结果分析
  •     5.3.1 学习原子调控因子
  •     5.3.2 dlGRN方法的网络重构性能评估
  •     5.3.3 肺癌基因调控网络的拓扑特性分析
  •     5.3.4 前馈环结构分析
  •     5.3.5 肺癌热点基因EGFR的转录因子
  •     5.3.6 肺癌DNA甲基化调控分析
  •     5.3.7 不同类型生物基因调控系统复杂度比较
  •   5.4 讨论和结论
  •   5.5 本章小结
  • 6 总结和展望
  •   6.1 总结
  •   6.2 展望
  • 参考文献
  • 攻读博士期间科研成果
  • 致谢
  • 文章来源

    类型: 博士论文

    作者: 时明

    导师: 沈未名,种衍文

    关键词: 基因调控网络重构,稀疏网络,稀疏表示,字典学习

    来源: 武汉大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 生物学,电信技术

    单位: 武汉大学

    分类号: TN911.7;Q811.4

    总页数: 115

    文件大小: 5922K

    下载量: 34

    相关论文文献

    • [1].随机森林在基因调控网络推断上的比较与应用[J]. 中国卫生统计 2019(06)
    • [2].时滞基因调控网络的稳定性与分叉分析[J]. 三峡大学学报(自然科学版) 2018(04)
    • [3].具有变时滞的随机基因调控网络的指数稳定性分析(英文)[J]. 新疆大学学报(自然科学版) 2011(04)
    • [4].一种双层基因调控网络的构建方法[J]. 数字技术与应用 2019(02)
    • [5].具有单个时滞的基因调控网络的稳定性分析[J]. 河南理工大学学报(自然科学版) 2019(06)
    • [6].基于递归神经网络的基因调控网络稳定性分析[J]. 系统仿真学报 2012(12)
    • [7].布尔网络到离散时间马尔科夫模型的转换及性质研究——以大鼠干细胞基因调控网络为例[J]. 华东师范大学学报(自然科学版) 2018(01)
    • [8].贝叶斯方法的基因调控网络在医学领域的应用[J]. 自动化技术与应用 2018(03)
    • [9].基因调控网络中的癌症标记物预测方法[J]. 西安电子科技大学学报 2019(06)
    • [10].微分方程模型在基因调控网络构建中的应用[J]. 中国卫生统计 2008(01)
    • [11].基因调控网络中的“信息”概念——一种基于语境论的生物学信息认识[J]. 自然辩证法通讯 2018(05)
    • [12].金铁锁活性成分基因调控网络及其产物评价研究进展[J]. 中国民族民间医药 2014(05)
    • [13].基于基因调控网络的糖肾方治疗糖尿病肾病作用机理解析[J]. 中华中医药杂志 2018(04)
    • [14].部分转移概率缺失的时滞马尔可夫型基因调控网络稳定性分析[J]. 信息与控制 2015(06)
    • [15].SRY基因调控网络的研究进展[J]. 四川畜牧兽医 2010(08)
    • [16].基于最长控制链的基因调控网络可控性研究[J]. 计算机工程 2018(11)
    • [17].基于能量因子的基因调控网络重构[J]. 食品与生物技术学报 2010(01)
    • [18].分数阶基因调控网络的拉格朗日稳定性[J]. 武汉工程大学学报 2019(02)
    • [19].拟南芥成花关键基因调控网络研究进展[J]. 生物技术通报 2014(12)
    • [20].中国科学家发现决定稻米食用品质的基因调控网络[J]. 北京农业 2010(02)
    • [21].信息熵在基因调控网络构建中的应用[J]. 激光杂志 2008(01)
    • [22].用重采样和时延信息论构建基因调控网络[J]. 自动化技术与应用 2018(05)
    • [23].具有区间时变时滞随机基因调控网络的弱保守性的稳定性判据[J]. 黑龙江大学自然科学学报 2014(06)
    • [24].p53基因调控网络研究进展[J]. 重庆工商大学学报(自然科学版) 2008(05)
    • [25].随机基因调控网络的指数稳定性[J]. 宁夏大学学报(自然科学版) 2017(04)
    • [26].全局基因调控网络构建CPU/GPU并行算法[J]. 小型微型计算机系统 2015(02)
    • [27].基于数据集成的基因调控网络构建[J]. 计算机工程 2012(22)
    • [28].泌乳分子机制及基因调控网络[J]. 生物技术通报 2014(01)
    • [29].人CD8~+T细胞基因调控网络研究[J]. 西北农业学报 2019(06)
    • [30].AP数据源融合算法构建基因调控网络[J]. 吉林大学学报(理学版) 2019(05)

    标签:;  ;  ;  ;  

    基于稀疏表示的基因调控网络重构方法研究
    下载Doc文档

    猜你喜欢