单细胞数据的伪时间轨迹和调控网络推断研究

单细胞数据的伪时间轨迹和调控网络推断研究

论文摘要

近年来快速发展的单细胞测序技术可以在单次实验中同时测量数万个细胞数千个基因的表达量,产生了大量静态的单细胞快照数据,从而可以揭示出不同细胞间的微小差异。单细胞的规模性和复杂性使其成为了大数据研究的范例。如何从大规模异质单细胞数据集提取有效的生物信息,揭示基因之间隐藏的关联、交互和动态特性面临着重大挑战。对于单细胞数据的分析和处理已经成为了计算生物学的一个热门课题,有许多问题有待于解决和突破,受到了大量研究人员的关注。本文主要研究单细胞数据的伪时间轨迹推断以及基于伪时间轨迹的单细胞基因调控网络构建问题。通过识别单细胞的伪时间轨迹,为理解细胞行为和命运决定提供了全新的视角,为细胞发育的动力学机制提供了理论解释。通过构建基因调控网络,有助于从整体上了解不同基因的功能和基因之间的相互作用,更好地理解细胞内部的基因表达机制,促进疾病病理的研究。本文的主要研究工作如下:第一,我们开发了一个新的基于路标点构建单细胞伪时间轨迹的算法SCOUT。该方法首先通过局部线性嵌入降维算法将数据投影到一个低维空间。然后我们提出一种新的基于细胞密度寻找路标点的方法,可以比常规的基于聚类中心的方法找到更多的路标点,这样构建的最小生成树会更加稳健,从而减少了单细胞数据噪声的影响。此外我们提出基于阿波罗圆投影或者权重距离来计算单细胞伪时间,提高了伪时间轨迹推断算法的准确性。第二,我们开发了一个新的基于扩散传播的单细胞伪时间轨迹推断算法DTFLOW。该方法首先基于每个数据点及其邻近点的欧氏距离构建一个近邻图矩阵,然后利用高斯核函数将其转换为一个马尔可夫转移矩阵,这时可以通过重启随机游走算法将不同的数据点转化为同一概率空间的不同离散分布。接着利用巴氏系数可以构建一个巴氏核矩阵,并通过对数操作将其转换为一个新的核矩阵,基于该核矩阵进行降维和伪时间排序。我们提出的新方法一方面其降维过程采用了新的技巧,另一方面单细胞的伪时间排序不完全依赖于降维过程,大大减少了信息损失。我们同时提出一种新的基于已排序结果在近邻图上逆向搜索识别分支的方法,比较符合单细胞的分化过程。数据实验表明DTFLOW优于目前先进的伪时间轨迹算法。第三,我们设计了一个新的基于伪时间轨迹的的单细胞基因调控网络构建模型。假定通过伪时间轨迹推断算法已经得到了不同单细胞的伪时间排序。该模型通过一个自顶向下的方法和一个自底向上的方法来研究调控网络,即首先基于单细胞的伪时间推断基因调控网络的结构,然后构建一个微分方程来描述基因调控网络的动态特征。该过程考虑了单细胞基因调控的时间依赖性,实验结果表明其用于基因调控网络是一种非常有效的方法。综上所述,本文的研究为单细胞的数据分析问题提供了一个新的框架,并在该框架中实现了新的算法和模型,针对单细胞数据上的信息提取进行了有意义的探索和尝试,为今后的研究提供了思路。

论文目录

  • 摘要
  • Abstract
  • 导论
  •   一、选题背景与意义
  •   二、研究综述
  •   三、研究方法及内容结构
  •   四、研究创新之处
  • 第一章 核方法与降维
  •   第一节 核方法介绍
  •     一、核函数与核矩阵
  •     二、核构造
  •     三、巴氏核
  •   第二节 图结构
  •     一、近邻图搜索算法
  •     二、最小生成树和最短路径算法
  •   第三节 基于核方法的降维
  •     一、核主成分分析降维算法
  •     二、多维标度和等距特征映射降维算法
  •     三、局部线性嵌入降维算法
  •     四、扩散映射降维算法
  •     五、拉普拉斯特征映射降维算法
  •     六、DPT伪时间排序算法
  •   本章小结
  • 第二章 基于路标点的单细胞伪时间轨迹推断算法
  •   第一节 SCOUT算法实现
  •     一、路标点细胞选取
  •     二、基于阿波罗圆投影的伪时间轨迹排序
  •     三、基于权重距离的伪时间轨迹排序
  •     四、沿着伪时间的数据平滑
  •   第二节 实验结果分析
  •     一、模拟数据集
  •     二、人类胚胎干细胞数据集
  •     三、小鼠胚胎单细胞数据集
  •   本章小结
  • 第三章 基于扩散传播的单细胞伪时间轨迹推断算法
  •   第一节 DTFLOW算法实现
  •     一、马尔科夫转移矩阵构建
  •     二、巴氏核特征分解降维
  •     三、伪时间距离排序
  •     四、逆向搜索分支识别
  •   第二节 实验结果分析
  •     一、小鼠胚胎单细胞数据集
  •     二、小鼠骨髓祖细胞数据集
  •   第三节 关于巴氏核特征分解的进一步讨论
  •     一、新的可视化思路
  •     二、手写数字数据集
  •   本章小结
  • 第四章 基于伪时间轨迹的单细胞基因调控网络构建
  •   第一节 网络构建模型
  •     一、GENIE3网络推断
  •     二、微分方程数学建模
  •     三、近似贝叶斯计算拒绝采样估计模型参数
  •   第二节 实验结果分析
  •     一、小鼠胚胎早期造血干细胞q PCR数据集说明
  •     二、伪时间轨迹推断
  •     三、调控网络构建
  •     四、微分方程建模
  •   本章小结
  • 结论及展望
  •   一、主要结论
  •   二、研究不足与展望
  • 参考文献
  • 在读期间科研成果
  • 附录A 统计学三大相关性系数评估指标
  • 致谢
  • 文章来源

    类型: 博士论文

    作者: 魏江勇

    导师: 田天海

    关键词: 单细胞数据分析,伪时序轨迹推断,降维,流形学习,核方法,调控网络推断

    来源: 中南财经政法大学

    年度: 2019

    分类: 基础科学

    专业: 生物学

    单位: 中南财经政法大学

    分类号: Q811.4

    总页数: 124

    文件大小: 5792K

    下载量: 44

    相关论文文献

    • [1].国内政府调控网络舆论研究综述[J]. 才智 2011(35)
    • [2].miRNA及其调控网络与中医治病求本机制研究[J]. 中华中医药杂志 2012(11)
    • [3].结直肠癌相关miRNA及其信号通路调控网络综合分析[J]. 肿瘤综合治疗电子杂志 2020(02)
    • [4].肝组织选择性转录因子调控网络的构建[J]. 中国生物工程杂志 2008(S1)
    • [5].γ-氨基丁酸受体基因的系统性调控网络[J]. 深圳大学学报(理工版) 2015(02)
    • [6].政府调控网络舆论的法律责任——以“李刚门”事件为例[J]. 军事记者 2011(03)
    • [7].青春期的内分泌调控网络[J]. 生理科学进展 2014(04)
    • [8].2012年全国生物化学与分子生物学学术大会胜利召开[J]. 生命的化学 2012(05)
    • [9].研究构建可自组织细胞极化合成调控网络[J]. 中国医药科学 2012(20)
    • [10].MicroRNA参与下的p53调控网络[J]. 中国生物工程杂志 2010(11)
    • [11].基于microRNA共调控网络的microRNA调控机制研究[J]. 生物信息学 2012(04)
    • [12].Bta-miR-223靶基因及调控网络的生物信息学分析[J]. 畜牧兽医学报 2019(10)
    • [13].环境内分泌干扰物对性分化和性发育的神经内分泌调控网络的影响[J]. 环境与健康杂志 2012(08)
    • [14].p53/miR-34a调控网络在肿瘤中的作用[J]. 生命科学 2016(04)
    • [15].基于miRNA-mRNA调控网络的幽门螺杆菌感染相关病变分子机制研究[J]. 胃肠病学 2019(01)
    • [16].猪转录因子SOX2下游调控蛋白筛选及调控网络建立[J]. 东北农业大学学报 2019(06)
    • [17].基于Cytoscape的miRNA调控网络的构建与研究[J]. 中国医学装备 2018(10)
    • [18].基于XGBoost的基因静态数据调控网络推断方法[J]. 集成技术 2020(02)
    • [19].高通量测序筛选冠心病血瘀证相关lncRNA-miRNA-mRNA调控网络[J]. 中国实验方剂学杂志 2017(19)
    • [20].意大利蜜蜂幼虫肠道在球囊菌侵染前期的差异表达microRNA及其调控网络[J]. 中国农业科学 2019(01)
    • [21].HAUSP调控网络在肿瘤的研究进展[J]. 中国微侵袭神经外科杂志 2013(02)
    • [22].microRNA调控网络与肿瘤[J]. 生命科学 2010(07)
    • [23].先天性小耳畸形微小RNA综合调控网络的生物信息学分析[J]. 世界最新医学信息文摘 2019(51)
    • [24].意大利蜜蜂幼虫肠道发育过程中的差异表达microRNA及其调控网络[J]. 中国农业科学 2018(21)
    • [25].肝内胆管细胞癌与肝细胞癌miRNA相关级联调控网络及通路研究[J]. 现代生物医学进展 2018(02)
    • [26].乳腺癌致病microRNA调控网络的识别与生物信息学分析[J]. 生物技术通讯 2019(03)
    • [27].网络舆论与政府的引导调控[J]. 贵阳市委党校学报 2010(02)
    • [28].C-fos基因在麻醉中的功能分析及相关调控网络的构建[J]. 南昌大学学报(医学版) 2019(01)
    • [29].PTEN的ceRNA网络调控研究进展[J]. 医学研究杂志 2016(07)
    • [30].骨肉瘤miRNA分子共调控网络的构建[J]. 肿瘤防治研究 2017(09)

    标签:;  ;  ;  ;  ;  ;  

    单细胞数据的伪时间轨迹和调控网络推断研究
    下载Doc文档

    猜你喜欢