MultCausal:一种利用多组学数据推断causal基因的统一方法

MultCausal:一种利用多组学数据推断causal基因的统一方法

论文摘要

Causal基因的推断在理论和实践中都有重要意义,包括阐明生理过程尤其是人类疾病的机理,以及作物改良和疾病的治疗等,因此相应统计学方法的开发至关重要。现有的causal基因推断方法根据利用的数据类型和统计方法,大致可分三类:基于基因组的方法、基于其他组学数据和多组学数据的方法,以及基于网络的方法。方法繁杂多样,改进层出不穷,但仍然存在一些问题。一则这些方法无法同时形式化地容纳多种组学数据;二则这些方法并不孤立,但是这些方法间的联系并没有得到清楚阐释。鉴于此,本文开发了一个名为MultCausal的causal基因推断方法。主要思路是将多种组学数据以矩阵乘法的形式定义为设计矩阵Z,将Z矩阵带入线性模型运算求解,各基因P值取负对数,其相对大小即为causal基因的相对概率。为验证该方法的有效性,本文首先从现有三类方法中各选取一个代表(线性回归、GSMR、GeneRank),与MultCausal一起,在模拟数据和拟南芥开花时间数据集中加以比较。与三种方法相比,MultCausal效果有所提升,能够在控制假阳性率的同时保持较高的效力。随后本文探讨了MultCausal和三种方法的联系,形式上证明了MultCasual和线性模型、GSMR的等价性,并利用模拟证明了MultCausal和GeneRank的相关性。此外还从SVR的核技巧中得到的启发,将Z变成f(Z),显式地赋予设计矩阵非线性结构,从而提升了MultCausal的表现。

论文目录

  • 摘要
  • Abstract
  • 缩略词表
  • 1 前言
  •   1.1 基于基因型的causal基因推断方法
  •     1.1.1 混淆因素的控制
  •     1.1.2 Fine-mapping
  •     1.1.3 基于snp-set的GWAS
  •     1.1.4 基因型推断
  •     1.1.5 Meta分析
  •     1.1.6 贝叶斯方法
  •   1.2 基于其他组学数据和多组学数据的causal基因推断方法
  •     1.2.1 第一类方法
  •     1.2.2 第二类方法
  •     1.2.3 第三类方法
  •   1.3 基于网络的causal基因推断方法
  •     1.3.1 构造网络
  •     1.3.2 推断causal基因
  •   1.4 Mult Causal的目的与意义
  • 2 材料与方法
  •   2.1 实验步骤
  •   2.2 Mult Causal
  •   2.3 Mult Causal的实现
  •   2.4 模拟
  •     2.4.1 模型 1:causal模型
  •     2.4.2 模型 2:pleiotropy模型
  •     2.4.3 PPI矩阵模拟
  •   2.5 材料
  •   2.6 拟南芥数据集中Z矩阵的构造方式
  •   2.7 Mult Causal的比较对象
  • 3 结果与分析
  •   3.1 四种方法在模拟数据集中的效果比较
  •   3.2 四种方法在拟南芥开花时间数据集中的效果比较
  •   3.3 Mult Causal和TWAS的等价性
  •   3.4 Mult Causal和MR的等价性
  •   3.5 Mult Causal和基于网络的causal基因推断方法
  •   3.6 用核技巧扩展Mult Causal
  • 4 讨论
  •   4.1 Mult Causal生效的原因
  •   4.2 S矩阵的选择对Mult Causal的影响
  •   4.3 P矩阵的选择对Mult Causal的影响
  •   4.4 非线性结构对Mult Causal的影响
  •   4.5 Z矩阵的合理构造方式
  •   4.6 Gene Rank的有效性
  • 5 总结和展望
  •   5.1 总结
  •   5.2 展望
  • 参考文献
  • 附录一 各参数条件下各GSMR的效果比较
  • 附录二 各参数条件下各Gene Rank的效果比较
  • 附录三 各参数条件下各Mult Causal的效果比较
  • 1中效果的影响'>附录四 矩阵P的参数对Mult Causal在数据集d1中效果的影响
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 姜凌瀚

    导师: 张红雨

    关键词: 基因,多组学,统计遗传学

    来源: 华中农业大学

    年度: 2019

    分类: 基础科学

    专业: 生物学

    单位: 华中农业大学

    分类号: Q811.4

    DOI: 10.27158/d.cnki.ghznu.2019.000616

    总页数: 78

    文件大小: 3175K

    下载量: 48

    相关论文文献

    • [1].An Integrated Causal Path Identification Method[J]. Wuhan University Journal of Natural Sciences 2019(04)
    • [2].ICA Based Identification of Time-Varying Linear Causal Model[J]. Journal of Harbin Institute of Technology(New Series) 2019(04)
    • [3].Learning causality and causality-related learning:some recent progress[J]. National Science Review 2018(01)
    • [4].Causal inference and related statistical methods[J]. Baosteel Technical Research 2010(S1)
    • [5].LEARNING MULTIVARIATE TIME SERIES CAUSAL GRAPHS BASED ON CONDITIONAL MUTUAL INFORMATION[J]. Journal of Systems Science and Systems Engineering 2013(01)
    • [6].LEARNING CAUSAL GRAPHS OF NONLINEAR STRUCTURAL VECTOR AUTOREGRESSIVE MODEL USING INFORMATION THEORY CRITERIA[J]. Journal of Systems Science & Complexity 2014(06)
    • [7].含causal算子分数阶非线性微分方程的拟线性方法[J]. 河北大学学报(自然科学版) 2012(01)
    • [8].Windowing and Gapping in Imperative Sentences: on the Basis of Talmy's"Causal-chain Windowing"Approach[J]. 海外英语 2013(12)
    • [9].用扩充的因果网来识别随机干预的因果效应(英文)[J]. 应用概率统计 2012(06)
    • [10].CONDITIONS FOR UNIFORMLY NON-CONFOUNDING OF CAUSAL DISTRIBUTION EFFECTS OVER MULTIPLE COVARIATES[J]. Journal of Systems Science & Complexity 2010(04)
    • [11].Causal Inference in Graph-Text Constellations:Designing Verbally Annotated Graphs[J]. Tsinghua Science and Technology 2011(01)
    • [12].Comparison of BBFs Observed by Single and Multi Satellites[J]. 空间科学学报 2010(04)
    • [13].Expression quantitative trait analyses to identify causal genetic variants for type 2 diabetes susceptibility[J]. World Journal of Diabetes 2014(02)
    • [14].Bivariate association analysis for quantitative traits using generalized estimation equation[J]. 遗传学报 2009(12)
    • [15].Observed communication between oncologists and patients:A causal model of communication competence[J]. World Journal of Meta-Analysis 2014(04)
    • [16].Comparison of dimension reduction-based logistic regression models for case-control genome-wide association study:principal components analysis vs.partial least squares[J]. The Journal of Biomedical Research 2015(04)
    • [17].Some Properties of Causal Linear Time-Invariant(LTI) Operators on the Weighted ?_2 Space[J]. Journal of Mathematical Research with Applications 2015(06)
    • [18].Diabetes,insulin and cancer risk[J]. World Journal of Diabetes 2012(04)
    • [19].Gummosis Disease of Mango and Its Control[J]. Chinese Forestry Science and Technology 2012(04)
    • [20].Statistical Analysis and Evaluation of Macroeconomic Policies: A Selective Review[J]. Applied Mathematics:A Journal of Chinese Universities 2020(01)
    • [21].Multi-agent modeling and analysis of EV users' travel willingness based on an integrated causal/statistical/behavioral model[J]. Journal of Modern Power Systems and Clean Energy 2018(06)
    • [22].The stationarity and invertibility of a class of nonlinear ARMA models[J]. Science China(Mathematics) 2011(03)
    • [23].Disease Biomarkers for Precision Medicine:Challenges and Future Opportunities[J]. Genomics,Proteomics & Bioinformatics 2017(02)
    • [24].Is diabetes a causal agent for colorectal cancer? Pathophysiological and molecular mechanisms[J]. World Journal of Gastroenterology 2011(04)
    • [25].如何解读机器知识[J]. Engineering 2020(03)
    • [26].The causal sequence investigation of the ring current ion-flux increasing and the magnetotail ion injection during a major storm[J]. Science China(Earth Sciences) 2016(01)
    • [27].Adapting to International System Change[J]. Contemporary International Relations 2014(04)
    • [28].Learning Dynamic Causal Relationships Among Sugar Prices[J]. Acta Mathematicae Applicatae Sinica 2017(03)
    • [29].Nerve growth factor,sphingomyelins,and sensitization in sensory neurons[J]. 生理学报 2008(05)
    • [30].Examining the effect of speed, roadside features, and roadway geometry on crash experience along a rural corridor[J]. Journal of Modern Transportation 2014(02)

    标签:;  ;  ;  

    MultCausal:一种利用多组学数据推断causal基因的统一方法
    下载Doc文档

    猜你喜欢