基因变异间的因果关系发现方法研究

基因变异间的因果关系发现方法研究

论文摘要

高通量测序技术的成熟和普及使得基因测序数据海量产生,如何从这些数据中挖掘出充分的信息是生物信息学的热点和难点。生物信息学中,基因变异间的相互作用一直是全基因组关联分析的难点,其相关研究成果也必将会对人类社会带来冲击。对基因变异间的因果关系进行研究是合理应用相关科研成果和做好相关问题防范所不可或缺的一环。关于基因变异间的相互作用的研究,目前多数是在相关关系的层面进行的,容易引入假阳性。本文则从因果关系的角度切入,基于WTCCC(Wellcome Trust Case Control Consortium)的数据,分别从基因粒度和SNP(Single Nucleotide Polymorphism,简记为SNP)粒度的数据设计因果关系发现算法,提出了基因变异间的因果关系发现算法和非对称因果关联规则发现算法,展开了基因变异间的因果关系发现问题的研究。通过构建因果网络来描述基因变异间的因果关系,检测出两种粒度的数据中所隐含的有向结构关系,该方法发现了数据之间的有向结构,其不对称性揭示了基因变异间的因果关系。在基因变异间的因果关系发现算法中,根据一个基因包含了多个SNPs位点的实际情况,对WTCCC研究机构的SNPs数据进行编码处理,把同属一个基因的多个SNPs数据编码为离散型的基因粒度数据。在进行因果关系发现时,选出一个目标基因,遍历其他的基因,经过条件独立性检验遴选出跟目标基因直接相互作用的备选基因,并通过算法的后向阶段把冗余的非直接互作用基因剔除,以减少因第一类错误而引入的基因,提高了因果关系检测结果的可靠性,最后根据汇连结构在条件独立性上的特性识别出了备选基因和目标基因之间的结构,进而推出其因果关系。实验结果检测出了一批因果性较强的基因变异,可以给相关的生化研究提供参考。针对SNP粒度数据提出了非对称因果关联规则发现算法,把关联规则挖掘和VStructure结合起来,检测数据中的因果结构。首先基于信息论提出了V-Structure Measure(VSM)以度量变量间的结构关系和基本的汇连结构的匹配程度,并把该指标推广到了更一般的多对多情形中,然后针对对称性情况给出了非对称因果关联规则发现算法(ASymmetric Causal Association Rule Discovery,简记为ASCARD)的具体流程,并在模拟数据上分别使用ASCARD方法和现有方法进行检测,证明了ASCARD方法的有效性。最后在WTCCC的真实SNPs数据集上使用ASCARD方法检测。实验结果检测出了不同基因上的SNPs之间的因果性。结合相关研究,文章也对部分实验结果从生物学的角度进行了可能的解释和一个可供参考的研究提议。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  •   1.1 研究背景及意义
  •   1.2 国内外研究现状
  •   1.3 本文主要工作
  •   1.4 论文组织框架
  • 第二章 相关理论和技术原理
  •   2.1 因果性和相关性
  •   2.2 因果网络中的独立性和相关性
  •     2.2.1 因果网络
  •     2.2.2 独立性与不相关性
  •     2.2.3 独立性的图表示
  • 2检验'>    2.2.4 G2检验
  •   2.3 关联规则挖掘
  •   2.4 基因变异、SNP和信号通路
  •   2.5 本章小结
  • 第三章 数据准备
  •   3.1 数据背景
  •   3.2 数据提取与划分
  •   3.3 基因与SNPs
  •   3.4 本章小结
  • 第四章 基因变异间的因果关系发现算法及实验
  •   4.1 研究动机及问题描述
  •   4.2 算法原理及流程
  •   4.3 实验结果及分析
  •   4.4 本章小结
  • 第五章 非对称因果关联规则发现算法及实验
  •   5.1 研究动机及问题描述
  •   5.2 算法原理及流程
  •     5.2.1 SNPs的 V-Structure
  •     5.2.2 度量指标VSM
  •     5.2.3 算法流程
  •   5.3 实验结果及分析
  •     5.3.1 模拟数据实验
  •     5.3.2 真实数据实验
  •   5.4 本章小结
  • 总结与展望
  • 参考文献
  • 攻读学位期间发表的论文
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 甄启祺

    导师: 蔡瑞初

    关键词: 因果关系,基因变异,单核苷酸多态性,条件独立性检验,非对称因果关联规则发现

    来源: 广东工业大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 生物学,计算机软件及计算机应用

    单位: 广东工业大学

    分类号: Q811.4;TP311.13

    DOI: 10.27029/d.cnki.ggdgu.2019.000364

    总页数: 60

    文件大小: 2068K

    下载量: 31

    相关论文文献

    • [1].基于图注意力网络的因果关系抽取[J]. 计算机研究与发展 2020(01)
    • [2].事实因果关系不明侵权中比例因果关系的确定[J]. 法学家 2020(02)
    • [3].用思维导图巧析“因果关系”助力学生科学思维能力的培养[J]. 生物学通报 2020(05)
    • [4].特殊体质案件中的因果关系[J]. 公民与法(综合版) 2018(11)
    • [5].论可预见性规则在我国食品侵权因果关系认定中的适用[J]. 法制与经济 2019(05)
    • [6].大数据时代的相关关系与因果关系探讨[J]. 科学咨询(科技·管理) 2019(09)
    • [7].论刑法替代因果关系的归责:理论基奠与事实根据[J]. 政治与法律 2019(09)
    • [8].交通事故“当事人责任”确定规则研究[J]. 安徽警官职业学院学报 2015(01)
    • [9].维吾尔语句际关系中因果关系的表达[J]. 喀什大学学报 2017(04)
    • [10].渎职犯罪因果关系的认定——以赖恒远滥用职权案为视角[J]. 法律适用(司法案例) 2017(20)
    • [11].论刑法中提前的因果关系与延后的因果关系[J]. 传播力研究 2018(14)
    • [12].浅析钢琴演奏系统中的因果关系[J]. 艺术评鉴 2018(15)
    • [13].侵权法因果关系的要素分析[J]. 法制博览 2017(18)
    • [14].否定性因果关系是真正的因果关系吗?[J]. 科学技术哲学研究 2017(05)
    • [15].山西省民间金融与经济增长的因果关系检验[J]. 科技和产业 2017(09)
    • [16].环境侵权中的因果关系推定[J]. 法制博览 2015(36)
    • [17].不作为因果关系的理论流变与研究进路[J]. 法律科学(西北政法大学学报) 2016(01)
    • [18].环境侵权因果关系推定的法律适用[J]. 科技展望 2015(28)
    • [19].办理环境污染犯罪中疫学因果关系的应用[J]. 中国检察官 2016(04)
    • [20].网言网语·因果[J]. 咬文嚼字 2015(05)
    • [21].疫学因果关系在环境保护中的适用[J]. 商 2015(14)
    • [22].相当因果关系说与条件说之比较[J]. 法制博览 2015(28)
    • [23].也论虚假陈述民事案件系统风险的认定与扣减——以因果关系证明的回归为讨论中心[J]. 证券法苑 2019(03)
    • [24].侵权法中相当因果关系的再定位[J]. 南京大学法律评论 2019(02)
    • [25].MapInfo在地理因果关系知识教学中的运用[J]. 地理教学 2017(12)
    • [26].本体论与本体教育(下)[J]. 中国教师 2017(02)
    • [27].假设因果关系的类型化研究[J]. 智富时代 2016(S1)
    • [28].课堂教学中对密歇根九级语言考试逻辑关系题解析[J]. 散文百家(新语文活页) 2016(12)
    • [29].议论文“说理逻辑”系列四 多重归因:寻找立论的充分理由[J]. 少男少女 2016(02)
    • [30].记叙文中逻辑和因果关系的重要性及写作的改进[J]. 作文教学研究 2016(06)

    标签:;  ;  ;  ;  ;  

    基因变异间的因果关系发现方法研究
    下载Doc文档

    猜你喜欢