基于高通量数据的增强子及其作用位点预测方法

基于高通量数据的增强子及其作用位点预测方法

论文摘要

对于多细胞真核生物来说,细胞的特异性功能是十分重要的。这就要求在相同遗传物质的基础上,细胞能够通过不同的基因表达模式来适应环境的变化。基因表达调控的因素有很多,近年来随着对基因组非编码区的研究,发现了一些非编码的DNA序列对于基因表达调控具有重要意义。增强子是对基因表达调控具有重要作用的非编码序列元件之一。一些增强子能够通过转录产生具有调控功能的RNA,也被称为增强子RNA(enhancerRNA,简称eRNA)。因此对于增强子的序列特征、作用位点以及在特定时间和特定组织中表达模式的研究成为了基因表达调控领域的一个重要问题。然而由于增强子的调控模式会受到时空特异性等因素的影响,因此对于组织特异性增强子的研究,尤其是与疾病相关的研究一直是近年来增强子相关研究的重点问题。随着高通量测序技术的发展,生物学数据实现了爆发式的增长,同时也使得通过计算学方法应用这些数据大规模分析增强子的功能成为可能。而已有的生物信息学研究对于现有的数据利用不足或者无法满足预测精度的需求。针对现有的增强子预测及分析方法中存在的问题,本文首先对增强子进行了生物特征分析,在此基础上提出了增强子的预测方法。进一步地,通过对全基因组SNPs数据进行分析,提出了基于SNPs数据的肝癌相关增强子的预测方法。最后,提出了基于随机森林的增强子作用位点预测方法。本文的主要内容包括以下四个部分:(1)使用生物特征来预测增强子一直是一个热点问题,已有的生物信息学方法只应用了一种或几种特征来预测增强子,忽视了其它特征对于表征增强子的作用。本文则充分考虑与增强子相关的多种生物特征,包括:序列特征,转录特征和表观遗传特征。通过对每种特征进行量化处理来分析不同特征在增强子预测中的重要程度。最后说明了分析结果的合理性。(2)已有的研究对于预测增强子的方法主要集中在实验手段和分析表达量差异的方式,这种方法难以实现高通量的预测或者预测精度较低。本文从与增强子相关的生物特征出发,基于后验概率贝叶斯分类模型对增强子进行预测。通过人类肝癌和正常组织中的表达数据,本文预测了人类基因组上与肝癌相关的增强子lncRNA。与其它预测增强子的方法相比,该模型具有更高的预测准确度。(3)与增强子相关的单核苷酸多态性(Single Nucleotide Polymorphism,简称SNP)等遗传突变在疾病的产生和发展过程中起了重要作用。这些遗传突变通过影响转录因子与增强子的结合程度对增强子的功能进行调控。因此可以应用SNPs数据对疾病相关的增强子进行预测。本文通过量化不同SNPs与增强子内部转录因子结合位点序列的结合程度,转化为SNPs对于增强子转录调控功能强弱的度量,构建与疾病相关增强子的预测模型。通过人类肝癌组织数据,本文对该模型进行了测试,验证了结果的合理性。(4)增强子对基因表达起调控作用主要体现在其与基因启动子区的相互作用上,因此有效的预测增强子与启动子的关联关系对于分析增强子的功能是十分重要的。目前应用计算学方法对增强子调控位点的预测正确率有限。因此,本文提出基于随机森林方法综合使用增强子区、启动子区和增强子与启动子间基因组区域的多种生物特征来预测增强子与启动子的关联关系。通过与其他预测方法相比,该模型具有更高的预测精度。

论文目录

  • 摘要
  • ABSTRACT
  • 第1章 绪论
  •   1.1 课题研究的背景及意义
  •     1.1.1 研究背景
  •     1.1.2 研究的目的与意义
  •   1.2 生物学相关背景知识
  •     1.2.1 基因的转录调控
  •     1.2.2 增强子
  •     1.2.3 单核苷酸多态性
  •     1.2.4 高通量生物数据
  •   1.3 研究现状
  •     1.3.1 增强子预测的研究现状
  •     1.3.2 增强子作用位点预测的研究现状
  •   1.4 存在的主要问题
  •   1.5 本文的主要内容
  • 第2章 增强子生物特征分析方法
  •   2.1 引言
  •   2.2 增强子生物特征分析方法设计
  •     2.2.1 增强子的生物特征分析
  •     2.2.2 增强子生物特征量化方法
  •     2.2.3 增强子生物特征显著性判别方法
  •     2.2.4 增强子生物特征重要性评估
  •   2.3 增强子生物特征分析实验结果与验证
  •     2.3.1 增强子相关生物特征数据来源及预处理
  •     2.3.2 基于信息增益的方法对特征进行重要性评估结果
  •     2.3.3 基于单一特征预测准确度对特征进行重要性评估结果
  •     2.3.4 增强子生物特征重要性评估实验结果合理性分析
  •   2.4 本章小结
  • 第3章 基于生物特征的增强子预测方法
  •   3.1 引言
  •   3.2 基于生物特征增强子预测的模型设计
  •     3.2.1 增强子相关生物特征集合的选取
  •     3.2.2 增强子RNA在正常和肝癌组织中的表达数据整理
  •     3.2.3 后验概率贝叶斯分类模型设计
  •     3.2.4 在人类基因组上预测肝癌相关增强子的位置
  •   3.3 基于生物特征增强子预测的结果与验证
  •     3.3.1 增强子相关生物特征数据来源及数据参考集的构建
  •     3.3.2 后验概率贝叶斯分类模型的预测性能及评价
  •     3.3.3 人类基因组上肝癌相关增强子的预测结果及评价
  •   3.4 本章小结
  • 第4章 基于SNPs数据的肝癌相关增强子预测方法
  •   4.1 引言
  •   4.2 基于SNPs数据的肝癌相关增强子预测模型设计
  •     4.2.1 肝癌相关SNPs集合的构建
  •     4.2.2 基于PWM的SNPs调控增强子转录模型设计
  •     4.2.3 肝癌相关致病风险增强子的预测
  •   4.3 基于SNPs数据的肝癌相关增强子预测结果与验证
  •     4.3.1 增强子、转录因子和与肝癌相关SNPs的数据来源及预处理
  •     4.3.2 肝癌相关增强子预测结果及评价
  •   4.4 本章小结
  • 第5章 基于随机森林的增强子作用位点预测方法
  •   5.1 引言
  •   5.2 基于随机森林的增强子作用位点预测模型设计
  •     5.2.1 增强子-启动子关联关系数据集的构建
  •     5.2.2 与增强子-启动子关联关系相关的生物特征分析
  •     5.2.3 基于随机森林的增强子-启动子关联关系预测模型设计
  •   5.3 基于随机森林的增强子作用位点预测结果与验证
  •     5.3.1 与增强子作用位点预测相关的数据来源及基本分析
  •     5.3.2 基于信息增益的方法对特征进行重要性评估结果
  •     5.3.3 增强子-启动子关联关系预测结果及评价
  •     5.3.4 肝癌数据集上预测增强子调控的基因
  •   5.4 本章小结
  • 结论
  • 参考文献
  • 攻读博士学位期间发表的论文及其它成果
  • 致谢
  • 个人简历
  • 文章来源

    类型: 博士论文

    作者: 章天骄

    导师: 王亚东

    关键词: 增强子,基因表达调控,转录因子结合位点,单核苷酸多态性,高通量数据

    来源: 哈尔滨工业大学

    年度: 2019

    分类: 基础科学

    专业: 生物学

    单位: 哈尔滨工业大学

    分类号: Q811.4

    DOI: 10.27061/d.cnki.ghgdu.2019.004970

    总页数: 125

    文件大小: 4578k

    相关论文文献

    • [1].生物信息学方法预测增强子及其作用位点综述[J]. 智能计算机与应用 2020(03)
    • [2].基于自相关函数的蛋白质-蛋白质作用位点预测研究[J]. 计算机与应用化学 2010(06)
    • [3].基于稳定体系的魔芋葡甘聚糖与卡拉胶作用位点的研究[J]. 食品科学技术学报 2014(05)
    • [4].玉米黑粉菌基因组编码蛋白作用位点的计算机预测[J]. 西南农业学报 2008(01)
    • [5].蛋白质-核酸复合物中氢键和范德华力作用位点偏好性分析[J]. 南京邮电大学学报(自然科学版) 2011(04)
    • [6].应用正交设计筛选hTERT基因siRNA最佳作用位点[J]. 广东医学 2011(12)
    • [7].α-synuclein蛋白与A-β肽和β-synuclein蛋白相互作用位点的预测[J]. 上海大学学报(自然科学版) 2012(02)
    • [8].美国科研人员确认首例苋菜藤子对除草剂6种作用位点存在抗性[J]. 农药 2018(07)
    • [9].蛋白质-核酸复合物氢键与范德华力作用位点分析[J]. 东南大学学报(自然科学版) 2011(04)
    • [10].HIF-1α调控Snail基因启动子活性及作用位点的鉴定[J]. 肿瘤学杂志 2016(11)
    • [11].基于最大熵模型的蛋白质作用位点识别方法[J]. 计算机工程 2010(18)
    • [12].HIV-1 Tat调控MCAK基因启动子活性及作用位点的鉴定[J]. 免疫学杂志 2011(03)
    • [13].Mo/γ-Al_2O_3催化剂中金属-载体相互作用位点的研究[J]. 石油炼制与化工 2018(11)
    • [14].“重组DNA分子的模拟操作”中的问题及修正[J]. 生物学教学 2008(02)
    • [15].碱基对AT/GC与组氨酸/天冬酰胺侧链间氢键作用的优势位点[J]. 辽宁师范大学学报(自然科学版) 2019(03)
    • [16].NMDA受体的作用位点研究[J]. 中国药理学与毒理学杂志 2019(06)
    • [17].甲型流感病毒PB1-PA蛋白作用位点的发现与分析[J]. 中山大学学报(自然科学版) 2011(02)
    • [18].褪黑激素对动物繁殖活动的影响及调控机理[J]. 特产研究 2014(01)
    • [19].定点突变技术鉴定弓形虫微线体蛋白6与醛缩酶的作用位点[J]. 中国寄生虫学与寄生虫病杂志 2014(03)
    • [20].miR-152对HLA-G的作用靶点预测与验证[J]. 现代肿瘤医学 2013(10)
    • [21].PRV SA株gB基因和EGFP基因在BHK细胞中的融合表达研究[J]. 黑龙江畜牧兽医 2019(11)
    • [22].含有α-胰凝乳蛋白酶作用位点的Cry3A突变体的构建、表达、纯化以及杀虫活性分析[J]. 中国农业科学 2011(07)
    • [23].流式细胞术联合共聚焦显微镜对G_2和M期作用位点的鉴别意义[J]. 中国实验血液学杂志 2009(04)
    • [24].4-羟基-3-甲氧基肉桂酸乙酯在拟南芥中的作用位点研究[J]. 华北农学报 2020(01)
    • [25].抗HCV治疗领域进展迅速,丙肝已经可以治愈[J]. 中国社区医师 2018(28)
    • [26].野生型和突变型荞麦蛋白酶抑制剂的活性比较及抗肿瘤功能分析[J]. 生物化学与生物物理进展 2010(06)
    • [27].犬瘟热病毒F蛋白单克隆抗体的制备及鉴定[J]. 安徽农业科学 2008(25)
    • [28].刚地弓形虫MIC2与醛缩酶作用位点的鉴定[J]. 中国人兽共患病学报 2014(07)
    • [29].微丝相关蛋白HSPC300/hHBRK1与肌球蛋白Ⅵ相互作用位点的计算机预测[J]. 上海大学学报(自然科学版) 2010(06)
    • [30].免疫共沉淀法测定14-3-3ε蛋白与Cdc25B的相互作用[J]. 山西医科大学学报 2019(07)

    标签:;  ;  ;  ;  ;  

    基于高通量数据的增强子及其作用位点预测方法
    下载Doc文档

    猜你喜欢