基于高通量测序数据的跨界sRNA数据分析方法研究

基于高通量测序数据的跨界sRNA数据分析方法研究

论文摘要

Small RNA(sRNAs)是一类长度在几十至几百个核苷酸之间的非编码小分子RNA,在生物体内通过和靶mRNA碱基互补配对结合进而调控基因表达,从而参与控制细胞的多种生物过程。最初,sRNA由于长度过小,很难被检测到。随着高通量测序技术的出现,越来越多的sRNA不断被发现,其作为调控基因表达的重要调节因子也逐渐成为生命科学研究的热点问题。现有研究证实sRNA在跨界调控中起着重要作用。由于sRNA的序列及结构与其进入宿主细胞的能力息息相关,因此从序列及结构方面对跨界sRNA进行数据分析,进而寻找并识别类似的跨界sRNA,不仅可以发掘sRNA序列及结构和功能的相关性,也对有效识别未知的跨界sRNA有重要意义。截止到目前,有关sRNA的研究主要集中在对sRNA的序列分析和靶基因功能识别方面,而对于跨界sRNA序列的研究还处于初期研究阶段,且均是针对特定物种进行研究。本文从生物计算入手,在研究常见RNA数据分析方法基础上,基于真菌和植物、植物和人体sRNA高通量数据提出了一种跨界sRNA数据分析方法。首先应用统计学方法分析跨界sRNA序列及结构信息,其次在对差异表达的跨界sRNA分析的基础上,识别出可能影响sRNA进入宿主细胞参与跨界调控的分子特征,构建基于机器学习的跨界sRNA识别模型,用来识别可能被宿主吸收的外源性sRNA,进而挖掘跨界sRNA可能存在的生物学意义及生物功能。本文首先收集真菌和植物、植物和人体sRNA数据并对其进行质量、剪切识别等一系列预处理;然后,应用机器学习方法对sRNA序列及结构特征进行选择构建特征子集,进而构建跨界sRNA识别模型,用来对能够进入宿主细胞的sRNA进行识别;最后,对模型进行评估,并对识别的跨界sRNA进行靶基因筛选、功能富集分析及基因相互作用关系挖掘,从而分析出其在生物系统中的功能。本文选用真菌和植物数据以及人类和植物sRNA数据作为实例分别用本文提出的数据分析方法进行研究,其中,对真菌和植物模型的正确率在84.5%,植物和人体正确率在78.2%。本文提出针对跨界sRNA高通量测序数据的分析方法为研究跨界sRNA进入宿主细胞的能力与其结构和特征间的关系提供了新的研究思路,为今后研究sRNA的跨界调控机制提供了新的研究方向,同时在农作物,药物和疾病等方面都有部分指导意义。

论文目录

  • 摘要
  • abstract
  • 第1章 绪论
  •   1.1 研究背景及意义
  •   1.2 国内外研究现状
  •   1.3 研究内容及工作
  •   1.4 论文结构
  • 第2章 sRNA调控机理
  •   2.1 sRNA分子概述及作用机制
  •   2.2 sRNA跨界调控基本机制
  •     2.2.1 真菌小分子RNA跨界调节宿主基因表达
  •     2.2.2 植物小分子RNA跨界调节动物基因表达
  •   2.3 高通量测序
  •   2.4 基因调控网络
  •   2.5 本章小结
  • 第3章 传统sRNA数据分析方法
  •   3.1 reads质控方法
  •   3.2 序列比对方法
  •   3.3 序列标准化
  •   3.4 靶基因预测及筛选
  •   3.5 基因功能分析
  •   3.6 本章小结
  • 第4章 跨界sRNA数据分析
  •   4.1 跨界sRNA序列及结构特征识别
  •   4.2 跨界sRNA模型构建算法选择
  •   4.3 基于随机森林和SVM的跨界sRNA特征筛选算法
  •   4.4 本章小结
  • 第5章 基于真菌、植物及人体sRNA跨界调控
  •   5.1 真菌和植物的sRNA数据分析
  •     5.1.1 sRNA数据集选取
  •     5.1.2 跨界sRNA模型训练
  •     5.1.3 模型评估
  •     5.1.4 生物学意义挖掘
  •   5.2 植物和人体的sRNA数据分析
  •     5.2.1 sRNA数据集选取
  •     5.2.2 模型训练及评估
  •     5.2.3 生物学意义挖掘
  •   5.3 本章小结
  • 第6章 总结与展望
  •   6.1 论文总结
  •   6.2 展望
  • 参考文献
  • 作者简介及在学期间所取得的科研成果
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 占萌苹

    导师: 张浩

    关键词: 高通量测序数据,序列及结构特征,机器学习

    来源: 吉林大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 生物学,自动化技术

    单位: 吉林大学

    分类号: TP181;Q811.4

    总页数: 62

    文件大小: 2846K

    下载量: 73

    相关论文文献

    • [1].并行数据库下的海量数据分析方法[J]. 中国新通信 2020(06)
    • [2].基于数据挖掘的金融数据分析方法[J]. 电子技术与软件工程 2020(06)
    • [3].交通大数据分析方法在大型活动交通协同中的研究与应用——以中国国际智能产业博览会实践为例[J]. 智能城市 2020(17)
    • [4].探讨基于并行数据库的海量数据分析方法[J]. 冶金管理 2019(17)
    • [5].大数据分析方法在量化评级中的应用探讨[J]. 时代金融 2016(33)
    • [6].大数据分析方法在防范保险欺诈中的应用[J]. 审计月刊 2016(11)
    • [7].数据分析方法一点通[J]. 数据 2013(12)
    • [8].基于数据血缘构建数据分析方法[J]. 中国新通信 2020(20)
    • [9].有限资源下的大数据分析方法(英文)[J]. 数据分析与知识发现 2017(09)
    • [10].天然气管网大数据分析方法及发展建议[J]. 油气储运 2020(10)
    • [11].大数据分析方法与关键技术研究[J]. 产业创新研究 2020(20)
    • [12].大数据分析方法及应用初探[J]. 科技资讯 2017(18)
    • [13].《数据分析方法与应用》课程的研究性教学探讨[J]. 中国科教创新导刊 2010(11)
    • [14].大数据时代数据分析方法概述[J]. 电脑知识与技术 2019(14)
    • [15].高速铁路无砟轨道精测数据分析方法探讨[J]. 高速铁路技术 2015(01)
    • [16].大数据分析方法在管理会计中的应用探索[J]. 中国总会计师 2015(03)
    • [17].基于主动维保的城轨列车停车精度数据分析方法研究[J]. 科技视界 2019(35)
    • [18].大数据分析方法在企业档案管理中的应用[J]. 黑龙江科技信息 2017(12)
    • [19].基于大数据分析方法的微博热点建模与预测[J]. 现代电子技术 2019(21)
    • [20].JMP、JMP Clinical新品发布暨先进数据分析方法研讨会盛大开幕[J]. 中国医药导刊 2011(04)
    • [21].基于密度聚类的网络性能故障大数据分析方法[J]. 电信科学 2020(09)
    • [22].大数据分析方法在企业档案管理中的应用[J]. 办公室业务 2019(18)
    • [23].运用关系型数据分析方法规划企业级IT系统模型[J]. 电信技术 2010(04)
    • [24].大数据分析方法在企业档案管理中的应用[J]. 智能城市 2019(21)
    • [25].环境监测过程中数据分析方法研究[J]. 节能 2018(01)
    • [26].基于数据分析方法的动力电池系统滥用故障诊断[J]. 新能源进展 2020(01)
    • [27].一种应用于轨道自动测量车的组合传感器的数据分析方法[J]. 传感器世界 2019(11)
    • [28].质量管理数据分析方法在船舶设计中的应用[J]. 广东造船 2014(01)
    • [29].基于Hadoop的大数据分析方法优化策略研究[J]. 科技展望 2016(26)
    • [30].呈现数据分析的基本过程,体现数据分析方法的合理性——人教A版普通高中数学教科书必修第九章“统计”编写思考[J]. 中学数学教学参考 2020(25)

    标签:;  ;  ;  

    基于高通量测序数据的跨界sRNA数据分析方法研究
    下载Doc文档

    猜你喜欢