深度学习在植物lncRNA识别中的研究与应用

深度学习在植物lncRNA识别中的研究与应用

论文摘要

长度大于200nt的非编码RNA被称为长非编码RNA(lncRNA),lncRNA是当下研究的一大热门。虽然不具有编码蛋白的能力,但是lncRNA通过作用于其他分子间接的影响了蛋白的形成。随着测序技术的延伸更多的序列被发现,只有从中精准识别出lncRNA,才能为日后探索其内在结构、预测功能打下基础。对于人类、动物lncRNA识别的研究已经相对成熟,而植物lncRNA结构复杂,样本数量不足,识别较为困难。并且之前的方法大都基于特征工程手动提取特征,不能学习序列的内在特征。因此使用深度学习方法高效准确识别植物lncRNA并预测其功能具有重大意义。本文基于长短期记忆网络(LSTM)和卷积神经网络(CNN)分别构建了两种lncRNA识别模型,lncRNA-LSTM和lncRNA-CNN。对负集进行聚类欠采样操作,达到正负样本均衡。为了使RNA序列能够输入到LSTM中,对序列进行p-nts编码,依次对连续的p个核苷酸进行编码,把每条RNA表示成数字序列。然后对RNA进行one-hot编码,每条RNA都被表示成4*n的矩阵进而可以输入到CNN中。实验的训练集和测试集划分为8:2。lncRNA-LSTM和lncRNA-CNN在测试集上的总体准确率分别达到了96.2%和95.2%。为了展示本文提出方法的优越性,增加基于特征工程的对比实验,提取二级结构、k-mers等特征并选取支持向量机等模型,在玉米数据集上的结果表明提出的两种模型表现得更好。此外,本文提出的方法与目前较为流行的CPC2、CNCI、PLEK、LncADeep等方法在同样的数据集上的结果相比效果更好。根据内源性竞争和RNA结构信息,提取lncRNA-microRNA和mRNA-microRNA互作对,然后结合RNA内在结构规则进行筛选,再通过整合两类互作数据建立RNA相互作用调控网络,并对网络各个模块进行模块分析。通过GO术语富集分析预测和mRNA有相关性的lncRNA参与的调控过程与具有的功能。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  •   1.1 研究背景与意义
  •   1.2 国内外研究现状
  •   1.3 本文研究内容及结构
  • 2 lncRNA识别相关技术
  •   2.1 lncRNA识别方法与工具
  •     2.1.1 CPC&CPC2 在线分类工具
  •     2.1.2 CNCI分类软件
  •     2.1.3 PLEK分类软件
  •     2.1.4 LncRNAnet分类软件
  •   2.2 lncRNA与其他RNA或蛋白互作方式
  •     2.2.1 lncRNA作为信号颗粒
  •     2.2.2 lncRNA作为诱饵颗粒
  •     2.2.3 lncRNA作为引导颗粒
  •     2.2.4 lncRNA作为支架颗粒
  •   2.3 本章小结
  • 3 lncRNA预测模型的构建
  •   3.1 数据集的选取和预处理
  •     3.1.1 数据集来源
  •     3.1.2 数据集预处理
  •     3.1.3 RNA序列p-nts编码
  •     3.1.4 RNA序列one-hot编码
  •   3.2 基于深度学习的lncRNA预测模型构建
  •     3.2.1 lncRNA-LSTM
  •     3.2.2 lncRNA-CNN
  •   3.3 基于特征工程的对比实验
  •     3.3.1 特征抽取
  •     3.3.2 特征融合和模型训练
  •   3.4 实验结果和分析
  •     3.4.1 性能评价指标
  •     3.4.2 不同p-nts编码的性能对比
  •     3.4.3 与特征工程的性能对比
  •     3.4.4 与其它现有工具性能对比
  •   3.5 本章小结
  • 4 植物lncRNA功能预测
  •   4.1 数据集选取和预处理
  •   4.2 提取靶向预测互作对
  •     4.2.1 提取lncRNA-microRNA互作对
  •     4.2.2 提取microRNA-mRNA互作对
  •   4.3 调控网络构建及lncRNA功能预测
  •     4.3.1 RNA调控网络构建
  •     4.3.2 模块分析与功能预测
  •   4.4 本章小结
  • 结论
  • 参考文献
  • 攻读硕士学位期间发表学术论文情况
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 常征

    导师: 孟军

    关键词: 深度学习,长非编码,识别,植物,功能预测

    来源: 大连理工大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 生物学,自动化技术

    单位: 大连理工大学

    基金: 国家自然科学基金项目(No.61872055),国家重点研发计划项目课题“面向实体的多源信息感知融合与理解技术研究”(课题编号:2016YFB1001103)

    分类号: Q94;TP18

    DOI: 10.26991/d.cnki.gdllu.2019.001858

    总页数: 58

    文件大小: 2589K

    下载量: 93

    相关论文文献

    • [1].长链非编码RNA、焦亡和心肌缺血-再灌注损伤[J]. 生物化学与生物物理进展 2019(12)
    • [2].非小细胞肺癌的潜在生物标记物:长链非编码RNA[J]. 现代肿瘤医学 2020(01)
    • [3].非编码RNA在细胞自噬中的研究进展[J]. 中国生物工程杂志 2019(12)
    • [4].环状RNA影响肝疾病的发生发展[J]. 中国生物化学与分子生物学报 2019(12)
    • [5].环状RNA在肝细胞癌中的作用及机制[J]. 中国生物化学与分子生物学报 2019(12)
    • [6].环状RNA在胃癌中的研究进展[J]. 生物技术通讯 2019(06)
    • [7].西花蓟马不同RNA干扰技术比较研究[J]. 福建农业学报 2019(10)
    • [8].微小RNA在非酒精性脂肪肝病中调控作用的研究进展[J]. 重庆医科大学学报 2019(12)
    • [9].卵巢上皮性癌中RNA结合基序蛋白3及环氧化酶-2的表达与意义[J]. 医疗装备 2019(23)
    • [10].非编码RNA在周围神经损伤修复中的重要角色和作用[J]. 中国组织工程研究 2020(14)
    • [11].长链非编码RNA在鼻咽癌中的研究进展[J]. 中国医药 2020(01)
    • [12].微小循环RNA在鉴别前列腺增生和前列腺癌的有效性分析[J]. 临床泌尿外科杂志 2020(01)
    • [13].长链非编码RNA调控肝纤维化信号通路的研究进展[J]. 胃肠病学 2019(11)
    • [14].环状RNA在肺腺癌中的差异表达分析[J]. 东南大学学报(医学版) 2019(06)
    • [15].环状RNA调控结肠直肠癌的研究进展[J]. 外科理论与实践 2019(06)
    • [16].RNA干扰药物——下一代治疗药物?[J]. 科学通报 2020(07)
    • [17].环状RNA生物学功能及其在组织修复过程中的作用[J]. 中国组织工程研究 2020(17)
    • [18].Deep Learning Deciphers Protein–RNA Interaction[J]. Genomics,Proteomics & Bioinformatics 2019(05)
    • [19].CIRCexplorer3:A CLEAR Pipeline for Direct Comparison of Circular and Linear RNA Expression[J]. Genomics,Proteomics & Bioinformatics 2019(05)
    • [20].环状RNA在冠状动脉粥样硬化性心脏病中的研究进展[J]. 心血管病学进展 2019(09)
    • [21].心肌纤维化研究的新领域——长链非编码RNA[J]. 心血管病学进展 2019(09)
    • [22].长链非编码RNA及相关调控通路与急性心肌梗死的研究进展[J]. 心血管病学进展 2019(08)
    • [23].微小RNA在自身免疫性甲状腺疾病中的研究进展[J]. 江苏大学学报(医学版) 2020(01)
    • [24].结直肠癌相关长链非编码RNA调控信号通路研究进展[J]. 西部医学 2020(02)
    • [25].环状RNA与肝癌相互关系的研究进展[J]. 中国卫生检验杂志 2020(03)
    • [26].非编码RNA在葡萄膜炎发生发展过程中的调控作用研究进展[J]. 眼科新进展 2020(01)
    • [27].长链非编码RNA在心血管疾病中的研究进展[J]. 临床误诊误治 2020(02)
    • [28].长链非编码RNA影响糖尿病心肌病的研究[J]. 糖尿病新世界 2020(01)
    • [29].骨肉瘤中环状RNA的研究进展[J]. 临床与病理杂志 2020(02)
    • [30].长链非编码RNA作为肾细胞癌预后生物标志物的研究新进展[J]. 现代肿瘤医学 2020(05)

    标签:;  ;  ;  ;  ;  

    深度学习在植物lncRNA识别中的研究与应用
    下载Doc文档

    猜你喜欢