论文摘要
长度大于200nt的非编码RNA被称为长非编码RNA(lncRNA),lncRNA是当下研究的一大热门。虽然不具有编码蛋白的能力,但是lncRNA通过作用于其他分子间接的影响了蛋白的形成。随着测序技术的延伸更多的序列被发现,只有从中精准识别出lncRNA,才能为日后探索其内在结构、预测功能打下基础。对于人类、动物lncRNA识别的研究已经相对成熟,而植物lncRNA结构复杂,样本数量不足,识别较为困难。并且之前的方法大都基于特征工程手动提取特征,不能学习序列的内在特征。因此使用深度学习方法高效准确识别植物lncRNA并预测其功能具有重大意义。本文基于长短期记忆网络(LSTM)和卷积神经网络(CNN)分别构建了两种lncRNA识别模型,lncRNA-LSTM和lncRNA-CNN。对负集进行聚类欠采样操作,达到正负样本均衡。为了使RNA序列能够输入到LSTM中,对序列进行p-nts编码,依次对连续的p个核苷酸进行编码,把每条RNA表示成数字序列。然后对RNA进行one-hot编码,每条RNA都被表示成4*n的矩阵进而可以输入到CNN中。实验的训练集和测试集划分为8:2。lncRNA-LSTM和lncRNA-CNN在测试集上的总体准确率分别达到了96.2%和95.2%。为了展示本文提出方法的优越性,增加基于特征工程的对比实验,提取二级结构、k-mers等特征并选取支持向量机等模型,在玉米数据集上的结果表明提出的两种模型表现得更好。此外,本文提出的方法与目前较为流行的CPC2、CNCI、PLEK、LncADeep等方法在同样的数据集上的结果相比效果更好。根据内源性竞争和RNA结构信息,提取lncRNA-microRNA和mRNA-microRNA互作对,然后结合RNA内在结构规则进行筛选,再通过整合两类互作数据建立RNA相互作用调控网络,并对网络各个模块进行模块分析。通过GO术语富集分析预测和mRNA有相关性的lncRNA参与的调控过程与具有的功能。
论文目录
文章来源
类型: 硕士论文
作者: 常征
导师: 孟军
关键词: 深度学习,长非编码,识别,植物,功能预测
来源: 大连理工大学
年度: 2019
分类: 基础科学,信息科技
专业: 生物学,自动化技术
单位: 大连理工大学
基金: 国家自然科学基金项目(No.61872055),国家重点研发计划项目课题“面向实体的多源信息感知融合与理解技术研究”(课题编号:2016YFB1001103)
分类号: Q94;TP18
DOI: 10.26991/d.cnki.gdllu.2019.001858
总页数: 58
文件大小: 2589K
下载量: 93
相关论文文献
- [1].长链非编码RNA、焦亡和心肌缺血-再灌注损伤[J]. 生物化学与生物物理进展 2019(12)
- [2].非小细胞肺癌的潜在生物标记物:长链非编码RNA[J]. 现代肿瘤医学 2020(01)
- [3].非编码RNA在细胞自噬中的研究进展[J]. 中国生物工程杂志 2019(12)
- [4].环状RNA影响肝疾病的发生发展[J]. 中国生物化学与分子生物学报 2019(12)
- [5].环状RNA在肝细胞癌中的作用及机制[J]. 中国生物化学与分子生物学报 2019(12)
- [6].环状RNA在胃癌中的研究进展[J]. 生物技术通讯 2019(06)
- [7].西花蓟马不同RNA干扰技术比较研究[J]. 福建农业学报 2019(10)
- [8].微小RNA在非酒精性脂肪肝病中调控作用的研究进展[J]. 重庆医科大学学报 2019(12)
- [9].卵巢上皮性癌中RNA结合基序蛋白3及环氧化酶-2的表达与意义[J]. 医疗装备 2019(23)
- [10].非编码RNA在周围神经损伤修复中的重要角色和作用[J]. 中国组织工程研究 2020(14)
- [11].长链非编码RNA在鼻咽癌中的研究进展[J]. 中国医药 2020(01)
- [12].微小循环RNA在鉴别前列腺增生和前列腺癌的有效性分析[J]. 临床泌尿外科杂志 2020(01)
- [13].长链非编码RNA调控肝纤维化信号通路的研究进展[J]. 胃肠病学 2019(11)
- [14].环状RNA在肺腺癌中的差异表达分析[J]. 东南大学学报(医学版) 2019(06)
- [15].环状RNA调控结肠直肠癌的研究进展[J]. 外科理论与实践 2019(06)
- [16].RNA干扰药物——下一代治疗药物?[J]. 科学通报 2020(07)
- [17].环状RNA生物学功能及其在组织修复过程中的作用[J]. 中国组织工程研究 2020(17)
- [18].Deep Learning Deciphers Protein–RNA Interaction[J]. Genomics,Proteomics & Bioinformatics 2019(05)
- [19].CIRCexplorer3:A CLEAR Pipeline for Direct Comparison of Circular and Linear RNA Expression[J]. Genomics,Proteomics & Bioinformatics 2019(05)
- [20].环状RNA在冠状动脉粥样硬化性心脏病中的研究进展[J]. 心血管病学进展 2019(09)
- [21].心肌纤维化研究的新领域——长链非编码RNA[J]. 心血管病学进展 2019(09)
- [22].长链非编码RNA及相关调控通路与急性心肌梗死的研究进展[J]. 心血管病学进展 2019(08)
- [23].微小RNA在自身免疫性甲状腺疾病中的研究进展[J]. 江苏大学学报(医学版) 2020(01)
- [24].结直肠癌相关长链非编码RNA调控信号通路研究进展[J]. 西部医学 2020(02)
- [25].环状RNA与肝癌相互关系的研究进展[J]. 中国卫生检验杂志 2020(03)
- [26].非编码RNA在葡萄膜炎发生发展过程中的调控作用研究进展[J]. 眼科新进展 2020(01)
- [27].长链非编码RNA在心血管疾病中的研究进展[J]. 临床误诊误治 2020(02)
- [28].长链非编码RNA影响糖尿病心肌病的研究[J]. 糖尿病新世界 2020(01)
- [29].骨肉瘤中环状RNA的研究进展[J]. 临床与病理杂志 2020(02)
- [30].长链非编码RNA作为肾细胞癌预后生物标志物的研究新进展[J]. 现代肿瘤医学 2020(05)