基于机器学习的RNA与蛋白质绑定位点预测研究

基于机器学习的RNA与蛋白质绑定位点预测研究

论文摘要

RNA与蛋白质结合形成的复合物在许多生物过程中起关键作用,然而通过生物实验检测RNA-蛋白质相互作用非常耗时费力,开发计算预测工具势在必行。计算工具的预测性能依赖于两个因素,即RNA序列的特征表示和分类模型,在现有方法中,统计特征或one-hot向量是常见的特征表示方法,同时大多数分类器都使用传统的机器学习模型,而分布式特征表示和灵活的深度学习架构尚未被深入研究。因此,在本研究中,我们通过连续分布特征表示RNA序列,并提出一种混合深度学习架构,将两个神经网络框架CNN和RNN进行有效组合,充分利用各自优势,其中卷积神经网络(CNN)学习高级抽象特征,循环神经网络(RNN)学习序列中的长依赖性。针对RNA世界的后起之秀环状RNA(circRNA),我们构建CRIP(CircRNA Interact with Proteins)模型,它仅使用RNA序列预测环状RNA上的蛋白质结合位点。为了充分利用序列信息,我们还提出了一种堆叠式密码子编码方案。实验结果表明,新的编码方案优于现有用于RNA序列的特征表示方法,并且混合网络大大优于传统的分类器,CNN和RNN组件都有助于提高性能。据我们所知,CRIP是第一个基于机器学习专门用于预测环状RNA和蛋白质相互作用的工具,预计将在环状RNA大规模功能分析中扮演重要角色。

论文目录

  • 摘要
  • abstract
  • 第一章 绪论
  •   1.1 环状RNA的生物机制
  •   1.2 研究背景
  •   1.3 现有方法
  •   1.4 本文所提方案概述
  •   1.5 本章小结
  • 第二章 国内外研究现状
  •   2.1 基于传统机器学习的预测方法
  •   2.2 基于神经网络的预测方法
  •   2.3 本章小结
  • 第三章 方法介绍
  •   3.1 数据集构建
  •   3.2 特征编码
  •     3.2.1 k-mer编码
  •     3.2.2 One-hot编码
  •     3.2.3 词向量编码
  •     3.2.4 IUPAC编码
  •     3.2.5 堆叠式密码子编码(Stack coden-based encoding)
  •   3.3 模型介绍
  •     3.3.1 特征编码
  •     3.3.2 CNN层
  •     3.3.3 BiLSTM层
  •     3.3.4 全连接层
  •   3.4 环境搭建
  •     3.4.1 服务器配置
  •     3.4.2 编辑器
  •     3.4.3 机器学习框架
  •     3.4.4 参数选择
  •   3.5 实验结果
  •     3.5.1 数据分布分析
  •     3.5.2 特征编码分析
  •     3.5.3 模型各模块分析
  •     3.5.4 与现有预测环状RNA和 RBP相互作用的模型比较
  •     3.5.5 环状RNA和线性RNA共有RBP数据集上的实验结果
  •   3.6 本章小结
  • 第四章 讨论
  •   4.1 本研究的主要贡献
  •   4.2 motif分析
  •   4.3 本章小结
  • 总结与展望
  • 参考文献
  • 致谢
  • 攻读学位期间发表的学术论文
  • 攻读学位期间参与的项目
  • 文章来源

    类型: 硕士论文

    作者: 张开明

    导师: 杨旸

    关键词: 环状,密码子编码,卷积神经网络,循环神经网络

    来源: 上海交通大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 生物学,自动化技术

    单位: 上海交通大学

    分类号: Q811.4;TP181

    DOI: 10.27307/d.cnki.gsjtu.2019.001977

    总页数: 67

    文件大小: 2692K

    下载量: 14

    相关论文文献

    • [1].长链非编码RNA、焦亡和心肌缺血-再灌注损伤[J]. 生物化学与生物物理进展 2019(12)
    • [2].非小细胞肺癌的潜在生物标记物:长链非编码RNA[J]. 现代肿瘤医学 2020(01)
    • [3].非编码RNA在细胞自噬中的研究进展[J]. 中国生物工程杂志 2019(12)
    • [4].环状RNA影响肝疾病的发生发展[J]. 中国生物化学与分子生物学报 2019(12)
    • [5].环状RNA在肝细胞癌中的作用及机制[J]. 中国生物化学与分子生物学报 2019(12)
    • [6].环状RNA在胃癌中的研究进展[J]. 生物技术通讯 2019(06)
    • [7].西花蓟马不同RNA干扰技术比较研究[J]. 福建农业学报 2019(10)
    • [8].微小RNA在非酒精性脂肪肝病中调控作用的研究进展[J]. 重庆医科大学学报 2019(12)
    • [9].卵巢上皮性癌中RNA结合基序蛋白3及环氧化酶-2的表达与意义[J]. 医疗装备 2019(23)
    • [10].非编码RNA在周围神经损伤修复中的重要角色和作用[J]. 中国组织工程研究 2020(14)
    • [11].长链非编码RNA在鼻咽癌中的研究进展[J]. 中国医药 2020(01)
    • [12].微小循环RNA在鉴别前列腺增生和前列腺癌的有效性分析[J]. 临床泌尿外科杂志 2020(01)
    • [13].长链非编码RNA调控肝纤维化信号通路的研究进展[J]. 胃肠病学 2019(11)
    • [14].环状RNA在肺腺癌中的差异表达分析[J]. 东南大学学报(医学版) 2019(06)
    • [15].环状RNA调控结肠直肠癌的研究进展[J]. 外科理论与实践 2019(06)
    • [16].RNA干扰药物——下一代治疗药物?[J]. 科学通报 2020(07)
    • [17].环状RNA生物学功能及其在组织修复过程中的作用[J]. 中国组织工程研究 2020(17)
    • [18].Deep Learning Deciphers Protein–RNA Interaction[J]. Genomics,Proteomics & Bioinformatics 2019(05)
    • [19].CIRCexplorer3:A CLEAR Pipeline for Direct Comparison of Circular and Linear RNA Expression[J]. Genomics,Proteomics & Bioinformatics 2019(05)
    • [20].环状RNA在冠状动脉粥样硬化性心脏病中的研究进展[J]. 心血管病学进展 2019(09)
    • [21].心肌纤维化研究的新领域——长链非编码RNA[J]. 心血管病学进展 2019(09)
    • [22].长链非编码RNA及相关调控通路与急性心肌梗死的研究进展[J]. 心血管病学进展 2019(08)
    • [23].微小RNA在自身免疫性甲状腺疾病中的研究进展[J]. 江苏大学学报(医学版) 2020(01)
    • [24].结直肠癌相关长链非编码RNA调控信号通路研究进展[J]. 西部医学 2020(02)
    • [25].环状RNA与肝癌相互关系的研究进展[J]. 中国卫生检验杂志 2020(03)
    • [26].非编码RNA在葡萄膜炎发生发展过程中的调控作用研究进展[J]. 眼科新进展 2020(01)
    • [27].长链非编码RNA在心血管疾病中的研究进展[J]. 临床误诊误治 2020(02)
    • [28].长链非编码RNA影响糖尿病心肌病的研究[J]. 糖尿病新世界 2020(01)
    • [29].骨肉瘤中环状RNA的研究进展[J]. 临床与病理杂志 2020(02)
    • [30].长链非编码RNA作为肾细胞癌预后生物标志物的研究新进展[J]. 现代肿瘤医学 2020(05)

    标签:;  ;  ;  ;  

    基于机器学习的RNA与蛋白质绑定位点预测研究
    下载Doc文档

    猜你喜欢