基于混合深度学习模型的蛋白质磷酸化和羟基化位点预测算法研究

基于混合深度学习模型的蛋白质磷酸化和羟基化位点预测算法研究

论文摘要

蛋白质作为细胞、组织的重要组成成分,是形成生命体的物质基础。蛋白质翻译后修饰(PTM)是调控蛋白质功能的重要机制。蛋白质翻译后修饰有多种修饰类型,深入研究鉴定PTM对于理解蛋白质结构和功能具有重要意义。随着后基因组时代的到来,产生了数量庞大的未标识蛋白序列。蛋白质序列上的翻译后修饰残基位点能否被快速准确高效地标识,对于蛋白质序列的基础研究和药物的开发至关重要,也是本领域最基础和最核心问题,尤其是对蛋白质磷酸化和羟基化的研究。传统的实验学方法,需要耗费大量的时间、精力和资金。有效的生物信息学计算方法能够准确、高效地预测蛋白质翻译后修饰位点。深度学习近年来在图像识别、机器视觉、自然语言处理等方面取得突破性进展。近几年深度学习算法用于蛋白质翻译后修饰的研究文献较少,本文通过构建混合深度神经网络模型,并进一步应用于预测蛋白质磷酸化和羟基化。主要工作如下:1、综述了预测PTM的研究现状,概述了磷酸化、羟基化位点预测方法,深度学习的研究现状。2、构建混合深度学习神经网络模型。通过对蛋白质序列特征肽段的提取,选取以PTM位点为中心的肽13作为最优肽段,进一步将蛋白质字符序列转化为位置特异性打分矩阵以便作为神经网路的输入。通过卷积神经网络(CNN)提取蛋白质序列的高维特征,通过循环神经网络(RNN)提取氨基酸残基之间的关系,结合两种神经网络特点,构建混合神经网络CNN+RNN预测PTM模型。3、利用混合深度学习神经网络模型预测磷酸化、羟基化修饰位点。在蛋白质磷酸化和羟基化正负样本数据集上训练、测试和预测。在磷酸化位点预测中,我们通过构建CNN和双向长短期记忆网络(BLSTM)结合的混合神经网络使得磷酸化位点预测在数据集上最低总体准确率为0.914,最低AUC值为0.994。在羟基化预测中我们进一步构建CNN和长短期记忆网络(LSTM)结合的混合神经网络使得羟基化预测在数据集上最低总体准确率为0.892,最低AUC值为0.96。混合神经网络模型整体均优于现有的预测模型。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  •   1.1 研究背景及意义
  •   1.2 国内外研究现状
  •     1.2.1 蛋白质翻译后修饰简介
  •     1.2.2 传统的实验学方法
  •     1.2.3 磷酸化位点预测方法概述
  •     1.2.4 羟基化位点预测方法概述
  •     1.2.5 深度学习
  •   1.3 论文的主要工作与结构安排
  • 2 蛋白质序列特征提取与预测PTM模型构建
  •   2.0 引言
  •   2.1 数据收集
  •   2.2 蛋白质低水平特征提取
  •     2.2.1 特征肽段的选取
  •     2.2.2 字符序列转换成数值矩阵
  •   2.3 基于CNN模型提取蛋白质序列高水平特征
  •   2.4 基于RNN模型揭示氨基酸残基之间的相互关系
  •   2.5 基于CNN+RNN模型预测PTM修饰位点
  •   2.6 模型的评价方法和评价指标
  •   2.7 本章小结
  • 3 基于混合神经网络模型预测蛋白质磷酸化修饰
  •   3.1 引言
  •   3.2 磷酸化修饰数据收集
  •   3.3 蛋白质序列特征提取
  •   3.4 研究方法
  •     3.4.1 随机森林模型
  •     3.4.2 混合深度学习神经网络模型CNN+RNN
  •   3.5 结果分析
  •     3.5.1 模型评估标准:
  •     3.5.2 比对预测结果
  •   3.6 本章小结
  • 4 基于混合神经网络模型预测蛋白质羟基化修饰
  •   4.1 引言
  •   4.2 羟基化修饰数集据收集
  •   4.3 特征肽段的序列特征提取
  •   4.4 研究方法
  •     4.4.1 现有预测羟基化模型
  •     4.4.2 混合CNN+LSTM神经网络预测模型
  •   4.5 结果分析
  •     4.5.1 模型评估标准
  •     4.5.2 比对预测结果
  •   4.6 本章小结
  • 5 总结与展望
  • 参考文献
  • 攻读研究生期间的研究成果
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 徐兴宇

    导师: 金伟波,姚玉华

    关键词: 蛋白质翻译后修饰,卷积神经网络,循环神经网络,磷酸化位点,羟基化位点,曲线

    来源: 浙江理工大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 生物学,自动化技术

    单位: 浙江理工大学

    分类号: TP18;Q51

    DOI: 10.27786/d.cnki.gzjlg.2019.000010

    总页数: 57

    文件大小: 3552K

    下载量: 40

    相关论文文献

    • [1].基于表达和反应耦联的羟基化酶催化合成反式-4-羟基-L-脯氨酸[J]. 生物加工过程 2020(01)
    • [2].杂多酸/离子液体杂化材料催化苯的高选择性羟基化[J]. 物理化学学报 2016(12)
    • [3].新型羟基化酶基因的克隆及其洛伐他汀转化的应用[J]. 生物工程学报 2013(11)
    • [4].3-甾酮-9α-羟基化酶基因在分枝杆菌中强化表达[J]. 药物生物技术 2016(05)
    • [5].磁性修饰羟基化多壁碳纳米管萃取人血浆中马钱子生物碱的方法研究[J]. 分析试验室 2017(04)
    • [6].木质素生物合成中羟基化酶的研究进展[J]. 河南农业科学 2008(04)
    • [7].羟基化碳纳米管/聚己内酯复合材料的结构和力学性能![J]. 湖北大学学报(自然科学版) 2012(04)
    • [8].固定化赭曲霉、犁头霉双霉协同转化甾苷元C_(11)α-羟基化研究[J]. 化学与生物工程 2009(12)
    • [9].烟酸羟基化酶产生菌的快速筛选及催化条件[J]. 过程工程学报 2010(03)
    • [10].表面羟基化石墨相氮化碳的制备及其对光催化降解有机染料性能的研究[J]. 山西能源学院学报 2019(05)
    • [11].南京工业大学开发新分子筛使芳烃羟基化瞬时完成[J]. 石油炼制与化工 2018(11)
    • [12].分枝杆菌Mycobacterium sp.NwIB-01 3-甾酮-9α-羟基化酶基因的克隆、异源表达及分离纯化[J]. 生物工程学报 2009(12)
    • [13].VD_3羟基化酶的定向研究进展[J]. 生物技术通报 2014(01)
    • [14].多级孔钛硅分子筛制备及其催化羟基化性能[J]. 无机盐工业 2019(09)
    • [15].铁卟啉催化二乙基亚硝胺羟基化的反应机理[J]. 分子科学学报 2017(01)
    • [16].有机蒙脱土改性羟基化聚酯的研究[J]. 北京理工大学学报 2013(10)
    • [17].5种甲氧基多溴联苯醚的羟基化产物测定及反应机理分析[J]. 化学分析计量 2019(S1)
    • [18].羟基化酶产生菌Stenorophomonas maltophilia CGMCC 1.1788对农药氯噻啉生物转化的条件研究[J]. 安徽农业科学 2012(36)
    • [19].细胞色素P450 BM-3羟基化吲哚能力的半理性改造[J]. 化工学报 2009(11)
    • [20].氨基酸突变对细胞色素P45 0BM-3羟基化吲哚能力的影响[J]. 高校化学工程学报 2008(02)
    • [21].柑、橘、橙果皮中天然羟基化多甲氧基黄酮的转化率研究[J]. 中国食品学报 2018(05)
    • [22].羟基化对Si_3N_4粉体水相分散性的影响(英文)[J]. 无机化学学报 2018(11)
    • [23].羟基化碳纳米管对亚甲基蓝的吸附作用[J]. 广州化工 2017(13)
    • [24].菘蓝中肉桂酸-4-羟基化酶基因克隆与表达分析[J]. 中草药 2015(01)
    • [25].羟基化修饰对大鼠胶原热稳定性的影响研究[J]. 中国生物工程杂志 2015(11)
    • [26].铁掺杂TS-1分子筛催化剂催化苯羟基化制备苯酚反应[J]. 广州化工 2015(22)
    • [27].黑曲霉催化雄甾-4-烯-3,17-二酮16β-羟基化[J]. 生物工程学报 2014(09)
    • [28].外显子拼接法克隆紫杉烷2α-羟基化酶基因与生物信息学分析[J]. 生物技术通报 2011(04)
    • [29].有机溶剂对黑根霉甾体11α-羟基化的影响[J]. 工业微生物 2008(02)
    • [30].聚醚醚酮表面多孔羟基化改性对MC3T3-E1细胞黏附、增殖的影响[J]. 生物骨科材料与临床研究 2019(04)

    标签:;  ;  ;  ;  ;  ;  

    基于混合深度学习模型的蛋白质磷酸化和羟基化位点预测算法研究
    下载Doc文档

    猜你喜欢