拟南芥蛋白质互作网络建模及分析

拟南芥蛋白质互作网络建模及分析

论文摘要

蛋白质-蛋白质相互作用研究能够从分子水平上揭示蛋白质功能,帮助揭示生长发育、新陈代谢、分化和凋亡等细胞活动规律。目前虽已发展一些检测蛋白质互作的高通量实验方法,但由于实验手段需要耗费大量的人力和物力,蛋白质互作的大规模解析还远未在植物学研究中普及。作为实验手段的有效补充,利用生物信息学方法在基因组尺度预测蛋白质互作已日趋受到关注。本研究在前期研究基础上,通过采用更为全面的生物数据以及引入训练数据不平衡问题的解决方法,构建了新版拟南芥蛋白质互作网络。与之前版本相比,新版互作网络采用了更为全面的生物数据,如使用RNA-seq数据计算基因共表达特征值,使得该特征值覆盖率从59.51%增加至96.02%;新收集结构信息覆盖率则由11.48%提升至23.94%。此外,模型训练过程通过引入SMOTE算法,解决了训练数据不平衡问题。新版拟南芥蛋白质互作网络共包含345,006对预测的互作关系,涉及13,929个蛋白质,相较于之前版本,分别提升8.9%与10.8%。本研究采用10折交叉验证对新版拟南芥蛋白质互作预测模型的性能进行了测试,结果表明模型的预测真阳性率为49.74%,假阳性率为0.095%。精确-召回曲线(Precision-Recall curve)显示新方法预测性能明显高于之前版本。此外,本研究采用高通量与新发布两组独立的实验数据对新版互作网络的准确性进行了进一步评估,结果表明新方法可以分别成功预测到2,252(15.2%)对高通量实验检测数据以及2,880(13.5%)对新发表互作关系,其准确性高于之前版本及另外三种蛋白质互作预测方法(AtPIN、AtPID和PAIR)。上述评估结果表明新版互作网络的预测准确性相比于其他蛋白质预测方法有了显著提高。基于新版拟南芥蛋白质互作网络,构建了赤霉素、生长素、细胞分裂素、乙烯和脱落酸五个重要植物激素信号通路的交叉互作网络。两组独立实验数据的测试结果表明其预测准确率明显表现高于前一版本。以IAA信号通路相关互作关系为例,新方法可以成功预测到75%的高通量实验检测互作蛋白对以及61%的新发表蛋白质互作关系,远高于之前版本的53%和43%。在此基础上,发掘构建了上述五种重要激素信号通路间可能的交叉互作关系,统计分析显示大量互作蛋白质同时涉及两个或以上激素信号通路,这些共同互作蛋白质可能对不同激素间的交叉互作调控起到了关键作用。新版拟南芥蛋白质互作网络提供了更为可靠稳定的蛋白质互作预测结果,该数据资源有助于进一步发掘研究植物激素信号转导途径之间的相互调控关系。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  •   1.1 蛋白质互作实验检测方法
  •     1.1.1 酵母双杂交系统
  •     1.1.2 免疫共沉淀技术
  •     1.1.3 Pull-down技术
  •     1.1.4 串联亲和纯化技术
  •     1.1.5 双分子荧光互补技术
  •   1.2 蛋白质互作信息收录数据库
  •     1.2.1 BioGRID数据库
  •     1.2.2 IntAct数据库
  •     1.2.3 DIP数据库
  •     1.2.4 BIND数据库
  •     1.2.5 MINT数据库
  •   1.3 蛋白质互作生物信息学预测方法
  •     1.3.1 基因系统发育谱
  •     1.3.2 基因功能相似性
  •     1.3.3 基因共表达
  •     1.3.4 基因同源映射
  •     1.3.5 基因融合
  •     1.3.6 基于蛋白质空间结构信息的蛋白质互作预测方法
  •   1.4 蛋白质互作机器挖掘方法
  •     1.4.1 支持向量机
  •     1.4.2 朴素贝叶斯
  •     1.4.3 随机森林
  •     1.4.4 神经网络
  •     1.4.5 深度学习
  •   1.5 拟南芥激素信号通路交叉互作研究进展
  •   1.6 研究目的与意义
  •   1.7 研究内容及技术路线
  •     1.7.1 研究内容
  •     1.7.2 研究技术路线
  • 第二章 材料与方法
  •   2.1 实验检测蛋白质互作数据收集
  •   2.2 训练数据集
  •     2.2.1 阳性数据集筛选
  •     2.2.2 阴性数据集构建
  •   2.3 测试数据集
  •   2.4 生物学特征值
  •     2.4.1 蛋白质空间结构信息
  •     2.4.2 基因共表达
  •     2.4.3 基因同源映射
  •     2.4.4 基因系统发育谱
  •     2.4.5 基因融合
  •     2.4.6 基因功能相似性
  •   2.5 拟南芥蛋白质互作网络的构建
  •     2.5.1 拟南芥蛋白质互作预测模型的构建
  •     2.5.2 拟南芥蛋白质互作网络可视化
  •   2.6 拟南芥蛋白质互作网络预测性能评估
  •   2.7 植物激素信号通路互作网络构建
  •   2.8 不同植物激素信号通路间的交叉互作挖掘
  • 第三章 结果与分析
  •   3.1 拟南芥蛋白质互作网络构建
  •     3.1.1 基础数据更新结果
  •     3.1.2 拟南芥蛋白质互作预测模型构建
  •     3.1.3 新版拟南芥蛋白质互作网络特点
  •   3.2 拟南芥蛋白质互作网络预测性能评估
  •   3.3 植物激素信号通路网络构建与评估
  •   3.4 植物激素信号通路间的交叉互作挖掘
  •     3.4.1 激素信号通路互作蛋白质挖掘与功能分析
  •     3.4.2 激素信号通路核心蛋白质互作关系挖掘与分析
  •     3.4.3 激素信号通路关键调控蛋白质挖掘与分析
  • 第四章 讨论与总结
  •   4.1 讨论
  •   4.2 总结
  •   4.3 创新点
  • 参考文献
  • 附录
  • 致谢
  • 攻读硕士学位期间已发表或录用的论文
  • 文章来源

    类型: 硕士论文

    作者: 赵佳薇

    导师: 张利达

    关键词: 拟南芥,生物信息学,蛋白质相互作用网络,随机森林,植物激素交叉互作

    来源: 上海交通大学

    年度: 2019

    分类: 基础科学

    专业: 生物学

    单位: 上海交通大学

    分类号: Q946

    DOI: 10.27307/d.cnki.gsjtu.2019.003259

    总页数: 70

    文件大小: 2799K

    下载量: 73

    相关论文文献

    • [1].不得不知的蛋白质三大功能[J]. 现代养生 2020(17)
    • [2].酷算龙(四)[J]. 小学科技 2011(02)
    • [3].当基因爱上蛋白质[J]. 生命的化学 2019(05)
    • [4].生命离不开蛋白质[J]. 科学大观园 2009(05)
    • [5].科学家为你设计手工蛋白质[J]. 世界科学 2018(02)
    • [6].基于氨基酸序列和模拟结构预测蛋白质稳定性的研究进展[J]. 生物技术通报 2017(04)
    • [7].如何补充蛋白质食物才科学[J]. 烹调知识 2016(09)
    • [8].《生命活动的主要承担者——蛋白质》一节的教学设计[J]. 新课程(中学) 2014(12)
    • [9].分龄解读蛋白质补充[J]. 父母必读 2015(07)
    • [10].蛋白质——生命的基础材料[J]. 现代养生 2012(06)
    • [11].蛋白质是人体的原材料[J]. 现代养生 2012(14)
    • [12].初学者做好蛋白质SDS-PAGE需要注意的一些问题[J]. 生物学通报 2011(06)
    • [13].我曾只想做一枚安静的蛋白质[J]. 生命的化学 2019(06)
    • [14].基于网络资本评估和节点失效的关键蛋白质识别算法研究[J]. 智能计算机与应用 2016(06)
    • [15].近红外成像用于双向电泳前的蛋白质快速定量[J]. 分析科学学报 2017(04)
    • [16].家兔对蛋白质营养需要的分析[J]. 现代畜牧科技 2017(11)
    • [17].研究发现蛋白质可通过“展开”来预防机能失调及疾病[J]. 广东药科大学学报 2017(05)
    • [18].浅析蛋白质的相关问题[J]. 中学生物教学 2016(Z1)
    • [19].健康人的尿液中为什么会有蛋白质?[J]. 中国科学:生命科学 2020(03)
    • [20].蛋白质互作技术研究进展[J]. 湖北农业科学 2019(12)
    • [21].动态蛋白质网络的构建、分析及应用研究进展[J]. 计算机研究与发展 2017(06)
    • [22].有关蛋白质问题的解题策略[J]. 中学生数理化(学习研究) 2016(07)
    • [23].第十讲 人体必需的营养素——蛋白质[J]. 现代养生 2014(01)
    • [24].浅谈运动员如何补充蛋白质[J]. 田径 2011(03)
    • [25].巧搭蛋白质[J]. 养生大世界(B版) 2009(05)
    • [26].如何评价蛋白质的优劣[J]. 科学健身(健美先生) 2009(04)
    • [27].漫话蛋白质[J]. 云南科技管理 2011(05)
    • [28].热处理对蛋白质的影响[J]. 食品安全导刊 2015(36)
    • [29].常见蛋白质易错题的归类分析[J]. 中学生物学 2011(01)
    • [30].生命活动的主要承担者——蛋白质[J]. 课程教育研究 2015(23)

    标签:;  ;  ;  ;  ;  

    拟南芥蛋白质互作网络建模及分析
    下载Doc文档

    猜你喜欢