蛋白质组一站式数据分析及可视化平台的研发及应用

蛋白质组一站式数据分析及可视化平台的研发及应用

论文摘要

蛋白质组学是后基因组时代的热点研究领域。随着仪器精度的提升及鉴定算法的完善,蛋白质组学的研究重点已经逐渐从定性研究转移到了定量研究。确定生物体不同状态下的差异表达蛋白质是定量蛋白质组研究的重要方向之一,对理解蛋白质功能以及整个生命活动起到了重要作用。目前已陆续发表了多种差异表达蛋白质计算工具,但它们普遍存在安装更新复杂、上游工具兼容性不佳、功能有限、使用门槛高、分析结果展示效果差等问题。这给蛋白质组技术的推广及应用造成了一定的困难,此时亟待推出一个功能全面、简单易用的组学数据分析工具。针对上面提出的问题,本工作主要关注于蛋白质组一站式分析及可视化平台MyOmics的研发及应用。本文的主要内容包括如下三方面:(1)我们首先调研了差异表达蛋白质筛选分析流程中缺失值处理、数据标准化、统计学分析及功能富集等各个阶段的常用分析方法及适用条件,引入机器学习方法实现高维数据的直观展示。之后我们使用Python及R语言,以多级索引数据框为核心数据结构,完成了主要方法的编程实现与功能对接,并针对组内全样本定量缺失、统计学检验方法择优选择等具体问题进行算法优化。(2)依托于Galaxy计算生物学平台系统,通过编写XML配置文件,我们完成了上述分析程序的网络上线及功能测试,并利用这些工具构建了两类主流组学实验设计类型(单因素二水平设计和单因素多水平设计)的数据分析工作流。为了解决用户访问统计困难、图表展示效果不佳、不能依据输入文件生成动态表单等Galaxy平台本身存在的固有问题,我们额外设计编写了独立的用户界面,并完善了用户注册、使用统计、多类型图表在线展示等诸多功能,基本完成了平台的开发工作。(3)最后,我们将MyOmics中的数据分析及可视化方法应用在了“血清蛋白质测试分析平台指导银屑病诊断标志物及药物响应标志物发现”的研究课题中。我们综合分析了抗体芯片及数据非依赖采集质谱两种来源的定量数据,通过缺失值插补、标准化、统计学检验、相关性分析等步骤筛选到了数十种血清样本的差异表达蛋白质,实现了十个数量级的丰度覆盖。我们成功找出了与银屑病诊断相关的潜在蛋白质生物标志物PI3并在实验中得到验证。最后我们还成功确认了临床指标与血清蛋白质间的相关性。这一应用实例证实了MyOmics平台的可用性。差异表达蛋白质的筛选是蛋白质组学研究的核心问题,对于解决生物学及临床问题意义重大,全面易用的差异表达蛋白质分析工具在研究中必不可少。本研究以差异表达蛋白质的筛选为核心,重点进行了分析流程中各功能的编程实现与功能优化,开发了网络客户端形式的分析及可视化平台MyOmics,平台及方法目前已在生物医学研究中得到了广泛应用。

论文目录

  • 缩略语表
  • 摘要
  • Abstract
  • 第一章 前言
  •   1.1 基于生物质谱的蛋白质组实验及分析流程
  •   1.2 蛋白质生物标志物发现的经典策略
  •   1.3 蛋白质组统计学分析中需解决的问题
  •   1.4 蛋白质组统计学分析现有工具及不足
  •   1.5 论文研究内容及创新点
  • 第二章 差异表达蛋白质筛选分析及可视化方法
  •   2.1 概述
  •   2.2 差异表达蛋白质筛选常用数据预处理方法
  •     2.2.1 缺失值处理(蛋白质筛选与缺失值插补)
  •     2.2.2 数据标准化
  •   2.3 差异表达蛋白质筛选常用统计分析方法
  •     2.3.1 单因素二水平设计(成组设计、配对设计)统计学检验
  •     2.3.2 单因素多水平设计统计学检验
  •   2.4 差异表达蛋白质筛选常用可视化方法
  •     2.4.1 火山图
  •     2.4.2 层次聚类
  •     2.4.3 t-分布邻域嵌入算法
  •     2.4.4 主成分分析
  •   2.5 差异表达蛋白质的富集分析
  •   2.6 数据分析工作流设计
  •   2.7 编程语言及函数模块
  •   2.8 本章小结
  • 第三章 基于Galaxy的蛋白质组数据分析及可视化平台MyOmics的研发
  •   3.1 概述
  •   3.2 Galaxy平台系统简介
  •   3.3 Galaxy平台框架核心组件及相互关系
  •   3.4 基于Galaxy平台的MyOmics单个工具的配置
  •     3.4.1 XML文件编写
  •     3.4.2 后台计算程序编写
  •     3.4.3 工具的Web界面展示
  •   3.5 基于Galaxy平台的MyOmics工作流的配置
  •   3.6 MyOmics分析及可视化平台的用户界面开发
  •     3.6.1 MyOmics用户管理及界面设计
  •     3.6.2 支持工具使用可变表单
  •     3.6.3 多类型图表的展示
  •   3.7 本章小结
  • 第四章 My Omics应用实例:血清蛋白质组测定分析平台发现银屑病诊断及药物响应标志物
  •   4.1 概述
  •   4.2 材料与方法
  •     4.2.1 实验材料
  •     4.2.2 抗体芯片测定血清蛋白质组
  •     4.2.3 DIA-MS测定血清蛋白质组
  •     4.2.4 ELISA验证差异表达蛋白质
  •     4.2.5 数据分析及可视化
  •     4.2.6 生物学功能分析
  •     4.2.7 数据存储
  •   4.3 结果与讨论
  •     4.3.1 抗体芯片实验129组待测蛋白的生物学功能的GO分析
  •     4.3.2 分析平台重复性及可靠性测试
  •     4.3.3 抗体芯片及DIA-MS差异表蛋白质的筛选
  •     4.3.4 差异表达蛋白质的检测覆盖及生物功能
  •     4.3.5 临床指标、银屑病指标、血清蛋白质组分子指标间存在相关性
  •     4.3.6 血清蛋白质组测定分析平台发现银屑病相关生物标志物
  •   4.4 本章小结
  • 第五章 结论与展望
  • 参考文献
  • 附录A 人口统计学特征及临床检验信息
  • 附录B 抗体芯片、DIA-MS、ELISA实验步骤
  • 附录C 差异表达蛋白质富集分析结果
  • 附录D 中文综述
  •   REFERENCES
  • 作者在学期间取得的学术成果
  • 主要简历
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 徐开琨

    导师: 朱云平

    关键词: 蛋白质组学,差异表达蛋白质,统计分析,功能分析,可视化

    来源: 军事科学院

    年度: 2019

    分类: 基础科学,信息科技

    专业: 生物学,计算机软件及计算机应用

    单位: 军事科学院

    分类号: TP311.13;Q51

    总页数: 104

    文件大小: 8110K

    下载量: 181

    相关论文文献

    • [1].第六届中国蛋白质组学大会在我市召开[J]. 泰州科技 2009(08)
    • [2].桑树蛋白质组学研究进展[J]. 蚕业科学 2020(01)
    • [3].宏蛋白质组学在酒曲酶学及蛋白组成功能研究中的应用[J]. 食品安全导刊 2020(18)
    • [4].羊毛蛋白质组学研究进展[J]. 中国草食动物科学 2020(04)
    • [5].蛋白质组学在子痫前期的研究综述[J]. 贵州医药 2020(08)
    • [6].蛋白质组学技术在畜禽遗传育种中的应用与展望[J]. 中国牛业科学 2018(06)
    • [7].第十届中国蛋白质组学大会成功召开[J]. 生命的化学 2019(01)
    • [8].蛋白质组学及其应用研究[J]. 现代商贸工业 2019(16)
    • [9].第三军医大学第二届蛋白质组学和代谢组学论坛会讯[J]. 第三军医大学学报 2016(22)
    • [10].蛋白质组学专刊序言[J]. 生命的化学 2017(01)
    • [11].基于质谱的药物蛋白质组学研究[J]. 生命的化学 2017(01)
    • [12].分泌蛋白质组学在肿瘤标志物中的研究进展[J]. 生物技术通报 2017(03)
    • [13].甜菜蛋白质组学研究进展[J]. 中国糖料 2017(02)
    • [14].关注泪液蛋白质组学研究在眼表疾病中的临床意义和应用[J]. 临床检验杂志(电子版) 2017(02)
    • [15].基于质谱的蛋白质组学技术及其在绒毛用羊中的应用[J]. 中国畜牧兽医 2015(12)
    • [16].蛋白质组学及其在醋酸菌研究中的应用[J]. 食品科学 2016(05)
    • [17].宏蛋白质组学研究进展及应用[J]. 食品与发酵工业 2016(05)
    • [18].中药蛋白质组学研究策略[J]. 中国中药杂志 2016(22)
    • [19].浅谈蛋白质组学实验室的建设与管理——以南京农业大学植物保护学院蛋白质组学实验室为例[J]. 高校实验室工作研究 2014(04)
    • [20].蛋白质组学在皮肤科的研究进展[J]. 中国麻风皮肤病杂志 2009(12)
    • [21].血栓性疾病蛋白质组学的研究进展[J]. 医学综述 2015(10)
    • [22].蛋白质组学技术在恶性肿瘤研究中应用的新进展[J]. 现代生物医学进展 2015(18)
    • [23].蛋白组学教学内容与教学方式的改革初探[J]. 课程教育研究 2017(10)
    • [24].蛋白质组学的研究进展及应用[J]. 科学家 2017(17)
    • [25].乳酸菌蛋白质组学研究与在食品营养学中的应用[J]. 食品界 2017(09)
    • [26].蛋白质组学在植物逆境中的研究进展[J]. 当代化工研究 2019(02)
    • [27].蛋白质组学在鱼肉品质研究中的应用[J]. 饲料博览 2019(05)
    • [28].蛋白质组学实验课程教学实践与探讨[J]. 中国教育技术装备 2017(22)
    • [29].《蛋白质组学》课程教学初探[J]. 高教学刊 2018(06)
    • [30].蛋白质组学技术在肉类鉴别及肉质分析中的应用进展[J]. 生物技术进展 2018(03)

    标签:;  ;  ;  ;  ;  

    蛋白质组一站式数据分析及可视化平台的研发及应用
    下载Doc文档

    猜你喜欢