群智能优化算法识别关键蛋白质及其复合物

群智能优化算法识别关键蛋白质及其复合物

论文摘要

随着生物信息学的高速发展,大量可用的蛋白质数据得以产生并用于相关研究。现阶段,生物信息领域中值得研究的热点之一是通过计算手段有效分析蛋白质结构与功能以增进对生物体生命过程的理解。特别是蛋白质-蛋白质相互作用网络中的关键蛋白和蛋白质复合物的发现与检测对于揭示生物体功能与组织具有十分重大的意义。近年来,群体智能优化算法的兴起和日益成熟为关键蛋白预测问题和蛋白质复合物检测问题提供了新视角。在关键蛋白预测问题上,本文主要利用群体智能优化算法以设计其与关键蛋白识别问题之间的对应关系并构建相应的识别模型,或是基于群体智能优化机制提出有效特征选择策略以判断蛋白质是否为关键蛋白,以改进识别准确率。考虑到关键蛋白与蛋白质复合物之间的密切关系,在蛋白质复合物检测问题上,本文主要结合关键蛋白信息来构建基于群体智能优化过程的蛋白质复合物检测模型以提高蛋白质复合物的识别性能。本文主要工作如下:(1)基于群体智能优化过程的关键蛋白识别模型。针对于关键蛋白预测准确率低的缺陷,提出了改进的花授粉算法以识别关键蛋白。通过模仿花授粉算法中的花朵授粉过程,设计该过程与关键蛋白识别问题之间的对应关系,从而构建花朵授粉优化的新型关键蛋白识别模型。同时,较全面地融合蛋白质-蛋白质相互作用网络中的拓扑与生物属性。实验结果显示改进后,新算法的预测准确率优于经典的关键蛋白识别算法。(2)基于群体智能优化的特征选择策略预测关键蛋白。针对于大部分关键蛋白识别方法都是以少数特征为基础来识别关键蛋白,缺乏对多种拓扑特征与生物特征分析的缺陷,提出了基于花授粉优化的特征选择策略以预测蛋白质的关键性。收集与蛋白质关键性有关的多种拓扑特征与生物特征,融合花授粉算法与精英搜索机制选出最优特征子集,以确定每个蛋白质是否为关键蛋白。实验结果表明,新特征选择策略比经典特征选择方法具有更好性能。(3)基于群体智能优化机制的蛋白质复合物检测算法。针对于传统蛋白质复合物检测中的缺陷,并考虑到关键蛋白与复合物之间的密切关系,分别设计了花授粉机制与飞蛾扑火机制的复合物检测算法。在花授粉机制的复合物检测算法中,通过考虑数据源,包含关键蛋白信息、位置信息、功能信息及拓扑信息,以建立多关系重构动态蛋白质网络,然后结合复合物结构,寻找该网络中复合物的潜在核心,最后将附件蛋白质添加到相应核心中以形成蛋白质复合物,实验结果显示新提出的复合物检测算法比经典算法更能够准确检测蛋白质复合物。在飞蛾扑火机制的复合物检测算法中,从不同角度出发以构建可靠的动态蛋白质网络,然后引进逐层思想并整合关键蛋白信息以找到复合物核心作为火焰,使飞蛾围绕着火焰呈螺旋状飞行,从而找到蛋白质复合物,最后使用过滤操作以提炼出最终预测的蛋白质复合物,实验结果显示新设计的复合物检测算法可比经典算法检测出准确率更高的蛋白质复合物。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  •   1.1 研究背景及意义
  •   1.2 国内外研究现状
  •     1.2.1 研究现状之关键蛋白
  •     1.2.2 研究现状之蛋白质复合物
  •   1.3 论文研究内容
  •   1.4 论文结构安排
  • 第2章 基础知识介绍
  •   2.1 蛋白质相互作用网络
  •     2.1.1 PPI网络
  •     2.1.2 蛋白质复合物结构
  •   2.2 群体智能优化算法概述
  •   2.3 花授粉算法
  •     2.3.1 FPA算法的全局授粉
  •     2.3.2 FPA算法的局部授粉
  •     2.3.3 FPA算法执行步骤
  •   2.4 飞蛾扑火算法
  •     2.4.1 MFO算法的优化过程
  •     2.4.2 MFO算法执行步骤
  •   2.5 本章小结
  • 第3章 基于改进的花授粉算法识别关键蛋白质
  •   3.1 概述
  •   3.2 改进花授粉算法识别关键蛋白模型
  •     3.2.1 花粉位置设计
  •     3.2.2 授粉过程设计
  •     3.2.3 评价函数设计
  •     3.2.4 算法流程
  •   3.3 实验仿真及分析
  •     3.3.1 实验数据
  •     3.3.2 算法比较
  •     3.3.3 参数分析
  •   3.4 本章小结
  • 第4章 基于花授粉算法的特征选择策略预测蛋白质关键性
  •   4.1 概述
  •   4.2 花授粉算法的特征选择策略预测蛋白质关键性
  •     4.2.1 特征收集
  •     4.2.2 特征选择
  •     4.2.3 分类器设计
  •     4.2.4 算法流程
  •   4.3 实验仿真及分析
  •     4.3.1 实验数据
  •     4.3.2 平衡数据集比较
  •     4.3.3 不同特征选择方法比较
  •     4.3.4 不同特征子集比较
  •     4.3.5 不同分类器性能比较
  •   4.4 本章小结
  • 第5章 基于花授粉机制的蛋白质复合物检测
  •   5.1 概述
  •   5.2 多关系重构动态蛋白质网络
  •   5.3 IFPA算法检测蛋白质复合物
  •   5.4 实验仿真及分析
  •     5.4.1 实验数据
  •     5.4.2 评价指标
  •     5.4.3 参数分析
  •     5.4.4 算法比较
  •   5.5 本章小结
  • 第6章 基于飞蛾扑火优化算法的蛋白质复合物检测
  •   6.1 可靠动态PPI网络构建
  •   6.2 飞蛾扑火优化算法检测蛋白质复合物
  •     6.2.1 MFOC算法
  •     6.2.2 算法时间复杂度分析
  •   6.3 实验仿真及分析
  •     6.3.1 实验数据
  •     6.3.2 评价指标
  •     6.3.3 参数分析
  •     6.3.4 算法比较
  •   6.4 本章小结
  • 第7章 总结与展望
  •   7.1 研究工作总结
  •   7.2 研究未来展望
  • 参考文献
  • 致谢
  • 攻读硕士期间研究成果
  • 文章来源

    类型: 硕士论文

    作者: 方铭

    导师: 雷秀娟

    关键词: 蛋白质相互作用网络,群智能优化,蛋白质复合物,关键蛋白

    来源: 陕西师范大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 生物学,自动化技术

    单位: 陕西师范大学

    分类号: TP18;Q51

    DOI: 10.27292/d.cnki.gsxfu.2019.001271

    总页数: 93

    文件大小: 6374K

    下载量: 28

    相关论文文献

    标签:;  ;  ;  ;  

    群智能优化算法识别关键蛋白质及其复合物
    下载Doc文档

    猜你喜欢