一类广义迭代图形表示在蛋白质序列分析中的应用

一类广义迭代图形表示在蛋白质序列分析中的应用

论文摘要

构建计算模型分析海量的蛋白序列数据并实现其信息的准确识别是生物信息学领域研究中的重点问题。这里数据的定量描述和模型构建是蛋白序列分析的关键。蛋白序列图形表示方法拥有计算简单、易数值刻画和可用于处理大量数据等优点,自提出以来备受研究者们的关注。迭代函数构造是蛋白序列图形表示中的重要一环。通过将蛋白质图形表示中的迭代函数推广到高维空间,本论文提出了一种适用范围更加广泛的广义迭代函数。应用该广义迭代函数和氨基酸残基的某些理化指标,得到了一类新的蛋白质序列图形表示方法并对所得到的图形进行数值刻画,从而得到了新的蛋白质序列的相似性分析方法。利用本文的方法,分别比较10种物种ND5蛋白序列与ND6蛋白序列的相似性并构建了它们之间的进化树。将本文方法所得结果与ClustalW方法得到的结果逐一进行相关性分析。分析结果显示,本文所得结果与ClustalW方法得到的结果具有较高的相关性。进一步地,本文利用提出的蛋白质序列图形表示方法,构造了一种基于多种氨基酸残基理化指标的高维广义迭代函数模型。采用矩阵的奇异值分解方法对其进行数值刻画,并将此方法应用于蛋白质亚细胞定位预测中。运用BP神经网络算法,对蛋白质数据集CL317进行预测,取得95.31%的总体预测精度。这些结果表明,本文所提出的方法具有一定的有效性和可靠性。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  •   1.1 蛋白质组学的研究背景和意义
  •   1.2 蛋白质序列的图形表示方法概况
  •   1.3 蛋白质序列中亚细胞定位预测研究概况
  •   1.4 本文主要的研究工作和内容
  • 第二章 蛋白质序列的相似性分析
  •   2.1 基于广义迭代函数的蛋白质序列图形表示
  •     2.1.1 确定氨基酸残基坐标
  •     2.1.2 广义迭代函数及其性质
  •   2.2 图形表示的数值刻画
  •   2.3 广义迭代函数的应用与评价
  •   2.4 模型推广
  •   2.5 本章小结
  • 第三章 新迭代模型在亚细胞定位预测中的应用
  •   3.1 确定氨基酸残基坐标与广义迭代函数参数
  •   3.2 矩阵的奇异值分解
  •   3.3 基于蛋白质图形表示的亚细胞定位预测模型
  •     3.3.1 方法与步骤
  •     3.3.2 数据选取
  •     3.3.3 实验过程
  •   3.4 模型评价
  •   3.5 本章小结
  • 第四章 总结与展望
  •   4.1 总结
  •   4.2 展望
  • 参考文献
  • 攻读硕士学位期间的研究成果
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 黄嘉禾

    导师: 贺平安

    关键词: 蛋白质序列,图形表示,广义迭代函数,神经网络,亚细胞定位

    来源: 浙江理工大学

    年度: 2019

    分类: 基础科学

    专业: 生物学

    单位: 浙江理工大学

    分类号: Q811.4

    总页数: 56

    文件大小: 1412K

    下载量: 14

    相关论文文献

    标签:;  ;  ;  ;  ;  

    一类广义迭代图形表示在蛋白质序列分析中的应用
    下载Doc文档

    猜你喜欢