论文摘要
构建计算模型分析海量的蛋白序列数据并实现其信息的准确识别是生物信息学领域研究中的重点问题。这里数据的定量描述和模型构建是蛋白序列分析的关键。蛋白序列图形表示方法拥有计算简单、易数值刻画和可用于处理大量数据等优点,自提出以来备受研究者们的关注。迭代函数构造是蛋白序列图形表示中的重要一环。通过将蛋白质图形表示中的迭代函数推广到高维空间,本论文提出了一种适用范围更加广泛的广义迭代函数。应用该广义迭代函数和氨基酸残基的某些理化指标,得到了一类新的蛋白质序列图形表示方法并对所得到的图形进行数值刻画,从而得到了新的蛋白质序列的相似性分析方法。利用本文的方法,分别比较10种物种ND5蛋白序列与ND6蛋白序列的相似性并构建了它们之间的进化树。将本文方法所得结果与ClustalW方法得到的结果逐一进行相关性分析。分析结果显示,本文所得结果与ClustalW方法得到的结果具有较高的相关性。进一步地,本文利用提出的蛋白质序列图形表示方法,构造了一种基于多种氨基酸残基理化指标的高维广义迭代函数模型。采用矩阵的奇异值分解方法对其进行数值刻画,并将此方法应用于蛋白质亚细胞定位预测中。运用BP神经网络算法,对蛋白质数据集CL317进行预测,取得95.31%的总体预测精度。这些结果表明,本文所提出的方法具有一定的有效性和可靠性。
论文目录
文章来源
类型: 硕士论文
作者: 黄嘉禾
导师: 贺平安
关键词: 蛋白质序列,图形表示,广义迭代函数,神经网络,亚细胞定位
来源: 浙江理工大学
年度: 2019
分类: 基础科学
专业: 生物学
单位: 浙江理工大学
分类号: Q811.4
总页数: 56
文件大小: 1412K
下载量: 14