多功能酶分类预测中的特征表达与融合算法研究

多功能酶分类预测中的特征表达与融合算法研究

论文摘要

多功能酶作为一种生物催化剂在生物的各种反应中都起到了非常重要的作用。正确区分多功能酶在基因工程和细胞工程中能起到关键性作用。本文目的是通过多标签分类器对多功能酶进行功能预测,由于多功能酶的预测受到数据集、特征表达、分类器的选择影响,因此,本文从这些方面展开了研究工作。具体研究工作如下:(1)多功能酶的研究中前人构建的数据集同源性太高,在对低同源性多功能酶进行预测时精度不是很高,因此,本文构建出了较低同源性多功能酶数据集进行多功能酶的预测。(2)针对特征表达,本文提出了多重进化信息PSSM矩阵。多重进化信息PSSM矩阵相对于传统的PSSM矩阵能够表达出多功能酶序列的更多进化信息。本文还结合二维Gabor变换对PSSM矩阵进行局部特征提取。通过Gabor变换可以将PSSM矩阵进行多尺度、多方向的分解,因此,能得到PSSM更多的信息。相对于现有的基于PSSM矩阵的特征提取法(DPC-PSSM)本文的方法在分类效果上有一定的优势。基于氨基酸序列特征表达中,本文提出了二肽局部词特征提取法,提取到的特征相对于AAC、AmPseAAC有更好的效果。(3)针对实验中得到的多种特征信息,本文进行了特征融合。首先。运用特征抽取融合方法进行特征的融合,在特征抽取中运用到了递归特征消除法(RFE)。其次,将融合后的数据进行归一化和除冗余。经过处理后的融合特征数据在召回率、精度、F-值和平均精度这四种指标上能达到92.21%、93.73%、91.11%、97.68%。(4)针对多功能酶分类预测问题,本文使用了随机K标签集成分类算法,在随机K标签分类算法中基分类器的选择上做了详细的讨论。本文中分别用了支持向量机分类模型(SVM)、K近邻分类模型(KNN)、贝叶斯分类模型(NB)、随机森林分类模型(RF)四个分类器进行实验。通过五折交叉验证以及四种评估指标对这些基分类器进行分析,发现随机森林作为基分类器取得的性能最好。本文构建的模型与其它多标签分类模型相比,能取得比较良好的分类效果。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  •   1.1 多功能酶的研究背景及意义
  •     1.1.1. 多功能酶的背景介绍
  •     1.1.2 多功能酶的研究意义
  •   1.2 多功能酶预测的研究现状
  •   1.3 多功能酶相关数据库的介绍
  •   1.4 本文的工作及创新点
  •   1.5 本文的组织结构
  • 第二章 多功能酶预测分类常用分析方法
  •   2.1 多功能酶研究的分类算法
  •     2.1.1 问题转化策略算法
  •     2.1.2 算法自适应策略分类器
  •     2.1.3 随机K标签算法(RAKEL算法)
  •   2.2 分类器评估指标
  •   2.3 多功能酶的特征表达传统的方法
  •     2.3.1 基于序列本身的特征表达
  •     2.3.2 基于PSSM矩阵的特征表达
  •   2.4 本章小结
  • 第三章 基于改进PSSM矩阵及二维Gbor变换局部特征提取的多功能酶预测
  •   3.1 数据集的构建
  •   3.2 多重进化信息PSSM矩阵
  •     3.2.1 多重进化信息PSSM矩阵生成原理
  •     3.2.2 生成多重进化信息PSSM矩阵的步骤
  •   3.3 二维Gbor变换局部特征提取法
  •     3.3.1 Gabor变换
  •     3.3.2 PSSM矩阵二维Gabor变换局部特征提取法步骤
  •   3.4 实验步骤
  •   3.5 实验结果分析
  •     3.5.1 三种特征表达的比较
  •     3.5.2 不同基分类器的比较
  •     3.5.3 与其他PSSM方法比较
  •   3.6 本章小结
  • 第四章 基于二肽局部词特征提取及多特征融合的多功能酶预测
  •   4.1 基于二肽局部词特征提取算法
  •     4.1.1 相关概念
  •     4.1.2 二肽局部词特征提取步骤
  •   4.2 特征融合方法
  •     4.2.1 特征抽取的融合方法
  •     4.2.2 融合后的特征归一化及除冗余
  •   4.3 实验步骤
  •   4.4 实验结果分析
  •     4.4.1 二肽局部词特征提取的特征与基于序列特征表达比较
  •     4.4.2 RAKELo算法和RAKELd算法实验数据分析
  •     4.4.3 RANKELo算法中各基分类器实验数据分析
  •     4.4.4 不同来源的特征提取算法的实验数据分析
  •     4.4.5 与其他方法对比
  •     4.4.6 与不同的多标签分类器进行对比
  •   4.5 本章小结
  • 第五章 总结与展望
  •   5.1 本文的工作总结
  •   5.2 本文的未来工作展望
  • 参考文献
  • 攻读硕士学位期间完成的科研成果
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 刘干

    导师: 王顺芳

    关键词: 多标签学习,多功能酶,矩阵,多重进化矩阵,特征融合

    来源: 云南大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 生物学,自动化技术

    单位: 云南大学

    分类号: TP181;Q55

    总页数: 60

    文件大小: 3385K

    下载量: 30

    相关论文文献

    • [1].我国首个智能多功能酶研制成功[J]. 食品与发酵工业 2008(06)
    • [2].催化剂及助剂[J]. 精细与专用化学品 2008(09)
    • [3].代谢途径的进化[J]. 动物学研究 2008(04)
    • [4].科研动态[J]. 上海化工 2008(06)
    • [5].寄生虫烯醇化酶的研究进展[J]. 中国动物传染病学报 2015(04)
    • [6].CaMKⅡ在神经缺血性损伤中的作用[J]. 山东医药 2013(28)
    • [7].角质酶的研究进展[J]. 生物工程学报 2009(12)
    • [8].天津工生所在羧酸还原酶催化机制的计算解析领域取得进展[J]. 河南化工 2019(01)
    • [9].β-甘露聚糖酶的研究进展[J]. 河南农业科学 2011(04)
    • [10].谷胱甘肽S转移酶系与年龄相关性白内障的研究进展[J]. 国际眼科杂志 2011(11)
    • [11].环糊精葡萄糖基转移酶的基因改造与高效表达[J]. 中国生物工程杂志 2015(02)
    • [12].家蚕质型多角体病毒(苏州株)基因组片段8 cDNA克隆与分析[J]. 科技通报 2010(06)
    • [13].涉及西他列汀的中国专利申请分析与预警[J]. 中国医药生物技术 2015(03)
    • [14].L-蛋氨酸γ-裂解酶的研究进展[J]. 生物技术通报 2009(10)

    标签:;  ;  ;  ;  ;  

    多功能酶分类预测中的特征表达与融合算法研究
    下载Doc文档

    猜你喜欢