论文摘要
多功能酶作为一种生物催化剂在生物的各种反应中都起到了非常重要的作用。正确区分多功能酶在基因工程和细胞工程中能起到关键性作用。本文目的是通过多标签分类器对多功能酶进行功能预测,由于多功能酶的预测受到数据集、特征表达、分类器的选择影响,因此,本文从这些方面展开了研究工作。具体研究工作如下:(1)多功能酶的研究中前人构建的数据集同源性太高,在对低同源性多功能酶进行预测时精度不是很高,因此,本文构建出了较低同源性多功能酶数据集进行多功能酶的预测。(2)针对特征表达,本文提出了多重进化信息PSSM矩阵。多重进化信息PSSM矩阵相对于传统的PSSM矩阵能够表达出多功能酶序列的更多进化信息。本文还结合二维Gabor变换对PSSM矩阵进行局部特征提取。通过Gabor变换可以将PSSM矩阵进行多尺度、多方向的分解,因此,能得到PSSM更多的信息。相对于现有的基于PSSM矩阵的特征提取法(DPC-PSSM)本文的方法在分类效果上有一定的优势。基于氨基酸序列特征表达中,本文提出了二肽局部词特征提取法,提取到的特征相对于AAC、AmPseAAC有更好的效果。(3)针对实验中得到的多种特征信息,本文进行了特征融合。首先。运用特征抽取融合方法进行特征的融合,在特征抽取中运用到了递归特征消除法(RFE)。其次,将融合后的数据进行归一化和除冗余。经过处理后的融合特征数据在召回率、精度、F-值和平均精度这四种指标上能达到92.21%、93.73%、91.11%、97.68%。(4)针对多功能酶分类预测问题,本文使用了随机K标签集成分类算法,在随机K标签分类算法中基分类器的选择上做了详细的讨论。本文中分别用了支持向量机分类模型(SVM)、K近邻分类模型(KNN)、贝叶斯分类模型(NB)、随机森林分类模型(RF)四个分类器进行实验。通过五折交叉验证以及四种评估指标对这些基分类器进行分析,发现随机森林作为基分类器取得的性能最好。本文构建的模型与其它多标签分类模型相比,能取得比较良好的分类效果。
论文目录
文章来源
类型: 硕士论文
作者: 刘干
导师: 王顺芳
关键词: 多标签学习,多功能酶,矩阵,多重进化矩阵,特征融合
来源: 云南大学
年度: 2019
分类: 基础科学,信息科技
专业: 生物学,自动化技术
单位: 云南大学
分类号: TP181;Q55
总页数: 60
文件大小: 3385K
下载量: 30
相关论文文献
- [1].我国首个智能多功能酶研制成功[J]. 食品与发酵工业 2008(06)
- [2].催化剂及助剂[J]. 精细与专用化学品 2008(09)
- [3].代谢途径的进化[J]. 动物学研究 2008(04)
- [4].科研动态[J]. 上海化工 2008(06)
- [5].寄生虫烯醇化酶的研究进展[J]. 中国动物传染病学报 2015(04)
- [6].CaMKⅡ在神经缺血性损伤中的作用[J]. 山东医药 2013(28)
- [7].角质酶的研究进展[J]. 生物工程学报 2009(12)
- [8].天津工生所在羧酸还原酶催化机制的计算解析领域取得进展[J]. 河南化工 2019(01)
- [9].β-甘露聚糖酶的研究进展[J]. 河南农业科学 2011(04)
- [10].谷胱甘肽S转移酶系与年龄相关性白内障的研究进展[J]. 国际眼科杂志 2011(11)
- [11].环糊精葡萄糖基转移酶的基因改造与高效表达[J]. 中国生物工程杂志 2015(02)
- [12].家蚕质型多角体病毒(苏州株)基因组片段8 cDNA克隆与分析[J]. 科技通报 2010(06)
- [13].涉及西他列汀的中国专利申请分析与预警[J]. 中国医药生物技术 2015(03)
- [14].L-蛋氨酸γ-裂解酶的研究进展[J]. 生物技术通报 2009(10)