导读:本文包含了蛋白质亚细胞位置论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:细胞,蛋白质,位置,特异性,向量,特征,凋亡。
蛋白质亚细胞位置论文文献综述
郭庭炜[1](2019)在《基于信息熵与深度森林的蛋白质亚细胞位置预测》一文中研究指出蛋白质的亚细胞位置信息能够为理解其生物学功能提供有力线索,在药物设计、病理分析等领域的研究中有着重要作用。在后基因组时代的当下,蛋白质测序技术取得了长足的发展。新发现蛋白质的数量正以惊人的速度飞速增长。如何快速准确的获取蛋白质的亚细胞位置信息已经成为了蛋白质组学中的一项关键任务。现有的蛋白质亚细胞位置识别方法主要分为基于生物化学实验的方法和基于计算的方法。其中,基于生物化学实验的方法是目前获取蛋白质亚细胞位置信息的主要手段。但是由于时间成本巨大,此类方法已经难以满足人们在识别效率方面的需求。与之相对,基于计算方法的出现为高效解决海量蛋白质序列的亚细胞位置识别问题提供了可行方案。近年来,人们对基于计算的蛋白质亚细胞位置预测方法做出了大量的研究。然而,受制于特征提取技术以及分类算法的性能,相关方法的预测准确率仍待提高。针对这一现状,本文在信息熵与深度森林的基础上对现有蛋白质亚细胞位置预测技术进行改进。在蛋白质特征提取方面,本文在分析了现有蛋白质特征提取技术缺陷的基础上,探究了基于信息熵的改进方案的有效性。在分类算法的构建方面,本文首先讨论了深度森林对蛋白质亚细胞位置预测问题的适用性,随后针对性的提出了两种改进模型以进一步提高最终预测结果的准确率。本文主要工作如下:(1)针对现有蛋白质序列信息特征提取技术以及进化信息特征提取技术的缺陷,提出了一种新的蛋白质特征提取方法,即IE-MoAC-PFR方法。其中,对于蛋白质序列信息特征的提取,针对传统n-gram-frequency特征不能有效表示蛋白质序列中氨基酸位置信息的缺陷,IE-MoAC-PFR方法使用信息熵刻画不同氨基酸片段在蛋白质序列中的分布情况,从而提升特征向量对蛋白质序列信息的反映能力。对于蛋白质进化信息特征的提取,针对传统基于自协方差的位置特异性矩阵的特征转换方法忽略了蛋白质序列中不同氨基酸在进化过程中的关系信息,IE-MoAC-PFR方法将自协方差扩展到位置特异性矩阵的不同列上。最后,为了能够更好地将蛋白质的序列信息和进化信息用于亚细胞位置的预测当中,IE-MoAC-PFR方法将所提取的蛋白质序列信息特征与进化信息特征结合生成蛋白质最终的特征向量。(2)针对蛋白质亚细胞位置预测问题小样本高维度的特性,提出一种深度森林改进算法,即FS-DF算法。为避免蛋白质高维稀疏特征向量中的无关特征以及噪声特征对模型最终预测准确率的影响,FS-DF算法将基于基尼系数的特征选择机制引入到深度森林的层级结构中。通过逐层筛除原始蛋白质特征向量中的无关特征以及噪声特征,相较于深度森林方法,FS-DF方法能够极大提升各层模型的性能,并在此基础上进行更为有效的表示学习。(3)FS-DF算法中,随着层级的不断加深,被筛除特征的不断增多可能会导致部分有用信息的丢失。为了更加充分地利用蛋白质特征向量中所蕴涵的亚细胞位置相关信息,从寻找并利用最优特征子集的角度出发,提出了一种新的深度森林改进算法,即Tabu-DF算法。在Tabu-DF算法中,面向最优特征子集的禁忌搜索机制被用于改进深度森林的层级结构。基于禁忌搜索可以避免陷入局部最优解的特性,Tabu-DF算法能够更有效地处理高维稀疏的蛋白质特征向量,并进一步提升最终预测结果的准确率。本文在Plant,NonPlant以及PsortNeg叁个标准数据集上对新提出方法的性能进行了验证。实验结果显示,相较于现有的方法,新提出的方法能够有效提高蛋白质亚细胞位置预测结果的准确率,为相关研究提供更为有效的信息。(本文来源于《西南大学》期刊2019-04-06)
翟云清,翟胜楠[2](2018)在《基于多标记学习的人类蛋白质亚细胞多位置预测》一文中研究指出细胞被认为是组成生物体机能的最小单位,而蛋白质是组成细胞的生物大分子,在生物体的生命活动中起着至关重要的作用.给定一个蛋白质序列,预测它在哪一个具体的细胞器工作,如细胞膜、线粒体等,该方法称为蛋白质亚细胞定位.预测蛋白质亚细胞定位是了解其功能和确定药物靶点的必要步骤.现有的预测方法只能预测单个蛋白质的亚细胞位置,本文致力于预测多位点的蛋白质亚细胞位置预测,基于含有3 077个凋亡蛋白的数据集,提取其GO特征并使用LIFT_PCC算法进行预测,实验结果表明该方法整体精度达到了59.36%,并通过了性能测试,这表明该方法将成为一个非常有用的高通量工具.(本文来源于《湖北民族学院学报(自然科学版)》期刊2018年01期)
王彤,薛建新,谭文安[3](2015)在《利用半监督降维算法预测蛋白质亚细胞位置》一文中研究指出首先采用伪氨基酸组成(Pse AA)和特定位点记分矩阵(PSSM)2种方法组合的特征提取方法来表达蛋白质序列。通过该方法将蛋白质序列转化成特征向量,虽然该向量在很大程度上保留了蛋白质序列的原始信息,但是它产生的相应的维数会很高,这使得蛋白质亚细胞位置的预测过程变得很复杂。同时,就目前的情况来看,想要获取大量已标记的蛋白质亚细胞位置样本也很困难。为了解决这些问题,提出采用半监督降维算法(SS-MVP)对特征向量进行降维的同时能从标记和未标记的样本点中提取对分类有用的信息。基于降维后的样本利用支持向量机(SVM)的算法来预测蛋白质亚细胞位置类型。实验结果表明,采用上述方法既能简化蛋白质亚细胞位置的预测系统,又能提高其分类性能。(本文来源于《上海第二工业大学学报》期刊2015年03期)
姜燕[4](2015)在《基于多信息融合预测单定位和多定位凋亡蛋白质亚细胞位置》一文中研究指出蛋白质是生物体关键的组成成分,存在于细胞中不同区域的蛋白质它们的功能也不一样。所以,预测蛋白质在细胞中的位置能更好的了解它们的功能。我们建立了一个新的单定位凋亡蛋白质数据集,通过特征筛选提取了氨基酸n肽组分信息、蛋白质骨架信息、化学位移信息和蛋白质保守位点的进化信息,并根据蛋白质物理化学特性提取了亲疏水信息,最后将以上各单特征信息进行融合,采用支持向量机(SVM)算法及加权K近邻(K-Nearest Neighbors, KNN)算法对单定位细胞凋亡蛋白质数据集进行分类预测,Jackknife检验下总体预测成功率分别达到了81%和77.9%。以单定位凋亡蛋白质数据集为标准集,本文还构建了一个多定位凋亡蛋白质数据集作为独立测试集,以氨基酸二肽组分信息和蛋白质骨架信息作为多定位凋亡蛋白质数据集的特征参数。结合加权K近邻(K-Nearest Neighbors, KNN)算法对其进行预测,总体预测成功率达到60.9%。(本文来源于《内蒙古大学》期刊2015-05-01)
严寿江[5](2014)在《基于氨基酸约化和位置特异性得分矩阵的蛋白质亚细胞定位预测方法研究》一文中研究指出为了加速蛋白质结构和功能的注解进程,研究如何通过理论计算或统计方法来预测蛋白质在细胞中的定位就成了一个非常重要的研究课题。蛋白质亚细胞定位预测对蛋白质的功能、相互作用及调控机制的研究具有重要意义。其研究成果可对蛋白质相互作用研究及新药物的开发提供借鉴和参考,还可为蛋白质的信息分析和应用算法设计提供新的思路。目前蛋白质亚细胞定位预测的研究主要集中在以下几个方面:(1)构建或选择一个有效的基准数据集来训练和测试预测模型;(2)建立能够真正反映要预测序列的本质相关属性的数学表达;(3)开发强有力的算法;(4)寻找可以用于客观评估预测模型准确率的合理验证方法;(5)建立公用的预测网站。本文针对定位预测中信息的提取、挑选及融合等问题,运用机器学习方法对蛋白质亚细胞定位预测展开研究,主要工作如下:首先,我们提出了基于位置特异性得分矩阵(PSSM)的特征表示方法,在此基础上得到叁种新的特征,分别表征了进化距离、区域组成和家族分类信息,构建融合模型来系统的提取序列信息,并使用主成分分析(PCA)算法挑选关键信息。同时,还详细讨论了不同参数对实验结果的影响,具体的实验及比较结果显示了该方法的有效性。其次,通过氨基酸物化性质和结构性质的约化,描述序列局部和全局信息的“组成”、“转换”和“分布”特征,并基于氨基酸亲疏水性的数值统计特征,提出了一种新的蛋白质特征表示方法(NSBH)。分别使用叁种分类器KNN、SVM及BP神经网络进行预测,比较了几种方法和特征融合方法的预测结果,显示融合特征表示及结合SVM分类器时能够达到更好的预测准确率。最后,使用MATLAB实现相关算法的图形用户界面(GUI)设计。结合具体的实例说明GUI的设计、编译及打包软件过程,详细介绍了该软件的安装和使用教程,用户可以根据自己的需求选择对应的算法来验证或者应用。(本文来源于《浙江理工大学》期刊2014-12-25)
陈颖丽,李前忠[6](2009)在《不同亚细胞位置的细胞凋亡蛋白质的结构特性分析》一文中研究指出细胞凋亡蛋白质是一类与人类疾病密切相关的蛋白质,在肿瘤、神经退行性疾病等病理过程中都有细胞凋亡存在。由于这些蛋白质在生物体的生长发育和动态平衡中起重(本文来源于《生物物理学报》期刊2009年S1期)
陈颖丽,李前忠[7](2009)在《不同亚细胞位置的细胞凋亡蛋白质的结构特性分析》一文中研究指出细胞凋亡蛋白质是一类与人类疾病密切相关的蛋白质,在肿瘤、神经退行性疾病等病理过程中都有细胞凋亡存在。由于这些蛋白质在生物体的生长发育和动态平衡中起重(本文来源于《第十一次中国生物物理学术大会暨第九届全国会员代表大会摘要集》期刊2009-07-12)
邹凌云,王正志,黄教民[8](2007)在《基于位置特异性谱和输入加权神经网络的蛋白质亚细胞定位预测(英文)》一文中研究指出蛋白质必须处于正确的亚细胞位置才能行使其功能。文章利用PSI-BLAST工具搜索蛋白质序列,提取位点特异性谱中的位点特异性得分矩阵作为蛋白质的一类特征,并计算4等分序列的氨基酸含量以及1~7阶二肽含量作为另外两类特征,由这叁类特征一共得到蛋白质序列的12个特征向量。通过设计一个简单加权函数对各类特征向量加权处理,作为神经网络预测器的输入,并使用Levenberg-Marquardt算法代替传统的EBP算法来调整网络权值和阈值,大大提高了训练速度。对具有4类亚细胞位置和12类亚细胞位置的两种蛋白质数据集分别进行"留一法"测试和5倍交叉验证测试,总体预测精度分别达到88.4%和83.3%。其中,对4类亚细胞位置数据集的预测效果优于普通BP神经网络、隐马尔可夫模型、模糊K邻近等预测方法,对12类亚细胞位置数据集的预测效果优于支持向量机分类方法。最后还对叁类特征采取不同加权比例对预测精度的影响进行了讨论,对选择的八种加权比例的预测结果表明,分别给予叁类特征合适的权值系数可以进一步提高预测精度。(本文来源于《遗传学报》期刊2007年12期)
裴志利,陈劲,练智超,孔英,梁艳春[9](2007)在《基于SOM算法的蛋白质亚细胞位置预测》一文中研究指出由于蛋白质的功能与亚细胞位置有关,可以通过预测蛋白质的亚细胞位置来推断蛋白质分子的功能.首先介绍了SOM模型和Batch-Type SOM模型,并用这两个模型分别预测了蛋白质的亚细胞位置,结果表明,使用SOM模型和Batch-Type SOM模型均可以比较准确地预测蛋白质的亚细胞位置;Batch-Type SOM模型在保持预测准确率的同时还可以减少预测的时间.(本文来源于《内蒙古大学学报(自然科学版)》期刊2007年02期)
陈颖丽,李前忠[10](2003)在《用离散量预测原核生物蛋白质的亚细胞位置》一文中研究指出基于不同亚细胞位置中蛋白质的氨基酸组成及序列信息不同这一观点,以单个氨基酸含量及两两组合氨基酸含量为信息构成离散源,分别计算了原核生物蛋白质叁类亚细胞位置的标准离散量D(Xe),D(Xp),D(Xc).利用离散增量的概念预测蛋白质的亚细胞位置,它是由这个蛋白质的离散量D(X)与叁个标准离散量D(Xe),D(Xp),D(Xc)之间离散增量的最小值所决定的.采用Self-consistency检验和Jack-knife检验方法,给出了选择五组不同信息作为离散源中参数时的预测结果.与现有的方法比较,发现用Jack-knife检验法预测extracellular类蛋白质时,给出的离散量方法能够给出最好的预测性能,结果也表明提取更多有效的序列信息是提高预测精度的关键.(本文来源于《内蒙古大学学报(自然科学版)》期刊2003年05期)
蛋白质亚细胞位置论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
细胞被认为是组成生物体机能的最小单位,而蛋白质是组成细胞的生物大分子,在生物体的生命活动中起着至关重要的作用.给定一个蛋白质序列,预测它在哪一个具体的细胞器工作,如细胞膜、线粒体等,该方法称为蛋白质亚细胞定位.预测蛋白质亚细胞定位是了解其功能和确定药物靶点的必要步骤.现有的预测方法只能预测单个蛋白质的亚细胞位置,本文致力于预测多位点的蛋白质亚细胞位置预测,基于含有3 077个凋亡蛋白的数据集,提取其GO特征并使用LIFT_PCC算法进行预测,实验结果表明该方法整体精度达到了59.36%,并通过了性能测试,这表明该方法将成为一个非常有用的高通量工具.
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
蛋白质亚细胞位置论文参考文献
[1].郭庭炜.基于信息熵与深度森林的蛋白质亚细胞位置预测[D].西南大学.2019
[2].翟云清,翟胜楠.基于多标记学习的人类蛋白质亚细胞多位置预测[J].湖北民族学院学报(自然科学版).2018
[3].王彤,薛建新,谭文安.利用半监督降维算法预测蛋白质亚细胞位置[J].上海第二工业大学学报.2015
[4].姜燕.基于多信息融合预测单定位和多定位凋亡蛋白质亚细胞位置[D].内蒙古大学.2015
[5].严寿江.基于氨基酸约化和位置特异性得分矩阵的蛋白质亚细胞定位预测方法研究[D].浙江理工大学.2014
[6].陈颖丽,李前忠.不同亚细胞位置的细胞凋亡蛋白质的结构特性分析[J].生物物理学报.2009
[7].陈颖丽,李前忠.不同亚细胞位置的细胞凋亡蛋白质的结构特性分析[C].第十一次中国生物物理学术大会暨第九届全国会员代表大会摘要集.2009
[8].邹凌云,王正志,黄教民.基于位置特异性谱和输入加权神经网络的蛋白质亚细胞定位预测(英文)[J].遗传学报.2007
[9].裴志利,陈劲,练智超,孔英,梁艳春.基于SOM算法的蛋白质亚细胞位置预测[J].内蒙古大学学报(自然科学版).2007
[10].陈颖丽,李前忠.用离散量预测原核生物蛋白质的亚细胞位置[J].内蒙古大学学报(自然科学版).2003