导读:本文包含了膜蛋白预测论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:蛋白,蛋白质,抗原,向量,疏水,算法,弧菌。
膜蛋白预测论文文献综述
卿蕊,向晴可,刘众齐,肖非,阳帆[1](2018)在《幽门螺杆菌外膜蛋白Omp18免疫优势表位的预测与鉴定》一文中研究指出目的:分析预测幽门螺杆菌(Hp)外膜蛋白Omp18的免疫优势表位,并进一步验证确定其免疫优势片段的免疫原性。方法:通过生物信息学软件DNAStar分析预测幽门螺杆菌外膜蛋白Omp18的潜在优势表位,并由北京赛百盛基因技术有限公司合成相应的优势片段;片段通过口服免疫的方式免疫接种雌性BALB/c小鼠,每周1次共免疫4次。末次免疫10 d后处死小鼠,取血清检测IgG、IgA水平,取肠道灌洗液检测sIgA水平;取小鼠脾细胞ELISA法检测细胞上清中IFN-γ、IL-2、IL-4、IL-6水平,并通过MTT比色法检测脾细胞增殖情况;末次免疫10 d后Hp标准株攻击小鼠2次,4周后处死小鼠,取胃组织进行快速尿素酶实验,并计算每组的感染率。结果:ELISA法检测各片段免疫小鼠血清IgG、IgA以及肠道sIgA水平均高于对照组,且差异有显着统计学意义(P<0. 05);各免疫组脾细胞上清INF-γ、IL-2水平均显着高于对照组(P<0. 05),而IL-4、IL-6水平较对照组则差异无显着统计学意义(P>0. 05);MTT比色法结果显示各片段刺激后小鼠淋巴细胞均有显着增殖(P<0. 05);快速尿素酶实验结果提示各片段免疫后均能显着减少小鼠胃组织中Hp的感染(P<0. 05)。结论:通过生物信息学软件分析预测的外膜蛋白Omp18优势片段均具有较好的免疫原性,且对Hp感染有一定的保护作用。(本文来源于《中国免疫学杂志》期刊2018年12期)
张峥嵘,张玉晴,许如苏,许晓升[2](2018)在《副溶血性弧菌外膜蛋白K的B细胞线性表位预测》一文中研究指出目的预测副溶血性弧菌外膜蛋白K(OmpK)的B细胞线性表位。方法 NCBI下载已登录的OmpK的基因序列,对其进行生物信息学分析,应用DNAStar protean软件综合分析OmpK蛋白的二级结构、柔性、表面可能性、亲水性和抗原指数等多种参数,预测其B细胞线性表位。结果 OmpK蛋白的优势B细胞线性表位位于肽链的第7-13、25-36、63-69、140-147、182-188、234-239区段。结论预测得到OmpK蛋白的6个优势B细胞线性表位,为进而克隆表达串联表位蛋白,研制副溶血性弧菌多表位疫苗奠定基础。(本文来源于《中国微生态学杂志》期刊2018年07期)
郭磊,王顺芳[3](2019)在《序列信息融合与两阶段特征选择的膜蛋白预测》一文中研究指出膜蛋白的功能与其类型密切相关,因此膜蛋白类型的预测具有重要意义。针对膜蛋白特征表达过程中出现的特征维数高的问题,结合最大信息系数与遗传算法提出一种两阶段特征选择(MIC-GA)。抽取膜蛋白序列信息中的伪氨基酸组成、二肽组成和位置特异性分数矩阵等特征融合后作为特征参数,并在融合过程中提出一种改进的ReliefF算法(FReliefF)得到更有效的特征分数。基于Stacking集成学习框架,两次使用极端随机树对膜蛋白类型进行合理化预测。结果表明该方法能够有效提高膜蛋白预测的准确率。(本文来源于《计算机工程与应用》期刊2019年06期)
张席[4](2018)在《基于PsePSSM的蛋白质-ATP结合位点预测与膜蛋白分类》一文中研究指出蛋白质序列特征提取是生物信息学研究中的关键环节。基于内容的氨基酸组分特征K-mer是常用的蛋白质特征提取方法,但对较短序列存在特征表达稀疏的缺陷。伪氨基酸序列进化信息(PsePSSM)源自位置特异性得分矩阵(PSSM),能反映序列进化信息且适于不等长序列,但其容错性优点尚未引起足够重视。本文将PsePSSM应用于蛋白质-ATP结合位点预测和膜蛋白分类,结果报道如下:基于伪氨基酸序列进化信息的蛋白质-ATP结合位点预测。蛋白质-ATP结合位点预测是高度不均衡的二分类问题,通过机器学习高精度预测蛋白质-ATP结合位点对研究蛋白质功能和药物设计意义重大。其样本序列等长、现有研究多经验性地选取窗口长度17aa、以位置特异性得分矩阵(PSSM)提取特征、用支持向量分类(SVC)建模预测,其独立预测Acc虚高、MCC偏低,预测精度尚有较大提升空间。本文以互信息I确定窗口长度为15aa、以更具容错性的PsePSSM提取特征、以相同正样本不同负样本构建多个1∶1 SVC分类器、最后进行简单投票,对两个蛋白质-ATP结合位点数据集ATP168与ATP227均获得了明显优于参比特征提取方法的独立预测结果,其MCC值分别从0.3110~0.5360、0.3060~0.553提升至0.7512、0.7106。进一步,我们阐明了PsePSSM容错性强的原因。基于伪氨基酸序列进化信息的膜蛋白分类预测。膜蛋白分类预测是一个典型的蛋白质序列不等长、多分类问题。PsePSSM能有效解决序列不等长问题,因本文所用数据集中最短序列为50aa,取最大间隔距离为25aa,则每条序列可用520个PsePSSM特征表征。以SVC建模预测,其独立预测精度Acc为66.86%。特征选择往往可降低模型复杂度、提高预测精度;采用可自动终止特征引入的特征选择方法MIC-share,获得了一个包含16个保留特征的最优特征子集,其独立预测精度Acc为86.41%,较未实施特征选择有大幅度提升。进一步讨论了OVO(一对一)、OVA(一对余)、HC(层次分类)等叁种多分类转二分类策略对预测精度的影响。反映序列进化信息、适于不等长序列、容错性强的PsePSSM在蛋白质序列特征提取方面有广泛应用前景。(本文来源于《湖南农业大学》期刊2018-06-01)
彭晟程[5](2018)在《基于多特征融合的高维膜蛋白数据分类预测研究》一文中研究指出膜蛋白作为蛋白质功能的体现者和承担者,在蛋白质组学研究中占有重要地位。研究表明,某些疾病的产生与膜蛋白功能及结构的改变有很大关系,因此,针对膜蛋白类型进行精确的分类预测成为一项重要的研究课题。面对海量膜蛋白序列数据,采用机器学习分类的方法,不仅节约时间、精力,而且能够提高序列数据的利用率。在复杂的蛋白质序列信息中,使用膜蛋白的物理化学性质,序列相关性以及序列进化信息,提取有效的特征,是本文处理序列特征的主要方法。本文提出了一种膜蛋白序列特征融合的表达方法并针对高维特征进行维度约减处理,最后使用多种分类器,引入集成分类思想开展实验对比,我们取得了前沿的成果,实验结果也充分表明融合表达方法的有效性。本文工作具体如下:(1)通过对膜蛋白的序列信息的分析,提出了融合四种特征抽取方法:伪氨基酸组成(40维)、二肽组成(400维)、氨基酸的属性组(13维)和位置特异性分数矩阵(400维)的方法,将原始的膜蛋白序列转化为一个853维度的特征向量。该特征中包含了丰富的序列特征信息,为后续建立可靠的预测模型奠定了良好的基础。(2)膜蛋白特征融合方法也同时带来了信息冗余和维度灾难的问题。因此,本文使用两种降维算法:主成分分析(PCA)与线性判别分析(LDA)。实验表明,经过降维处理后的融合表达方法不仅能够提高运算效率,分类性能也得到了改善。(3)为了进一步提高膜蛋白分类预测性能,本文引入集成学习中的Stacking集成学习框架。框架中的基分类器包括K近邻(KNN)、支持向量机(SVM)、神经网络(NN)和随机森林(RF),元分类器采用多元逻辑斯蒂回归算法(MLR)。实验表明,该方案能够获得更好的预测准确率。(本文来源于《云南大学》期刊2018-05-01)
宋佳智[6](2018)在《基于集成学习的膜蛋白金属离子结合位点预测》一文中研究指出蛋白质结构预测一直是近几年计算生物学领域的热门问题,我们可以通过了解蛋白质的相应结构,从而推断出其具有的功能并加以运用。不同功能的蛋白质可以与不同种类的化合物发生结合并构成结合蛋白质,这些化合物包括金属离子,核酸和磷酸等等。本文所研究的问题就是结合蛋白质中可以与金属离子结合的一类,即金属蛋白(metalloprotein)。超过1/3的蛋白质可以与金属离子结合以达到相应的结构和功能,因此确定蛋白序列中金属离子结合位点的位置对于理解蛋白质的生物功能有着十分重要的作用。传统使用生物实验的方法来测定结合位点位置的方式对于时间和经济的花费是非常巨大的,很难满足大规模的应用。因此采用计算方法来预测结合位点的信息有着很好的应用前景,可以对蛋白质结构的研究提供帮助。膜蛋白作为生物膜与外界进行物质交换的通道和载体,对于维持生物膜结构的稳定及实现生物膜的物质转运具有很重要的意义。通过预测膜蛋白序列上的金属离子结合位点,能够对膜蛋白结构—功能之间的关系有更深的理解。本文基于膜蛋白的序列信息对六种金属离子结合位点进行预测,包括~2,~2,,~2,以及~2。数据集包括PDB数据库中所有具有明确金属离子结合位点记录的膜蛋白序列信息,基于这些序列信息本文提出四类特征包括拓扑结构特征,进化保守性特征,协同进化性特征以及溶剂可及性特征,并将特征矩阵送入基于集成学习算法构成的分类器,进而预测金属离子与蛋白质的结合。与传统依靠滑动窗口反映氨基酸保守性从而预测序列上连续的结合位点的方法相比,本文的预测方法更关注结合位点在蛋白质空间结构上的连续性,由于蛋白质二级结构的存在,空间结构上连续的结合位点氨基酸在序列上很可能是离散的,因此这种观点更加符合生物学意义。在测试集上的实验结果表明,本文所阐述的预测方法具有较好的泛化能力,能够较准确地完成对膜蛋白离子结合位点的预测工作,同时相较于同样使用序列信息对金属离子结合位点进行预测的S-SITE拥有更好的预测效果。(本文来源于《东北师范大学》期刊2018-03-01)
殷曦[7](2017)在《基于机器学习及统计计算模型的膜蛋白结构预测》一文中研究指出蛋白质在生命活动中扮演着极为重要的角色,在生物体结构中发挥着关键作用。蛋白质广泛分布于细胞结构中,以蛋白质大分子的形式通过不同的折迭构象表达了多样的生物遗传基因。膜蛋白是作为一种重要的蛋白质类型主要存在于生物膜中,由于其结构的复杂性,目前已解决结构的膜蛋白数量非常少,在蛋白质数据库中膜蛋白所占比例不足蛋白质组总数的30%。但是膜蛋白分布在生物膜中,在分子运输、离子交换、膜的锚定、药物靶点以及药物设计等方面中有着至关重要影响,接近60%的药物作用在膜蛋白上。因此,解决膜蛋白的结构具有深远的意义。结构相似的蛋白质往往具有相似的功能,因此,获取蛋白质的结构对解析蛋白质功能机理具有重要的作用。在目前的后基因组时代,蛋白质数据库中所收录的序列数目已经达到百万级别并在迅速扩充,与之相比,而通过实验的方法已解决结构的蛋白质数量则存在巨大差距。因此,对获取更多蛋白质结构的需求尤为紧迫。目前测定蛋白质的结构可以通过传统的实验方法如X射线、核磁共振(NMR)和冷冻电镜(Cryo-EM)等方式。由于膜蛋白的结构复杂性,特别是其镶嵌在脂类层的跨膜结构具有疏水特性,利用实验的方法解决蛋白质结构时难以结晶,而且这种方式有着成本高昂,耗时长的弊端,所以为计算的方法预测蛋白质结构提供了广阔的发展空间。近些年来,随着模式识别研究领域的发展,基于机器学习和人工智能的方法得到了深入的研究和广泛的应用,其中,利用模式识别理论与方法预测蛋白质结构在生物信息学领域取得了一定的成果。利用当前蛋白质数据库中已解决结构的蛋白质数据为样本,按照一定的标准筛选并组织数据集,根据已知结构的注释信息建立训练数据的样本和类标,为实现机器学习算法提供了样本数据。与此同时,通过分析和研究蛋白质的结构及其特性,提取多种蛋白质特征,组建训练和测试数据集,然后运用机器学习算法训练预测模型。基于评价指标和交叉验证的方法检验算法流程的性能,从而实现对目标蛋白质的结构预测。另一方面,基于蛋白质残基特异性的统计计算和分析的方法,也取得了重要的进展,此类方法不需要训练过程,而是对大规模、高质量的样本进行统计计算。如同源性多重序列比对的方法,通过统计和计算共进化特征,得到蛋白质序列中残基之间的进化保守性关联信息。目前的这些方法在蛋白质结构预测方面虽然取得了一定进展,但还存在一定局限性和提升空间。在预测精确度、蛋白质结构特异性、不规则复杂空间结构、预测算法鲁棒性和蛋白质类型适用性方面还需提高,而且有些预测模型没有考虑蛋白质的结构特性以及氨基酸之间的局部关联特征。基于诸多方面,为了进一步提升和改善蛋白质结构预测方法的精度和性能,针对蛋白质序列的生物和结构特性,本文在β-桶状蛋白质(β-barrels)拓扑结构预测、残基相互作用以及β-链(β-strand)之间的关联性计算等方面进行了深入研究,并创新了预测模型的构建以及方法流程的设计。本文的主要贡献由以下几个部分构成:(1)通过从最新的蛋白质数据库(Protein Data Bank,PDB)筛选高分辨率蛋白质样本,构建高质量基准数据集。为排除数据集中蛋白质同源性的影响,去除相似度冗余,数据集中任意两条序列的同源性降低至30%,使得数据集涵盖更多的蛋白质超家族,从而使预测模型具有更为广泛的适用性,覆盖更多的蛋白质类型。通过组建高质量基准数据集进行训练和测试预测模型,其中,所构建的数据集相对于目前其他的方法,具有更大规模、覆盖蛋白质超家族更广、具高精度的蛋白质结构类标等特点,为建立预测模型提供更准确可靠的基准样本集及类别属性。(2)在特征提取方面,基于多视角蛋白质特征提取结合多重序列比对等方法,挖掘隐含的氨基酸进化保守性以及关联一致性信息。对多重同源蛋白质序列的结构特异性进行统计计算,利用基于优化的滑动窗口的方法将氨基酸结构特征与进化保守性信息进行融合,对特征矩阵采用稀疏编码算法进行抽取,达到了降低维度冗余和去除混入噪声的效果,进一步为提升预测蛋白质拓扑结构的性能。(3)本文提出了链学习的方法对膜蛋白β-桶状蛋白质(β-barrels)拓扑结构进行预测。克服了目前方法处理复杂特殊结构以及残基状态连续性等预测精确度较低的问题,本文通过融合局部序列中相邻残基之间的关联特性,挖掘隐含的状态连续性约束信息,与全局序列特征相结合,再通过构建两层分类器的方式,对上一层模型的输出结果进行优化,解决了目前的方法独立预测残基状态所带来的输出突变的问题,同时对预测概率曲线起到平滑作用,显着提高总体预测准确率。(4)在预测β-桶状蛋白跨膜结构的后处理阶段,提出了动态阈值的方法,对预测得到的概率曲线进行划分。这种方法是基于优化的初始阈值之上,根据统计的β-链(β-strand)长度分布,有针对性的处理由短的卷曲结构(Loop)连接的β-strand,能够识别β-转角(β-turn)和β-凸起(β-bugle)等不规则特殊的折迭片段,有效的去除易导致误分类的影响因素。经过对蛋白质结构的特异性分析,采用动态阈值分割的方法,对预测结果进行后处理,提升了预测模型的广泛适用性。(5)在基于预测膜蛋白拓扑结构的基础之上,预测β-桶状蛋白质关联图、β-strand结构相互作用关系,提出了融合共进化关联计算与机器学习的方法,实现了算法的优势互补,覆盖不同残基关联模式,提高了模型的泛化性能。在特征提取方面,采用了基于深度学习的神经网络框架,构建多层自动编码器,挖掘残基特征隐含的进化关联特性,实现高维特征的低维表达,同时,起到了对特征空间降维和去噪的作用,进一步提高了预测模型的性能。(本文来源于《上海交通大学》期刊2017-12-01)
李渊,徐黎明,赵景壮,刘淼,任广明[8](2017)在《黑龙江地区鲤疱疹病毒3型的流行病学调查及其主要囊膜蛋白的抗原表位预测》一文中研究指出2015-2016年对来自黑龙江地区46个养殖场送检的鲤鱼进行锦鲤疱疹病毒(Koi herpes virus,KHV)的分离鉴定,并应用DNAStar等软件对检出的阳性样本的主要囊膜蛋白(Major envelop protein,MEP)基因进行生物信息学分析。结果显示,KHV的检出率约为6.5%,3株阳性样本具有相同的MEP基因序列,称之为KHV-HLJ1516。MEP基因开放阅读框为771 bp,编码256个氨基酸,相对分子质量为28 280.58,等电点为8.40。对KHV-HLJ1516的MEP基因序列同源性分析表明,其与KHV-GZ11分离株仅有1个碱基不同,但并未导致氨基酸发生改变,碱基相似性为99%;而与HZ419分离株相比,KHV-HLJ1516的MEP基因有3个碱基发生突变,相应的氨基酸由Asn变为IIe。聚类分析结果显示,KHV-HLJ1516与KHV-GZ11处于同一分支,而HZ419位于另一分支。B细胞抗原表位预测结果显示,KHV-HLJ1516的MEP的抗原表位主要位于4~11,24~40,42~63,82~110,209~218,238~249氨基酸区段。(本文来源于《淡水渔业》期刊2017年04期)
俱雄,党亚锋,刘祥,丁锐,陈琛[9](2017)在《大肠杆菌外膜蛋白OmpC的生物信息学分析及表位多肽疫苗的重组预测》一文中研究指出为设计大肠杆菌外膜蛋白OmpC的表位多肽重组疫苗,进一步提高OmpC蛋白的免疫效果,通过生物信息学软件对OmpC蛋白的进化关系、高级结构与细胞表位进行分析。结果表明,大肠杆菌、沙门伤寒菌、肺炎克雷伯菌,这3种细菌具有较高同源性,OmpC蛋白可能对这3种菌株的感染起到交叉免疫保护作用。OmpC为亲水性蛋白,1~21位氨基酸为信号肽位置,无跨膜结构并定位于细胞膜外;OmpC二级结构中含无规则卷曲43.05%,a-螺旋16.08%,β-转角0%,β-片层40.87%。OmpC蛋白可能存在5个优势B细胞表位,1个CTL表位,1个Th细胞表位;并重组拼接获得抗原性较好的OmpC蛋白表位多肽。(本文来源于《河南农业大学学报》期刊2017年01期)
郜法启,于东军,沈红斌[10](2016)在《基于分类器集成的跨膜蛋白两亲螺旋区域位置预测》一文中研究指出为提高跨膜蛋白两亲螺旋区域(Amphipathic helices,AHs)预测的精度,基于蛋白质位置特异性得分矩阵、二级结构以及疏水矩,提出了一种新的衡量两亲性的螺旋周期性(Helix periodicity,HP)特征;利用Mem Brain预测器滤除跨膜区域片段并使用下采样的方法,降低了AHs的搜索空间;在此基础上训练基于支持向量机(Support vector machine,SVM)的集成分类器用于AHs预测。为了客观评价AHs的预测性能,首次构建了领域内较为完备可用的标准数据集。在此数据集上的实验结果表明所提方法优于其他AHs预测方法。(本文来源于《南京理工大学学报》期刊2016年04期)
膜蛋白预测论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
目的预测副溶血性弧菌外膜蛋白K(OmpK)的B细胞线性表位。方法 NCBI下载已登录的OmpK的基因序列,对其进行生物信息学分析,应用DNAStar protean软件综合分析OmpK蛋白的二级结构、柔性、表面可能性、亲水性和抗原指数等多种参数,预测其B细胞线性表位。结果 OmpK蛋白的优势B细胞线性表位位于肽链的第7-13、25-36、63-69、140-147、182-188、234-239区段。结论预测得到OmpK蛋白的6个优势B细胞线性表位,为进而克隆表达串联表位蛋白,研制副溶血性弧菌多表位疫苗奠定基础。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
膜蛋白预测论文参考文献
[1].卿蕊,向晴可,刘众齐,肖非,阳帆.幽门螺杆菌外膜蛋白Omp18免疫优势表位的预测与鉴定[J].中国免疫学杂志.2018
[2].张峥嵘,张玉晴,许如苏,许晓升.副溶血性弧菌外膜蛋白K的B细胞线性表位预测[J].中国微生态学杂志.2018
[3].郭磊,王顺芳.序列信息融合与两阶段特征选择的膜蛋白预测[J].计算机工程与应用.2019
[4].张席.基于PsePSSM的蛋白质-ATP结合位点预测与膜蛋白分类[D].湖南农业大学.2018
[5].彭晟程.基于多特征融合的高维膜蛋白数据分类预测研究[D].云南大学.2018
[6].宋佳智.基于集成学习的膜蛋白金属离子结合位点预测[D].东北师范大学.2018
[7].殷曦.基于机器学习及统计计算模型的膜蛋白结构预测[D].上海交通大学.2017
[8].李渊,徐黎明,赵景壮,刘淼,任广明.黑龙江地区鲤疱疹病毒3型的流行病学调查及其主要囊膜蛋白的抗原表位预测[J].淡水渔业.2017
[9].俱雄,党亚锋,刘祥,丁锐,陈琛.大肠杆菌外膜蛋白OmpC的生物信息学分析及表位多肽疫苗的重组预测[J].河南农业大学学报.2017
[10].郜法启,于东军,沈红斌.基于分类器集成的跨膜蛋白两亲螺旋区域位置预测[J].南京理工大学学报.2016