蛋白质识别论文-董祥芝,马勇,侯春平,张宝亮,张和鹏

蛋白质识别论文-董祥芝,马勇,侯春平,张宝亮,张和鹏

导读:本文包含了蛋白质识别论文开题报告文献综述及选题提纲参考文献,主要关键词:温度,pH双敏性,壳聚糖,N-异丙基丙烯酰胺,分子印迹

蛋白质识别论文文献综述

董祥芝,马勇,侯春平,张宝亮,张和鹏[1](2019)在《用于蛋白质BSA识别的温度/pH双敏印迹聚合物》一文中研究指出用N-异丙基丙烯酰胺(NIPAM)和壳聚糖为功能单体,牛血清白蛋白(BSA)为模板蛋白,在改性SiO2表面制备温度/pH双敏蛋白质印迹聚合物。TEM、FTIR和TG等结果证明印迹层已成功接枝在载体表面。系统研究了聚合物的温度/pH双敏性、吸附容量、吸附动力学、特异性、竞争吸附性及重复性。结果表明,印迹聚合物(MIP)的溶胀率和吸附容量受温度和pH影响较大,高温碱性收缩,低温酸性溶胀。在pH 4.6和35℃下,对0.6mg/mL BSA吸附4h时获得较大的吸附容量(83.74mg/g),印迹因子为2.02。同时MIP也有较好的特异性和竞争吸附性。重复5次后,吸附容量仍能维持在88%,说明重复性良好。这种新型的温度/pH双敏蛋白质分子印迹合成方法简单,在蛋白质的分离和识别方面有较好的应用前景。(本文来源于《化工进展》期刊2019年11期)

曹曼[2](2019)在《机器学习在蛋白质磷酸化、硝基化和硫化位点识别中的应用研究》一文中研究指出蛋白质翻译后修饰,也称为共价修饰,是调控蛋白质功能的重要机制,在信号通路和生物学过程中发挥着不可替代的作用,并可逆地决定了细胞的动力学和可塑性。然而,随着蛋白质翻译后修饰数据的高通量发展,传统的实验方法往往是费力、费时和昂贵的,快捷便利的计算识别修饰位点的预测方法应运而生。本论文主要基于机器学习,针对酪氨酸硝基化、硫化和磷酸化以及7种真菌的丝氨酸、苏氨酸和酪氨酸磷酸化位点分别建立了在线预测工具,并对其进行蛋白质组学分析。具体内容如下:1、基于弹性网络优化特征方法预测和分析酪氨酸翻译后修饰位点。酪氨酸翻译后修饰,主要包括硝基化、硫化和磷酸化,涉及不同的生理和病理过程。因此,预测整个蛋白质序列中酪氨酸残基的硝基化、硫化和磷酸化具有重要意义和实用价值。在这里,我们采用序列特征、物理化学性质和进化信息对特征进行编码,引入弹性网络进行特征选择,建立了在线预测酪氨酸硝基化、硫化和激酶特异性酪氨酸磷酸化位点的工具TyrPred(http://computbiol.ncu.edu.cn/TyrPred)。交叉验证和独立测试结果表明,利用弹性网络提取训练的重要特征可以显着提高预测性能,同时我们期望TyrPred能够对现有方法起到补充作用。2、基于特征优化策略计算预测和分析真菌特异性磷酸化位点。蛋白磷酸化主要发生在丝氨酸、苏氨酸和酪氨酸残基上,调节多种生物过程。目前真核蛋白磷酸化位点的计算预测主要集中在动物和植物上,尤其是人类,真菌较少。因此对真菌特异性磷酸化的鉴定越来越受到重视。我们基于收集到的真菌磷酸化位点实验数据,按物种和修饰残基进行分类,并以不同特征编码,采用两步特征优化方法进行训练,提出了一种新的真菌特异性磷酸化预测工具—PreSSFP(http://computbiol.ncu.edu.cn/PreSSFP)。Motif和特征分析结果表明7种真菌物种间存在显着差异,为今后真菌磷酸化的计算分析提供新的线索。(本文来源于《南昌大学》期刊2019-06-05)

钟宇泓[3](2019)在《基于序列信息的蛋白质折迭识别研究》一文中研究指出随着分子生物学的深入研究,各种类型的生物数据也在呈指数增长。然而,受到人力、物力以及当前技术水平的限制,蛋白质的结构和功能信息增长缓慢。蛋白质的折迭模式的预测是蛋白质结构和功能预测的关键环节,传统的生物实验方法虽然能准确预测出蛋白质的折迭模式,但是耗时长且成本高。因此利用已有的大量蛋白质的序列信息,结合机器学习方法进行研究变得十分必要。本文利用蛋白质的序列信息、遗传信息以及层次信息,结合多种机器学习分类算法对蛋白质的折迭模式的预测进行了深入的探索和研究,具体研究内容如下:蛋白质的分类是层级结构的,针对现有方法较少利用到蛋白质层次化信息的问题,本文提出使用结构化支持向量机来将蛋白质层次化信息加入到分类过程中。本文选择了叁种领域内常用的特征进行对比实验:ACC-PSSM、RPSSM、MEDP。对比实验结果显示,在采用结构化支持向量机后,相较于普通支持向量机,识别的准确率提升了2.7%-6.4%。采用简单的加和策略将叁种特征集成后,准确率达到69.0%。验证了层次化信息在蛋白质折迭识别中的有效性。特征提取是解决蛋白质折迭识别问题的关键,基于位置特异性矩阵的自协方差(ACC-PSSM)的特征提取方法在蛋白质折迭识别领域被非常多的分类方法采用,它的性能也是众多特征里面比较好的一个。为了让ACC-PSSM能包含更多的蛋白质信息,本文提出了3种优化方案来对ACC-PSSM特征进行优化:ACC-PSSMpro-plus、ACC-PSSMpro-multiply、ACC-PSSMpro-acc,原理是改变计算PSSM值的公式以扩展PSSM。为了在分类中利用更多的有效信息,本文提出了选择最优子方法的优化策略:将折迭识别多分类问题分解为二分类问题,并为每一个二分类器选择最优的一个子分类器,将ACC-PSSM、ACC-PSSMpro-plus、ACC-PSSMpro-multiply、ACC-PSSMpro-acc、DP、DR、TOP2GRAM等七种特征融合,发挥它们各自的优势,最终使准确率达到78.3%,优于所有的单一特征的分类器。针对人工提取特征可能会遗漏某些蛋白质的重要信息的问题,利用深度学习能够自动学习特征的特点,本文提出了用卷积神经网络进行特征提取的方法:用样本量较大的经过去冗余的SCOP1.75数据集训练卷积神经网络,以蛋白质长度间隔划分mini-batch,选择小批量梯度下降法进行优化。训练好卷积神经网络后,将其用于DD数据集的特征提取,结合前面的特征以及基于选择最优子方法的优化策略,得到一个新的集成分类器。实验结果显示,新的集成分类器准确率达到79.4%,提升了1.1%,验证了卷积神经网络提取特征的有效性。(本文来源于《哈尔滨工业大学》期刊2019-06-01)

赵亚青[4](2019)在《若干锌指蛋白质识别(亚)端粒DNA的结构生物学研究》一文中研究指出端粒长度的动态平衡决定着细胞增殖潜能,对于相应的细胞功能至关重要。端粒长度缩短过程主要有细胞分裂过程中端粒缩短和端粒修剪(Telomere trimming)快速调控。端粒长度延长过程则是通过激活端粒酶活性或端粒延伸替代机制(ALT)延长反应。端粒缩短和端粒延长之间动态平衡决定干细胞和生殖细胞的端粒长度,表明端粒长度应当受到严格控制,而此过程中相关端粒结合蛋白起到重要作用。目前已知直接结合端粒重复序列蛋白质组包括shelterin复合物的叁个成员(TRF1,TRF2和POT1结合单链DNA)和HOT1蛋白质。而本文主要分叁部分阐述若干锌指蛋白质识别(亚)端粒DNA的结构生物学研究。论文第一部分为人源TZAP蛋白质(ZBTB48,更名为端粒相关锌指蛋白质)与端粒DNA TTAGGG结构与功能的研究。TZAP蛋白质可直接结合到端粒双链DNA TTAGGG序列并诱发端粒修剪过程,参与端粒长度调控。TZAP蛋白质由N-端BTB/POZ结构域和C-端的11个串联C2H2锌指(Znf1-11)组成。研究发现TZAP对端粒DNA TTAGGG结合能力定位于第9-11个锌指Znf9-11,并且进一步研究表示结合能力主要由ZnF1 1贡献。虽然C2H2锌指结合DNA的特异性和机制已被深入研究,但TZAP是第一个直接结合端粒DNA的C2H2锌指蛋白质。端粒结合蛋白TRF1,TRF2和HOT1以homeodomains结构域识别双链端粒DNA,且不识别亚端粒DNA,而TZAP蛋白质偏好性地识别不同类型亚端粒DNA。因此,TZAP特异性识别(亚)端粒DNA的机制仍需进一步研究。TZAP_ZnF9-11-C蛋白质与18bp TTAGGG双链核苷酸复合物晶体结构证明第11个锌指Znf1 1负责识别G4G5G6叁联体,C末端保守氨基酸负责识别T2A3,该复合物晶体结构为TZAP识别端粒DNA提供分子基础。论文第二部分为ZBTB10、Znf827、TR4/COUP-TF2 C4等锌指蛋白质与(亚)端粒序列结构与功能的研究。Dennis Kappei课题组筛选得到TZAP蛋白质时,获得另一个端粒DNA结合蛋白质ZBTB10。ZBTB10与TZAP(ZBTB48)皆属于Kruppel-like C2H2锌指蛋白质家族,其含有N端BTB/POZ结构域和C端两个串联C2H2(Znf1-2)锌指结构域。分析ZBTB10核酸序列,发现在两个串联C2H2锌指结构域后还存在一个保守C2HR类锌指结构域。通过荧光偏振实验发现C2HR类锌指对于ZBTB10蛋白质识别端粒序列至关重要。因此,旨在解析ZBTB10蛋白质与端粒DNA高分辨率复合物晶体结构,为阐述ZBTB10蛋白质识别端粒DNA的特异性提供分子基础。目前已获得初筛晶体,仍需进一步重复和优化晶体。澳大利亚悉尼大学HildaAPickett研究组发现锌指蛋白质Znf827能够募集NuRD(Nucleosome Remodeling and histone Deacetylase complex)复合物至ALT端粒区域,促进ALT机制发生。课题组孙爱爱博士阐述Znf827如何募集NuRD复合物,但Znf827-NuRD复合物如何定位到ALT端粒区域仍有待研究。Hilda A Pickett在文章中提出TR4和COUP-TF2两个孤儿核受体(orphan nuclear receptor)蛋白质可能在募集Znf827-NuRD中起重要作用。另一方面,关注到Znf827蛋白质自身包含9个C2H2(Znf1-9)锌指,可能也具有ALT端粒DNA结合能力。此课题期望通过解析TR4/COUP-TF2 C4锌指、Znf827与(亚)端粒DNA复合物晶体结构,阐述其定位于ALT端粒区域的结构基础。目前已获得初筛晶体,仍需进一步重复和优化晶体。论文第叁部分初步探索AEBP2锌指蛋白质结构与功能。多梳抑制家族复合物PRC2的游离组分AEBP2与核心组分RBBP4和SUZ12相互作用,从而进一步增加PRC2核心复合物稳定性,同时也一定程度地提高PRC2多元复合物酶活性。AEBP2串联叁个C2H2锌指结构域C端存在一段富含精氨酸和赖氨酸区域(RRK区域),与TZAP蛋白质C端保守序列相似,由此猜测AEBP2 RRK区域可能对于AEBP2蛋白质识别dsDNA有重要作用。本课题期望解析AEBP2锌指蛋白质与DNA复合物晶体结构,并且阐述其分子机制。目前已通过荧光偏振实验证明RRK区域对于AEBP2蛋白质结合T1 DNA序列尤为重要,仍需进一步获得复合物晶体结构。(本文来源于《中国科学技术大学》期刊2019-05-01)

徐元科[5](2019)在《基于支持向量机的抗氧化蛋白质识别》一文中研究指出自由基是不稳定分子,一旦自由基与身体内的原子结合就会发生链式反应,它们就会造成细胞中DNA损伤从而导致衰老和各种疾病的发生。抗氧化蛋白质是一种保护细胞免受自由基破坏的物质,准确识别抗氧化蛋白对于理解它们延缓衰老的作用和在相关疾病预防治疗方面非常重要。传统生物手段对蛋白质功能进行分析耗时费力,因此,发展识别抗氧化蛋白的计算方法是非常可取和急需的。本文所做的主要工作如下:1、为有效挖掘蛋白质序列中的特征信息,本文基于蛋白质序列一级结构融合氨基酸组成和g-gap二肽组合来描述蛋白质序列的特征信息。本文所用的特征提取方法具有计算简洁、高效快速、不需要借助其他信息的特点,能使分类器获得较好的分类效果。2、通过过采样技术将收集到的抗氧化蛋白质的数量平衡到与非抗氧化蛋白质数量一致,并对数据进行了归一化处理,排除了类别不平衡对分类准确度高估的影响。3、基于主成分分析方法进行特征降维,将420维特征降为230维。将数据投入支持向量机对蛋白质进行识别,并另找了20种经过实验证明的具有抗氧化性的蛋白质来验证本文所构建的模型,排除了模型过拟合的问题。本实验的预测准确度Acc达到了98.38%,对正样本的召回率Sn达到了99.27%,对负样本的召回率Sp达到了97.54%,MCC值为0.9678,本文构建的支持向量机分类器对抗氧化蛋白质的识别效果优于已存在的分类器的识别效果。(本文来源于《湘潭大学》期刊2019-04-25)

张晓瑾[6](2019)在《基于GBM算法识别蛋白质中金属离子配体的结合残基》一文中研究指出蛋白质是生命的物质基础,在不同的生命过程中实现了不同的特殊功能。然而,许多蛋白质功能的实现需要结合特定的配体,超过叁分之一的蛋白质需要与金属离子配体结合,因此金属离子配体对蛋白质功能的实现起着重要作用,正确识别蛋白质中金属离子配体的结合残基对人体健康及分子药物设计有重要意义。通过实验识别金属离子配体的结合残基费时耗材,且不能批量处理数据,所以利用理论计算的方法准确识别蛋白质中金属离子配体的结合残基显得尤为重要。此外,不是所有的蛋白质都有叁维结构信息,因此本文从蛋白质的序列信息出发,对金属离子配体的结合残基进行了统计分析和预测,主要工作如下:(1)以10种金属离子配体Zn~(2+)、Cu~(2+)、Fe~(2+)、Fe~(3+)、Co~(2+)、Ca~(2+)、Mg~(2+)、Mn~(2+)、Na~+和K~+的结合残基为研究对象,根据前人的研究及蛋白质的生物学背景知识,选取了氨基酸残基、亲疏水、极化电荷、预测的二级结构以及相对溶剂可及性信息作为特征参数,通过对相对溶剂可及性信息进行统计分析,将相对溶剂可及性进行了重新分类,得到了4种不同的分类(SA_2、SA_V、SA_P、SA_4)。(2)以位点氨基酸、位点亲疏水、位点电荷、位点二级结构和位点相对溶剂可及性保守信息为基础特征,利用位置权重矩阵分别得到了2L维特征参数;将相对溶剂可及性4种不同分类分别对应的5*2L维特征参数输入梯度提升算法(GBM)对10种金属离子配体结合残基进行识别,根据最优的预测结果,我们得到了10种金属离子配体相对应的相对溶剂可及性的最优分类;5交叉检验下得到的最优预测结果好于前人的预测结果,预测总精度(Acc)和马氏相关系数(MCC)均高于77.9%和0.558。而且以降维之后的特征子集为特征参数,也得到了好于前人的预测结果,说明构建的预测模型稳定性较好。为了检验预测模型的实用性,对金属离子配体的预测模型进行了独立检验,得到了较好的预测结果。实验结果说明本文构建的预测模型对金属离子配体结合残基有较好的识别能力。(3)利用离散增量算法和位置权重矩阵打分算法分别对氨基酸、亲疏水、极化电荷、二级结构和相对溶剂可及性的组分信息和位点保守信息进行降维处理,得到了20维组合信息。以组合信息为特征参数,基于算法参数优化设置的GBM算法,给出了10种金属离子配体分别对应的最优算法参数以及最优预测结果。同时计算了以5*2L维位点保守信息为特征参数,GBM在算法参数优化设置下10种金属离子配体结合残基的预测结果,预测结果进一步说明GBM中算法参数的优化设置是很重要的。(本文来源于《内蒙古工业大学》期刊2019-04-01)

蔡松成[7](2019)在《基于局部和全局上下文的蛋白质交互关系识别》一文中研究指出蛋白质交互(Protein-Protein Interaction,PPI)作为生物医学领域一项重要的研究课题,在发现疾病,探究生命规律方面有重要的应用价值。随着互联网的快速发展,生物医学文献呈指数级增长。依靠人工阅读的方式,从海量非结构化的文本中获取PPI的有效信息很难满足实际需求。因此,如何设计算法从大量文本资源中准确提取信息,实现自动化PPI信息抽取的这个问题亟待解决。目前蛋白质交互关系识别主要采用基于单句和基于大规模文本两种方式。基于单句的蛋白质交互关系抽取,只依赖单个句子,很难掌握目标蛋白质对的全面描述信息。基于大规模文本的交互关系抽取,虽然获取了目标蛋白质对更全面的信息进行PPI判断,但是对于有交互的蛋白质对下会有一些句子没有表达蛋白质之间的交互关系,将所有句子同等看待,会抽取出一些无效的特征,从而影响识别的精度。针对两者各自存在的缺陷,本文首先建立了基于双层逻辑回归分类器框架的基本模型,利用多实例多标记学习关系抽取框架来对目标蛋白质对进行表示,充分结合了蛋白质对的局部信息和全局上下文信息。利用训练后的分类器在测试数据集上进行预测,结果表明,本文的模型取得了较好的识别性能。接下来本文主要从单句级和蛋白质对级两个层面对基本模型进行改进,设计了基于多层次线索的PPI识别改进模型。对于包含核心词的蛋白质对,利用句子重要性、句子相似性以及关键词集等概念对包含核心词集的蛋白质对从蛋白质对级上抽取额外的特征进行特征改进。和基本模型相比,有交互蛋白质对的F1度量最高提高了2.8%,无交互蛋白质对的F1度量最高提高了1.9%。对于无核心词的蛋白质对,观察到有交互的蛋白质之间单词数量明显少于无交互的蛋白质,因此采用图模型来对每一个蛋白质对进行建模,利用不同句子中单词之间以及单词和关键词之间的相似性来构建边。对于最终得到的图模型,利用图的相关属性抽取有效线索来对句子级分类器特征进行更丰富的展示。相较于基本模型,有交互蛋白质对F1度量提高了2.9%,无交互蛋白质对提高了2.5%。整体来说,该改进模型的抽取性能有明显提升,并且抽取结果更加稳定。(本文来源于《南京航空航天大学》期刊2019-03-01)

胡健,朱海湾,毛伊敏[8](2019)在《基于时序加权PPI网络的关键蛋白质识别》一文中研究指出关键蛋白质是生物体内一切生命活动中不可缺少的物质基础,关键蛋白质的识别不仅可以从理论上理解生命活动机理,同时在实际应用中为药物研制、疾病治疗提供重要基础。目前,现有的关键蛋白质识别算法大多应用在静态PPI网络上,忽略了蛋白质的动态性和保守性,只考虑网络拓扑结构,忽略了蛋白质的生物特性,并且未能完全解决PPI网络中假阳性和假阴性问题。针对以上问题,构建一种混合动态保守蛋白质的时序加权PPI网络,并提出一种名为JTBC(Joint Topological properties,Biological properties and Complexes information)的关键蛋白质识别算法。利用基因表达数据提取动态蛋白质和保守蛋白质的活性信息,以动态调整静态PPI网络进而构建时序PPI网络,有效降低了PPI网络中的假阴性;设计一种融合双重拓扑特性的点边凝聚度DEcc(node and edge cohesion coefficient),以衡量蛋白质在PPI网络中的拓扑特性,再结合带有生物特性的蛋白质结构域信息和皮尔逊相关系数为时序PPI网络加权,以准确描述蛋白质之间的相互作用,减少了假阳性的影响;根据关键蛋白质的聚集特性和共表达特性,设计一种共表达复合物中心性方法局部评估蛋白质的重要程度。综上考虑,整合权重信息和蛋白质复合物信息来综合衡量蛋白质的关键性。实验结果表明该算法能够从全局和局部特性较准确地识别关键蛋白质。(本文来源于《计算机工程与应用》期刊2019年23期)

毛宇薇[9](2019)在《基于复杂网络和图嵌入表示的弱监督蛋白质交互识别》一文中研究指出蛋白质交互(Protein-Protein Interaction,PPI)对于生命过程有着巨大影响,在生物医学领域的研究中起了重要作用。蛋白质交互关系的发现与记录可以帮助新药的发现,诊断的疾病等研究。目前的PPI相关内容主要以文献的形式存储,然而随着医学文献的飞速发展,查询PPI关系往往给相关研究人员带来了难度。因此,许多科研人员致力于研究如何自动从文献中识别出PPI关系。目前,基于有监督的算法是进行PPI识别的主流方法。该方法虽然能实现较好的效果,但需要大量的标注数据,往往难以在实际中应用。因此,本文提出基于弱监督的算法进行PPI识别。本文的主要工作为:一、首先,利用专业数据库中所收集的目标蛋白质对,从中查找出所有含有目标蛋白质对的句子构建签名档,并以少量有交互关系的蛋白质对作为种子集。然后,从每个句子中提取能够表达文本关系的特征作为词汇模式,根据分布式假设原理将词汇模式表示为向量,通过相似性提取出与种子词汇模式相似的语料中的词汇模式构建候选集。最后,通过对候选集的评估,挑选出大于阈值的蛋白质对加入种子集。重复上述过程进行迭代,通过对种子集的不断迭代扩充实现交互关系的识别。该方法仅需少量标注数据实现了较好的结果,F值最高为67.35%。二、因为弱监督算法在每轮迭代过程中可能引入与种子集不相关的噪音蛋白质对,即产生语义漂移现象,因此我们提出使用复杂网络模型对候选集进一步评估,有效减少了每一轮迭代中的噪音,减轻语义漂移问题。该方法在弱监督的基础模型上精确度有了明显提高,F值也有提高,最高的F值可达68.14%。叁、本文提出使用图嵌入方法生成词汇模式向量。该方法可以有效结合传统的一元词表示法所包含的单词信息,以及基于分布式假设法表示向量所包含的语义关系信息,实现更好的表示效果。最后的实验结果表明,该种表示方法有效提高了PPI识别算法的精确度、召回率和F值,其中当F值最高时叁个评价指标值分别为70.96%,71.00%,70.98%,模型的性能明显提高。(本文来源于《南京航空航天大学》期刊2019-01-01)

毛宇薇,牛耘[10](2019)在《基于关键词的蛋白质交互关系识别》一文中研究指出蛋白质交互关系(PPI)是生物医学领域的重要研究内容之一,目前通过生物医学实验得到的PPI信息主要以文本的形式存储在相关文献中。随着生物医学文献数量的飞速增长,人工识别PPI的方式已经难以满足实际应用需求。文中采用基于弱监督的PPI识别基础框架,以少量有交互关系的蛋白质对作为种子集,通过对种子集的不断迭代扩充,最终实现蛋白质交互关系识别。相比于现有的其他方法,该方法仅需少量有标注数据实现了较好的识别效果,节省了大量人力物力。在此基础上,利用词向量对现有的表达交互关系的关键词进行扩充,并对关键词的可靠性进行评分,根据扩充后的关键词集合对基础框架的聚类过程做了改进,将聚类的输入词汇模式集合根据所包含的关键词分数做降序排序。实验结果表明,基础的PPI识别框架仅有少量有标注数据取得了较好的结果,在此基础上改进后的关键词扩充算法进一步提高了PPI识别结果,第一次迭代后的F值最高为67.20%,比改进前的算法提高了1.54%,叁次迭代后的F值为69.05%。(本文来源于《计算机技术与发展》期刊2019年03期)

蛋白质识别论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

蛋白质翻译后修饰,也称为共价修饰,是调控蛋白质功能的重要机制,在信号通路和生物学过程中发挥着不可替代的作用,并可逆地决定了细胞的动力学和可塑性。然而,随着蛋白质翻译后修饰数据的高通量发展,传统的实验方法往往是费力、费时和昂贵的,快捷便利的计算识别修饰位点的预测方法应运而生。本论文主要基于机器学习,针对酪氨酸硝基化、硫化和磷酸化以及7种真菌的丝氨酸、苏氨酸和酪氨酸磷酸化位点分别建立了在线预测工具,并对其进行蛋白质组学分析。具体内容如下:1、基于弹性网络优化特征方法预测和分析酪氨酸翻译后修饰位点。酪氨酸翻译后修饰,主要包括硝基化、硫化和磷酸化,涉及不同的生理和病理过程。因此,预测整个蛋白质序列中酪氨酸残基的硝基化、硫化和磷酸化具有重要意义和实用价值。在这里,我们采用序列特征、物理化学性质和进化信息对特征进行编码,引入弹性网络进行特征选择,建立了在线预测酪氨酸硝基化、硫化和激酶特异性酪氨酸磷酸化位点的工具TyrPred(http://computbiol.ncu.edu.cn/TyrPred)。交叉验证和独立测试结果表明,利用弹性网络提取训练的重要特征可以显着提高预测性能,同时我们期望TyrPred能够对现有方法起到补充作用。2、基于特征优化策略计算预测和分析真菌特异性磷酸化位点。蛋白磷酸化主要发生在丝氨酸、苏氨酸和酪氨酸残基上,调节多种生物过程。目前真核蛋白磷酸化位点的计算预测主要集中在动物和植物上,尤其是人类,真菌较少。因此对真菌特异性磷酸化的鉴定越来越受到重视。我们基于收集到的真菌磷酸化位点实验数据,按物种和修饰残基进行分类,并以不同特征编码,采用两步特征优化方法进行训练,提出了一种新的真菌特异性磷酸化预测工具—PreSSFP(http://computbiol.ncu.edu.cn/PreSSFP)。Motif和特征分析结果表明7种真菌物种间存在显着差异,为今后真菌磷酸化的计算分析提供新的线索。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

蛋白质识别论文参考文献

[1].董祥芝,马勇,侯春平,张宝亮,张和鹏.用于蛋白质BSA识别的温度/pH双敏印迹聚合物[J].化工进展.2019

[2].曹曼.机器学习在蛋白质磷酸化、硝基化和硫化位点识别中的应用研究[D].南昌大学.2019

[3].钟宇泓.基于序列信息的蛋白质折迭识别研究[D].哈尔滨工业大学.2019

[4].赵亚青.若干锌指蛋白质识别(亚)端粒DNA的结构生物学研究[D].中国科学技术大学.2019

[5].徐元科.基于支持向量机的抗氧化蛋白质识别[D].湘潭大学.2019

[6].张晓瑾.基于GBM算法识别蛋白质中金属离子配体的结合残基[D].内蒙古工业大学.2019

[7].蔡松成.基于局部和全局上下文的蛋白质交互关系识别[D].南京航空航天大学.2019

[8].胡健,朱海湾,毛伊敏.基于时序加权PPI网络的关键蛋白质识别[J].计算机工程与应用.2019

[9].毛宇薇.基于复杂网络和图嵌入表示的弱监督蛋白质交互识别[D].南京航空航天大学.2019

[10].毛宇薇,牛耘.基于关键词的蛋白质交互关系识别[J].计算机技术与发展.2019

标签:;  ;  ;  ;  ;  

蛋白质识别论文-董祥芝,马勇,侯春平,张宝亮,张和鹏
下载Doc文档

猜你喜欢