导读:本文包含了蛋白质结构预测论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:蛋白质,结构,卷积,算法,神经网络,相互作用,理化。
蛋白质结构预测论文文献综述
王小奇,周晓根,胡俊,张贵军[1](2019)在《距离和疏水模型辅助的蛋白质结构预测方法》一文中研究指出预测蛋白质结构对药物设计和疾病诊断有着重要的科学意义.针对蛋白质结构从头预测问题,在进化算法框架下,提出一种距离和疏水模型辅助的蛋白质结构预测方法(Distance and Hydrophobic Model-assisted Protein Structure Prediction Method,DHM A).首先根据亲疏水性构建氨基酸的回转半径来指导构象空间采样,达到提高搜索效率的目的;然后,利用距离谱构建距离分布估计模型和疏水概率模型,指导种群更新,缓解能量函数不精确带来的误差.在10个测试蛋白的预测结果表明,DHM A具有良好的搜索性能和预测精度,是一种有效的蛋白质结构预测方法.(本文来源于《小型微型计算机系统》期刊2019年12期)
卫博翔,焦雄[2](2019)在《基于结构域理化性质的蛋白质相互作用方向预测》一文中研究指出为了更好地理解蛋白质相互作用,用蛋白质相互作用间信号传递方向进一步注释蛋白质相互作用网络,提出了一种基于结构域理化性质预测蛋白质相互作用方向的方法。首先提取蛋白质结构域的10种理化性质,构成表示方向信息的特征向量;然后建立支持向量机预测模型,并利用网格搜索对模型进行参数寻优;最后用拥有最优参数的模型进行预测。实验结果表明,该模型准确率达到88.17%,AUC值为0.837.与PIDS方法比较结果表明,蛋白质结构域的10种理化性质能够有效用于蛋白质相互作用方向的预测,为预测蛋白质相互作用方向提供了一种新思路。(本文来源于《太原理工大学学报》期刊2019年04期)
李章维,郝小虎,张贵军[3](2019)在《蛋白质结构从头预测多级个体筛选进化算法》一文中研究指出针对蛋白质高维构象空间采样多样性问题,文中提出了一种蛋白质结构从头预测多级个体筛选进化算法(MlISEA)。基于进化算法框架,首先采用基于知识的Rosetta粗粒度能量模型作为优化目标函数,以降低构象空间优化变量维数;其次以基于9片段和3片段的片段组装技术为不同的变异策略,增加同代种群的多样性;同时,设计多级个体筛选方法,进一步增加不同代种群间的多样性;然后利用Monte Carlo算法较强的局部搜索能力对每个个体做局部增强,以得到当前的局部最优解;最后,得到全局最优解以及不同的局部最优解。10个目标蛋白的测试结果表明,所提方法能够有效提高采样多样性,得到TMscore大于0.5的预测构象,为进一步做结构修饰提供便利。(本文来源于《计算机科学》期刊2019年S1期)
李艳萍[4](2019)在《基于决策森林的蛋白质二级结构预测算法研究》一文中研究指出蛋白质是人类机体的重要组成并且机体内几乎所有的活动都需要具有特定功能的蛋白质参与。蛋白质的空间结构决定其主要功能。因此对于蛋白质结构的研究有助于更好的了解它的功能。但并不能直接通过模拟蛋白质的折迭过程来了解它的空间结构。然而蛋白质是由氨基酸序列组成的,因此,通过氨基酸序列来预测蛋白质的二级结构进而了解它的叁维构象便成为了一种常用的方法。在大数据、云计算和人工智能快速发展的时代背景下,采用机器学习的方法对蛋白质的二级结构进行预测已经成为生物信息学中的一个研究热点。基于决策树森林模型及机器学习技术,本文深入研究了蛋白质的八类二级结构预测,主要研究内容如下:针对蛋白质的八类二级结构预测问题,提出了一种基于梯度提升的决策森林预测算法。该算法基于氨基酸序列的PSSM谱特征采用交叉熵损失函数的二阶泰勒近似作为优化目标,以决策树确定的映射函数作为优化参数,通过贪婪地在特征值上选取最佳分裂点来构造决策树。此外,为了防止过拟合,进一步在目标函数中引入了_2L正则化项,以便控制模型的复杂度。在标准的CB513蛋白质二级结构评估数据集上,本文提出的算法达到了64.89%的_8Q准确率。针对梯度提升决策森林算法运行速度慢的缺点,本文基于直方图思想提出了一种快速梯度提升的预测模型。该模型通过直方图的方法将样本特征离散化,对于大量的样本数据采用单边梯度技术对数据进行采样,并采用特征绑定技术对多维特征进行降维,实现了样本数量和特征两个维度的并行。通过大量的实验对影响模型性能的指标进行分析,实验结果表明,基于本文所提出的快速梯度提升算法对蛋白质的二级结构进行预测,在测试集上的_8Q准确率达到了66.35%。另外,在同样的数据集上,相对于其他算法来比较,本文所提出的算法运行速度非常快,时间复杂度很小。(本文来源于《河南大学》期刊2019-06-01)
王蕾蕾[5](2019)在《基于条件随机场与深度学习的蛋白质二级结构预测》一文中研究指出随着生物信息学的发展,蛋白质数据库中的蛋白质序列信息越来越多,尤其是生物信息学的出现,使得人们能够更好地利用这些蛋白质信息了解生物系统。生物信息学可以利用这些序列信息寻找相关的蛋白质,并收集其他信息推测未知蛋白质的结构和功能等可能的特性。蛋白质结构分析预测也经常被用在药物设计中。通过实验方法获取蛋白质二级结构所需的成本高,专业人才紧缺,所以目前面临的核心问题就是利用生物信息学找到一种能够高效地预测蛋白质二级结构的算法。本文使用深度学习算法和条件随机场算法对蛋白质二级结构进行预测。在蛋白质数据处理中,本文用到了位置特异性矩阵(Position-Specific Scoring Matrix,PSSM),同时为了更好的表示氨基酸序列,使用了滑动窗口技术。在蛋白质二级结构预测算法方面,本文提出了两种学习分类方法:第一种是卷积神经网络结合Softmax分类器的算法,此方法改进了卷积神经网络的模型结构,针对梯度消失问题在各卷积层之后添加了修正线性单元(Rectified Linear Units,ReLU)激活层,为了最大限度地保留原始数据的重要特征,提取了全连接层之前的特征数据作为Softmax分类器的输入,对蛋白质二级结构进行分类和预测,与传统的卷积神经网络方法比较,此方法提高了预测精度。第二种是基于集成学习的思想:使用了一种简单的集成策略把卷积神经网络和条件随机场模型进行了结合,使得这两种学习器最大限度的发挥自身的优势同时弥补彼此的缺点,最后用本文的集成分类器对蛋白质二级结构进行分类和预测,提高了预测的精度。实验证明,本文提出的两种方法在公开的蛋白质数据集25PDB数据集上准确率有所提高。实验证明,由卷积神经网络和条件随机场模型基于集成学习策略组成的集成学习器在25PDB数据集上的预测准确率高于CNN-Softmax网络模型,所以,深度学习算法与条件随机场模型结合可以更好地提高蛋白质二级结构的预测准确率。(本文来源于《齐鲁工业大学》期刊2019-05-31)
王剑[6](2019)在《基于分组式的多分类器的蛋白质二级结构预测的算法研究》一文中研究指出蛋白质二级结构预测是蛋白质结构预测和理解蛋白质结构和功能的重要课题,主要工作是依据蛋白质氨基酸序列的编码特征正确识别出对应的蛋白质二级结构标签。本文采用25PDB蛋白质序列数据集,采用PSSM编码﹑正交编码和滑动窗口方法将氨基酸处理成伪图像对蛋白质二级结构预测做了研究,在研究过程中选定了叁种训练模型,分别是卷积神经网络﹑LSTM神经网络和随机森林。每个训练模型对应一个分组实验,在每个分组实验中对训练模型做了训练模型的优化设计:在基于卷积神经网络的分组实验中,设计了一个包含两个网络结构单元的一般卷积神经网络,每个网络单元包含主要的卷积层和下采样层,因为蛋白质氨基酸的伪图像对于卷积神经网络来说相对于真正的图像而言数据量较少,所以本文设计了一个可以增加输入冗余,解决一般卷积神经网络梯度偏离的残差卷积神经网络,实验证明这种卷积神经网络更加稳定,预测更准确。在基于LSTM神经网络的分组实验中,分别对伪图像在两个维度上切片生成序列数据对于一般的LSTM神经网络做了实验,因为直接切片会破坏蛋白质氨基酸序列的上下文特,所以本文采用滑动窗口操作在蛋白质序列维度生成了多个BP神经网络隐层,将这些BP神经网络隐层神经元的输出当作序列数据输入LSTM神经网络,实验证明添加BP神经网络隐层的LSTM神经网络能更好的提取蛋白质序列的上下文特征。在基于随机森林的分组实验中,本文将残差卷积神经网络在最后一个平均池化层提取的样本特征作为随机森林的输入,相当于为随机森林做了一个特征提取器,实验证明添加了特征提取器的随机森林预测结果会有很大提升。在分组实验结束之后,本文利用ensemble方法将实验中叁种优化设计之后的模型进行了整合,将残差卷积神经网络﹑加入了BP神经网络隐层的LSTM神经网络和添加了特征提取器的随机森林模型在每个蛋白质二级标签上的输出概率相加,取最大概率对应的标签作为ensemble模型的输出,实验证明ensemble模型相对于叁类成员模型的预测结果均有提高。(本文来源于《齐鲁工业大学》期刊2019-05-31)
卫博翔[7](2019)在《基于结构域理化性质的蛋白质相互作用方向预测》一文中研究指出蛋白质相互作用间的信号传递方向对生物体内大多数的信号转导是非常重要的。随着生命科学研究的不断深入,积累了大量的蛋白质相互作用数据以及由这些数据构成的蛋白质相互作用网络,同时也出现了通过各种形式对蛋白质相互作用网络进行注释的方法。然而,仅有少数研究人员用蛋白质相互作用间的信号传递方向对蛋白质相互作用网络进行注释。在目前的研究中,大多数预测蛋白质相互作用间信号传递方向的方法,都是从蛋白质相互作用网络出发,仅考虑网络的拓扑属性,很少涉及KEGG中经过注释的蛋白质相互作用数据。少数利用已注释的蛋白质相互作用数据的方法也是从蛋白质相互作用出发,基于GO注释或者结构域相互作用与蛋白质相互作用的关系,构建表示方向信息的特征矩阵,训练用于分类的预测模型。然而,这些方法对蛋白质结构域的理化特性都没有涉及。为了解决这一问题,本研究设计了一种从蛋白质结构域的十种理化性质出发,预测蛋白质相互作用间信号传递方向的方法,基于该方法训练了一个用于蛋白质相互作用方向预测的支持向量机模型,并将该模型用于蛋白质相互作用类别预测。首先,我们利用有特定方向的蛋白质相互作用数据,计算蛋白质结构域的十种理化性质,构成可以表示蛋白质相互作用方向信息的特征矩阵,并用特征矩阵训练一个用于蛋白质相互作用间信号传递方向预测的支持向量机模型,通过对比试验和网格搜索算法,对支持向量机模型的核函数、惩罚因子以及核函数参数进行选择,完成了对预测模型的优化。然后,通过五次五倍交叉验证,对预测模型的整体性能进行了分析,模型可以有效、稳定用于蛋白质相互作用间信号传递方向预测;与不同分类方法、不同预测方法的性能比较,进一步说明我们的预测模型的有效性;对影响预测模型精度的结构域理化特性组合进行了研究,说明十种理化特性的必要性;通过不同物种数据集上的性能对比,发现预测模型在进化程度高的物种上的性能更好。我们将基于结构域理化性质的方法用于人类蛋白质相互作用间的激活/抑制类别的预测,进行了相关研究,预测结果为之后蛋白质相互作用间信号传递类别预测提供了参考。总的来说,本文提出了一种基于结构域理化性质信息预测蛋白质相互作用间信号传递方向的方法;通过此方法建立的支持向量机模型可以有效用于蛋白质相互作用间信号传递方向的预测。另外,本研究还对影响预测模型精度的结构域理化性质组合进行了研究,证明结构域十种理化性质的必要性;并将基于结构域理化性质的方法扩展到人类蛋白质相互作用类别研究。这可以为研究人员利用蛋白质相互作用方向和类别对蛋白质相互作用网络进行进一步注释提供新的思路。(本文来源于《太原理工大学》期刊2019-05-01)
夏慧芳,郭雨珍,江宏昊[8](2019)在《基于遗传算法预测2D叁向的蛋白质结构》一文中研究指出本文基于范德华力势能预测2D叁向的蛋白质结构。首先,将蛋白质结构预测这一生物问题转化为数学问题,并建立基于范德华力势能函数的数学模型。其次,使用遗传算法对数学模型进行求解,为了提高蛋白质结构预测效率,我们在标准遗传算法的基础上引入了调整算子这一概念,改进了遗传算法。最后,进行数值模拟实验。实验的结果表明范德华力势能函数模型是可行的,同时,和规范遗传算法相比,改进后的遗传算法能够较大幅度提高算法的搜索效率,并且遗传算法在蛋白质结构预测问题上有巨大潜力。(本文来源于《生物信息学》期刊2019年01期)
朱树平,刘毅慧[9](2019)在《蛋白质二级结构在线服务器预测评估》一文中研究指出蛋白质二级结构的预测,对于研究蛋白质的功能和人类生命科学意义非凡。1951年开始提出预测蛋白质二级结构,1983年对于二级结构的预测只有50%的准确率。经过多年的发展,预测方式不断的改进和完善,到如今准确率已经超过80%。但目前预测在线服务器繁多,连续自动模型评估(CAMEO)也只给出服务器叁级结构的预测评估,二级结构评估还未实现。针对上述问题,选取了以下6个服务器:PSRSM、MUFOLD、SPIDER、RAPTORX、JPRED和PSIPRED,对其预测的二级结构进行评估。并且为保证测试集不在训练集内,实验数据选取蛋白质结构数据库(Protein Data Bank,PDB)最新发布的蛋白质。在基于蛋白质同源性30%、50%和70%的实验中,PSRSM取得Q3的准确率分别为91.44%、88.12%和90.17%,比其他预测服务器中最高的MUFOLD分别高出3.19%、1.33%和2.19%,证明在同一类同源性数据中PSRSM比其他服务器有更好的预测效果。除此之外实验也得到其预测的Sov准确度也比其他服务器要高。比较各类服务器的方法与结果,得出今后蛋白质二级结构预测应当重点从大数据、模板和深度学习的角度进行研究。(本文来源于《生物信息学》期刊2019年01期)
德克[10](2019)在《DeepMind开发新AI工具:利用基因序列预测蛋白质结构》一文中研究指出新浪科技讯北京时间12月4日早间消息,据美国《麻省理工科技评论》(MIT Technology Review)报道,谷歌旗下DeepMind开发一个新AI工具,它可以利用基因序列预测蛋白质结构。新工具叫作"AlphaFold",可以给长链氨基酸的折迭模式构建模型,制作蛋白质3D模型,这是基于长链氨基酸的化学相互作用。这种折迭模式被取名叫(本文来源于《《科学与现代化》2019年第1期(总第078期)》期刊2019-03-01)
蛋白质结构预测论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
为了更好地理解蛋白质相互作用,用蛋白质相互作用间信号传递方向进一步注释蛋白质相互作用网络,提出了一种基于结构域理化性质预测蛋白质相互作用方向的方法。首先提取蛋白质结构域的10种理化性质,构成表示方向信息的特征向量;然后建立支持向量机预测模型,并利用网格搜索对模型进行参数寻优;最后用拥有最优参数的模型进行预测。实验结果表明,该模型准确率达到88.17%,AUC值为0.837.与PIDS方法比较结果表明,蛋白质结构域的10种理化性质能够有效用于蛋白质相互作用方向的预测,为预测蛋白质相互作用方向提供了一种新思路。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
蛋白质结构预测论文参考文献
[1].王小奇,周晓根,胡俊,张贵军.距离和疏水模型辅助的蛋白质结构预测方法[J].小型微型计算机系统.2019
[2].卫博翔,焦雄.基于结构域理化性质的蛋白质相互作用方向预测[J].太原理工大学学报.2019
[3].李章维,郝小虎,张贵军.蛋白质结构从头预测多级个体筛选进化算法[J].计算机科学.2019
[4].李艳萍.基于决策森林的蛋白质二级结构预测算法研究[D].河南大学.2019
[5].王蕾蕾.基于条件随机场与深度学习的蛋白质二级结构预测[D].齐鲁工业大学.2019
[6].王剑.基于分组式的多分类器的蛋白质二级结构预测的算法研究[D].齐鲁工业大学.2019
[7].卫博翔.基于结构域理化性质的蛋白质相互作用方向预测[D].太原理工大学.2019
[8].夏慧芳,郭雨珍,江宏昊.基于遗传算法预测2D叁向的蛋白质结构[J].生物信息学.2019
[9].朱树平,刘毅慧.蛋白质二级结构在线服务器预测评估[J].生物信息学.2019
[10].德克.DeepMind开发新AI工具:利用基因序列预测蛋白质结构[C].《科学与现代化》2019年第1期(总第078期).2019