蛋白质关系抽取论文-赵哲焕,杨志豪,孙聪,林鸿飞

蛋白质关系抽取论文-赵哲焕,杨志豪,孙聪,林鸿飞

导读:本文包含了蛋白质关系抽取论文开题报告文献综述及选题提纲参考文献,主要关键词:关系词抽取,蛋白质实体识别,蛋白质关系抽取

蛋白质关系抽取论文文献综述

赵哲焕,杨志豪,孙聪,林鸿飞[1](2018)在《生物医学文献中的蛋白质关系抽取研究》一文中研究指出蛋白质关系抽取研究对于生命科学各领域的研究具有广泛的应用价值。但是,基于机器学习的蛋白质关系抽取方法普遍停留在二元关系抽取,失去了丰富的关系类型信息,而基于规则的开放式信息抽取方法可以抽取完整的蛋白质关系("蛋白质1,关系词,蛋白质2"),但是召回率较低。针对以上问题,该文提出了一种混合机器学习和规则方法的蛋白质关系抽取框架。该框架先利用机器学习方法完成命名实体识别和二元关系抽取,然后利用基于句法模板和词典匹配的方法抽取表示当前两个蛋白质间关系类型的关系词。该方法在AImed语料上取得了40.18%的F值,远高于基于规则的Stanford Open IE方法。(本文来源于《中文信息学报》期刊2018年07期)

闵庆凯[2](2018)在《基于远监督的蛋白质交互关系抽取》一文中研究指出蛋白质交互关系(Protein-Protein Interaction,PPI)是生物医学领域研究的重要内容之一,对疾病的诊断和治疗以及新药的研制具有重要的意义,目前经过实验验证得到的PPI相关知识主要以非结构化文本的形式存储于生物医学文献中。随着生物医学文献数量的飞速增长,依靠人工挖掘蛋白质交互信息的方式难以满足实际的应用需求。因此,从生物医学文献中自动抽取蛋白质交互关系成为生物信息领域重要的研究课题。目前蛋白质交互关系抽取主要基于远监督的方法,通过将知识库与非结构化文本对齐来自动获取大规模训练数据,在一定程度上减轻了对人工标注语料的依赖。但是这种方法存在明显的缺陷,即在构建训练数据的过程中引入了大量的噪音数据,这些噪音会对模型的抽取性能造成很大的影响。针对这个问题,本文首先建立了基于远监督的蛋白质交互关系抽取基本模型,利用远监督产生的训练数据来训练分类模型,并在人工标注语料上进行测试,通过实验结果进一步分析了训练数据中存在的噪音问题。接下来本文建立了基于主题集合的蛋白质交互关系抽取模型,在交叉预测的基础上利用关键词和句子相似性抽取蛋白质对签名档对应的主题集合,并将主题集合之外的句子视为噪音进行清除,利用去噪后的数据训练分类模型并在人工标注语料上进行测试。实验通过对多个不同参数组合进行测试,得到的最好结果与远监督基本模型相比,有交互蛋白质对和无交互蛋白质对的F1度量分别提高了1.49%和9.18%,去噪效果明显。为了充分利用训练数据中句子类别间的相互关系,本文引入了多示例多标记学习模型用于蛋白质交互关系抽取中,将蛋白质对签名档中的句子及其类别构造为多示例多标记模型,利用最大期望算法来确定句子的类别,进而清除训练数据中的噪音。实验结果表明,基于多示例多标记的迭代算法对于训练数据中的噪音识别更加准确,相比于远监督的基本模型,在有交互蛋白质的F1度量略有提升的基础上,无交互蛋白质对的F1度量提高了14.84%,模型性能提高明显,且抽取结果更加平衡。(本文来源于《南京航空航天大学》期刊2018-01-01)

包振栋[3](2017)在《基于生物医学文本挖掘的蛋白质间相互作用关系抽取方法的研究》一文中研究指出近年来,在生物医学领域随着其文献数量的快速增长,利用数据挖掘技术从生物医学文献中获取所需的生物医学知识已经成为生物信息学领域的研究热点。蛋白质发挥其生物功能最基础和重要的一种方式就是通过蛋白质间相互作用(Protein-Protein Interaction,PPI),而大量的蛋白质相互作用信息都以非结构化数据的形式记录在生物医学文献中,人工检阅的方式查找文献中的PPI信息十分耗时费力,因此,利用文本挖掘技术对生物医学文献中的蛋白质相互作用关系进行挖掘和分析,从而准确的提取PPI关系具有十分重要的意义。现有的PPI关系抽取的研究中将从生物医学文献中抽取PPI关系视为一个二值分类问题,PPI抽取任务中多采用基于统计和机器学习的算法,通过对生物文本进行特征提取形成特征向量,从而构建分类模型,取得了较好的抽取效果。但是现有研究中所采用的机器学习方法通常是监督学习方法,需要大量已标注的PPI关系数据来构建分类模型,而在生物医学领域,利用人工标注PPI关系语料需要花费大量的人力和时间成本。为了降低构建分类模型对标注数据的要求,本文从以下两个方面进行研究:1、基于远程监督和迁移学习提取蛋白质相互作用关系将待分类的PPI关系数据集视为目标领域数据集,为降低目标领域PPI关系抽取中对标注数据的需求,本研究使用迁移学习,通过对不同分布的源领域PPI关系数据集进行知识迁移,来构建关系抽取模型,从而对目标领域待分类PPI样本进行分类。本研究基于远程监督思想构建人工标注语料作为源领域PPI数据集,首先从IntAct蛋白质相互作用数据库中下载PPI数据作为关系知识库,并从PubMed数据库中爬取生物医学文献摘要作为原始语料集,根据知识库中的PPI对在原始语料集中进行映射,通过启发式的匹配来获取包含有该PPI的语句,将原始语料集中存在映射的PPI作为正例样本,否则作为负例样本,以此得到人工标注的PPI数据集。使用基于实例的迁移学习方法TrAdaboost在构建的源领域PPI数据集和部分目标PPI数据集上构建分类模型,对目标领域的PPI样本进行分类。在3个标准数据集上的实验结果表明,本研究利用远程监督构建的人工数据集能够很好的辅助算法建立分类模型,在目标领域标注样本较少的情况下,通过迁移人工数据集的知识对目标领域PPI关系进行抽取具有较好的性能。2、PU(Positive Unlabeled)场景下基于迁移学习和远程监督提取蛋白质相互作用在实际应用中,数据经常是未标注的或少量标注的,如本研究中涉及到的PPI数据集。由于实验条件的制约,现有的很多PPI关系并不能确定其是否有相互作用,因此可以将这部分数据视为未标注数据集,仅有少量的PPI关系经实验验证后确实存在相互作用,这部分数据可以视为正例样本。在这种情况下,传统的有监督算法就无法构建高效的分类模型来对生物文献中的PPI关系进行识别。在远程监督的基础上,本研究从迁移学习和PU学习两个角度展开研究,提出了在PU场景下基于迁移学习和远程监督的蛋白质相互作用关系抽取方法——TPAODE算法。该方法收集目标PPI数据集的特征信息,利用数据引力方法对源PPI数据集样本赋予权重进行知识迁移,基于贝叶斯理论在加权的源PPI数据集上估算概率参数,利用静态分类器集成技术构建基于权重的PU学习算法。实验结果表明,本研究提出的TPAODE算法对目标领域PPI数据集不需要类别标注,仅在源领域PPI数据集上标注部分有相互作用关系的样本,基于源领域PPI数据集和目标领域PPI数据集构建分类模型,具有比传统PU方法相当或更好的性能。为了进一步降低模型对标注数据的要求,本研究将前文利用远程监督构建的人工PPI数据集作为源领域数据集,基于仅有少量正例样本的源数据集和目标数据集学习模型,对目标领域的PPI样本进行分类,结果表明,本研究提出的TPAODE算法利用远程监督数据集依然比现有的PU学习方法PNB和PTAN具有更优异的分类性能。(本文来源于《西北农林科技大学》期刊2017-05-01)

龙光宇[4](2017)在《蛋白质磷酸化与疾病关系抽取研究》一文中研究指出蛋白质磷酸化是生物体内最重要的一种蛋白质翻译后修饰,目前大量的人类疾病都被证实是由异常的磷酸化修饰所引起的,一些与疾病相关的磷酸化修饰可以被开发为疾病的分子标志或治疗靶标。随着生物医学文献的爆炸性增长,如何从生物医学文献中自动抽取蛋白质磷酸化与疾病之间的关系成为相关领域的研究热点。蛋白质磷酸化与疾病关系抽取任务包括疾病命名实体识别和蛋白质磷酸化与疾病关系判断。目前解决疾病命名实体识别问题的主流方法是机器学习,但是机器学习的方法难以有效地识别疾病命名实体中的医学术语,蛋白质磷酸化与疾病之间的关系抽取目前没有可获得的公开系统。本文对蛋白质磷酸化与疾病之间的关系抽取问题进行了研究,研究工作和贡献如下:本文给出了一种条件随机场与语义词典相结合的疾病命名实体识别方法,其中利用网络资源来构建含有语义信息的医学术语词典可以克服病疾命名实体中的医学术语识别的难点。先使用该词典获得医学术语的语义信息;然后CRF利用这些信息结合词法与词性特征、拼写与领域特征对疾病命名实体进行识别;最后对缩写词识别进行调整,来提升疾病名实体识别的效果。在NCBI Disease Corpus数据集上的实验结果表明,本文方法比DNorm方法提升了约2.5%的F值;在开放数据集上实验验证了本文方法对于较长疾病实体识别具有一定的优势。蛋白质磷酸化与疾病之间的关系分为Absence(缺失)、Presence(存在)、Down-regulation(调降)和Up-regulation(调升)四种类型。本文实现了一个蛋白质磷酸化与疾病关系抽取系统PDRMine,该系统分为叁个步骤:首先利用基于规则的蛋白质磷酸化信息抽取系统RLIMS-P从文献中抽取蛋白质磷酸化信息;再利用本文设计的疾病命名实体识别方法识别包含磷酸化信息句子中的疾病命名实体;最后利用基于规则的方法对蛋白质磷酸化与疾病之间的关系类型进行判断。触发词的识别是最后一步的难点,本文通过同义词扩展的方法扩大了触发词集合,提升了蛋白质磷酸化与疾病之间关系类型的判断效果。在开放数据集上取得了 72.6%的准确率和66.4%的召回率。(本文来源于《中国科学技术大学》期刊2017-04-20)

李丽双,蒋振超,万佳,黄德根[5](2017)在《利用词表示和深层神经网络抽取蛋白质关系》一文中研究指出蛋白质关系抽取是生物医学信息抽取领域的重要分支。目前研究中,基于特征和核函数方法的蛋白质关系抽取已被充分研究,并且达到了很高的F-值,通过改进特征和核函数进一步优化实例表示变得十分困难。该文结合词表示和深层神经网络,提出了一种实例表示模型。该模型能够充分利用词表示的语义表示能力和深层神经网络的表示优化能力;同时引入主成分分析和特征选择进行特征优化,并且通过比较多种传统的分类器,寻找适合蛋白质关系抽取的分类器。该方法在AIMed语料、BioInfer语料和HPRD50语料上的F-值分别取得了70.5%、82.2%和80.0%,在蛋白质关系抽取任务上达到了目前最好的抽取水平。(本文来源于《中文信息学报》期刊2017年01期)

李丽双,郭瑞,黄德根,周惠巍[6](2016)在《基于迁移学习的蛋白质交互关系抽取》一文中研究指出作为生物医学信息抽取领域的重要分支,蛋白质交互关系(Protein-Protein Interaction,PPI)抽取具有重要的研究意义。目前的研究大多采用统计机器学习方法,需要大规模标注语料进行训练。训练语料过少,会降低关系抽取系统的性能,而人工标注语料需要耗费巨大的成本。该文采用迁移学习的方法,用大量已标注的源领域(其它领域)语料来辅助少量标注的目标领域语料(本领域)进行蛋白质交互关系抽取。但是,不同领域的数据分布存在差异,容易导致负迁移,该文借助实例的相对分布来调整权重,避免了负迁移的发生。在公共语料库AIMed上实验,两种迁移学习方法获得了明显优于基准算法的性能;同样方法在语料库IEPA上实验时,TrAdaboost算法发生了负迁移,而改进的DisTrAdaboost算法仍保持良好迁移效果。(本文来源于《中文信息学报》期刊2016年02期)

刘敏捷[7](2015)在《基于组合学习和主动学习的蛋白质关系抽取》一文中研究指出生命科学技术的不断发展,导致了生物医学领域文献的数量呈爆炸式增长。因此,研究人员迫切需要自动化工具,从海量的文献中,提取出感兴趣的信息。随着互联网的日益完善,信息抽取技术迅速发展起来,并且在生物医学领域产生了很大影响。蛋白质关系(Protein-Protein Interaction, PPI)抽取,作为信息抽取在生物医学领域的一个重要的应用,旨在从分子层面挖掘潜在的知识,以供研究者使用。围绕PPI抽取问题,本文从以下方面展开研究。为解决特征挖掘不足、单个分类器决策能力有限的问题,本文提出了组合学习的方法。该方法重点探索了特征设计以及多个分类器的集成问题。在特征选择方面,从句子上下文以及多种句法结构中提取了丰富的特征,并采用信息增益的特征选择方法来筛选出最优特征,然后构建特征向量;在分类器集成方面,选择叁个分类准确率较高、决策机制不同的分类器,分别为支持向量机、最大熵和朴素贝叶斯,应用Q-statistic方法验证了不同分类器之间的差异性。采用线性加权的方法,将各个分类器的决策结果集成,保证单独抽取性能表现好的分类器,在融合中能够分配到更高的权重。组合学习方法在典型的AIMed语料上获得了71%的F值和92.9%的AUC值。组合学习方法,只适用在有标注语料充足的情况。然而,在实际应用中,有标注的语料数量相对稀少。因此,为了解决这个问题,本文在组合学习方法的基础上,提出了主动学习的方法。该方法采用基于不确定样本的选择方法,不断从大量未标注语料中挑选出最具信息的样本进行标注,对分类器无用的样本则不进行标注,并将标注后的样本重新加入到训练集中进行自主的学习。主动学习的方法不仅具有良好的PPI抽取效果,而且可以减轻人工标注的工作量。主动学习方法在5个语料上进行的实验取得了不错的效果:在除了LLL之外的4个语料上均获得了较高的AUC值(尤其是在AIMed和BioInfer这样的大语料上),表现出了较强的泛化能力。(本文来源于《大连理工大学》期刊2015-06-01)

郭瑞[8](2015)在《基于迁移学习和词表示的蛋白质交互关系抽取》一文中研究指出作为生物医学信息抽取领域的重要分支,蛋白质交互关系抽取(Protein-Protein Interaction (PPI))是构建蛋白质关系网络的前提条件,具有至关重要的研究意义。目前的PPI研究大多采用统计机器学习的方法,取得了较好的效果。但现有的机器学习方法在PPI抽取任务上仍存在两个亟待解决的难题:标注数据匮乏问题和特征表示时的“数据稀疏”和“数据鸿沟”问题。首先,已标注数据不足会导致模型的抽取效果下降,而在生物医学领域,人工标注数据往往需要大量的、昂贵的实验;另外,传统机器学习方法在特征表示时普遍采用独热码(One-Hot Code)编码方式,忽略了语序和语法等信息,不能表达出词汇间的语义关联信息,限制了PPI抽取精度的提高。针对上述两个问题,本文分别从以下两个方面进行了研究:(1)将基于实例的迁移学习方法TrAdaboost引入到PPI抽取任务中,并在此基础上提出了一种改进的DisTrAdaboost算法。由于不同领域间数据分布存在差异,TrAdaboost算法容易因收敛速度过慢而产生负迁移,而改进的DisTrAdaboost算法借助于实例的相对分布来调整初始权重,可以有效地避免负迁移。实验结果表明,在公共语料库AIMed 上, TrAdaboost算法和改进的DisTrAdaboos t算法均获得了明显优于基准算法的性能;同样方法在语料库IEPA上实验时,TrAdaboost算法发生了负迁移,而改进的DisTrAdaboost算法仍保持良好的迁移效果。(2)提出了一种基于词表示的特征表示方法,用于解决PPI抽取中的“数据稀疏”和“数据鸿沟”问题。本文使用词表示方法从大量无标记数据中无监督地学习潜在语义信息,根据语义信息将单词映射成向量空间中的向量或者将语义相似的单词聚为一类,使得语义相近的单词具有相似的空间分布,进而解决“数据稀疏”和“数据鸿沟”问题,提高PPI抽取性能。本文使用了叁种词表示方法:分布式词表示方法、基于向量的聚类方法和布朗聚类方法用于提升蛋白质关系抽取任务的效果。实验结果显示,分布式词表示方法在五个公共语料库:AIMed, BioInfer, HPRD50, IEPA和LLL上效果均优于其他两种聚类方法,并且F-值分别达到了69.7%,74.0%,78.0%,76.5%和87.3%,高于其他现有的蛋白质关系抽取系统。(本文来源于《大连理工大学》期刊2015-05-05)

张盼盼[9](2014)在《基于篇章的蛋白质交互关系抽取》一文中研究指出文本挖掘的主要目的是自动地从大量文本中抽取有用的信息。生物医学领域的文本挖掘,可以帮助领域专家快速地从相关领域文献中发现对研究有参考意义的信息,此外,还可以减少数据库专家在数据库维护方面所需要的人力和物力。蛋白质-蛋白质之间的交互作用抽取这一课题的相关文献越来越多。这些相关文章的研究都只是针对文献的摘要部分,考虑的只是研究者在摘要中所提到的交互关系,并没有从整篇文章中系统地考虑所有交互关系,并且,全文蛋白质交互关系的评价数据集也相对缺乏。本文使用BioCreative Ⅱ.5中所提供的训练集和FEBS Letters提供的部分文献作为评价集,在摘要关系抽取的基础上,加入全文特有的属性,并通过特征选择进行关系抽取。首先,在对摘要中的蛋白质交互关系抽取的基础上,提出将基本词特征、句法模式特征进行组合。其中,基本词特征中引入篇章位置信息Part、频度特征Coo这两个全文特有的属性;句法模式中,从语句描述的角度总结了关系的模式,并且将其作为一个特征,从而对全文进行关系抽取,取得了72.57%的F-score,AUC达到了77.90%。其次,不同的特征对抽取性能所起的所用也不一致,这些特征进行不同的结合时,正向作用和逆向作用所占的比重也不一致,甚至相互抵消。因此,本文通过特征选择的方式,对基本词特征和句法模式特征进行选择。特征选择的主要目的是提高分类的性能或者利用最少的特征维数取得较好的性能。最终,将特征选择获得的子集特征与树核进行结合,进行基于篇章的蛋白质交互关系抽取。句法树是在现有的动态扩展树(DET)的基础上进行二次扩展,形成二级DET。最终,F-score和AUC分别达到了74.46%、78.50%。(本文来源于《大连理工大学》期刊2014-05-04)

徐博[10](2014)在《基于蛋白质关系网络的复合物抽取研究》一文中研究指出开创系统生物学以来,信息技术成为生物学研究不可缺少的重要手段。计算机领域的研究者利用数据挖掘、机器学习等方法从不同角度诠释生物学中的难题。其中关于生物网络中重要的蛋白质关系网络的研究逐渐成为近年来研究的热点,计算机领域研究者通过计算方法来探寻蛋白质功能、发现蛋白质复合物及功能模块。本文通过分析蛋白质关系网络的可靠性对蛋白质复合物识别的影响,针对生物学家不同的需求情况,设计了基于蛋白质关系网络可靠性分析的蛋白质复合物识别算法,主要研究包括:本文首先对蛋白质关系网络的可靠性进行分析,即利用基因共表达数据、蛋白质结构域等量化蛋白质关系的可信度,并通过对比模糊贝叶斯分类模型与普通贝叶斯模型在分类蛋白质复合物时的差异,揭示蛋白质关系网络的噪音对蛋白质复合物识别的影响较大,为设计以下叁种基于蛋白质关系网络可靠性分析的复合物识别方法提供依据。在已知蛋白质关系网络并且网络不可变的情况下,本文提出基于基因本体的语义相似度计算方法来对网络边加权,并结合加权网络设计了蛋白质复合物的识别方法。结果表明,利用基因本体的加权方式,减轻了网络中的假阳性信息的影响,与现有多个性能领先的复合物识别方法相比,该方法取得了最高的F值。在已知蛋白质关系网络并且网络可变的情况下,本文融合丰富生物信息资源为特征利用机器学习方法重新构建网络用于复合物识别。结果表明,重新构建的关系网络较之现有蛋白质关系网络含有可信蛋白质关系比例更高,现有蛋白质复合物识别方法在重新构建的网络上性能均有提高,尤其显着体现在准确率和F值上。在未知蛋白质关系网络仅已知有限的少量蛋白质关系情况下,本文提出了多层网络模式转换方法构建新关系网络用于复合物识别。实验结果表明,本文方法识别复合物的性能高于现有方法,尤其体现在F值上,此外,新建网络较现有网络含有更高比例的在生物学意义上相关的关系,其他蛋白质复合物识别方法在新建网络上性能同样得到提高。综上所述,本文针对蛋白质关系网络的可靠性问题,在不同条件下,有效的解决了网络中关系不可靠性对蛋白质复合物识别的影响,其中一些预测的新复合物已经过生物意义上统计评价,很可能对生物实验有所启发。此外,本文提出的蛋白质关系网络构建方法,对其他复杂网络中边的预测也具有一定的借鉴意义,将在未来工作中继续探讨。(本文来源于《大连理工大学》期刊2014-03-21)

蛋白质关系抽取论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

蛋白质交互关系(Protein-Protein Interaction,PPI)是生物医学领域研究的重要内容之一,对疾病的诊断和治疗以及新药的研制具有重要的意义,目前经过实验验证得到的PPI相关知识主要以非结构化文本的形式存储于生物医学文献中。随着生物医学文献数量的飞速增长,依靠人工挖掘蛋白质交互信息的方式难以满足实际的应用需求。因此,从生物医学文献中自动抽取蛋白质交互关系成为生物信息领域重要的研究课题。目前蛋白质交互关系抽取主要基于远监督的方法,通过将知识库与非结构化文本对齐来自动获取大规模训练数据,在一定程度上减轻了对人工标注语料的依赖。但是这种方法存在明显的缺陷,即在构建训练数据的过程中引入了大量的噪音数据,这些噪音会对模型的抽取性能造成很大的影响。针对这个问题,本文首先建立了基于远监督的蛋白质交互关系抽取基本模型,利用远监督产生的训练数据来训练分类模型,并在人工标注语料上进行测试,通过实验结果进一步分析了训练数据中存在的噪音问题。接下来本文建立了基于主题集合的蛋白质交互关系抽取模型,在交叉预测的基础上利用关键词和句子相似性抽取蛋白质对签名档对应的主题集合,并将主题集合之外的句子视为噪音进行清除,利用去噪后的数据训练分类模型并在人工标注语料上进行测试。实验通过对多个不同参数组合进行测试,得到的最好结果与远监督基本模型相比,有交互蛋白质对和无交互蛋白质对的F1度量分别提高了1.49%和9.18%,去噪效果明显。为了充分利用训练数据中句子类别间的相互关系,本文引入了多示例多标记学习模型用于蛋白质交互关系抽取中,将蛋白质对签名档中的句子及其类别构造为多示例多标记模型,利用最大期望算法来确定句子的类别,进而清除训练数据中的噪音。实验结果表明,基于多示例多标记的迭代算法对于训练数据中的噪音识别更加准确,相比于远监督的基本模型,在有交互蛋白质的F1度量略有提升的基础上,无交互蛋白质对的F1度量提高了14.84%,模型性能提高明显,且抽取结果更加平衡。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

蛋白质关系抽取论文参考文献

[1].赵哲焕,杨志豪,孙聪,林鸿飞.生物医学文献中的蛋白质关系抽取研究[J].中文信息学报.2018

[2].闵庆凯.基于远监督的蛋白质交互关系抽取[D].南京航空航天大学.2018

[3].包振栋.基于生物医学文本挖掘的蛋白质间相互作用关系抽取方法的研究[D].西北农林科技大学.2017

[4].龙光宇.蛋白质磷酸化与疾病关系抽取研究[D].中国科学技术大学.2017

[5].李丽双,蒋振超,万佳,黄德根.利用词表示和深层神经网络抽取蛋白质关系[J].中文信息学报.2017

[6].李丽双,郭瑞,黄德根,周惠巍.基于迁移学习的蛋白质交互关系抽取[J].中文信息学报.2016

[7].刘敏捷.基于组合学习和主动学习的蛋白质关系抽取[D].大连理工大学.2015

[8].郭瑞.基于迁移学习和词表示的蛋白质交互关系抽取[D].大连理工大学.2015

[9].张盼盼.基于篇章的蛋白质交互关系抽取[D].大连理工大学.2014

[10].徐博.基于蛋白质关系网络的复合物抽取研究[D].大连理工大学.2014

标签:;  ;  ;  

蛋白质关系抽取论文-赵哲焕,杨志豪,孙聪,林鸿飞
下载Doc文档

猜你喜欢