文本知识获取论文_赵超

导读:本文包含了文本知识获取论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:知识,自然语言,文本,本体,中文,算法,分词。

文本知识获取论文文献综述

赵超[1](2018)在《面向中文文本的医学知识获取、表示与推理》一文中研究指出面向文本的知识获取、表示与推理属于自然语言处理、知识表示和知识推理的交叉课题,主要研究利用自动化方法从文本中抽取叁元组信息、将信息加工成为知识图谱、并利用已有知识发现新知识等问题。这些问题用于模拟智能系统从外部获取信息、生成知识结构、以及利用知识进行推理的能力,是智能体不可缺少的能力,是整个人工智能的核心。经过二十余年的发展,面向文本的知识获取、表示与推理系统在开放域中获取了一定的成功,出现了bootstrapping、远程监督(distant supervision)等一些经典的知识抽取方法;YAGO、NELL等一些大型知识库;以及Path-Ranking、Trans X等一些知识推理方法。近年来,基于深度学习的方法为知识获取和推理注入了新的活力,被证明在多数情况下可以有效提高这些算法的性能。在限定域中,开放域的通用方法与领域特点相结合,往往可以在扩展知识深度的同时,避免开放域的一些难以解决的问题,如实体消歧等。限定域知识在医疗、法律、生物等专业领域、娱乐、饮食、商务等生活领域都发挥着重要的作用。本文关注于医疗领域,研究面向中文电子病历和半结构化医学文本的医学知识获取、表示与推理的关键技术。主要包含以下叁个方面:(1)面向中文电子病历的医学知识获取与表示。针对医学实体关系自动抽取精度不高的问题,本文提出医学知识网络(medical knowledge network,MKN)作为电子病历医学知识表示方法。MKN是一个仅包含医学实体,不包含医学实体关系的网络。该网络以医学实体为节点,以实体在一份电子病历中的共现关系为边。虽然以共现为关系的叁元组往往不能被视为医学知识,但相比于随机网络,MKN确实显示出了一定的知识复杂性,可以在其之上构建相应的知识推理系统。(2)面向半结构化医学文本的医学知识获取与表示。电子病历作为一种单一知识源,无法覆盖临床所需的全部的医疗知识。为了从其他来源进行知识挖掘,本文提出了一套医学知识图谱构建方案,包括实体识别、实体关系抽取等知识获取模块,以及知识描述、存储、归一、校验等知识加工模块。该方案可以从半结构化医学文本中抽取叁元组信息,并自动整合为一个医学知识图谱。(3)基于马尔科夫随机场的临床决策推理。面向MKN以共现关系加以组织的特点,本文提出基于马尔科夫随机场的医学知识推理框架,针对疾病诊断、检查推荐、治疗方案推荐叁大临床决策问题,结合图特征、边特征、分布式表示的节点特征等构建了6种势函数,设计3种评价指标对推理系统性能进行评估。真实电子病历上的实验表明该方法可以有效从MKN中过滤出医学知识。医学知识图谱可以为MKN推理提供节点归一和解释性功能。综上所述,本文面向两大类医学文本知识源,研究了在此之上的医学知识获取、表示与推理的关键技术。在真实的电子病历和医学文本数据上测试有效,取得了初步的研究成果。我们希望这些成果能够进一步应用到更广泛的医学文本数据和医学知识推理任务上,以进一步推动自然语言处理和知识表示与推理在医学领域的研究和发展。(本文来源于《哈尔滨工业大学》期刊2018-06-01)

刘锴锋,王红军,左云波[2](2017)在《基于本体及Web文本的数控机床知识获取》一文中研究指出为了有效解决数控机床领域,由于知识没有结构化描述,导致知识获取效率低的问题以及实现知识重用和知识共享,通过对该领域Web文本中机床知识进行研究,分析文本结构特点,提出一种基于本体的数控机床知识抽取方法。对爬虫程序获取的文档进行预处理,通过模式匹配的方式抽取Web文本中存在上下位关系的语句,经过中文分词系统ICTCLAS分词处理后抽取概念,构建概念集合和概念树,最终构建领域本体并以OWL语言储存。实验中对随机选取的网页进行知识抽取,并采用对比实验,证明该方法能有效地对数控机床领域中半结构化和结构化Web文本信息进行获取。(本文来源于《电子测量与仪器学报》期刊2017年04期)

郭茂盛,张宇,刘挺[3](2017)在《文本蕴含关系识别与知识获取研究进展及展望》一文中研究指出文本蕴含关系是广泛分布于自然语言文本中的单向推理关系,文本蕴含相关研究是自然语言处理领域的一项基础性研究,它可以辅助其他自然语言处理任务的进行,并且具有丰富的应用场景.文中首先界定了文本蕴含研究的范畴.作为一种二元关系,文本蕴含有3个基本研究任务——关系识别、知识获取和蕴含对生成.其中,关系识别有两个核心问题——语义表示与推理机制;知识获取也有两个核心问题——知识表示与知识来源;蕴含对生成研究进展比较缓慢,文中细致地分析了其内因和外因.文中围绕语义表示与推理机制这两个核心问题梳理了关系识别的研究进展,围绕知识表示与知识来源梳理了知识获取的研究进展,并指出了各类方法的可取之处与不足之处.文本蕴含研究的进展离不开相关国际评测,文中也对这些国际评测和数据集进行了归纳总结.大数据时代的到来和深度学习理论的不断发展,为文本蕴含相关研究提供了丰富的知识来源和有力的研究工具,同时也带来了许多崭新的研究课题.文中立足当前研究形势,展望了未来研究方向,并从理论上探讨了其可行性.(本文来源于《计算机学报》期刊2017年04期)

冯昊南[4](2016)在《多文本知识源下的历史知识的获取与修正》一文中研究指出历史知识是人类最重要的知识之一。"以铜为镜可以正衣冠,以史为镜可以知兴衰。"了解历史能够让一个人更好的了解过去,并且更好的掌握现在,从而提高一个人的人文素养。但是,历史毕竟是由人编撰,必然会带有一定的主观色彩,而史学家的主观色彩会影响他们对某一历史事件是否能够的准确记录,所以有时出现即使是同一历史事件,在不同的史料对其的记录中亦有所异同的情况。所以如何在卷帙浩繁的史料中对某一历史知识进行较为准(本文来源于《山海经》期刊2016年11期)

陈娟[5](2016)在《基于多文本知识源的知识修正与获取》一文中研究指出知识获取是知识工程中关键的一环,而从文本知识源中获取专业知识是一种重要而常用的途径。但从文本中获取知识并不简单,不管是手工获取还是机器获取,领域专家所使用的概念都很难被识别和抽取出来。另外,由于自然语言的歧义性、非规范性和文本知识源的多样性,常常会产生知识不一致性问题。知识获取的途径主要有叁种:第一种是将文本中的概念和关系直接自动的抽取出来的自动化知识获取方式;第二种是依靠人工操作进行知识获取的非自动化知识获取方式;第叁种是人机交互合作的半自动化知识获取方式。通过对上述叁种知识获取途径的分析,本文选取第叁种方式进行知识的获取。知识获取与知识表示两者密不可分,知识获取的前提是采用合适的方法将知识表示出来。只有知识得到了合适的表示,才能更好的实现知识的获取和合理运用。本体作为一种形式化的、概念化的知识表示方法,可以将概念间的语义关系通过层次结构很好的体现出来,而且通过对相同领域中概念的统一,可以实现知识的互通和重复利用。同时,框架表示法作为本体的一种描述语言,可以将概念中所包含的属性和属性值形象、直观的表示出来,有利于对不同知识源中的同一事物或概念进行分析和比较,实现知识不一致性的检测与修正。因此,本文采用基于本体的框架表示对知识进行获取。针对知识获取过程中的不一致性问题,本文首先提出了框架提取算法,实现了文本知识到知识框架的自动获取。其次,利用概念格对框架集的相关性进行分析,为知识框架的检测与合并奠定了基础。然后,对知识不一致性的类型进行了分析和总结,如概念名称不一致、单位类型不一致和知识粒度不一致等,并在框架表示的基础上提出了相应的处理策略。最后,以历史事件知识为例,结合不一致性策略提出了合一算法。并基于Visual studio平台进行实验验证,获取到了高精度和细粒度的历史知识,实现了知识的不一致性检测、修正与合并。通过实验证明了该方法的可行性和有效性,为下一步的知识服务奠定重要的基础。(本文来源于《曲阜师范大学》期刊2016-04-10)

陈娟,韩永花,雷玉霞[6](2015)在《基于多文本知识源的历史知识修正与获取》一文中研究指出知识获取是知识工程中关键的一环,而从文本知识源中获取专业知识是一种重要而常用的途径。而不同文本知识源对同一对象描述往往有所不同,为了获取完备的高精度和细粒度的知识,给出了一种从多种文本知识源中获取历史知识的方法。其基本思想是:将不同文本知识源的知识自动翻译成框架知识;对描述相同对象的不同框架进行不一致性检测并修正;合并知识框架。实验表明,该方法能获取到高精度和细粒度的历史知识,是可行和有效的,并为下一步的知识服务奠定重要的基础。(本文来源于《计算机工程与应用》期刊2015年18期)

曲朝阳,范旭东,于华涛,曲楠[7](2014)在《基于本体的智能电网文本知识获取模型》一文中研究指出针对智能电网知识的共享与重用问题,本文提出了一种基于本体的智能电网文本知识获取方法。首先,以《电力主题词表》和《中国分类主题词表》为基础,基于Protégé构建一个初始种子本体,用Jena对此本体进行解析,生成概念树;然后,利用ICTCLAS进行中文分词,生成概念词集;最后,提出基于How Net的GSS匹配算法,并将概念词集与概念树进行匹配,将获取到的概念和属性添加到种子本体中,完成一次知识获取。通过抓取智能电网领域相关网页进行实例验证,获得了较好的效果。(本文来源于《东北电力大学学报》期刊2014年05期)

裘江南,王延章,杜云阶[8](2011)在《基于知识模型的应急文本中的事实获取方法研究》一文中研究指出为应急决策者提供快速而准确的决策知识和决策支持一直是应急领域的研究热点。本文首先构建了一个突发事件的基于框架的知识模型,可用于表示各类突发事件的知识。进而提出一种针对应急领域文本的基于知识模型的事实获取方法,主要包括文本预处理、事实的获取、事实的检验3个部分。最后通过实验验证了该方法的有效性,并取得了良好的效果。该模型为事实间的关系模式获取提供了基础,最终可为应急决策提供知识支持。(本文来源于《情报理论与实践》期刊2011年02期)

姚金国,代志龙[9](2011)在《基于文本分析的知识获取系统设计与实现》一文中研究指出知识获取一直以来都是构建专家系统的瓶颈问题。针对该问题,利用自然语言处理技术,设计并实现一个针对化学科技文献进行分析的知识获取系统,并对其关键技术进行分析。系统对输入文本进行分词及词性标注,在此基础上,使用Tregex在句法分析树上进行实体识别,同时利用依存关系进行搭配词识别。实验结果表明了该系统的有效性。(本文来源于《计算机工程》期刊2011年02期)

苑金海,刘弘[10](2010)在《基于遗传算法和K-medoids算法的产品设计文本知识获取》一文中研究指出产品设计是设计众多知识的一个过程,如何从大量原始数据中获取有益的知识是非常值得研究的问题.本文采用遗传算法和K-medoids算法相结合,通过聚类来去除无关的数据,获取有益的知识.(本文来源于《聊城大学学报(自然科学版)》期刊2010年04期)

文本知识获取论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

为了有效解决数控机床领域,由于知识没有结构化描述,导致知识获取效率低的问题以及实现知识重用和知识共享,通过对该领域Web文本中机床知识进行研究,分析文本结构特点,提出一种基于本体的数控机床知识抽取方法。对爬虫程序获取的文档进行预处理,通过模式匹配的方式抽取Web文本中存在上下位关系的语句,经过中文分词系统ICTCLAS分词处理后抽取概念,构建概念集合和概念树,最终构建领域本体并以OWL语言储存。实验中对随机选取的网页进行知识抽取,并采用对比实验,证明该方法能有效地对数控机床领域中半结构化和结构化Web文本信息进行获取。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

文本知识获取论文参考文献

[1].赵超.面向中文文本的医学知识获取、表示与推理[D].哈尔滨工业大学.2018

[2].刘锴锋,王红军,左云波.基于本体及Web文本的数控机床知识获取[J].电子测量与仪器学报.2017

[3].郭茂盛,张宇,刘挺.文本蕴含关系识别与知识获取研究进展及展望[J].计算机学报.2017

[4].冯昊南.多文本知识源下的历史知识的获取与修正[J].山海经.2016

[5].陈娟.基于多文本知识源的知识修正与获取[D].曲阜师范大学.2016

[6].陈娟,韩永花,雷玉霞.基于多文本知识源的历史知识修正与获取[J].计算机工程与应用.2015

[7].曲朝阳,范旭东,于华涛,曲楠.基于本体的智能电网文本知识获取模型[J].东北电力大学学报.2014

[8].裘江南,王延章,杜云阶.基于知识模型的应急文本中的事实获取方法研究[J].情报理论与实践.2011

[9].姚金国,代志龙.基于文本分析的知识获取系统设计与实现[J].计算机工程.2011

[10].苑金海,刘弘.基于遗传算法和K-medoids算法的产品设计文本知识获取[J].聊城大学学报(自然科学版).2010

论文知识图

:军事文本知识获取知识库知识念...基于文本的知识获取过程知识获取系统结构图基于互联网的词汇语义知识库框架示意...从军事文本中获取知识的过程知识获取模型

标签:;  ;  ;  ;  ;  ;  ;  

文本知识获取论文_赵超
下载Doc文档

猜你喜欢