浅层语义分析论文-李冬梅,张琪,王璇,檀稳

浅层语义分析论文-李冬梅,张琪,王璇,檀稳

导读:本文包含了浅层语义分析论文开题报告文献综述及选题提纲参考文献,主要关键词:中文问答系统,本体,浅层句法分析,最大熵

浅层语义分析论文文献综述

李冬梅,张琪,王璇,檀稳[1](2017)在《基于浅层句法分析和最大熵的问句语义分析》一文中研究指出为了使中文问答系统能够准确高效地识别问句的语义,在构建生物医学领域本体的基础上,提出了一种基于浅层句法分析和最大熵模型的语义分析算法。该算法首先对自然语言问句进行语义块识别,如果识别成功,则形成问句向量,然后利用本体进行SPARQL查询;如果识别失败,则调用最大熵模型,判断问句的语义角色。最大熵模型利用标注好语义的熟语料进行训练,提取语义组块特征,从而判断出最可能的句型,形成问句向量,然后再利用本体进行查询,获取答案。通过实验与其他方法相比,新算法具有更高的查准率和召回率。(本文来源于《计算机科学与探索》期刊2017年08期)

吐尔地·托合提,维尼拉·木沙江,艾斯卡尔·艾木都拉[2](2017)在《基于统计和浅层语言分析的维吾尔文语义串快速抽取》一文中研究指出该文提出了一种基于统计和浅层语言分析的维吾尔文语义串快速抽取方法,采用一种多层动态索引结构为大规模文本建词索引,结合维吾尔文词间关联规则采用一种改进的n元递增算法进行词串扩展并发现文本中的可信频繁模式,最终依次判断频繁模式串结构完整性从而得到语义串。通过在不同规模的语料上实验发现,该方法可行有效,能够应用到维吾尔文文本挖掘多个领域。(本文来源于《中文信息学报》期刊2017年04期)

李宝程[3](2016)在《基于浅层语义分析的文本摘要方法研究与实现》一文中研究指出当前,互联网和移动互联网的快速普及使得信息资源爆炸性增长。丰富的信息资源一方面给人们带来极大便利,同时也在有效资源的选择上面临诸多困难。从网络信息资源的类型来看,非结构化资源的比例呈现增长趋势,所涉及的处理技术相比结构化数据而言具备更大的难度。其中,文本类型信息具有典型的非结构化特征,对其进行有效分析和处理在互联网以及诸多行业中具有十分重要的理论价值和实践意义。是文本信息处理中的一个非常重要的组成部分。在实现方法上,本文使用的浅层语义特征区别于常用的词语特征,研究的重点不再是可以观察到的构成文章的词语、句子等基本信息,而是隐藏在这些句子、词语背后,更深层次的语义信息,称之为主题特征。通过对文章主题特征的挖掘与分析,可以进一步得到主题-词语的关联,主题-句子的关联。基于这种关联关系衡量句子或者词语表达文章主题的能力,从而选择出能够完整表达文章主题的句子作为文本摘要。本文在详细阐述国内外研究现状的基础上,首先基于主题对句子关联度计算进行了针对性研究,提出一种新的衡量句子与句子相关性的方法,在语义层面,充分利用主题对文章的表达能力,基于主题在句子上的概率分布,使用相对熵来计算两个句子上主题概率分布的差异性来确定句子相关度,同时将文本归结为叁类内容,作为摘要提取的依据,并在NLPCC2015数据集上进行了实验验证。同时,论文基于主题和图模型改进了文本摘要算法。通过LDA模型挖掘出文本语义层面的主题特征,分析文本中词语和主题的对应关系,基于改进的图模型进行文本摘要,改进其以往的建边方式,使用主题关联来确定不同节点之间是否建边。并在DUC数据集上实验验证,其ROUGE分数在比较的几种算法中得分最高。最后,在文本摘要关键技术基础上搭建了一个文本摘要功能演示系统。基于Struts2、Hibernate框架,结合sitemesh、JQuery、CSS、JSP、HTML等技术,可以通过在输入框中输入文本或者提交文档的方式实时得到文本摘要的分析结果。本文所研究内容已经在实际项目中得到工程应用和验证,在自然语言处理平台中发挥了重要作用。(本文来源于《电子科技大学》期刊2016-03-01)

李风环,郑德权,赵铁军[4](2015)在《基于浅层语义分析的主题事件的时间识别》一文中研究指出时间识别是自然语言处理中极其重要的课题。事件中与主题相关的时间信息体现了事件在时间维度的主题特征。当前面向事件的时间识别大多是基于句子或短语的,并采用静态时间值机制。本文提出了一个面向主题事件的时间识别模型。该模型采用参考时间动态选择机制对时间表达式规范化。结合事件抽取和浅层语义分析,将浅层语义分析结果和时间表达式进行映射,将基于句子或短语的时间识别转化为基于篇章的时间识别,从而识别主题事件片段的时间。实验表明所提出的方法使主题事件片段的时间识别的性能提高了9.6%。(本文来源于《山东大学学报(理学版)》期刊2015年11期)

张成功[5](2013)在《基于浅层语义的文本倾向性分析研究》一文中研究指出随着Web2.0时代的到来,互联网不再只是人们获取信息的重要来源,而且逐渐成为人们表达自己观点和情感的的重要平台,于是互联网上出现了大量的主观性文本,比如购买产品的评论信息、微博等社交平台上表达网民观点或情感的信息等。如何从这些主观性文本中提取有意义的单元,从而实现对主观性文本的分析、处理和应用成为研究的热点,文本倾向性分析正是在这种背景下产生的。文本倾向性分析在产品评论领域、舆情分析领域以及其他诸多领域有着广泛的应用价值。文本倾向性分析的任务主要有叁个:情感信息的抽取、情感信息的分析及情感信息的应用。情感信息的抽取旨在从主观性文本中抽取有意义的单元,将非结构化的文本转变为计算机能够处理的结构化文本;情感信息的分析是从短语级、句子级和篇章级等多个粒度上对主观性文本进行分析,从而得到作者的观点、情感及态度。本文在两次参与中文信息学会组织的中文倾向性评测会议的基础上,对文本倾向性分析的前两个任务展开研究,所做主要工作和成果有:首先,本文对情感信息抽取中的评价对象抽取和观点句抽取展开研究。通过对评价对象的不同模式进行研究,发现评价对象多包含一些出现频率较高的名词,于是本文抽取评价对象中出现频率较高的名词作为核心词,并通过引入词频、情感词、上下文、组块等浅层语义特征,提出了一种基于核心词和浅层语义特征的评价对象抽取方法。在观点句抽取方面,引入情感词、评价对象、感叹词、带情感色彩的标点符号、人称代词、主张动词等特征,提出了一种融合多特征的观点句抽取方法。其次,本文从短语级、句子级和篇章级叁个粒度对情感信息的倾向性分析展开研究。针对单纯使用情感词代表文本倾向性所存在的问题,提出使用情感词和修饰词组成极性短语作为代表文本倾向性的基本单元,并给出了极性短语的倾向性计算方法。评价对象的倾向性及倾向强度即为修饰该评价对象的极性短语的倾向性及强度;观点句的倾向性是在短语级倾向性分析的基础上,考虑了转折、递进等连词的出现对极性短语权重产生的影响,采用一种基于极性短语加权求和的句子倾向性计算方法;篇章级的倾向性分析是在观点句的倾向性分析的基础上,考虑篇章结构对观点句权重的影响,将观点句分为总结观点句、半总结观点句和一般观点句,提出了一种基于观点句的篇章倾向性加权计算方法。最后,对本文提出的情感信息抽取及倾向性分析方法进行了实验分析,将参加评测时所用方法的实验结果、本文改进方法的实验结果及其它参赛队伍的实验结果进行了对比,证明了本文所提出方法的有效性。(本文来源于《山东师范大学》期刊2013-06-06)

孙志军,郑烇,袁婧,刘恒,王嵩[6](2012)在《基于浅层语义分析技术的语义检索》一文中研究指出在信息检索领域,语义检索技术较传统的关键字检索,无论在检索效果还是用户体验方面,都有诸多优势。语义检索融合了信息检索、语义分析以及信息融合等诸多方法,已成为现阶段该领域研究的一项重要技术。在Lu-cene索引技术基础之上,提出了语义检索的方法,即对语句进行语义分析,获得一种描述语句浅层语义信息的形式化表示,并对这种形式化表示建立索引;将表述语义联系的多层次相似度通过信息融合技术进行融合,并将其映射成查询语句与索引数据之间的相似度,达到语义检索的目的。(本文来源于《计算机科学》期刊2012年06期)

李世奇[7](2011)在《面向文景转换的中文浅层语义分析方法研究》一文中研究指出本文针对中文浅层语义分析中的关键问题展开了全面深入的研究。浅层语义分析是自然语言处理领域里的研究要点,基于语言学特征和统计机器学习的方法是目前浅层语义分析的主流方法,该方法中最关键的因素是特征的选择和机器学习方法的优化。另外,本文中的浅层语义分析主要面向文景转换这项应用任务,文景转换是指把自然语言文本通过计算机自动转换成为相应的场景或动画,是一门具有重要理论和实际意义的新兴研究方向。本文首先对文景转换中必要的共指消解模块进行了研究;然后从特征选择角度对浅层语义分析方法进行了探索,发掘出在浅层语义分析中具有较强区分能力的句法特征;接着提出一种组合分类模型的方法对浅层语义分析进行完善;最后提出一种基于计算认知模型的方法,从更深层面对中文浅层语义分析进行了探索。具体地说,本文主要包括以下研究内容:(1)首先提出一种基于自适应谐振理论(ART)网络的无指导中文名词短语共指消解方法。该方法充分利用了名词短语自身特征,通过调整ART网络模型中的参数动态地控制聚类数量,有效解决了目前聚类共指消解中输出类别数目难以确定这一难题。另外聚类算法中还采用了一种基于信息增益率的特征选择方法,减少了区分度较弱特征给聚类所带来的干扰。该方法在保证了共指消解准确率的前提下,具有较好的可移植性和鲁棒性,突破了目前文景转换中的浅层语义分析在预处理阶段的主要障碍。(2)本文从语言学特征层面深入地研究了中文浅层语义分析,提出一种基于多重句法特征的中文浅层语义分析方法。现有研究表明,对特征集合进行改进是目前提高浅层语义分析性能最有效的方法。本文提出将短语结构句法和依存句法两种类型的句法特征进行融合,为浅层语义分析提供了更加丰富和互补的句法信息。然后在这两个句法特征集合基础上,提出一种基于统计的组合特征选择方法,根据各个特征在语料库中的分布状况,快速有效地筛选出适于各分类阶段的组合特征。最后利用短语结构句法特征、依存句法特征以及在前两者基础上构造的组合特征进行语义分析相关的分类。实验表明,本文提出的多重句法特征集合能够有效地提高中文浅层语义分析的性能,在正确句法分析以及自动句法分析条件下均取得了较好的效果。(3)提出了一种基于组合分类模型的中文浅层语义分析方法,从优化机器学习方法的层面进一步对浅层语义分析进行完善。本文在前面提出的多重句法特征集合基础上,采用五种机器学习方法:K近邻、决策树、感知器、最大熵以及支持向量机,在训练语料上构造了五个语义角色分类模型,作为组合模型中的基本单元。接着通过一种输入相关的选通系统将五个基本分类模型有机地整合到一起,通过调整选通系统中的参数协调各个基本分类模型,控制组合模型的输出结果。最后采用EM算法在训练语料上对选通系统中的参数进行学习,在通用语料库上进行了相关的训练和测试,结果表明该方法能够显着地提高中文语义角色分析的效果。(4)最后,本文提出了探索性的基于计算认知模型的中文浅层语义分析方法,以认知理论为基本依据,通过模拟人类的语言理解过程,从本质上来研究中文浅层语义分析。首先设计了一种面向计算认知模型和文景转换的命题语义表示形式,这种命题形式能够简单高效地表达自然语言中蕴涵的语义信息。本文将该命题形式作为认知模型中的基本单元,然后在认知模型网络上模拟人脑中神经元的扩散激活机制,使符合上下文约束的命题节点不断被加强,不符合上下文约束的节点逐渐被削弱,根据当网络达到稳定状态时的最终激活命题节点,即可还原出谓词相关的语义分析结果。(本文来源于《哈尔滨工业大学》期刊2011-06-01)

王鑫,孙薇薇,穗志方[8](2011)在《基于浅层句法分析的中文语义角色标注研究》一文中研究指出语义角色标注是获取语义信息的一种重要手段。许多现有的语义角色标注都是在完全句法分析的基础上进行的,但由于现阶段中文完全句法分析器性能比较低,基于自动完全句法分析的中文语义角色标注效果并不理想。因此该文将中文语义角色标注建立在了浅层句法分析的基础上。在句法分析阶段,利用构词法获得词语的"伪中心语素"特征,有效缓解了词语级别的数据稀疏问题,从而提高了句法分析的性能,F值达到了0.93。在角色标注阶段,利用构词法获得了目标动词的语素特征,细粒度地描述了动词本身的结构,从而为角色标注提供了更多的信息。此外,该文还提出了句子的"粗框架"特征,有效模拟了基于完全句法分析的角色标注中的子类框架信息。该文所实现的角色标注系统的F值达到了0.74,比前人的工作(0.71)有较为显着的提升,从而证明了该文的方法是有效的。(本文来源于《中文信息学报》期刊2011年01期)

张巍,陈俊杰[9](2011)在《浅层语义分析及SPARQL在问答系统中的应用》一文中研究指出为了解决受限域问答系统中答案抽取的问题,提出了一种基于浅层语义分析的问答系统模型。该模型以自然语言为接口,利用医院信息本体,采用浅层语义分析技术,由语义块定义规则和语义块判定规则,首先生成问句向量,然后利用SPARQL查询技术,在本体中进行查询,从而得到答案。实验表明该方法可行,对自动问答系统的设计具有借鉴意义和深入研究的价值。(本文来源于《计算机工程与应用》期刊2011年02期)

王鑫,孙薇薇,穗志方[10](2010)在《基于浅层句法分析的中文语义角色标注研究》一文中研究指出语义角色标注是获取语义信息的一种重要手段。许多现有的语义角色标注部是在完全句法分析的基础上进行的,但由于现阶段中文完全句法分析器性能比较低,基于自动的完全句法分析的中文语义角色标注效果并不理想.因此本文将中文语义角色标注建立在了浅层句法分析的基础上。在句法分折阶段。利用构词法获得词语的语素信息,有效提高了句法分析的性能,F值达到了93.61。在角色标注阶段,利用动词的语素信息,并提出了句子的"粗框架"特征,使角色标注阶段的F值达到了74.1,比前人(71.9)有较为显着的提升,从而证明了笔者的方法是有效的。(本文来源于《第六届全国信息检索学术会议论文集》期刊2010-08-12)

浅层语义分析论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

该文提出了一种基于统计和浅层语言分析的维吾尔文语义串快速抽取方法,采用一种多层动态索引结构为大规模文本建词索引,结合维吾尔文词间关联规则采用一种改进的n元递增算法进行词串扩展并发现文本中的可信频繁模式,最终依次判断频繁模式串结构完整性从而得到语义串。通过在不同规模的语料上实验发现,该方法可行有效,能够应用到维吾尔文文本挖掘多个领域。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

浅层语义分析论文参考文献

[1].李冬梅,张琪,王璇,檀稳.基于浅层句法分析和最大熵的问句语义分析[J].计算机科学与探索.2017

[2].吐尔地·托合提,维尼拉·木沙江,艾斯卡尔·艾木都拉.基于统计和浅层语言分析的维吾尔文语义串快速抽取[J].中文信息学报.2017

[3].李宝程.基于浅层语义分析的文本摘要方法研究与实现[D].电子科技大学.2016

[4].李风环,郑德权,赵铁军.基于浅层语义分析的主题事件的时间识别[J].山东大学学报(理学版).2015

[5].张成功.基于浅层语义的文本倾向性分析研究[D].山东师范大学.2013

[6].孙志军,郑烇,袁婧,刘恒,王嵩.基于浅层语义分析技术的语义检索[J].计算机科学.2012

[7].李世奇.面向文景转换的中文浅层语义分析方法研究[D].哈尔滨工业大学.2011

[8].王鑫,孙薇薇,穗志方.基于浅层句法分析的中文语义角色标注研究[J].中文信息学报.2011

[9].张巍,陈俊杰.浅层语义分析及SPARQL在问答系统中的应用[J].计算机工程与应用.2011

[10].王鑫,孙薇薇,穗志方.基于浅层句法分析的中文语义角色标注研究[C].第六届全国信息检索学术会议论文集.2010

标签:;  ;  ;  ;  

浅层语义分析论文-李冬梅,张琪,王璇,檀稳
下载Doc文档

猜你喜欢