语句相似度论文_毕玉德,姜博文

导读:本文包含了语句相似度论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:语句,分词,系统,向量,问答,特征,词形。

语句相似度论文文献综述

毕玉德,姜博文[1](2019)在《韩国语句子结构相似度计算方法研究》一文中研究指出句子相似度计算是信息处理领域一项基础技术,在基于实例的机器翻译中直接影响译文质量。该文以韩国语句子为研究对象,结合韩国语的句子特点提出了一种句子结构相似度的计算方法。该方法通过先提取句子的骨架结构,然后结合韩国语的句法特点制定标记转换规则,最后用转换后的句子结构与实例库中句子匹配得到与之相似的句子,得出两个句子间的结构相似度,并且通过实验验证了该方法的可行性,提高了相似度计算效果。(本文来源于《中文信息学报》期刊2019年03期)

刘佳雯[2](2018)在《语句相似度匹配在自动问答系统中的应用与实现》一文中研究指出随着人工智能技术的快速发展,机器人、智能交互终端、智慧呼叫中心等应用系统已在现实社会中逐步呈现,其中,智能语音交互,即自动问答已经成为各类智慧系统应用的重要模块之一,针对特定行业应用中的常问问题集(FAQ)问答系统是将用户常问问题与对应答案组织起来形成行业应用的专家库,为用户提供更加方便专业的服务。在自动问答系统中,由于用户提问的随机性,语句相似度匹配是解决智能问答最关键的技术之一。本文从句法结构角度和词共现角度对语句相似度计算进行了研究,提出了一种基于词向量的多特征相融合的语句相似度计算方法。在语句相似度匹配的过程中,采用基于Word2Vec词向量的词语相似度来完成语句的相似度计算,词向量能够更加准确地反映词语本身的语义关系,给语句语义计算提供了良好的基础;采用语句依存结构分析工具,来确定中心词和语句元素,得到依存对的搭配关系,为了凸显不同依存对在语句中的重要程度,为依存对设置了重要度,有效规避了中文复杂句式给语句相似度计算带来的影响;在词共现的基础上,采取词向量共现计算语句的相似度。最后将两种计算方法相结合并赋予不同的权重,并将本文的语句相似度计算方法应用于基于政务大厅应用场景的自动问答系统当中,通过实际系统验证测试,表明本文所提出的方法在计算语句相似度时,正确率与召回率均有较好表现。(本文来源于《南京邮电大学》期刊2018-11-14)

陈贤武,刘道波[3](2018)在《基于语句相似度的主观试题自动阅卷模型研究》一文中研究指出为了实现网络考试的自动化,提出了基于语句相似度的主观试题自动阅卷模型.首先,从关键词、语义、句法3类文本特征相似度方面分析了主观试题自动评阅的可能性,并对答案数据进行清洗、特征分类,给出了自动阅卷的步骤;其次,建立多特征语句相似度计算模型,以语义为核心,基于多特征综合相似度对主观试题进行分析比对,理论上提高了主观试题的评审准确度;最后,为某副省级城市人才培训网设计了一个针对主观试题的自动阅卷系统原型.实验表明,提出的改进语句多特征相似度计算方法,能有效提高智能阅卷系统中主观试题自动阅卷的准确性,具有较好的应用前景.(本文来源于《武汉大学学报(工学版)》期刊2018年07期)

高旭杨[4](2018)在《基于语句相似度计算的FAQ问答系统设计》一文中研究指出当今互联网行业飞速发展,人工智能引领的科技浪潮正在把人类社会从互联网2.0时代推向互联网3.0时代。在全新互联网3.0时代提出的设想和建设中,互联网将理解用户需求并为之提供服务。互联网会对用户数据了如指掌,知道用户有什么、想要什么以及用户的行为习惯,并依据数据进行资源筛选匹配,直接给用户提供服务。如此一来,人们从互联网寻求问题答案、信息知识时,交流途径将变得越来越多样化。从传统的搜索引擎时代,演变到用户与用户之间交互式的问答知识社区时代,一步一步走向基于大量知识语料训练得到的问答机器人时代。传统搜索引擎对知识和答案的检索是一种纯粹的关键词查询方案,通过这种渠道检索到的问题答案往往没有针对性,不能准确理解用户检索、询问意图,且检索结果以网页相关信息列表呈现,包含大量无用信息,导致难以快速定位结果的问题;用户之间交互式的问答社区虽然部分消除了通过机器进行语义理解的环节,但同时又产生了时效性问题,同时需要人为干预以保证社区答案知识的准确性;通过语料知识训练的智能问答机器人既能在一定程度上理解用户检索问题的语义,又能保证回答的即时性和准确性,它将会成信息检索、自动问答领域中更高效、更便捷、更及时、更准确的解决方案。本文以浙江汇信科技有限公司数字证书问答客服系统科研项目为背景,设计并实现了基于语句相似度计算的FAQ问答。主要实现了包括问答知识库梳理、语言模型设计与实现、问答接口设计与实现等主要功能,项目涉及到文本检索、分词、词向量、语言模型、深度神经网络、RestfulAPI、Gunicorn/Gevent等关键技术。通过浙江汇信科技有限公司的内部对接评测,该项目开发的智能问答客服机器人最终准确率达到83.75%,达到FAQ问答行业相似水平,远高于其原有基于关键字检索的问答检索方案。目前该算法模型及接口已成功通过各项测试,正在部署系统服务,做最后的上线准备。(本文来源于《浙江大学》期刊2018-01-05)

李春生,卢鹏飞,张可佳[5](2018)在《基于语句相似度计算的智能答疑系统机理研究》一文中研究指出在使用互联网进行在线学习的过程中,为了解决现有答疑方式答疑实时性差、准确度低、效率低的问题,提出了一种基于语句相似度计算的智能答疑方案。首先分析现有的答疑方式及其不足;其次详细阐述了智能答疑系统的工作流程、总体结构和相关数据库结构,针对原有答疑方式检索效率低的问题加入了常用问题库,并引入基于字符串匹配的分词方法完成对学习者提出的问题的拆分;最后结合基于词信息的语句相似度计算方法对语句相似度进行计算并将结果呈现给学习者,以达到提高答疑系统的准确度、效率以及实时性的目的,满足学习者的需求。实验结果表明,基于语句相似度计算的智能答疑方案相对于原有答疑方案具有较高的准确度与效率。(本文来源于《计算机技术与发展》期刊2018年04期)

张俊飞[6](2017)在《改进TF-IDF结合余弦定理计算中文语句相似度》一文中研究指出提出一种改进TF-IDF结合余弦定理计算中文语句相似度方法。首先采用IKAnalyzer分词器对中文语句分词处理,提取核心关键词,然后通过计算句子关键词词频和权重形成的TF-IDF向量组,结合余弦定理实现中文句子相似度计算。改进后的TF-IDF计算方法采用《同义词词林》词典实现对关键词及其同义词词频统计,并通过Lucene技术实现关键词权重快速计算。改进后的中文句子相似度算法不仅考虑句子中关键词的物理特征,还对关键词的语义特征进行相似度计算,提高中文句子相似度计算的准确性。(本文来源于《现代计算机(专业版)》期刊2017年32期)

曾小芹[7](2017)在《基于多要素的中文语句相似度算法》一文中研究指出为了更精准地在海量信息中检索目标,笔者在前人研究基础上提出了一种中文语句相似度的层次递进算法。中文语句相似度综合考虑了无序相似度及有序相似度两个因素:无序相似度通过中文语句切词后得到具有相同或相近词义的词语比例;有序相似度则是计算语句各成分位置词相似度。其中,还考虑了句型转换因素及语句语气参数的修正,如此层层递进得到中文语句的相似度。最后通过实验对比验证其合理性。(本文来源于《信息与电脑(理论版)》期刊2017年21期)

郜炎峰,林燕芬,王忠建[8](2017)在《基于马尔科夫模型的汉语语句相似度计算》一文中研究指出语句相似度计算在自然语言处理领域是一项非常重要的实用技术,基于马尔科夫模型的汉语语句相似度计算方法通过对语句进行分词处理、构建特征词向量以及权重值向量的方式实现了语句相似度计算.该方法以关系向量模型为基础,通过深入研究汉语语句的特征,利用前后相邻词的共现对权重值向量进行加权处理,以调整不同特征词的权重.方法重点考虑了关键词词形的相似度,结合了句长、词序等表面信息的相似度,并考虑了同义词的情况.最后采用两种不同的方案与关系向量模型进行了对比实验,结果表明方法可以更好的处理长度差很大的两个语句的相似度计算问题,尤其在检索相关新闻标题时准确率较高.(本文来源于《哈尔滨商业大学学报(自然科学版)》期刊2017年01期)

蒋宗礼,赵洁[9](2016)在《关联首尾段落与首尾语句的多特征融合段落相似度计算》一文中研究指出首尾段落和首尾语句对语义有着较大的贡献,应该作为判别段落相似度的主要因素。本文将其以恰当权重融入SiteQ算法,提出关联首尾段落和首尾语句的多特征融合段落相似度计算算法Topic-SiteQ。该算法采用多特征融合的算法计算首尾语句的语义相似度,并以一定的权值体现它们对段落相似度的贡献,同时提高首尾段落的评分值,并根据这次评分值进行推荐排序。实验表明,采用该算法,相关段落排序的MRR值提高了0.032,F测度值平均提高了1.4%,说明该算法的改进是有效的。(本文来源于《计算机与现代化》期刊2016年09期)

郜炎峰[10](2016)在《基于多特征融合的汉语语句相似度计算》一文中研究指出汉语语句相似度计算是在分析汉语语句相关特征之后,根据语句特征设定语句相似度的计算标准,结合这些标准来计算出一个具体数值。汉语语句相似度计算作为一项非常重要的实用技术,长期以来作为研究人员关注的热点和难点,并被广泛应用于自然语言处理的众多领域。文中详细介绍了汉语语句相似度计算的方法以及存在的困难,通过对关系向量模型的语句相似度计算方法进行解析,根据汉语语句的关键词、句长、词序等特征,提出了一种基于多特征融合的汉语语句相似度计算方法。该方法以关系向量模型为基础,通过深入研究汉语语句的特征,利用前后相邻词的共同出现对权重值向量进行加权处理,以调整不同特征词的权重。方法以关键词词形的相似度为重点,适当的考虑了语句的局部结构和同义词的情况。在综合分析表层特征和语句结构的基础上,本文对语句的相似度计算问题进行深入探索和创新,着重进行了以下几个方面的研究:1)分析汉语语句,找出其中与语句相似度有关的特征。这些特征对语句相似度影响程度不同,因此通过实验选取其中对语句相似度影响较大的特征(关键词、句长、词序等)用于相似度计算。2)提高了关键词和语句长度对关系向量模型影响的有效性,并加入了词序、非关键词等影响因素,使相似度计算的正确率得到提高。通过实验验证了提出方法在计算新闻标题相似度时的准确率较高。提出的相似度计算方法不仅在处理长度差较大的两个语句相似度时优于关系向量模型,而且发现在带标点符号以及不去停用词的情况下,语句相似度计算的准确率依然较高。(本文来源于《哈尔滨商业大学》期刊2016-04-10)

语句相似度论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

随着人工智能技术的快速发展,机器人、智能交互终端、智慧呼叫中心等应用系统已在现实社会中逐步呈现,其中,智能语音交互,即自动问答已经成为各类智慧系统应用的重要模块之一,针对特定行业应用中的常问问题集(FAQ)问答系统是将用户常问问题与对应答案组织起来形成行业应用的专家库,为用户提供更加方便专业的服务。在自动问答系统中,由于用户提问的随机性,语句相似度匹配是解决智能问答最关键的技术之一。本文从句法结构角度和词共现角度对语句相似度计算进行了研究,提出了一种基于词向量的多特征相融合的语句相似度计算方法。在语句相似度匹配的过程中,采用基于Word2Vec词向量的词语相似度来完成语句的相似度计算,词向量能够更加准确地反映词语本身的语义关系,给语句语义计算提供了良好的基础;采用语句依存结构分析工具,来确定中心词和语句元素,得到依存对的搭配关系,为了凸显不同依存对在语句中的重要程度,为依存对设置了重要度,有效规避了中文复杂句式给语句相似度计算带来的影响;在词共现的基础上,采取词向量共现计算语句的相似度。最后将两种计算方法相结合并赋予不同的权重,并将本文的语句相似度计算方法应用于基于政务大厅应用场景的自动问答系统当中,通过实际系统验证测试,表明本文所提出的方法在计算语句相似度时,正确率与召回率均有较好表现。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

语句相似度论文参考文献

[1].毕玉德,姜博文.韩国语句子结构相似度计算方法研究[J].中文信息学报.2019

[2].刘佳雯.语句相似度匹配在自动问答系统中的应用与实现[D].南京邮电大学.2018

[3].陈贤武,刘道波.基于语句相似度的主观试题自动阅卷模型研究[J].武汉大学学报(工学版).2018

[4].高旭杨.基于语句相似度计算的FAQ问答系统设计[D].浙江大学.2018

[5].李春生,卢鹏飞,张可佳.基于语句相似度计算的智能答疑系统机理研究[J].计算机技术与发展.2018

[6].张俊飞.改进TF-IDF结合余弦定理计算中文语句相似度[J].现代计算机(专业版).2017

[7].曾小芹.基于多要素的中文语句相似度算法[J].信息与电脑(理论版).2017

[8].郜炎峰,林燕芬,王忠建.基于马尔科夫模型的汉语语句相似度计算[J].哈尔滨商业大学学报(自然科学版).2017

[9].蒋宗礼,赵洁.关联首尾段落与首尾语句的多特征融合段落相似度计算[J].计算机与现代化.2016

[10].郜炎峰.基于多特征融合的汉语语句相似度计算[D].哈尔滨商业大学.2016

论文知识图

5 基于语句的相似度计算基于语句的相似度计算4-18语句相似度计算中文语句相似度计算演示示7.2....用户语义图标注界面《知网》词语定义结构分解图

标签:;  ;  ;  ;  ;  ;  ;  

语句相似度论文_毕玉德,姜博文
下载Doc文档

猜你喜欢