导读:本文包含了词义排歧论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:词义,自然语言,句法,向量,语义,系数,多义词。
词义排歧论文文献综述
牛长伟,程邦雄[1](2019)在《基于规则的多义疑问词“怎么”的词义排歧模型研究》一文中研究指出在自然语言处理中,多义疑问词的词义识别尚存改进空间。以"怎么"为例,其可表全称解读(任指)、存在解读(虚指)和疑问解读(询问状况、性状、方式和原因)。目前主流机器翻译系统在处理"怎么"的识别情况上仍需改进。该文从词义排歧的角度出发,尝试总结"怎么"的叁类解读所处的句法环境的特征,确立复杂句法环境中其语义表现,进而构建一个基于规则的词义排歧模型,制定词义排歧决策表,为提高机器对该类词的识别率提供一种思路。最后,通过实验验证该决策表,并对其改进。(本文来源于《中文信息学报》期刊2019年06期)
任恺[2](2015)在《基于核模糊C均值聚类算法的词义排歧研究》一文中研究指出该文建立了一个无监督的词义排歧系统,并将它应用于生物医学领域的语料中。该系统使用未进行人工标注的语料进行机器学习,学习过程只需预先定义标准词义的数量,不需要其他人工干预。该系统使用了一种通常使用于图像识别领域的基于核的模糊C均值算法。该文针对文本应用改进该算法并将其应用在生物医学文本的词义排歧领域,并取得了较好的效果。(本文来源于《电脑知识与技术》期刊2015年34期)
王永生[3](2013)在《基于改进的Lesk算法的词义排歧算法》一文中研究指出英文中的一词多义现象非常普遍,这给英文的词义排歧带来了极大的困难。针对这种情况,提出了一种基于改进的Lesk算法的词义排歧算法,即以语义词典WordNet为基础,借助CBC算法扩充目标词的相似词集合,通过改进的Lesk算法进行词义排歧。算法以英文Senseval-2任务作为测试目标,通过对目标词的义项进行筛选,去除其中一些不常用的义项,实验结果表明,总体排歧正确率达到58.4%。(本文来源于《微型机与应用》期刊2013年24期)
辛日华[4](2013)在《用于词义排歧的语义剪枝方法研究》一文中研究指出词义排歧方法的研究在自然语言处理领域具有重要的理论和实践意义。研究了一种基于知网的语义剪枝算法,来解决自然语言处理过程中的词义排歧问题。其目的是通过语义剪枝系统尽可能地减少歧义词在上下文中错误的或最不可能的义项。语义剪枝以后,形成词和其可能义项的一个列表,尽量将一个词真正正确的义项保留下来。为了对语义剪枝算法进行评价,开发了一个手工标注交互环境,并使用了召回率和简化率2个指标。对窗口的尺寸和分析单元的选取对召回率和简化率的影响进行了研究。(本文来源于《控制工程》期刊2013年05期)
贾超琴[5](2012)在《机器翻译中的词义排歧》一文中研究指出机器翻译的根本问题是语义在从源语向目标语的转化中信息的一致性和表达的易理解性,在这一过程中多义词的歧义排除既是重点也是难点,有效的歧义排除是决定译文质量的关键。本文介绍了六种排歧方法,并对语用意义排歧和修辞意义排歧这两大难题进行分析,指出它们是机器翻译未来发展的突破点。(本文来源于《赤峰学院学报(汉文哲学社会科学版)》期刊2012年07期)
王宏显,周强[6](2010)在《句法特征在动词词义排歧中的应用》一文中研究指出特征选取是用统计方法进行词义排歧的关键。本文通过句法块的分析结果,将主语和宾语、以及主语和宾语在知网中的归类信息应用于目标动词的词义排歧。实验表明,句法特征对于目标动词的词义排歧有重要作用,相对于仅使用词语和词性特征的系统,加入人工标注句法特征后,拥有类动词正确率由83.7%提高到89.2%,存在类动词正确率由84.8%提高到86.1%。(本文来源于《第五届全国青年计算语言学研讨会论文集》期刊2010-10-11)
郭志兵,黄广君,卢朝华[7](2010)在《一种改进的词义排歧算法》一文中研究指出针对传统基于义原同现频率的汉语词义排歧算法的"盲目性",提出一种"双距离"词义排歧算法,即在计算待排歧词各义项与特征词之间的相关系数时,考虑两个距离因素:特征词与待排歧词之间的空间距离;最近选择该义项的同形歧词与该待排歧词之间的空间距离。实验表明,改进的算法是有效的。(本文来源于《计算机工程与应用》期刊2010年19期)
赵晨光,蔡东风[8](2010)在《基于改进的VSM的词义排歧策略》一文中研究指出为了提高词义排歧的准确率,提出了一种基于改进的向量空间模型(VSM)的词义排歧策略,该模型在提取特征向量的基础上,考虑了语法、词形、语义等因素,计算语境相似度,并引入搭配约束,改进了算法的效果,在开放测试环境下,词义标注正确率可达到80%以上。实验结果表明,该方法对语境信息的描述更加全面,有利于进一步的语义分析。(本文来源于《计算机应用》期刊2010年06期)
刘亚清,于纯妍,张瑾[9](2006)在《改进的基于义原同现频率的汉语词义排歧方法》一文中研究指出针对传统的基于义原同现频率的汉语词义排歧方法存在“盲目性”的不足,本文根据《知网》中对概念定义的描述,分别计算多义词的每个义项与特征词的第一独立义原、其他独立义原、关系义原、符号义原之间的相关系数;最后通过比较多义词的每个义项与特征词之间的相关系数来决定多义词的义项。经过实验验证,该方法进一步提高了词义排歧的效果。(本文来源于《计算机工程与科学》期刊2006年12期)
刘亚清,张瑾,于纯妍[10](2006)在《基于义原同现频率的汉语词义排歧系统》一文中研究指出词义排歧在自然语言处理领域占有重要地位。词义排歧的精确率依赖于排歧知识的完备性。但是目前使用的基于词典的和基于语料库的词义排歧方法来获取排歧知识的效果都不令人满意。文中借助《知网》,以义原同现频率矩阵作为排歧知识,在其基础上设计并实现了一个基于义原同现频率的汉语词义排歧系统,大大地提高词义排歧的精确率。(本文来源于《计算机技术与发展》期刊2006年05期)
词义排歧论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
该文建立了一个无监督的词义排歧系统,并将它应用于生物医学领域的语料中。该系统使用未进行人工标注的语料进行机器学习,学习过程只需预先定义标准词义的数量,不需要其他人工干预。该系统使用了一种通常使用于图像识别领域的基于核的模糊C均值算法。该文针对文本应用改进该算法并将其应用在生物医学文本的词义排歧领域,并取得了较好的效果。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
词义排歧论文参考文献
[1].牛长伟,程邦雄.基于规则的多义疑问词“怎么”的词义排歧模型研究[J].中文信息学报.2019
[2].任恺.基于核模糊C均值聚类算法的词义排歧研究[J].电脑知识与技术.2015
[3].王永生.基于改进的Lesk算法的词义排歧算法[J].微型机与应用.2013
[4].辛日华.用于词义排歧的语义剪枝方法研究[J].控制工程.2013
[5].贾超琴.机器翻译中的词义排歧[J].赤峰学院学报(汉文哲学社会科学版).2012
[6].王宏显,周强.句法特征在动词词义排歧中的应用[C].第五届全国青年计算语言学研讨会论文集.2010
[7].郭志兵,黄广君,卢朝华.一种改进的词义排歧算法[J].计算机工程与应用.2010
[8].赵晨光,蔡东风.基于改进的VSM的词义排歧策略[J].计算机应用.2010
[9].刘亚清,于纯妍,张瑾.改进的基于义原同现频率的汉语词义排歧方法[J].计算机工程与科学.2006
[10].刘亚清,张瑾,于纯妍.基于义原同现频率的汉语词义排歧系统[J].计算机技术与发展.2006