组合型切分歧义论文_杨万兵,杨峥琳

导读:本文包含了组合型切分歧义论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:切分,歧义,组合,分词,汉语,词语,语料库。

组合型切分歧义论文文献综述

杨万兵,杨峥琳[1](2016)在《不同水平留学生汉语交集型与组合型切分歧义识别实验研究》一文中研究指出通过对初、中级水平留学生汉语交集型与组合型切分歧义识别实验研究发现:两种类型切分歧义识别的汉语水平和链长主效应都十分显着,初级识别错误率、修改率均高于中级。对于交集型切分歧义而言,链长越长,识别错误率越低;组合型链长1、2识别错误率无显着差异,但链长为3时识别错误率显着提高;链长为1时,初级与中级识别错误率相当,链长为2、3时,初级识别错误率高于中级。文章从两类切分歧义特点、汉语水平与链长、动态语境与修改意识等方面分析了造成这些差异的原因,并提出了相应的教学建议。(本文来源于《语言科学》期刊2016年03期)

张严虎,潘璐璐,彭子平,张靖波,于中华[2](2008)在《基于规则挖掘和Nave Bayes方法的组合型歧义字段切分》一文中研究指出组合型歧义字段切分是中文自动分词的难点之一。在对现有方法进行深入分析的基础上,提出了一种新的切分算法。该算法自动从训练语料中挖掘词语搭配规则和语法规则,基于这些规则和Nave Bayes模型综合决策进行组合型歧义字段切分。充分的实验表明,相对于文献中的研究结果,该算法对组合型歧义字段切分的准确率提高了大约8%。(本文来源于《计算机应用》期刊2008年07期)

张霄军,董宇,陈小荷[3](2007)在《基于语料考察的“组合型歧义”与“切分变异”辨析》一文中研究指出本文以学界两次对组合型歧义字串考察的矛盾结果为引子,指出在现代汉语自动分词中“组合型歧义”和“切分变异”的概念界定不清,并以例示的方式给出了各自的定义。通过四次语料考察、统计和分析,总结了汉语自动分词中组合型歧义字串和切分变异字串的常见类型,并探讨了切分变异的消解方法。(本文来源于《内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集》期刊2007-08-01)

廉竹钧[4](2002)在《汉语组合型切分歧义字段消歧方法研究》一文中研究指出本文提出如下的汉语组合型切分歧义消歧策略:对分、合两种切分形式分布比较均匀的组合型切分歧义字段采用决策表算法消歧;对分、合两种切分形式分布悬殊的组合型切分歧义字段采用人工规则+默认切分形式的方法消歧。本文选择22个典型的组合型切分歧义字段作为实验对象,其中17个分、合分布均匀的,5个分、合分布悬殊的。开放测试的结果是:前17个和后5个的平均准确率分别为87.82%和97.70%。(本文来源于《第一届学生计算语言学研讨会论文集》期刊2002-08-01)

廉竹钧[5](2002)在《汉语组合型切分歧义字段消歧方法研究》一文中研究指出汉语组合型切分歧义是汉语自动分词的一个难点。这类歧义的特点在于其消歧依赖于上下文信息。 本文在对615个组合型切分歧义字段(从184万字语料中获得)进行深入分析的基础上,提出如下消歧策略:对分、合两种切分形式分布比较均匀的组合型切分歧义字段采用决策表算法消歧,对分、合两种切分形式分布悬殊的组合型切分歧义字段采用人工规则+默认切分形式的方法消歧。 本文选择22个典型的组合型切分歧义字段作为实验对象,其中17个分、合分布均匀的,5个分、合分布悬殊的。开放测试的结果是:前17个歧义字段的平均准确率为87.82%,后5个歧义字段的平均准确率为97.70%。 分析表明,实验结果还有提高的可能。本研究所得的消歧规则(包括由决策表算法自动获取的规则和由人工总结的规则)可为分词、标注词性等系统所应用。(本文来源于《北京语言文化大学》期刊2002-05-20)

组合型切分歧义论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

组合型歧义字段切分是中文自动分词的难点之一。在对现有方法进行深入分析的基础上,提出了一种新的切分算法。该算法自动从训练语料中挖掘词语搭配规则和语法规则,基于这些规则和Nave Bayes模型综合决策进行组合型歧义字段切分。充分的实验表明,相对于文献中的研究结果,该算法对组合型歧义字段切分的准确率提高了大约8%。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

组合型切分歧义论文参考文献

[1].杨万兵,杨峥琳.不同水平留学生汉语交集型与组合型切分歧义识别实验研究[J].语言科学.2016

[2].张严虎,潘璐璐,彭子平,张靖波,于中华.基于规则挖掘和NaveBayes方法的组合型歧义字段切分[J].计算机应用.2008

[3].张霄军,董宇,陈小荷.基于语料考察的“组合型歧义”与“切分变异”辨析[C].内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集.2007

[4].廉竹钧.汉语组合型切分歧义字段消歧方法研究[C].第一届学生计算语言学研讨会论文集.2002

[5].廉竹钧.汉语组合型切分歧义字段消歧方法研究[D].北京语言文化大学.2002

论文知识图

词典组织结构图组合型歧义字段按词长分布图歧义字段处理方法分词处理流程图集是最优分类超平面玻义消解算法谁程图

标签:;  ;  ;  ;  ;  ;  ;  

组合型切分歧义论文_杨万兵,杨峥琳
下载Doc文档

猜你喜欢