导读:本文包含了组合型歧义切分字段论文开题报告文献综述、选题提纲参考文献,主要关键词:分词,组合,歧义,切分,汉语,规则,中文。
组合型歧义切分字段论文文献综述写法
张严虎,潘璐璐,彭子平,张靖波,于中华[1](2008)在《基于规则挖掘和Nave Bayes方法的组合型歧义字段切分》一文中研究指出组合型歧义字段切分是中文自动分词的难点之一。在对现有方法进行深入分析的基础上,提出了一种新的切分算法。该算法自动从训练语料中挖掘词语搭配规则和语法规则,基于这些规则和Nave Bayes模型综合决策进行组合型歧义字段切分。充分的实验表明,相对于文献中的研究结果,该算法对组合型歧义字段切分的准确率提高了大约8%。(本文来源于《计算机应用》期刊2008年07期)
廉竹钧[2](2002)在《汉语组合型切分歧义字段消歧方法研究》一文中研究指出本文提出如下的汉语组合型切分歧义消歧策略:对分、合两种切分形式分布比较均匀的组合型切分歧义字段采用决策表算法消歧;对分、合两种切分形式分布悬殊的组合型切分歧义字段采用人工规则+默认切分形式的方法消歧。本文选择22个典型的组合型切分歧义字段作为实验对象,其中17个分、合分布均匀的,5个分、合分布悬殊的。开放测试的结果是:前17个和后5个的平均准确率分别为87.82%和97.70%。(本文来源于《第一届学生计算语言学研讨会论文集》期刊2002-08-01)
廉竹钧[3](2002)在《汉语组合型切分歧义字段消歧方法研究》一文中研究指出汉语组合型切分歧义是汉语自动分词的一个难点。这类歧义的特点在于其消歧依赖于上下文信息。 本文在对615个组合型切分歧义字段(从184万字语料中获得)进行深入分析的基础上,提出如下消歧策略:对分、合两种切分形式分布比较均匀的组合型切分歧义字段采用决策表算法消歧,对分、合两种切分形式分布悬殊的组合型切分歧义字段采用人工规则+默认切分形式的方法消歧。 本文选择22个典型的组合型切分歧义字段作为实验对象,其中17个分、合分布均匀的,5个分、合分布悬殊的。开放测试的结果是:前17个歧义字段的平均准确率为87.82%,后5个歧义字段的平均准确率为97.70%。 分析表明,实验结果还有提高的可能。本研究所得的消歧规则(包括由决策表算法自动获取的规则和由人工总结的规则)可为分词、标注词性等系统所应用。(本文来源于《北京语言文化大学》期刊2002-05-20)
组合型歧义切分字段论文开题报告范文
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文提出如下的汉语组合型切分歧义消歧策略:对分、合两种切分形式分布比较均匀的组合型切分歧义字段采用决策表算法消歧;对分、合两种切分形式分布悬殊的组合型切分歧义字段采用人工规则+默认切分形式的方法消歧。本文选择22个典型的组合型切分歧义字段作为实验对象,其中17个分、合分布均匀的,5个分、合分布悬殊的。开放测试的结果是:前17个和后5个的平均准确率分别为87.82%和97.70%。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
组合型歧义切分字段论文参考文献
[1].张严虎,潘璐璐,彭子平,张靖波,于中华.基于规则挖掘和NaveBayes方法的组合型歧义字段切分[J].计算机应用.2008
[2].廉竹钧.汉语组合型切分歧义字段消歧方法研究[C].第一届学生计算语言学研讨会论文集.2002
[3].廉竹钧.汉语组合型切分歧义字段消歧方法研究[D].北京语言文化大学.2002