交集型歧义切分字段论文_普布旦增欧珠

交集型歧义切分字段论文_普布旦增欧珠

导读:本文包含了交集型歧义切分字段论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:分词,歧义,藏文,切分,汉语,字段,概率。

交集型歧义切分字段论文文献综述

普布旦增欧珠[1](2012)在《藏文分词中交集型歧义字段的切分方法研究》一文中研究指出藏文自动分词是藏文信息处理中一项不可缺少的基础性工作,是藏文搜索引擎、语法信息词典建设、机器翻译、语音合成、文本自动分类、自动摘要、自动校对等等研究的基础工作。藏文自动分词中歧义消除也是关键技术,本文提出了藏文交集型歧义的切分方法即双向扫描识别和最大概率分词算法进行处理的方法。(本文来源于《西藏科技》期刊2012年03期)

普布旦增,欧珠[2](2010)在《藏文分词中交集型歧义字段的切分方法研究》一文中研究指出藏文自动分词是藏文信息处理中一项不可缺少的基础性工作,是藏文搜索引擎、语法信息词典建设、机器翻译、语音合成、文本自动分类、自动摘要、自动校对等等研究的基础工作。藏文自动分词中歧义消除也是关键技术,文章提出了藏文交集型歧义的切分方法即双向扫描识别和最大概率分词算法进行处理的方法。(本文来源于《西藏大学学报(社会科学版)》期刊2010年S1期)

乔维,孙茂松[3](2008)在《汉语交集型歧义切分字段关于专业领域的统计特性》一文中研究指出交集型分词歧义是汉语自动分词中的主要歧义类型之一。现有的汉语自动分词系统对它的处理能力尚不能完全令人满意。针对交集型分词歧义,基于通用语料库的考察目前已有不少,但还没有基于专业领域语料库的相关考察。根据一个中等规模的汉语通用词表、一个规模约为9亿字的通用语料库和两个涵盖55个专业领域、总规模约为1.4亿字的专业领域语料库,对从通用语料库中抽取的高频交集型歧义切分字段在专业领域语料库中的统计特性,以及从专业领域语料库中抽取的交集型歧义切分字段关于专业领域的统计特性进行了穷尽式、多角度的考察。给出的观察结果对设计面向专业领域的汉语自动分词算法具有一定的参考价值。(本文来源于《中文信息学报》期刊2008年04期)

张培颖,李村合[4](2006)在《基于知识库的交集型歧义字段切分系统》一文中研究指出无论在自然语言处理还是在机器翻译中,中文自动分词都是一个重要的环节。其中歧义字段切分是中文自动分词研究中的一个“拦路虎”,是影响分词系统切分精度的主要因素。能够正确切分某一类歧义字段的知识称为分词知识,所有分词知识的集合称为知识库或规则库。本文通过建立交集型歧义字段切分知识库,并采用知识学习的方法来丰富系统的知识,充分利用了知识库中积累的词的二元语法关系、语素构词、句法关系以及上下文等信息,提高了交集型歧义字段的切分精度。(本文来源于《计算机系统应用》期刊2006年08期)

闫引堂,周晓强[5](2000)在《交集型歧义字段切分方法研究》一文中研究指出本文通过动态建立独立成词能力频次库的方法以及基于词语 /词性搭配的规则库 ,对交集型歧义字段进行处理 ,大大提高了切分正确率。在 4万语料的开放测试中 ,交集型歧义字段的切分正确率可达 98%以上。(本文来源于《情报学报》期刊2000年06期)

孙茂松,左正平,邹嘉彦[6](1999)在《高频最大交集型歧义切分字段在汉语自动分词中的作用》一文中研究指出交集型歧义切分字段是影响汉语自动分词系统精度的一个重要因素。本文引入了最大交集型歧义切分字段的概念,并将之区分为真、伪两种主要类型。考察一个约1亿字的汉语语料库,我们发现,最大交集型歧义切分字段的高频部分表现出相当强的覆盖能力及稳定性:前4,619个的覆盖率为59.20%,且覆盖率受领域变化的影响不大。而其中4,279个为伪歧义型,覆盖率高达53.35%。根据以上分析,我们提出了一种基于记忆的、高频最大交集型歧义切分字段的处理策略,可有效改善实用型非受限汉语自动分词系统的精度。(本文来源于《中文信息学报》期刊1999年01期)

交集型歧义切分字段论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

藏文自动分词是藏文信息处理中一项不可缺少的基础性工作,是藏文搜索引擎、语法信息词典建设、机器翻译、语音合成、文本自动分类、自动摘要、自动校对等等研究的基础工作。藏文自动分词中歧义消除也是关键技术,文章提出了藏文交集型歧义的切分方法即双向扫描识别和最大概率分词算法进行处理的方法。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

交集型歧义切分字段论文参考文献

[1].普布旦增欧珠.藏文分词中交集型歧义字段的切分方法研究[J].西藏科技.2012

[2].普布旦增,欧珠.藏文分词中交集型歧义字段的切分方法研究[J].西藏大学学报(社会科学版).2010

[3].乔维,孙茂松.汉语交集型歧义切分字段关于专业领域的统计特性[J].中文信息学报.2008

[4].张培颖,李村合.基于知识库的交集型歧义字段切分系统[J].计算机系统应用.2006

[5].闫引堂,周晓强.交集型歧义字段切分方法研究[J].情报学报.2000

[6].孙茂松,左正平,邹嘉彦.高频最大交集型歧义切分字段在汉语自动分词中的作用[J].中文信息学报.1999

论文知识图

Notice: Undefined index: items in F:\Web\www\cnki.demo.com\app\cnki\tpl\search.html on line 79Warning: Invalid argument supplied for foreach() in F:\Web\www\cnki.demo.com\app\cnki\tpl\search.html on line 79

标签:;  ;  ;  ;  ;  ;  ;  

交集型歧义切分字段论文_普布旦增欧珠
下载Doc文档

猜你喜欢