词语切分论文-于文勃,梁丹丹

词语切分论文-于文勃,梁丹丹

导读:本文包含了词语切分论文开题报告文献综述及选题提纲参考文献,主要关键词:口语,词语切分,语音,语义

词语切分论文文献综述

于文勃,梁丹丹[1](2018)在《口语加工中的词语切分线索》一文中研究指出词是语言的基本结构单位,对词语进行切分是语言加工的重要步骤。口语语流中的切分线索来自于语音、语义和语法叁个方面。语音线索包括概率信息、音位配列规则和韵律信息,韵律信息中还包括词重音、时长和音高等内容,这些线索的使用在接触语言的早期阶段就逐渐被个体所掌握,而且在不同的语言背景下有一定的特异性。语法和语义线索属于较高级的线索机制,主要作用于词语切分过程的后期。后续研究应从语言的毕生发展和语言的特异性两个方面考察口语语言加工中的词语切分线索。(本文来源于《心理科学进展》期刊2018年10期)

叶昕怡[2](2015)在《外国学生汉语句子阅读词语切分表现考察》一文中研究指出外国学生在阅读中文时常会出现断词错误或字字停顿的现象,这给他们带来了很多阅读上的问题和障碍。因此,外国学生在阅读中文句子时的词语切分表现是一个值得探讨的问题,在对外汉语教学中具有很重要的实用意义。目前对外汉语教学界针对词语切分进行的研究还很少,研究成果还不够丰硕,所以本论文拟对外国学生被试在阅读中文句子时的词语切分表现做一个探讨。本文试图在对相关文献及以往研究进行分析总结的基础之上,探讨以下问题:外国学生对中文文本字与字相连的呈现方式的主观看法;具有一定汉语基础的外国学生在阅读汉语句子时的词语切分现象;造成这一现象的原因及如何解决。绪论部分对有关中文词语切分的研究进行了综述。由于汉语没有足够的形态来确定“词”的边界,目前为止,学界对“词”的分词规范尚未统一,普通人与专家的“词感”也不尽相同。鉴于本文的研究对象是外国学生,本文按照普通人分词“从宽”的原则,采用“词语”的概念。论文中所使用的“词语”,包括词汇、短语,也就是说,成语、框式结构、专有名词、双音节和叁音节偏正结构、动宾结构、动补结构也都从属于本文讨论的“词语”范围。词语切分概念最早出自计算语言学,本论文将此概念运用到中文文本阅读上,主要针对外国学生的中文阅读,并以提高其阅读能力为目的。本文采用“词语”概念作为切分单位,以描述外国学生阅读中文文本时识别词或短语的手段。另外,与其他相关研究相比,本文在实验设计上做了以下改变:(1)选取已经通过了 HSK4级、5级或6级的外国学生作为被试,被试具有一定的词汇量。为确保每组学生内部水平的基本一致,本文对被试进行了 HSK5级词汇水平测试,最终将被试分为词汇水平较高组和词汇水平较低组。(2)实验所选用的例句均来自于2012年和2013年的八套HSK5级真题。本文第二章对被试阅读中文文本的主观态度进行了调查。通过调查问卷更直观地了解中文文本呈现方式对被试汉语习得的影响。数据分析结果表明,大部分被试认为中文文本的呈现方式会干扰他们的阅读,而按词语切分好的文本应该会有助于他们的阅读和理解。被试认为,对阅读中文文本的不习惯会随着自身汉语水平的提高而逐渐减弱,但也有水平较高的学生认为自己在阅读中基本不会因为词语切分的问题而影响阅读。第叁章考察了被试在阅读30句中文句子时的词语切分情况。一方面通过被试断词数的统计,考察被试的词语切分能力和阅读情况。结果表明,词汇水平较高组的被试阅读单位较大,停顿较少,更倾向于逐词阅读;而词汇水平较低组的被试阅读单位则较小,停顿较多,更倾向于逐字识别。但在阅读难句时,词汇水平较高组的被试仍然会倾向于逐字识别。另一方面通过统计被试自主切分词语的错误率,考察被试阅读中文句子时的词语切分能力。结果显示,词汇水平较高组的错误率明显低于词汇水平较低组。但在阅读难句时,两者都产生了非常高的错误率。第四章对被试的偏误原因进行了分析,认为主要有以下八点原因导致了学生词语切分不当,包括1)受熟词干扰,先入为主;2)受同音字、多音字干扰;3)受专有名词和熟语干扰;4)语素构词知识和词语搭配知识欠缺;5)词汇量水平低;6)文化知识缺乏;7)语法结构掌握欠佳;8)缺乏对汉语文本语感的了解。最后,针对目前对外汉语课堂教学中还不太重视词语切分问题,提出了一些教学上的建议和对策。结论部分对论文做了概括:1)外国学生对中文文本字字相连的呈现方式需要通过一段时间的学习来适应,但是在阅读中因为词语切分不当而导致阅读障碍的问题也会长期存在。2)词汇水平较高的学生并不如他们所想的那样不再受到词语切分问题的困扰,而是仍然会在阅读中出现词语切分的偏误问题,需要引起教师和学生注意。(本文来源于《南京大学》期刊2015-05-01)

潘文帝[3](2011)在《《战国策》词语的切分及其复音词计量研究》一文中研究指出《战国策》是战国时期游说之士的策谋和言论的汇编,语言形象生动接近口语,是研究战国时期词汇研究的重要文献。《<战国策>词语的切分及其复音词计量研究》是对《战国策》的全文逐一做词语切分,再提取其中的复音词做具体研究的论文。本文的研究,试图展现战国时期复音词的主要面貌,以及单、复音词的比例关系。论文分为四大部分,第一部分是绪论,简单介绍了论文的选题缘由,《战国策》一书的内容、版本,研究的现状、目的和意义以及本文的研究重难点与解决方法。第二部分是《战国策》词语的切分,分为两部分内容。一是词语切分的标准,在这我们综合前人的理论研究成果,再结合切词的实际工作,摸索出适合《战国策》的具体的词语切分标准。二是《战国策》用词情况的简要分析,并把《战国策》词表作为附录,词表能体现出词语的类别和出现频次。第叁部分是《战国策》复音词计量研究,也由两大部分构成。一是单纯复音词,比较少且简单明了。二是复合复音词。我们对复音名词、复音动词、复音形容词做了结构上的分析,其他类型复音词也做了相应的研究,力求进行详细的描写与分析。第四部分是结束语与展望。(本文来源于《黑龙江大学》期刊2011-04-10)

李萍[4](2010)在《试论现代汉语词语的切分技术》一文中研究指出中文是一种没有明显的形态界限可以作为分词依据的表意语言,因而在中文文本的处理中面临的第一个问题就是词语的切分问题。本文说明了汉语自动分词的必要性和困难,介绍了自动分词的叁种算法。(本文来源于《中国新技术新产品》期刊2010年24期)

艳红,王斯日古楞[5](2010)在《蒙古文词语切分在自动词性标注中的应用》一文中研究指出本文首先介绍了蒙古文附加成分的切分方法,然后描述了改进的蒙古文自动词性标注系统的总体结构,最后以规模为95万词的语料库作为训练语料,对5万词的测试文本进行了一级标注,封闭测试标注准确率和排歧准确率分别为97.9%和85.9%,开放测试标注准确率和排歧准确率分别为97.6%和85.5%。(本文来源于《少数民族青年自然语言处理技术研究与进展——第叁届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集》期刊2010-06-27)

吴志杰[6](2009)在《一份社会语言调查对汉英机器翻译中词语切分的启示——汉语分词与汉英机器翻译研究系列之二》一文中研究指出本论文汇报了一份由两个问卷调查和八个后继采访组成的语言调查,其目的主要是为了探寻人们如何在阅读中进行汉语词语切分。本文作者接着讨论了问卷与采访的结果,将其与机器翻译实验中的相关结果进行了对比分析,并在对比中凸现人与机器在汉语分词过程中所表现出来的方法和策略差异。我们希望,人类独特的分词方式与方法可以给机器翻译中的汉语分词技术带来启示,对将来的机器翻译系统(尤其是词语切分部分)的设计有所帮助。(本文来源于《外语研究》期刊2009年05期)

吴志杰[7](2009)在《机器翻译中汉语词语切分的现状——汉语分词与汉英机器翻译研究系列之一》一文中研究指出汉语词语的切分是汉语自然语言处理和汉外机器翻译研究的一个难题。本文首先回顾了汉语词语切分的历史,评述了其主要的技术,然后对现有的汉英翻译软件的汉语分词系统进行测评。文章显示,汉语作为一种意合型、语用型语言的特点可以部分地解释为何现有机器翻译软件中的语言规则型或统计型的切分系统不能很好地进行分词。(本文来源于《外语研究》期刊2009年01期)

那顺乌日图,雪艳,叶嘉明[8](2005)在《现代蒙古语语料库加工技术的新进展——新一代蒙古语词语自动切分与标注系(Darhan Tagging System)》一文中研究指出鉴于现代蒙古语语料库加工的新需要,内蒙古大学蒙古学学院和北京大学计算语言学研究所合作开发了新一代蒙古语词语自动切分标注系统。本文在对新旧系统进行比较的基础上,着重介绍了新系统的核心组成部分,及其在标注方面的特点。(本文来源于《第十届全国少数民族语言文字信息处理学术研讨会论文集》期刊2005-07-01)

肖航,靳光瑾[9](2004)在《现代汉语词语切分歧义库构建》一文中研究指出本课题研究的歧义问题,特指中文信息处理中词语切分过程产生的切分歧义,不同于一般意义上的认知歧义。现代汉语词语切分歧义问题是中文信息处理领域面临的主要难题之一,它和未登录词识别一起成为现代汉语自动分词的主要难点,严重影响了词语切分技术的应用。(本文来源于《第叁届全国语言文字应用学术研讨会论文集》期刊2004-10-01)

宗胜利[10](1993)在《古诗文句内词语切分再论》一文中研究指出古诗文句内词语切分,即是古诗文句内的再“句读”,这种“句读”的正确与否不是通过标点符号,而是通过对古诗文的注释和翻译表现出来的。如:颜亨福《常用文言实词讲解》译《论语·季氏》“丘也闻有国有家者”句曰:“我(指孔丘)也听说有国有家的人。”①其实,句中的“也”不是表类同的副词,而是句中表停顿的语气词,翻译为现代汉语时,完全不必译出,正确的切分只能是“丘也/闻有国有家者”。类似的例子,在古诗文的注释和翻译中时有出现,究其原因,则可以从主观和客观两个方面进行考察。就客观而言,是由于注释者、翻译者缺乏古代汉语语言文字方面的知识,缺(本文来源于《丽水师专学报》期刊1993年01期)

词语切分论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

外国学生在阅读中文时常会出现断词错误或字字停顿的现象,这给他们带来了很多阅读上的问题和障碍。因此,外国学生在阅读中文句子时的词语切分表现是一个值得探讨的问题,在对外汉语教学中具有很重要的实用意义。目前对外汉语教学界针对词语切分进行的研究还很少,研究成果还不够丰硕,所以本论文拟对外国学生被试在阅读中文句子时的词语切分表现做一个探讨。本文试图在对相关文献及以往研究进行分析总结的基础之上,探讨以下问题:外国学生对中文文本字与字相连的呈现方式的主观看法;具有一定汉语基础的外国学生在阅读汉语句子时的词语切分现象;造成这一现象的原因及如何解决。绪论部分对有关中文词语切分的研究进行了综述。由于汉语没有足够的形态来确定“词”的边界,目前为止,学界对“词”的分词规范尚未统一,普通人与专家的“词感”也不尽相同。鉴于本文的研究对象是外国学生,本文按照普通人分词“从宽”的原则,采用“词语”的概念。论文中所使用的“词语”,包括词汇、短语,也就是说,成语、框式结构、专有名词、双音节和叁音节偏正结构、动宾结构、动补结构也都从属于本文讨论的“词语”范围。词语切分概念最早出自计算语言学,本论文将此概念运用到中文文本阅读上,主要针对外国学生的中文阅读,并以提高其阅读能力为目的。本文采用“词语”概念作为切分单位,以描述外国学生阅读中文文本时识别词或短语的手段。另外,与其他相关研究相比,本文在实验设计上做了以下改变:(1)选取已经通过了 HSK4级、5级或6级的外国学生作为被试,被试具有一定的词汇量。为确保每组学生内部水平的基本一致,本文对被试进行了 HSK5级词汇水平测试,最终将被试分为词汇水平较高组和词汇水平较低组。(2)实验所选用的例句均来自于2012年和2013年的八套HSK5级真题。本文第二章对被试阅读中文文本的主观态度进行了调查。通过调查问卷更直观地了解中文文本呈现方式对被试汉语习得的影响。数据分析结果表明,大部分被试认为中文文本的呈现方式会干扰他们的阅读,而按词语切分好的文本应该会有助于他们的阅读和理解。被试认为,对阅读中文文本的不习惯会随着自身汉语水平的提高而逐渐减弱,但也有水平较高的学生认为自己在阅读中基本不会因为词语切分的问题而影响阅读。第叁章考察了被试在阅读30句中文句子时的词语切分情况。一方面通过被试断词数的统计,考察被试的词语切分能力和阅读情况。结果表明,词汇水平较高组的被试阅读单位较大,停顿较少,更倾向于逐词阅读;而词汇水平较低组的被试阅读单位则较小,停顿较多,更倾向于逐字识别。但在阅读难句时,词汇水平较高组的被试仍然会倾向于逐字识别。另一方面通过统计被试自主切分词语的错误率,考察被试阅读中文句子时的词语切分能力。结果显示,词汇水平较高组的错误率明显低于词汇水平较低组。但在阅读难句时,两者都产生了非常高的错误率。第四章对被试的偏误原因进行了分析,认为主要有以下八点原因导致了学生词语切分不当,包括1)受熟词干扰,先入为主;2)受同音字、多音字干扰;3)受专有名词和熟语干扰;4)语素构词知识和词语搭配知识欠缺;5)词汇量水平低;6)文化知识缺乏;7)语法结构掌握欠佳;8)缺乏对汉语文本语感的了解。最后,针对目前对外汉语课堂教学中还不太重视词语切分问题,提出了一些教学上的建议和对策。结论部分对论文做了概括:1)外国学生对中文文本字字相连的呈现方式需要通过一段时间的学习来适应,但是在阅读中因为词语切分不当而导致阅读障碍的问题也会长期存在。2)词汇水平较高的学生并不如他们所想的那样不再受到词语切分问题的困扰,而是仍然会在阅读中出现词语切分的偏误问题,需要引起教师和学生注意。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

词语切分论文参考文献

[1].于文勃,梁丹丹.口语加工中的词语切分线索[J].心理科学进展.2018

[2].叶昕怡.外国学生汉语句子阅读词语切分表现考察[D].南京大学.2015

[3].潘文帝.《战国策》词语的切分及其复音词计量研究[D].黑龙江大学.2011

[4].李萍.试论现代汉语词语的切分技术[J].中国新技术新产品.2010

[5].艳红,王斯日古楞.蒙古文词语切分在自动词性标注中的应用[C].少数民族青年自然语言处理技术研究与进展——第叁届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集.2010

[6].吴志杰.一份社会语言调查对汉英机器翻译中词语切分的启示——汉语分词与汉英机器翻译研究系列之二[J].外语研究.2009

[7].吴志杰.机器翻译中汉语词语切分的现状——汉语分词与汉英机器翻译研究系列之一[J].外语研究.2009

[8].那顺乌日图,雪艳,叶嘉明.现代蒙古语语料库加工技术的新进展——新一代蒙古语词语自动切分与标注系(DarhanTaggingSystem)[C].第十届全国少数民族语言文字信息处理学术研讨会论文集.2005

[9].肖航,靳光瑾.现代汉语词语切分歧义库构建[C].第叁届全国语言文字应用学术研讨会论文集.2004

[10].宗胜利.古诗文句内词语切分再论[J].丽水师专学报.1993

标签:;  ;  ;  ;  

词语切分论文-于文勃,梁丹丹
下载Doc文档

猜你喜欢