导读:本文包含了干扰词论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:特征,实体,干扰,上下文,词汇,指数,类型。
干扰词论文文献综述
郝娟[1](2015)在《融合干扰词上下文特征的中文命名实体识别研究》一文中研究指出现有识别中文命名实体方法多依赖其自身结构特点,并且嵌套命名实体的识别还没有引起足够的重视,另外,广泛类型实体识别几乎没有研究,如产品品牌、新闻媒体等。基于此,本文提出了融合干扰词上下文特征的中文命名实体识别算法。该算法用统一模型识别人名、地名、机构名以及广泛类型的命名实体;同时,可以进行不包含自身结构特点的实体以及嵌套命名实体的识别。本文方法既不依赖命名实体边界词知识库和实体知识库,也不依赖命名实体的内部特征,而是通过训练得到命名实体的上下文特征,然后利用这些特征对命名实体进行识别。在特征选取上,将上下文特征分为命名实体独有特征和干扰词与命名实体相交特征。每一个特征赋予一个错误率权重w,选择不同错误率w范围内的特征,采用上下文特征匹配算法对各类命名实体进行识别。算法还通过建立干扰词表和扩展操作,进一步提高命名实体的准确率与召回率。为验证本文提出的命名实体识别方法的有效性,论文选择了多组测试数据进行测评。首先在人民日报语料上对人名、地名、机构名的识别进行6折交叉验证实验。接着分析1月人民日报语料各类命名实体的组成结构,并与依赖边界特征词、命名实体内部特征和命名实体知识库的方法进行对比。再接下来,本文又对广泛类型的命名实体进行识别,其中品牌、新闻媒体的识别取得了较好的结果。为了全面验证本文方法的有效性,又在搜狗测试集上对命名实体进行识别。最后,我们在人民日报语料与搜狗语料上,用本文的方法和最好的汉语词法分析器ICTCLAS对命名实体进行识别,本文方法在人民日报语料上获得较高的平均识别效果。(本文来源于《华东师范大学》期刊2015-04-01)
毛理想[2](2009)在《中国大学生英语词汇磨蚀中的干扰词特征分析》一文中研究指出在过去二十多年来,语言磨蚀一直是海外语言研究的热点领域。语言磨蚀研究的是语言习得的逆过程:语言应用中止一段时间所导致的语言能力下降。海外研究人员一直在投入大量时间精力来探索语言磨蚀的各个方面,包括语言磨蚀的性质、语言磨蚀速度和磨蚀中的各种影响因素等。不少卓有成效的研究得出了鼓舞人心的成果。然而,与语言习得相比,语言磨蚀有着更广阔的空间待于开拓。近些年来,语言磨蚀开始引起国内学者更多的关注。语言磨蚀可以在不同层面上发生。鉴于词汇在语言习得和语言保持方面的重大意义,词汇磨蚀一直是语言磨蚀研究的热点。根据干扰理论的观点,当对某个单词(干扰词)的回忆干扰对另一单词(受蚀词)的回忆的时候,词汇磨蚀就会发生。干扰词汇的出现是词汇磨蚀的一个标志。本文以汉语环境中的英语磨蚀为研究对象,要探索回答叁个问题:1)干扰词汇有怎样的特征?2)由Jakobson提出、尚有争议的回归假设是否适用于中国英语学习者;3)我们能否用基于已探明主要影响因素的磨蚀预测指标来预测未来的语言磨蚀?为了得出这叁个问题的答案,作者在已被探明影响磨蚀的各个因素的基础上设计了一项背景调查,调查结果被量化并作为词汇磨蚀的预测指标。背景问卷被用于同一班级非英语专业叁十名09届大四毕业生。根据背景问卷的结果,在叁十名学生中有七名被选作受试接受进一步的词汇测试。词汇测试分两次进行,中间间隔叁个月。测试词汇全选自受试大一大二两年内所学过的四册教科书。SPSS被用来分析对比不同阶段所学词汇磨蚀情况的不同。词汇在本文中根据磨蚀程度而分为已蚀词汇、受蚀词汇和未蚀词汇叁类。词汇测试的结果被收集来分析确定干扰词的特性。两次测试之间的磨蚀差异也被用来鉴定基于磨蚀影响因素基础的磨蚀预测指标的有效性。研究发现:第一,通常加速受蚀词汇磨蚀进程的干扰词分布很广,所选词汇中大部分在测试中都有干扰词,所选受试都受干扰词的影响;没有干扰词的词汇分成两类:未蚀词汇和已蚀词汇;干扰词与受蚀词汇在语音、词形、语意等层面展现出高度相似性。从历时的角度来看,词汇磨蚀是未蚀词汇在干扰词影响下逐渐变成已蚀词汇的过程。第二,回归假设在所选组中是适用的。所选第一册教材中所学的词汇比第四册教材中所学的词汇保存的更好,这表明先学的词汇后遗忘,正符合回归假设。第叁,在充分考虑已经探明有效的主要相关因素的基础上创立的磨蚀预测指标是可能做出对未来的预测。(本文来源于《中国海洋大学》期刊2009-04-01)
干扰词论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
在过去二十多年来,语言磨蚀一直是海外语言研究的热点领域。语言磨蚀研究的是语言习得的逆过程:语言应用中止一段时间所导致的语言能力下降。海外研究人员一直在投入大量时间精力来探索语言磨蚀的各个方面,包括语言磨蚀的性质、语言磨蚀速度和磨蚀中的各种影响因素等。不少卓有成效的研究得出了鼓舞人心的成果。然而,与语言习得相比,语言磨蚀有着更广阔的空间待于开拓。近些年来,语言磨蚀开始引起国内学者更多的关注。语言磨蚀可以在不同层面上发生。鉴于词汇在语言习得和语言保持方面的重大意义,词汇磨蚀一直是语言磨蚀研究的热点。根据干扰理论的观点,当对某个单词(干扰词)的回忆干扰对另一单词(受蚀词)的回忆的时候,词汇磨蚀就会发生。干扰词汇的出现是词汇磨蚀的一个标志。本文以汉语环境中的英语磨蚀为研究对象,要探索回答叁个问题:1)干扰词汇有怎样的特征?2)由Jakobson提出、尚有争议的回归假设是否适用于中国英语学习者;3)我们能否用基于已探明主要影响因素的磨蚀预测指标来预测未来的语言磨蚀?为了得出这叁个问题的答案,作者在已被探明影响磨蚀的各个因素的基础上设计了一项背景调查,调查结果被量化并作为词汇磨蚀的预测指标。背景问卷被用于同一班级非英语专业叁十名09届大四毕业生。根据背景问卷的结果,在叁十名学生中有七名被选作受试接受进一步的词汇测试。词汇测试分两次进行,中间间隔叁个月。测试词汇全选自受试大一大二两年内所学过的四册教科书。SPSS被用来分析对比不同阶段所学词汇磨蚀情况的不同。词汇在本文中根据磨蚀程度而分为已蚀词汇、受蚀词汇和未蚀词汇叁类。词汇测试的结果被收集来分析确定干扰词的特性。两次测试之间的磨蚀差异也被用来鉴定基于磨蚀影响因素基础的磨蚀预测指标的有效性。研究发现:第一,通常加速受蚀词汇磨蚀进程的干扰词分布很广,所选词汇中大部分在测试中都有干扰词,所选受试都受干扰词的影响;没有干扰词的词汇分成两类:未蚀词汇和已蚀词汇;干扰词与受蚀词汇在语音、词形、语意等层面展现出高度相似性。从历时的角度来看,词汇磨蚀是未蚀词汇在干扰词影响下逐渐变成已蚀词汇的过程。第二,回归假设在所选组中是适用的。所选第一册教材中所学的词汇比第四册教材中所学的词汇保存的更好,这表明先学的词汇后遗忘,正符合回归假设。第叁,在充分考虑已经探明有效的主要相关因素的基础上创立的磨蚀预测指标是可能做出对未来的预测。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
干扰词论文参考文献
[1].郝娟.融合干扰词上下文特征的中文命名实体识别研究[D].华东师范大学.2015
[2].毛理想.中国大学生英语词汇磨蚀中的干扰词特征分析[D].中国海洋大学.2009