导读:本文包含了正向最大匹配论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:分词,中文,算法,自然语言,信息,英文,校园网。
正向最大匹配论文文献综述
朱钟元,杨莹,薛醒思,詹先银,王家华[1](2019)在《基于改进正向最大匹配算法的股票资讯新闻自动标注技术》一文中研究指出目的提高在股票资讯领域中关键词的匹配效率。方法提出了一种改进的正向最大匹配算法。该方法先通过真实的股票资讯数据构建匹配关键词词集,然后通过分析关键词集合获取词集的特征,最后利用哈希技术整理重构算法词库以提高算法的匹配效率。结果对比无优化词库、tire索引数优化词库和本文的方法,在获取的抽词结果质量相同的前提下,采用本文提出的词典优化方案所需的运行时间最少。并且随着股票资讯新闻的规模增大,本文方法的优势愈加明显。结论实验结果表明,本文提出的方案能够在保证匹配质量的情况下有效提高算法效率。(本文来源于《宝鸡文理学院学报(自然科学版)》期刊2019年01期)
严良达[2](2017)在《一种改进的正向最大匹配算法》一文中研究指出中文分词技术是搜索引擎进行中文文本分析的关键,分词技术的好坏直接影响搜索引擎的实用性,本文在研究现有正向最大匹配算法的基础上,设计了一种新的改进的中文分词方法,并且通过验证表明了可以得到更好的分词速度和准确率。(本文来源于《福建电脑》期刊2017年12期)
吴兴蛟,吴晟[3](2016)在《基于正向最大匹配算法的密码破译》一文中研究指出论文运用基于正向最大匹配算法的破译方式,进行分词。同时基于单词频率进行差错更改及控制。其中主要步骤如下:1)编制符合要求的密文;2)进行替换解密;3)基于词库分词,同时进行差错仿真;4)构建句子。首先基于编码原理进行密文编写,同时进行随机差错制造。最后将分析后的结果存入文本,处理之后得到部分与原文进行对比,发现其错误率较低。故而所得模型其可靠度较高。文章主要工作在于构建一个较为可靠的具有较强普适性的基于字符频率的最大正向分词模型。同时在此基础上建立其余模型共同解决问题。(本文来源于《计算机与数字工程》期刊2016年05期)
李霞婷[4](2015)在《基于改进型正反向最大匹配中文分词算法的研究》一文中研究指出校园师生通过校园网进行有效的校内外信息搜索,中文分词起到举足轻重的作用。本文通过对中文分词方法的介绍,重点分析了最大匹配算法的优缺点,提出重组正向与逆向相结合的最大匹配算法思路,在校试验中取得了较好的效果。(本文来源于《信息技术与信息化》期刊2015年06期)
戴上静,石春,吴刚[5](2014)在《中文分词中的正向增字最大匹配算法研究》一文中研究指出针对正向最大匹配算法的长词丢失、匹配次数较多、歧义字段处理的准确率较低等问题,基于Trie树词典提出了3种正向增字最大匹配算法,分别使用逐词扫描、尾部折半扫描和尾部减一扫描这3种扫描方式采集歧义字段,并建立了一套歧义处理方法。实验结果表明,该3种算法在分词速度和准确率上均有显着提高,错误率降低到了原算法的叁分之一以下。当文本规模大于200 MB时,3种正向增字最大匹配算法的分词速度均比原最大匹配算法提高30%以上。(本文来源于《微型机与应用》期刊2014年17期)
熊志斌,朱剑锋[6](2014)在《基于改进Trie树结构的正向最大匹配算法》一文中研究指出提出一种改进的Trie树结构,树节点记录了字符串与构词的位置信息,子节点采用哈希查找机制,在此基础上优化了中文分词的正向最大匹配算法。分词过程中利用自动机机制判断是否构成最长词,解决了正向最大匹配算法需要根据词长调整字符串的问题。算法时间复杂度为1.33,对比试验结果表明有较快的分词速度。基于改进Trie树结构的正向最大匹配算法提高了中文分词速度,尤其适用于词典结构需要实时更新的场合。(本文来源于《计算机应用与软件》期刊2014年05期)
徐楠楠,王东风,韩璞[7](2014)在《基于正向最大匹配算法的电力两票安全识别》一文中研究指出为了让计算机具有处理甚至理解自然语言的能力,人们发明了很多自然语言语义分析理论。但是应用在电力系统工作票和操作票的领域中还很少。在中文分词的理论基础上利用正向最大匹配算法,针对电厂两票安全措施的语句进行自动识别,并分析了两票安全措施语句的语意。结果表明基于两票填写内容=动作词+设备名称词+状态词这种表示结构下,计算机能够很好的识别和理解电厂两票安全措施。这样计算机系统就能够对电力两票知识进一步的计算和推理,从而为深度人工智能开票提供了广泛的应用前景。(本文来源于《计算机仿真》期刊2014年01期)
桑书娟,王庆喜[8](2012)在《一种结合正向最大匹配法和互信息的中文分词算法》一文中研究指出中文分词是文本过滤的首要的基础性工作,也是智能化中文信息处理的关键。本文提出了一种结合正向最大匹配法和互信息的中文分词算法。实验结果说明,该算法能在一定程度上提高文本的分类性能。(本文来源于《计算机光盘软件与应用》期刊2012年07期)
吴旭东[9](2011)在《正向最大匹配分词算法的分析与改进》一文中研究指出本文主要通过对影响正向最大匹配算法效率的因素的分析,提出对该算法的一点改进,以及设计了相应的词典结构,以期在匹配过程中尽可能的减少比较次数,提高分词效率。(本文来源于《科技传播》期刊2011年20期)
王惠仙,龙华[10](2011)在《基于改进的正向最大匹配中文分词算法研究》一文中研究指出中文自动分词技术在中文信息处理、Web文档挖掘等处理文档类研究中是一项关键技术,而分词算法是其中的核心。正向最大匹配算法FMM(Forward Maximum Match)具有切分速度快、简洁、容易实现等优点,但是还存在分词过程中设定的最大词长初始值固定不变的问题,带来匹配次数相对较多的弊端。针对此问题提出了根据中文词典中的词条长度动态确定截取待处理文本长度的思想,改进了FMM算法,并用互信息统计来消除交集型歧义。最后,通过实验对算法进行了分词和验证,结果表明改进的算法与一般正向最大匹配算法相比,中文分词的准确率提高了。(本文来源于《贵州大学学报(自然科学版)》期刊2011年05期)
正向最大匹配论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
中文分词技术是搜索引擎进行中文文本分析的关键,分词技术的好坏直接影响搜索引擎的实用性,本文在研究现有正向最大匹配算法的基础上,设计了一种新的改进的中文分词方法,并且通过验证表明了可以得到更好的分词速度和准确率。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
正向最大匹配论文参考文献
[1].朱钟元,杨莹,薛醒思,詹先银,王家华.基于改进正向最大匹配算法的股票资讯新闻自动标注技术[J].宝鸡文理学院学报(自然科学版).2019
[2].严良达.一种改进的正向最大匹配算法[J].福建电脑.2017
[3].吴兴蛟,吴晟.基于正向最大匹配算法的密码破译[J].计算机与数字工程.2016
[4].李霞婷.基于改进型正反向最大匹配中文分词算法的研究[J].信息技术与信息化.2015
[5].戴上静,石春,吴刚.中文分词中的正向增字最大匹配算法研究[J].微型机与应用.2014
[6].熊志斌,朱剑锋.基于改进Trie树结构的正向最大匹配算法[J].计算机应用与软件.2014
[7].徐楠楠,王东风,韩璞.基于正向最大匹配算法的电力两票安全识别[J].计算机仿真.2014
[8].桑书娟,王庆喜.一种结合正向最大匹配法和互信息的中文分词算法[J].计算机光盘软件与应用.2012
[9].吴旭东.正向最大匹配分词算法的分析与改进[J].科技传播.2011
[10].王惠仙,龙华.基于改进的正向最大匹配中文分词算法研究[J].贵州大学学报(自然科学版).2011