分词系统论文开题报告文献综述

分词系统论文开题报告文献综述

导读:本文包含了分词系统论文开题报告文献综述、选题提纲参考文献,主要关键词:分词,中文,算法,系统,模型,文本,盲文。

分词系统论文文献综述写法

李妍,关钟,刘志丽,阎嘉,孙岩[1](2019)在《盲文分词修改系统的设计与实现》一文中研究指出目前汉语盲文语料库多是txt文本,txt文本在进行汉文和盲文采集、修改、管理时,操作不便,处理速度慢且效率低,本盲文分词修改系统提供了一个平台,可以将多个不同分词版本的txt导入到平台,实现多版本盲文分词的格式化排版、自动对齐、同步编辑、智能校对等操作,帮助用户更快、更便捷的进行盲文分词标记工作。(本文来源于《科技视界》期刊2019年30期)

刘桂梅[2](2019)在《应用中文分词技术的网络推广管理系统的设计与实现》一文中研究指出为满足某企业内部网络推广管理需求,系统从管理者的角度出发,以引流客户为目的,研究B2B模式下网络推广人员的发帖行为需求,确定系统的主要模块为发帖管理、关键词管理、网帖样本和公司网站管理。利用中文分词技术,基于产品关键词实现快速生成网帖标题和网帖正文,保存可复用的网帖段落,以供推广人员发布精准的网帖。(本文来源于《电子商务》期刊2019年09期)

陆丽婷[3](2019)在《基于商品搜索的智能分词系统的设计》一文中研究指出基于商品搜索的智能分词系统就是将商品名称通过智能分词系统分成若干有用的词语来匹配用户搜索时输入的词语,同时,根据分词结果可以将同类商品进行分类统计,分析了系统的架构,对系统进行了模块设计、功能流程的分析以及数据库的设计。(本文来源于《电脑知识与技术》期刊2019年23期)

马新意,王剑辉[4](2019)在《自动答疑系统中文分词模块的设计与实现》一文中研究指出本文对国内外自动答疑系统的研究现状进行了分析,对常用的分词词典机制和分词算法进行了理论研究,深入讨论了分词过程中常出现的歧义问题,提出了基于双字哈希索引的词典机制,并将改进的最大匹配算法与串频统计相结合,提高了中文分词的准确性,对自动答疑系统中的中文分词模块进行了设计与实现,通过实验证明该分词系统具有良好的切分精度和实用性。(本文来源于《信息技术与信息化》期刊2019年01期)

王志超,孙建斌,秦瑞丽[5](2018)在《基于分词的关联规则预测系统研究》一文中研究指出定向文本预测,往往存在预测不准、数据量大、针对性不高等问题。提出基于分词的关联规则预测方法,以煤化工行业为例进行发展方向的预测。对预测主题近期新闻标题进行层迭隐马尔可夫模型的初步分词,对得到的词集进行虚词修剪及喻词实化完成语义统一形成参与关联规则的事务集;通过提出的基于分词的关联规则算法Apriori_Split对事务集进行计算,最终得到预测结果。实验表明,该预测方法简单有效,可以极大提高预测准确性。(本文来源于《计算机应用与软件》期刊2018年12期)

徐浩洋[6](2018)在《基于IK分词全文检索算法的合同管理系统设计与实现》一文中研究指出随着我国企业信息化改革的深入,企业信息化的进展直接影响到企业的经营效益,企业通过内部管理、重组等方式来转变企业经营,从而满足企业长远发展利益。合同管理是企业信息化发展的一个重要手段,通过对合同精细化管理,对企业经营效益和长远发展都有积极作用。合同管理系统不仅有利于企业内部资源的重组,而且对于加强企业合同管理具有重要的现实意义。传统的合同管理系统已很难满足企业发展的要求,传统的人工合同管理方式或功能相对单一的合同管理系统有着许多弊端,合同管理系统差,合同文本易丢失、信息安全保密差、不便于对合同的查询和统计等,如果企业一旦发生合同变更等问题,这种传统的合同管理就需要面临大量的修改工作,重新起草、重新修改等,管理起来难度极大,而且需要大量的人力和物力的成本。因此如何在新时代背景下研发适合企业发展的合同管理系统已成为提高企业信息化和核心竞争力的重要手段。本文首先通过需求调研,分析和总结合同管理系统的实际业务流程,并且分析国内外合同管理系统的研究现状,从而提出合同管理系统的整体研究内容。其次,本文根据合同管理系统的功能需求和非功能性需求,对系统的整体结构和功能模块进行设计,并且在基于MVC设计模式的基础上,把系统划分为独立的四层结构,每个层次结构之间相对独立,从而降低系统模块之间的耦合度。在系统前端实现方面,系统采用AJAX技术来开发前台功能界面,它通过相应的异步可视化编程方法从而使前台WEB开发更流程,并且通过异步的方式处理服务器与客户端之间的业务请求。AJAX通过利用JavaScript和CSS技术来把请求的结果展示给前台用户层,从而提高了整个前台请求的服务效率。在关键算法实现方面,本文对IK分词和全文检索算法进行详细研究,在J2EE架构与全文检索技术整合基础上,对核心数据进行分词切割,并且在核心数据关键词数据上建立对应索引,从而可以根据关键词索引来对全文合同数据进行快速检索。本文所设计与实现的基于IK分词全文检索算法的合同管理系统可以高效、快捷的处理合同业务流程,从而实现合同管理的无纸化流程。系统从根本上提高了合同管理的工作效率,本文系统不仅提高了企业级系统的安全性,而且可以大幅缩短系统升级和维护的周期,从而提高了企业的核心竞争力。(本文来源于《大连海事大学》期刊2018-10-01)

夏同飞,李志,王超,郭振,张学敏[7](2018)在《基于互信息改进算法的新词发现对中文分词系统改进》一文中研究指出近几年,伴随着经济的发展和社会的进步,配电网在电网企业中发挥的作用在不断增大,基于此,要对营配台账予以重视。文章中主要是借助自然语言处理(NLP)中文分词、模型匹配等技术对相关问题进行分析,依据各个地区以及不同系统设备台账的命名常识有效提取标志性分词形式,借助台账关键属性完成系统之间台账匹配管理,合理性依据匹配规则完成台账实施监督和控制,从根本上发现异常数据从而辅助工作人员对台账数目和相关内容予以核查,能在提升营配基础数据质量的基础上,减少人工查验损耗的时间,具有重要的推广价值。(本文来源于《电子元器件与信息技术》期刊2018年09期)

袁向铎[8](2018)在《基于统计和规则的中文地址分词系统设计与实现》一文中研究指出近年来,信息技术日新月异,带动了各个行业的迅速发展,相应的数据量也在不断剧增,地址信息也相应地跟随更新和增加。电子地图的出现使得文字描述的地址能够映射到地理空间坐标上,实现这种映射的技术即为地理编码技术。地理编码一般包括地址标准化、地址分词、地址匹配、空间定位等步骤。其中,地址分词的作用主要是采用某一分词方法将中文地址拆分成若干个最小地址单元,为后续的地址匹配过程做铺垫,这也是地理编码中最为核心、关键的一步。本文主要对中文地址分词进行研究,重点分析中文地址的组成特点和规则,采用条件随机场模型解决中文地址分词中的未登录词识别问题,并构建出基于标准地址模型的知识库,基于此知识库设计出适用于中文地址标准化分词的算法,开发出可靠的中文地址分词原型系统,并通过实验验证其可行性。论文具体工作如下:1.构建基于标准地址模型的知识库。地址模型是本文研究对象中文地址中地址要素的组织方式,直接影响后面分词算法的设计和最终分词的准确率。通过对海量的中文地址数据的组成特点的研究和总结,中文地址分词需要完整的全国行政区划等级库,地址特征词库和地理实体名词库作为分词依据。2.设计有效的中文地址分词算法。中文分词算法的设计包括分词算法的选取和基于地址组成规则的分词结果处理算法的设计。由于分词算法已经比较成熟,结合中文地址特点,本文依据构建的知识库采用双数组trie树的字符串匹配方法对中文地址进行初步分词;针对初步分词结果中的歧义、错分等现象,本文又设计了基于地址组成规则的分词结果处理算法来对其进行消歧义、推导验证等处理,大大提高了分词的准确率。3.开发实现了一个中文地址分词的原型系统。本论文基于上述的地址知识库和中文地址分词算法开发、实现了中文地址分词原型系统,对该系统的性能和功能进行了实验测试,并与纯规则的分词方法做了比对,实验结果表明采用统计和规则的分词系统的分词准确率可达92.37%,远高于纯规则方法的分词结果,证明了系统的可靠性。(本文来源于《东南大学》期刊2018-05-01)

邢彪,根绒切机多吉[9](2018)在《基于jieba分词搜索与SSM框架的电子商城购物系统》一文中研究指出随大数据、云计算等计算机技术的发展,拥有实时检索功能的购物商城系统也越来越重要。笔者利用jieba分词对商城用户的搜索输入进行分词以便于检索商品,同时,利用最新的电子商城框架SSM搭建了购物商城系统,较好满足了大众实时检索和购买商品的需求。(本文来源于《信息与电脑(理论版)》期刊2018年07期)

赵坦[10](2018)在《基于扩展词库中文分词方法的购物网站系统的研究与实现》一文中研究指出随着互联网时代的到来,网络购物逐渐走进了人们的生活,在众多的B2C购物网站中,天猫、京东等网站占据了绝大部分网络销售额。在利润的驱使下,更多的购物网站应运而生。搜索系统作为购物网站的主要功能模块,在网络购物中的地位无法取代。用户通过搜索商品,最快速地完成购物流程。在搜索系统中,中文分词技术是基础。目前的中文分词技术虽然正逐步趋于成熟,但是中文分词中的两道鸿沟仍然无法逾越:歧义识别和新词发现。针对以上问题,本文对基于扩展词库的中文分词方法展开研究,提出了一种创建扩展词库的方法。该方法是在solr中文分词系统允许用户加入扩展词库的基础上,改进了CRF算法的特征选取,使用双向最大匹配法结合高频词组成的临时词库,对CRF算法进行结果修正,最后创建用户自己的扩展词库。本文针对使用扩展词库和不使用扩展词库的IK Analyzer中文分词器做对比实验,得到关于中文分词准确率等一系列实验数据。通过实验证明,该方法在一定程度上解决了中文分词中的歧义问题以及新词发现问题,提高了中文分词准确率。进而通过在购物网站中搜索模块的应用,使用户获得更好的搜索、购物体验。为构建具有应用价值的购物网站,本文首先研究了购物网站的构成,对购物网站系统进行功能性需求分析与非功能性需求分析,开发了包括后台管理模块、前台界面模块、搜索模块、订单模块、单点登录系统模块以及会员系统模块的购物网站系统。本系统实现了管理员在后台界面对商品信息、网站页面信息等进行管理,用户在前台界面进行浏览、注册、登录、搜索、完成订单等主要功能。系统搭建了3个linux服务器,分别是图片处理服务器、redis服务器以及solr服务器。系统对商品以及用户数据存入到mysql数据库中。对基于扩展词库的中文分词方法中创建的扩展词库数据,存入到linux系统下的mydic.dic文件中。最后对系统进行了全面测试,证明系统实现了需求分析中确定的各项功能,能够稳定、有效的运行。(本文来源于《辽宁大学》期刊2018-04-01)

分词系统论文开题报告范文

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

为满足某企业内部网络推广管理需求,系统从管理者的角度出发,以引流客户为目的,研究B2B模式下网络推广人员的发帖行为需求,确定系统的主要模块为发帖管理、关键词管理、网帖样本和公司网站管理。利用中文分词技术,基于产品关键词实现快速生成网帖标题和网帖正文,保存可复用的网帖段落,以供推广人员发布精准的网帖。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

分词系统论文参考文献

[1].李妍,关钟,刘志丽,阎嘉,孙岩.盲文分词修改系统的设计与实现[J].科技视界.2019

[2].刘桂梅.应用中文分词技术的网络推广管理系统的设计与实现[J].电子商务.2019

[3].陆丽婷.基于商品搜索的智能分词系统的设计[J].电脑知识与技术.2019

[4].马新意,王剑辉.自动答疑系统中文分词模块的设计与实现[J].信息技术与信息化.2019

[5].王志超,孙建斌,秦瑞丽.基于分词的关联规则预测系统研究[J].计算机应用与软件.2018

[6].徐浩洋.基于IK分词全文检索算法的合同管理系统设计与实现[D].大连海事大学.2018

[7].夏同飞,李志,王超,郭振,张学敏.基于互信息改进算法的新词发现对中文分词系统改进[J].电子元器件与信息技术.2018

[8].袁向铎.基于统计和规则的中文地址分词系统设计与实现[D].东南大学.2018

[9].邢彪,根绒切机多吉.基于jieba分词搜索与SSM框架的电子商城购物系统[J].信息与电脑(理论版).2018

[10].赵坦.基于扩展词库中文分词方法的购物网站系统的研究与实现[D].辽宁大学.2018

标签:;  ;  ;  ;  ;  ;  ;  

分词系统论文开题报告文献综述
下载Doc文档

猜你喜欢