导读:本文包含了检索语言论文开题报告文献综述及选题提纲参考文献,主要关键词:信息检索,跨语言检索,文本挖掘,关联规则
检索语言论文文献综述
黄名选,卢守东,徐辉[1](2019)在《基于加权关联模式挖掘与规则后件扩展的跨语言信息检索》一文中研究指出【目的】针对自然语言处理中查询主题漂移和词不匹配问题,提出一种基于加权关联模式挖掘和规则后件扩展的跨语言信息检索模型及其算法。【方法】该模型采用新的加权关联模式支持度和基于最大项目权值的项集剪枝策略挖掘频繁项集,利用置信度和相关度评价加权关联规则,根据扩展模型从规则中提取优质扩展词实现规则后件扩展,扩展词与原查询词项组合为新查询再次检索文档得到最终检索结果。【结果】实验结果表明,与单语言检索基准比较,本文检索模型的R-prec和P@10平均增幅分别为42.49%和25.53%;与跨语言检索基准比较,其平均增幅分别为91.87%和64.61%;与现有基于加权关联规则挖掘的跨语言检索方法比较,R-prec和P@10最高平均增幅分别可达93.20%和34.60%。【局限】只进行实验性研究,需要探讨在实际跨语言搜索引擎中的具体应用。【结论】本文检索模型能有效地减少查询主题漂移和词不匹配问题,改善和提高检索性能。(本文来源于《数据分析与知识发现》期刊2019年09期)
黄名选,夏国恩,高荣,蒋曹清[2](2019)在《融合加权模式挖掘与规则混合扩展的跨语言检索》一文中研究指出针对信息检索中查询主题漂移和词不匹配问题,本文给出项集有效性计算方法及其剪枝策略,构建一种关联模式评价框架ACSC(Availability_Chis-Square_Confidence)和基于ACSC挖掘的规则混合扩展模型,提出一种融合加权关联模式挖掘与规则混合扩展模型的跨语言信息检索算法.该算法通过项集权值比较从跨语言初检相关文档集挖掘含有原查询词项的频繁项集,利用基于有效性的剪枝方法对项集进行剪枝得到有效频繁项集,从有效频繁项集挖掘加权关联规则,根据规则混合扩展模型实现查询扩展,扩展词与原查询词组合为新查询再次检索文档得到最终检索结果.与现有跨语言检索算法比较,实验结果表明,本文算法能有效地减少查询漂移和词不匹配问题,提高和改善跨语言信息检索性能,有效性和置信度可使本文算法分别获得最优的检索结果 R-prec和P@10值.(本文来源于《小型微型计算机系统》期刊2019年09期)
曹树金,刘慧云,张乐乐,常赵鑫,李慧玲[3](2019)在《知识组织与检索语言学术研讨会综述》一文中研究指出为促进全国知识组织与检索语言领域的学术研讨和交流合作,2018年12月2日至5日,由中国图书馆学会学术研究委员会主办,中山大学资讯管理学院、中国图书馆学会学术研究委员会信息组织专业委员会承办的"知识组织与检索语言学术研讨会"在广州召开。会议邀请了图书情报领域的知名专家就主旨内容作了学术报告,并对知识组织与检索语言的理论、方法和工具发展进行了研讨。本文对此次会议的学术报告和研讨内容进行综述,以供更多的同仁了解和参考。(本文来源于《图书馆建设》期刊2019年01期)
黄武锋,何冬蕾,黄名选[4](2019)在《基于关联规则后件扩展的越英跨语言信息检索》一文中研究指出针对跨语言信息检索中存在的查询主题漂移问题,提出一种基于完全加权关联规则后件扩展的越英跨语言信息检索模型,给出了模型结构及其各个功能模块,详细阐述了模型的关键技术及其算法。该模型将完全加权模式挖掘技术和用户相关反馈扩展融合应用于越英跨语言信息检索,将越南语查询通过机器翻译系统译为英文并检索为英文文档,提取前列初检文档构建用户相关反馈文档集,采用完全加权关联规则挖掘技术对用户相关反馈文档集挖掘与原查询相关的关联规则,将关联规则后件作为扩展词,并和原查询组合成新查询再次检索英文文档,得到最终检索结果。在NTCIR-5 CLIR数据集上的实验结果表明,该模型能减少越英跨语言检索中的查询漂移,提高和改善其检索性能。(本文来源于《计算机技术与发展》期刊2019年04期)
石蕾[5](2018)在《布尔逻辑检索和自然语言检索对比研究》一文中研究指出采用4种检索方式(无过滤布尔逻辑、过滤布尔逻辑、无过滤自然语言和过滤自然语言)对7个常见数据库ASP、GS、JSTOR、Lexis Nexis、Pro Quest Central、Pub Med、Scopus和Web of Science检索测试,最后分析了在目前技术环境下,布尔逻辑和自然语言检索相比,哪种方式更加有效。(本文来源于《现代情报》期刊2018年09期)
马路佳[6](2018)在《蒙汉跨语言信息检索模型研究》一文中研究指出随着互联网信息全球化的发展进程,互联网上的网页信息迅速增长并不断积累。互联网上,不同国家、地区和民族所使用的语言文字的语种差异很大。互联网用户不仅想要找到母语信息,越来越多的用户希望获取到其他语言文字的信息内容。跨语言信息检索正是基于这种需求提出的一种技术和方法,并逐步发展成为信息处理技术的一个重要研究方向。在中国,互联网的发展也推动了少数民族语言文字信息处理的发展,越来越多少数民族语言网站纷纷涌现,面向少数民族语言文字的信息检索技术得到了极大的发展,跨语言信息检索允许用户使用熟悉的语言文字搜索其他语言文字信息。查询式翻译、文档翻译是实现跨语言信息检索常用的两种方法。借助这些翻译方法实现语种转化和统一,从而将跨语言信息检索任务转换成单语言信息检索任务。另外,也有研究借助双语词典来翻译查询词。借助词典翻译往往会结合查询扩展来提高检索效果,提升搜索结果的召回率;训练机器翻译模型的研究方法通常需要高质量、大规模的平行语料以期获取高质量机器翻译结果,但是大量优质的平行语料比较难获得,尤其像国内少数民族语言文字,都属于低资源语言范畴,获取难度更大,同时,采用文档翻译方法还需要考虑译文存储带来的存储空间消耗问题。鉴于上述原因,本文提出了应用最新的跨语言词向量方法进行查询词翻译和扩展的蒙汉跨语言信息检索模型。本文主要贡献如下:1)利用跨语言词向量实现从汉文查询词到蒙古文查询词扩展和映射,并利用本文提出的方法在进行词向量映射时对候选的蒙古文查询词进行筛选和排序,选择符合上下文语境的蒙古文词语。该方法在查询前将汉文查询式映射为蒙古文查询式,即针对每一个查询词进行映射时利用该查询词在查询式中的上下文信息对其候选蒙古文查询词进行交叉验证,从而选择一个相对更符合当前查询式上下文语境的候选词。这种方法跟机器翻译的跨语言查询方式相比,不需要大量的平行语料,这是一个很大的优势,并且该方法不需要考虑翻译文档所耗费的大量冗余磁盘空间,且比较易于跨语言查询语种的扩充。相对于基于词典翻译的方式,跨语言词向量可以对“词典外”的词进行映射,易于进行跨语言双语词汇的扩充。2)设计并实现蒙汉跨语言信息检索系统。通过分析网络爬虫技术开发了一个切实可用的蒙古文网页采集方案,采集的文档经过一系列蒙古文预处理步骤之后入库建立索引,通过跨语言词向量完成查询词源语言到目标语言的映射,最终形成一个可用的跨语言信息检索系统。(本文来源于《中央民族大学》期刊2018-05-12)
许舸[7](2018)在《基于语言模型的个性化检索方法研究》一文中研究指出近年来,在互联网的浪潮之下,信息规模达到空前水平,呈现“信息爆炸”之势。如何从海量数据中,获取满足不同用户需求的信息成为当务之急,也是信息检索领域中亟需解决的难题。信息检索领域中,融合用户信息,构建满足不同用户需求的个性化检索模型成为主流。个性化检索模型常见有基于用户检索历史、基于检索结果以及基于搜索引擎历史记录等方法。这些方法大多是基于用户非公开的信息构建检索模型,但这些信息的特点是获取难度大、噪音大。故而,面对日趋多样化的用户需求,可利用普及度较高的社交平台,构建用户画像,刻画用户的兴趣偏好。本文利用微博社交平台构建用户兴趣模型以满足不同用户的检索需求,并探讨个性化检索方法的可行性和有效性,主要工作分为以下两个方面:第一,本文利用用户微博信息,构建用户兴趣模型,实现个性化检索。具体步骤如下:首先,本文利用Scrapy框架爬取微博语料,并对语料进行预处理,构建实验所需的数据集,以人工标注的形式构建标准数据集;然后,在语言模型框架下,利用用户微博数据,构建基于用户微博的个性化检索方法(UPM);随后,利用用户社交关系,构建基于协同计算的个性化检索方法(CCUPM);最后,将UPM和CCUPM与基准模型进行对比分析。实验结果验证了个性化检索方法的可行性与有效性。第二,本文对用户兴趣建模的基础之上,融合伪相关反馈,实现个性化检索。首先,个性化检索方法中,获得初次检索结果,将结果文档视为反馈文档;然后,利用反馈文档实现对查询的扩展,构建基于伪相关反馈的个性化检索方法(PRF-CCUPM);最后,将PRF-CCUPM与基准模型进行对比分析。实验结果验证了 PRF-CCUPM的可行性与有效性。通过以上两个方面的研究和验证分析,本文成功地将用户模型运用于信息检索领域,为信息检索领域的研究提供了一种可行的解决方案。(本文来源于《华中师范大学》期刊2018-05-01)
唐亮,席耀一,彭波,刘香伟,易绵竹[8](2018)在《基于词向量的越汉跨语言事件检索研究》一文中研究指出为了解决越汉跨语言事件检索中的查询翻译问题,该文提出了一种基于词向量的越汉跨语言事件检索方法。首先利用词向量构建事件关键词的汉语语义特征向量,然后计算越语的事件关键词的特征翻译向量,最后通过计算语义特征向量之间的相似度完成跨语言关键词对齐,从而实现查询关键词的自动翻译,进而完成跨语言事件检索。在构建的南海话题相关越汉语料库上进行的实验证明了该方法的有效性。(本文来源于《中文信息学报》期刊2018年03期)
韦丽莉[9](2018)在《基于信息检索中的自然语言处理技术设计与应用》一文中研究指出互联网发展迅猛,网络上的信息量也越来越大,用户越来越难以快捷的获取想要的信息,在网络信息检索方面更是存在很大的问题,不仅查询主观信息性能低下,而且返回结果繁杂无用信息较多,不能满足人们对信息检索人性化的要求。针对此背景提出基于信息检索中的自然语言处理技术设计与应用,对其进行了实验分析,实验证明该技术达到了预期目的。(本文来源于《计算机产品与流通》期刊2018年02期)
章涵,张志昌[10](2018)在《自然语言处理在信息检索中的应用分析》一文中研究指出在信息检索中如何有效应用自然语言处理是二十一新世纪以来我国关注的一个重要问题,需要有关部门及研究者引起高度重视以及广泛关注。本文主要介绍了基本自然语言处理技术与高级自然语言处理技术在信息检索中的具体应用,进而提出一些建设性意见,为提高自然语言处理的应用价值贡献微薄之力。(本文来源于《电脑迷》期刊2018年02期)
检索语言论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
针对信息检索中查询主题漂移和词不匹配问题,本文给出项集有效性计算方法及其剪枝策略,构建一种关联模式评价框架ACSC(Availability_Chis-Square_Confidence)和基于ACSC挖掘的规则混合扩展模型,提出一种融合加权关联模式挖掘与规则混合扩展模型的跨语言信息检索算法.该算法通过项集权值比较从跨语言初检相关文档集挖掘含有原查询词项的频繁项集,利用基于有效性的剪枝方法对项集进行剪枝得到有效频繁项集,从有效频繁项集挖掘加权关联规则,根据规则混合扩展模型实现查询扩展,扩展词与原查询词组合为新查询再次检索文档得到最终检索结果.与现有跨语言检索算法比较,实验结果表明,本文算法能有效地减少查询漂移和词不匹配问题,提高和改善跨语言信息检索性能,有效性和置信度可使本文算法分别获得最优的检索结果 R-prec和P@10值.
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
检索语言论文参考文献
[1].黄名选,卢守东,徐辉.基于加权关联模式挖掘与规则后件扩展的跨语言信息检索[J].数据分析与知识发现.2019
[2].黄名选,夏国恩,高荣,蒋曹清.融合加权模式挖掘与规则混合扩展的跨语言检索[J].小型微型计算机系统.2019
[3].曹树金,刘慧云,张乐乐,常赵鑫,李慧玲.知识组织与检索语言学术研讨会综述[J].图书馆建设.2019
[4].黄武锋,何冬蕾,黄名选.基于关联规则后件扩展的越英跨语言信息检索[J].计算机技术与发展.2019
[5].石蕾.布尔逻辑检索和自然语言检索对比研究[J].现代情报.2018
[6].马路佳.蒙汉跨语言信息检索模型研究[D].中央民族大学.2018
[7].许舸.基于语言模型的个性化检索方法研究[D].华中师范大学.2018
[8].唐亮,席耀一,彭波,刘香伟,易绵竹.基于词向量的越汉跨语言事件检索研究[J].中文信息学报.2018
[9].韦丽莉.基于信息检索中的自然语言处理技术设计与应用[J].计算机产品与流通.2018
[10].章涵,张志昌.自然语言处理在信息检索中的应用分析[J].电脑迷.2018