主题检索论文-李璞,肖宝,孙玉胜,张志锋,邓璐娟

主题检索论文-李璞,肖宝,孙玉胜,张志锋,邓璐娟

导读:本文包含了主题检索论文开题报告文献综述及选题提纲参考文献,主要关键词:Wikipedia类图,主题特征,短文本,信息检索

主题检索论文文献综述

李璞,肖宝,孙玉胜,张志锋,邓璐娟[1](2019)在《一种融合Wikipedia类图和主题特征的短文本检索方法》一文中研究指出社交网络的快速发展催生出大量短文本数据.鉴于短文本具有长度短、信息量少、特征稀疏、语法不规则等特点,根据Wikipedia类图(Wikipedia Category Graph,WCG)中包含的结构信息,通过分析其中的主题特征,提出一种语义特征选择及关联度计算方法.以此为基础,通过计算用户查询与目标短文本之间的语义关联度,实现对短文本的检索和排序.最后通过在Twitter子集上的实验结果表明,融合Wikipedia类图和主题特征的短文本检索方法比现有一些检索方法在评估指标MAP,P@k及R-Prec上具有更好的效果.(本文来源于《河南师范大学学报(自然科学版)》期刊2019年06期)

李霄野[2](2019)在《基于主题模型的经济犯罪智能检索方法研究》一文中研究指出随着公安经济侦查业务的扩展,历史数据的日益增多,人工智能技术的广泛使用,针对经济犯罪信息的智能化检索模式已成为经济犯罪侦查领域的迫切需求。目前多数检索引擎大都使用关键词匹配的模式,没有考虑文本内在的语义,导致检索结果的准确率与查全率均不高。为了解决这一问题,主题模型以其挖掘文档隐含概念的优势大量被用在信息检索中,但是仍存在以下问题:第一,其无监督的学习形式,导致生成的主题解释性不够明确;第二,主题模型更适合处理长文本,对特征较少的查询语句不适用。为解决以上问题,本文从智能检索的语义特性出发,提出了一种基于主题模型的智能检索方法。该方法从文档的检索模型和用户提问两个角度进行研究,运用主题模型结合聚类算法挖掘文档的潜在语义,构造文档索引;应用本体技术处理用户提问语句,标准化检索式。首先选择经济犯罪领域专家知识作为主题模型的先验知识,改进了无监督主题模型的主题偏离实际语义的缺陷,实现了半监督性质的主题建模,生成了符合经济犯罪特征的文档主题标签。其次,研究了文档的聚类方法,结合了Bagging集成学习思想,改进了传统k-means算法,以解决原始语料经过主题模型训练生成的文本主题分布较为稀疏的问题。再次,构建了经济犯罪领域本体,描述各个实体间的逻辑关系,并完成本体的持久化,在检索阶段识别出查询语句的语义和逻辑关系,重构用户检索条件,发掘出用户真实检索要求;最后,根据查询与文档的综合匹配率,按照相似度排序结果列表,以提高检索准确率和召回率。在基于主题模型的智能检索方法的基础上,开发了经济犯罪智能检索系统。以某经济犯罪领域数据为样本实例,验证了本文改进的主题模型和智能检索方案的效果与价值。(本文来源于《东北石油大学》期刊2019-06-01)

阮光册,任金玥[3](2019)在《基于主题层次关系的文献检索结果可视化应用研究》一文中研究指出文献检索结果中隐藏着知识的层次关系,本文采用hLDA模型抽取检索结果数据集中隐藏的主题树结构,揭示研究主路径等信息,进而为用户提供高效的知识服务。首先,构建领域专业知识库,实现对检索结果的预处理;其次,通过合理的hLDA超参抽样,获得主题树结构;最后,结合可视化技术,识别检索问题下学术信息的知识层次结构。实验表明,本文采用的方法可以提供有效的检索结果可视化分析,相比经典的层次聚类方法,结果的可读性更高。(本文来源于《图书馆杂志》期刊2019年05期)

李燕凌,刘超[4](2019)在《中国突发动物疫情公共卫生事件研究脉络与主题热点的可视化分析——基于检索》一文中研究指出突发动物疫情公共卫生事件应急管理已成为中国公共管理学界的一个重要研究领域,为反映我国突发动物疫情公共卫生事件及其相关领域的研究进展,本文以中国知网(China national knowledge infrastructure,CNKI)数据库收录的中文社会科学引文索引(Chinese social science citation index,CSSCI)为数据源,以2003年-2017年共195篇突发公共卫生事件研究领域及相关动物疫情研究方向的期刊文献为样本,采用文献计量分析中的SPSS聚类与社会网络分析(social network analysis,SNA)等可视化技术,对国内的突发动物疫情公共卫生事件研究领域脉络进行了梳理,综合分析得出了国内突发动物疫情公共卫生事件领域五大研究主题,为学者在该领域今后的理论与实证的发展创新提供参考借鉴。(本文来源于《中国动物传染病学报》期刊2019年02期)

蒋宗礼,赵思露[5](2018)在《主题模型在检索结果聚类中的应用》一文中研究指出检索结果聚类能够有效帮助提高获取信息的效率和质量。针对传统文本聚类模型存在数据维数过高、缺乏语义理解等问题,提出一种面向检索结果聚类的融合共现分析主题建模算法。基于改进的LDA模型,对得到的"文档-主题"概率分布进行聚类分析,采用K-means算法完成聚类过程,最后提出根据聚类中心提取主题词作为类簇标签。实验结果表明,改进的LDA算法在检索结果聚类应用上不仅获得了很好的聚类效果,类簇标签也有良好的可读性。(本文来源于《软件导刊》期刊2018年12期)

蒋伟,董翔,史志林[6](2018)在《基于图像识别的“华夏文明”视角下主题知识库检索方法研究》一文中研究指出文章在华夏文明视域下将图像识别的方式用于主题知识库检索分析,改变只能靠关键词检索的单一检索方式,进而丰富信息检索方法。(本文来源于《数码世界》期刊2018年07期)

王岩,张静仪,何晓阳[7](2018)在《PubMed与Embase的主题标引及主题检索功能比较研究》一文中研究指出目的:比较分析PubMed与Embase的主题标引及检索功能。方法:从词表的发展历程、结构体系、主题标引、主题检索4个方面对Pubmed和Embase进行比较分析。结果:MeSH的历史悠久,成熟稳定,应用更广。MeSH和Emtree的结构类似,Emtree的体量更大; PubMed的主题标引在规范性方面更为出色。结论:PubMed和Embase二者各有特色,PubMed更方便易用,Embase更注重可视化操作以及检索结果处理的多样性。(本文来源于《中华医学图书情报杂志》期刊2018年06期)

张毓雄,汤跃跃[8](2018)在《我国城乡融合发展的整体性研究与反思——基于主题检索的CSSCI文献》一文中研究指出党的十九大提出"实施乡村振兴战略",其"城乡融合发展"意义重大,以"城乡融合"主题检索的CSSCI文献,其研究集中在城乡融合目标界定与指标探索、阶段划分、模式构想与实践、城乡融合障碍与对策分析等方面,五位一体思想和构建城乡融合的现代农业产业体系、生产体系、经营体系的思想对研究具有重要的参考价值。(本文来源于《社会科学家》期刊2018年04期)

陈明[9](2018)在《基于主题翻译模型的社区问答中问句检索技术研究》一文中研究指出互联网问答社区已经成为人们获取知识和信息的重要途径,它们成立多年来积累了海量的问答数据,而如何高效地利用这些数据成为了当前的研究重点。相关研究中,问句检索的主要研究目的为利用历史问答数据帮助用户找到其关心问题的答案,减少用户等待他人回答的时间,同时避免相似问题的重复提交给系统造成负担。本文主要针对问句检索中的两个方面——问句相关度计算和问答质量评估,从叁个不同的切入点进行研究。它们分别是:首先,针对当前面向问句检索的主题翻译模型中存在的,计算词相关度时忽略查询具体语义对词真实相关度的影响的问题,本文提出了一种融合查询主题信息的主题翻译模型,将查询的主题信息作为确定词语具体语义的依据,实现了查询和候选问答中词的有效匹配,优化了原有的主题翻译模型。其次,针对当前问句检索中对查询词项赋权时没有考虑查询具体语义的问题,本文提出了一种基于主题模型的词项赋权模型。它使用主题模型作为语义挖掘工具,结合信息熵的原理,根据词包含的信息量来计算其在查询中的权重。该模型能很好地解决复杂查询带来的冗长性问题。最后,针对如何有效评价问题-回答对质量的问题,本文提出了一种基于用户信息的问答对质量评分模型。它先依据用户的被采纳为最佳答案的回答的数量为用户的权威性进行评分,然后基于用户发布信息的质量与其权威性成正相关的假设,将问答对提问者和回答者的权威性评估结果作为问答对的质量特征。本文还利用排序学习(Learning to Rank)将问答质量特征和问句相关度特征结合起来形成了统一的面向社区型问句检索的排序模型。此外,在真实的数据集上的实验结果表明,对于各自要解决的问题,本文中提出的各个模型都取得了较好的效果。(本文来源于《武汉理工大学》期刊2018-04-01)

任鹏程[10](2018)在《基于主题排序与推荐的智能全文检索系统研究与实现》一文中研究指出随着互联网信息技术的飞速发展,各个门户站点井喷式爆发,网络数据呈爆炸式增长。从信息过载时代进入信息爆炸时代,人们从海量数据信息和门户站点中检索获取自己需要知识的需求愈加迫切。对于个人来说,如何从海量的信息中快速、准确地搜寻到目的信息页面是关键;对于各个拥有庞大数量页面的网站站点来说,如何快速构建一个准确化、个性化的检索系统成为当务之急。本论文在上述背景下,跟据信息检索的实际需求情况,提出了一种基于主题排序与推荐的智能全文检索系统。本文的主要工作内容有如下几点:第一,对系统的研究背景、目的及意义进行分析,介绍了国内外全文搜索引擎和排序技术的发展现状。同时对本全文搜索引擎系统具体架构和推荐模型建模进行了分析,明确了业务需求和流程,并提出构建本智能化全文搜索引擎的具体流程。第二,本文将系统分为了四层模块结构实现,首先针对检索结果进行排序,运用距离频度相关算法和LDA主题模型进行内容匹配,使用PageRank算法计算链接重要度,运用BP神经网络和用户日志对排序进行反馈学习与优化。最后使用几种算法结果的加权进行综合排序,使检索结果更加合理。同时对个性化推荐的理论技术进行探究,结合主题分析与检索系统的特点,提出了基于主题的混合推荐算法HRT。发掘用户主要偏好主题与潜在偏好主题,并采用两种方式相结合的混合推荐,也可以有效地解决推荐算法在搜索引擎应用中的冷启动问题。最后,系统的设计实现,主要采用Python进行各个模块的实现,同时设计有出错设计和提供多套方案供系统稳定运行。详细分析了系统各功能的实现效果以及结果指标,并运用黑盒测试方法和LoadRunner负载测试工具对系统进行了测试。各项结果表明,该系统基本达到了智能检索的需求。此外,本系统模块化的设计与灵活的优化算法组合为用户提供合理页面排序,并在实际功能的基础上保证了系统的稳定性,准确性与智能化以及高可扩展性,帮助用户从海量信息中最方便快速地找到自己需要的信息。有效地解决了用户智能信息检索问题和网站站点快速个性化部署的需求。(本文来源于《郑州大学》期刊2018-04-01)

主题检索论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

随着公安经济侦查业务的扩展,历史数据的日益增多,人工智能技术的广泛使用,针对经济犯罪信息的智能化检索模式已成为经济犯罪侦查领域的迫切需求。目前多数检索引擎大都使用关键词匹配的模式,没有考虑文本内在的语义,导致检索结果的准确率与查全率均不高。为了解决这一问题,主题模型以其挖掘文档隐含概念的优势大量被用在信息检索中,但是仍存在以下问题:第一,其无监督的学习形式,导致生成的主题解释性不够明确;第二,主题模型更适合处理长文本,对特征较少的查询语句不适用。为解决以上问题,本文从智能检索的语义特性出发,提出了一种基于主题模型的智能检索方法。该方法从文档的检索模型和用户提问两个角度进行研究,运用主题模型结合聚类算法挖掘文档的潜在语义,构造文档索引;应用本体技术处理用户提问语句,标准化检索式。首先选择经济犯罪领域专家知识作为主题模型的先验知识,改进了无监督主题模型的主题偏离实际语义的缺陷,实现了半监督性质的主题建模,生成了符合经济犯罪特征的文档主题标签。其次,研究了文档的聚类方法,结合了Bagging集成学习思想,改进了传统k-means算法,以解决原始语料经过主题模型训练生成的文本主题分布较为稀疏的问题。再次,构建了经济犯罪领域本体,描述各个实体间的逻辑关系,并完成本体的持久化,在检索阶段识别出查询语句的语义和逻辑关系,重构用户检索条件,发掘出用户真实检索要求;最后,根据查询与文档的综合匹配率,按照相似度排序结果列表,以提高检索准确率和召回率。在基于主题模型的智能检索方法的基础上,开发了经济犯罪智能检索系统。以某经济犯罪领域数据为样本实例,验证了本文改进的主题模型和智能检索方案的效果与价值。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

主题检索论文参考文献

[1].李璞,肖宝,孙玉胜,张志锋,邓璐娟.一种融合Wikipedia类图和主题特征的短文本检索方法[J].河南师范大学学报(自然科学版).2019

[2].李霄野.基于主题模型的经济犯罪智能检索方法研究[D].东北石油大学.2019

[3].阮光册,任金玥.基于主题层次关系的文献检索结果可视化应用研究[J].图书馆杂志.2019

[4].李燕凌,刘超.中国突发动物疫情公共卫生事件研究脉络与主题热点的可视化分析——基于检索[J].中国动物传染病学报.2019

[5].蒋宗礼,赵思露.主题模型在检索结果聚类中的应用[J].软件导刊.2018

[6].蒋伟,董翔,史志林.基于图像识别的“华夏文明”视角下主题知识库检索方法研究[J].数码世界.2018

[7].王岩,张静仪,何晓阳.PubMed与Embase的主题标引及主题检索功能比较研究[J].中华医学图书情报杂志.2018

[8].张毓雄,汤跃跃.我国城乡融合发展的整体性研究与反思——基于主题检索的CSSCI文献[J].社会科学家.2018

[9].陈明.基于主题翻译模型的社区问答中问句检索技术研究[D].武汉理工大学.2018

[10].任鹏程.基于主题排序与推荐的智能全文检索系统研究与实现[D].郑州大学.2018

标签:;  ;  ;  ;  

主题检索论文-李璞,肖宝,孙玉胜,张志锋,邓璐娟
下载Doc文档

猜你喜欢