导读:本文包含了倒排文件论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:文件,索引,效率,信息检索,搜索引擎,向量,管理器。
倒排文件论文文献综述
时亚南,束文杰,于国欣[1](2015)在《倒排文件页式存储方法》一文中研究指出页是磁盘与内存进行数据交换的基本单位,它在操作系统、数据库管理系统以及倒排文件的数据组织中占据十分重要的地位.为减少倒排索引的磁盘I/O读写开销,提出了一种倒排文件按页存储的构建方法,实现了按页读写文件.该方法主要包括磁盘I/O层设计、页管理器设计以及堆文件管理器设计叁个部分,实现了页大小可变的分块式数据文件管理,支持页内定长记录、变长记录的组装以及超长数据记录的跨页存储.经实验测试,结果表明该方法是行之有效的,可以将其应用到实际的垂直搜索引擎中.(本文来源于《计算机系统应用》期刊2015年05期)
陈浩[2](2012)在《基于倒排文件中一种性能模型的研究》一文中研究指出倒排文件作为现代大规模搜索引擎工作的一个核心技术,其原理简单,具备灵活高效的特点,具体体现在其根据需要可做到适当的变通。本文通过在给定搜索引擎系统内部参数的前提下对其吞吐率的研究,建立一种倒排文件性能模型,该模型有效地提高了倒排文件的运行效率。(本文来源于《计算技术与自动化》期刊2012年03期)
杨晓波[3](2012)在《倒排文件索引缓存机制的优化》一文中研究指出为了有效提高搜索引擎检索服务系统的整体性能,提出了一种基于倒排文件索引的缓存机制优化方法。具体研究过程是:首先分析倒排文件缓存的体系结构和数据加载,接着讨论负载数据对倒排文件缓存和缓存替换算法的影响,最后通过设计仿真实验研究倒排文件的缓存优化。研究结果表明,采用倒排文件索引的缓存机制优化方法可以明显减少磁盘系统I/O访问次数,提高磁盘系统带宽的利用率。(本文来源于《计算机系统应用》期刊2012年05期)
严浪[4](2011)在《倒排文件技术设计》一文中研究指出Maze系统是基于P2P,采用集中式架构管理用户和资源的内容交换系统。文章对Maze检索系统的性能问题进行了研究,讨论检索效率的影响因素,并提出改进的方法和途径。(本文来源于《计算机与数字工程》期刊2011年03期)
刘小珠,彭智勇,陈旭[5](2010)在《高效的随机访问分块倒排文件自索引技术》一文中研究指出针对倒排索引空间开销大、查询时间效率低以及难以同时支持连接布尔查询和排序查询的问题,提出了一种同时提高空间效率与查询时间效率的高效随机访问分块倒排文件自索引RABIF.为了在降低空间消耗的同时支持连接布尔查询与排序查询,RABIF将倒排列表进行合理地分块,然后对每个子块的不同部分采用相应的压缩方式,在不需要插入任何附加辅助信息的前提下实现压缩索引的快速定位与随机访问.理论分析及实验结果表明,与忽略倒排文件自索引SIF相比,提出的RABIF空间开销平均减少5.3%,布尔查询时间平均减少17.8%;对于0.2%与1%排序查询,查询时间分别平均减少34.4%与27.5%.(本文来源于《计算机学报》期刊2010年06期)
宋懿,国德峰[6](2008)在《基于压缩倒排文件的中文全文检索仿真系统》一文中研究指出探讨基于压缩倒排文件的中文全文检索技术,包括数据压缩方法、存储、检索与排名机制。借助中科院的高精度ICTCLAS中文分词系统,采用C++/STL语言仿真实现了一个中文全文检索系统。该文列出部分关键代码,利用搜狗实验室提供的数据进行实验。通过改进压缩算法,系统的磁盘利用率提高了近80%。(本文来源于《计算机工程》期刊2008年09期)
孙琦,牛军钰[7](2007)在《基于倒排文件的索引模型综述》一文中研究指出1引言文本索引中一般存放着文本库词典,记录着相应索引项的出现位置及其一些统计信息。经典的索引模型包括倒排文件,签名文件,位图,PatriciaTrie等。文[9]中考察了倒排文件与签名文件在索引文本数据方面的性能,结果表明倒排文件的效率(本文来源于《第二十四届中国数据库学术会议论文集(技术报告篇)》期刊2007-10-20)
王虎,王潜平[8](2006)在《对几种倒排文件压缩技术的研究与分析》一文中研究指出要提高文件检索系统的性能,需要对倒排文件压缩技术进行研究与对比,以使文件检索系统在最大压缩比和最快的解压速度间寻找均衡,以到达最大的吞吐量。对Golomb,Eliasgamma,Eliasdelta,VariableByteEncoding和BinaryInterpolativeCoding五种压缩技术通过在Windows操作系统下对theTRECWallStreetJournalcollection文件系统进行存取与压缩,从CPU时钟周期角度来对比各个算法的压缩比、压缩与解压缩的时间和对文件的读取和查询所花费的时间,并对它们进行了一个综合的评测。(本文来源于《计算机工程与应用》期刊2006年07期)
张伟,陈芸,邹汉斌,周霆[9](2005)在《基于倒排文件的布尔规则隐藏算法》一文中研究指出介绍了关联规则方法的研究概况,提出了利用基于倒排文件的比特向量操作实现布尔规则隐藏算法,以及对实验结果的评估分析,并对未来数据挖掘领域中涉及的信息隐藏研究进行了展望。(本文来源于《计算机工程》期刊2005年14期)
彭波,李晓明[10](2005)在《搜索引擎倒排文件的一种分块组织技术》一文中研究指出检索效率对大规模信息检索系统至关重要 .本文基于Web搜索应用背景 ,针对用户查询的统计特性 ,提出了一种分块组织倒排文件的方法 .通过建立检索性能模型 ,进行分析和仿真实验 ,结果表明这一方法下的检索算法可以有效的减少检索执行时间 ,并得到这一组织方式中分块参数的优化选择方法 .(本文来源于《电子学报》期刊2005年02期)
倒排文件论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
倒排文件作为现代大规模搜索引擎工作的一个核心技术,其原理简单,具备灵活高效的特点,具体体现在其根据需要可做到适当的变通。本文通过在给定搜索引擎系统内部参数的前提下对其吞吐率的研究,建立一种倒排文件性能模型,该模型有效地提高了倒排文件的运行效率。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
倒排文件论文参考文献
[1].时亚南,束文杰,于国欣.倒排文件页式存储方法[J].计算机系统应用.2015
[2].陈浩.基于倒排文件中一种性能模型的研究[J].计算技术与自动化.2012
[3].杨晓波.倒排文件索引缓存机制的优化[J].计算机系统应用.2012
[4].严浪.倒排文件技术设计[J].计算机与数字工程.2011
[5].刘小珠,彭智勇,陈旭.高效的随机访问分块倒排文件自索引技术[J].计算机学报.2010
[6].宋懿,国德峰.基于压缩倒排文件的中文全文检索仿真系统[J].计算机工程.2008
[7].孙琦,牛军钰.基于倒排文件的索引模型综述[C].第二十四届中国数据库学术会议论文集(技术报告篇).2007
[8].王虎,王潜平.对几种倒排文件压缩技术的研究与分析[J].计算机工程与应用.2006
[9].张伟,陈芸,邹汉斌,周霆.基于倒排文件的布尔规则隐藏算法[J].计算机工程.2005
[10].彭波,李晓明.搜索引擎倒排文件的一种分块组织技术[J].电子学报.2005