导读:本文包含了数据聚簇论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:数据,固态,传感器,索引,特征值,策略,硬盘。
数据聚簇论文文献综述
王浩,张云鹏,谢建华,游会迪[1](2019)在《WSN分层聚簇数据融合在煤矿火灾监测中的应用》一文中研究指出针对煤矿井下多传感器产生大量冗余信息导致火灾监测信息传输延迟、可信度低等问题,提出一种WSN分层聚簇融合的矿井火灾监测技术。先将簇内传感器节点收集的原始数据进行一级融合处理,去除冗余成分,只将具有代表意义的信息传输给簇头节点;再利用传感器节点间信息互补,采用灰色关联理论对簇内融合结果进行二级融合,完成对矿井火灾安全状况的精准分析。结果表明,该方法有效地提高了火灾监测的信息传输速度和精准度。(本文来源于《煤炭技术》期刊2019年09期)
崔超,张宪忠[2](2015)在《DBMS聚簇技术在用户相关数据管理中的应用分析》一文中研究指出Oracle DBMS[1]提供一种聚簇技术用于管理用户数据,即利用聚簇数据表关联序列决定数据物理存储位置,依据多个相关数据表中标识对象同一属性的相同字段键值建立存储索引,从而快速确定用户某类数据物理存储数据块,提高数据检索效率。(本文来源于《齐齐哈尔大学学报(自然科学版)》期刊2015年02期)
魏茹玉[3](2014)在《空间到达—离开数据中异常聚簇查询算法研究》一文中研究指出随着装有GPS功能的智能手机、出租车等大量可以获取时空数据的设备出现,产生了大量的轨迹数据、带地理标签的媒体数据及签到数据。基于这些数据的查询与挖掘也得到了广泛关注,研究成果可以应用于基于位置的服务、选址等领域。在时空数据中有一类表示用户在某一时间到达或者离开某一地点的数据,称之为到达离开数据,它可以是社交网站的签到数据、轨迹数据中的停留点及公共交通中乘客抵达或者离开的位置数据。到达离开数据的时空聚簇可以反映对象在一段时间、空间内的聚集情况。基于到达离开数据,本文提出了异常聚簇查询问题。将到达离开数据进行周期性划分,采用时空聚类算法对周期性的数据进行聚类,通过比较不同周期内聚簇的异常度,查询具有最大异常度的k个聚簇。同时本文还研究了到达聚簇与离开聚簇的对应关系,给定到达数据中的聚簇,在同一周期的离开数据中发现与其相对应的聚簇。到达离开异常聚簇查询可以应用于城市安全管理、基于位置的服务和交通调度等方面。以上研究问题的挑战在于如何对到达离开数据进行有效聚类,聚簇的异常度度量计算以及高效的异常聚簇查询算法设计等。根据到达离开数据的特点,在传统的DBSCAN算法基础上加入时间与聚簇空间规模约束,提出了区域敏感的时空聚类算法,该算法可以产生适应实际区域大小的时空聚簇;在聚簇的异常度计算方面,提出了基于二分图最大匹配的聚簇异常度度量;在异常聚簇查询算法方面,本文设计了基本的两阶段算法、优化的两阶段算法与动态建图匹配算法叁类查询算法。其中,动态建图匹配算法将二分图的建立与匹配相结合,只在需要进行匹配时才动态创建边,通过减少建边的数量来提高算法的运行效率;在到达与离开聚簇的对应方面,本文提出了有效的到达离开聚簇匹配算法,通过对到达与离开聚簇二分图匹配对象的相似程度,找到与已知到达聚簇所对应的离开聚簇。本文从真实的出租车GPS数据中抽取出表示乘客到达离开的信息,生成到达离开数据集,用于测试所提出算法的有效性及运行效率。测试评价结果显示:到达离开异常聚簇结果与实际区域发生的事件具有一定的对应关系;使用所提出的聚类IDBSCAN_T与传统的DBSCAN相比得到的聚簇更适合本文的应用需求;所提出的基于二分图最大匹配法的簇间度量方法与异常聚簇查询算法具有合理性;所提出的叁类算法中动态建图匹配算法具有更高的运行效率。(本文来源于《沈阳建筑大学》期刊2014-11-01)
李顺芬,陈小刚,周密,李鸽子,王玉婵[4](2014)在《基于写数据页聚簇的固态硬盘缓冲算法》一文中研究指出针对Flash写前需擦除,读写I/O开销不均衡等固有缺陷,研究面向闪存缓冲区管理,对提高基于Flash的固态硬盘(Solid State Disk,SSD)访问性能具有重要理论意义和应用价值.通过分析SSD关键技术及现有缓冲区管理算法,实现了一种适用于SSD的基于写数据页聚簇缓冲算法.文章中详细介绍了该算法关键技术及原理,并通过FlashSim仿真平台实现SSD写缓冲.基于仿真结果与传统缓冲算法性能比对,分析得出该缓冲算法可降低SSD随机写次数和SSD数据存储分散性,并提升SSD响应速度.(本文来源于《计算机系统应用》期刊2014年03期)
李顺芬,陈小刚,周密,李鸽子,王玉婵[5](2014)在《基于PCRAM数据页聚簇的缓冲算法》一文中研究指出针对Flash写前需擦除,读写I/O开销不均衡等固有缺陷,研究面向闪存缓冲区管理,对提高基于Flash的固态硬盘(Solid State Disk,SSD)访问性能以及降低系统功耗具有重要理论意义和应用价值。文章提出了一种新型存储架构,并实现了一种适用于SSD的基于相变存储器(Phase Change Memory,PCRAM)数据页聚簇的缓冲算法。文章中详细介绍了基于PCRAM聚簇的缓冲算法关键技术及原理,充分阐述算法相关元数据、存储数据、FTL管理与控制以及详尽分析了缓冲算法的读、写操作控制原理,最后通过FlashSim仿真平台实现SSD写缓冲。基于仿真结果与传统缓冲算法性能比对,分析得出该缓冲算法可降低SSD随机写次数和SSD数据存储分散性,并提升SSD响应速度,降低系统功耗。(本文来源于《中国集成电路》期刊2014年Z1期)
刘洁[6](2013)在《基于B*树聚簇索引数据库中加密字符串数据查询方法研究》一文中研究指出在DAS模型中,用户的数据存储在第叁方提供的数据库服务提供端并由第叁方负责查询、管理,这种拥有数据库管理员权限,可以随时的访问数据库所有数据。这种情况下,数据库中敏感数据对第叁方没有什么机密性可言。为了保证敏感数据的安全性,采用加密方法对数据进行加密处理。但是,这样增加了对加密数据查询的难点。为了提高在加密字符串数据的查询性能,本文给出了一种基于B*树聚簇索引的数据库加密字符串数据查询方法。利用索引特征函数为敏感字符串数据生成数值型索引特征值,并存储在新增的索引字段中,同时在新增的索引字段上建立B*树聚簇索引。在索引字段上使用聚簇,即把拥有相同或相关的索引特征值的记录存储在一个数据块中(或多个数据块中,用链表连接),从而能减少在查询过程中访问磁盘的次数,减少因访问磁盘消耗的时间。将对敏感字符串数据的查询转换为对索引字段的查询,通过B*树聚簇索引能快速的定位查询的数据所在数据块的地址,这样避免了为了查询数据进行全表扫描。本文采取二阶段查询策略:第一阶段,将对加密字段的查询条件转换为对索引字段的查询,通过使用索引特征值进行粗糙查询过滤部分与查询条件无关的记录;第二阶段,将第一阶段返回的记录集合进行解密,然后在明文的基础上进行查询。为了提高对加密字符串数据的模糊查询性能,在叶子节点中增加了两个数据:一个是指针型数组,另一个是标识域。数组存储的是满足一定规则的叶子结点指针。标识域用来标识叶子节点中的右指针和指针数组中第一个指针是否相等。利用通过指针和叶子节点中的右指针可以完成对加密字符串模糊查询,这样避免扫描所有的叶子节点。经过实验证明:本文方法具有较好的查询效率。(本文来源于《江苏科技大学》期刊2013-06-06)
庄嵩杰[7](2013)在《基于P2P的空间矢量数据索引网络聚簇机制的研究》一文中研究指出地理信息系统自从问世以来就备受注目,在短短几十年内就得到了飞速发展和广泛普及。当然,这与计算机技术的发展和因特网在全球范围内的推广也是密不可分的。现如今P2P技术作为一种新的分布式网络技术,为空间矢量地理数据日益增大所带来的负载不均衡和“热点瓶颈”问题提供了新的出路和解决方案。P2P技术颠覆了传统的服务器/客户端网络模型,采用了对等计算技术,使信息能够自由双工传递;它还能有效利用网络中的客户资源,以一种崭新的方式提高了空间矢量地理数据的索引性能和组织效率,为地理信息系统的发展又推上了一个新的里程碑。本文对已有的采用P2P技术的空间矢量数据索引网络进行研究和总结,在地理数据索引网络演化进步的认识过程中,研究了基于空间索引网络的聚簇机制。综合考虑索引网络节点的时延和带宽,利用一个可调权值对二者进行平衡并且计算出节点的性能指标,提出聚簇内组成员节点优化加入算法;在组成员节点达到组最大值的情况下采用权值契合条件,规范了聚簇内节点的动态退出和动态加入,实现组成员节点动态替换算法。利用Peersim仿真工具,我们验证了本文提出的算法的有效性。最后,本文在JXTA平台上设计并实现了基于P2P的空间矢量数据索引网络原型系统,并对所提出的优化算法进行系统测试。测试结果表明,本文提出的聚簇机制能更有效利用客户端的网络资源,在网络环境变化的情况下,能自适应调整节点筛选算法,保持聚簇内节点的高效性,从而提高查询效率。(本文来源于《南京邮电大学》期刊2013-02-25)
谷峪,于戈,胡小龙,王义[8](2010)在《基于监控对象动态聚簇的高效RFID数据清洗模型》一文中研究指出由于RFID(radio frequency identification)技术采用无线射频信号进行数据通信,漏读和多读现象时有发生,降低了其在事件检测中查询结果的准确性.在很多RFID监控应用中,监控物体都是以动态变化的小组为单位进行活动的.通过定义关联度和动态聚簇对各个RFID监控物体所在的小组进行动态的分析,并在此基础上定义了一套关联度维护和数据清洗的模型和算法,通过对图模型进行压缩,提出了基于分裂重组思想的链模型关联度维护策略,提高了维护的时空效率.模拟实验结果表明,该数据清洗模型可以获得较好的效率和准确性.(本文来源于《软件学报》期刊2010年04期)
陈光喜,徐健,成彦[9](2009)在《一种聚簇消减大规模数据的支持向量分类算法》一文中研究指出针对支持向量分类机对大规模数据集训练速度慢的瓶颈,提出一种聚簇消减数据集方法。首先建立样本中心距离函数,计算聚簇集的比例半径,然后利用聚簇集镜像扫描样本点确定簇集类,同一类样本特性的聚簇集中只保留代表样本点,建立异类点删除矩阵,通过上述方法消减样本集。证明了这种簇消减算法有较低的时间复杂度,并利用实验说明了保留代表点的有效意义。最后通过随机数据和UCI标准数据库验证了算法在保证分类精度的同时提高了分类速度。(本文来源于《计算机科学》期刊2009年03期)
康宁,杨晓春,郭茜,于戈[10](2008)在《传感器聚簇网络中一种面向感知数据的变长窗口动态调整技术》一文中研究指出无线传感器网络中感知的数据是连续实时的流式数据.由于传感器节点存储空间和处理能力有限,需要用滑动窗口技术将数据流分割成段进行后续处理.确定窗口长度是使用滑动窗口技术必须要解决的问题,包括如何选择滑动窗口的大小才能充分利用感知数据的周期性和相关性,最大程度地减少传感器网络的数据传输量.提出了一种面向感知数据的滑动窗口动态调整技术,该技术利用网络节点数据的关联性通过计算共享数据段的大小调节各节点的滑动窗口长度,并根据节点数据变化动态收缩探测到适当的窗口长度,在节省网络传送数据量的同时还能及时发现数据的异常变化.基于真实数据的实验结果表明,通过动态调整方法确定的窗口大小可以有效地减少数据传送量.(本文来源于《第二十五届中国数据库学术会议论文集(二)》期刊2008-10-24)
数据聚簇论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
Oracle DBMS[1]提供一种聚簇技术用于管理用户数据,即利用聚簇数据表关联序列决定数据物理存储位置,依据多个相关数据表中标识对象同一属性的相同字段键值建立存储索引,从而快速确定用户某类数据物理存储数据块,提高数据检索效率。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
数据聚簇论文参考文献
[1].王浩,张云鹏,谢建华,游会迪.WSN分层聚簇数据融合在煤矿火灾监测中的应用[J].煤炭技术.2019
[2].崔超,张宪忠.DBMS聚簇技术在用户相关数据管理中的应用分析[J].齐齐哈尔大学学报(自然科学版).2015
[3].魏茹玉.空间到达—离开数据中异常聚簇查询算法研究[D].沈阳建筑大学.2014
[4].李顺芬,陈小刚,周密,李鸽子,王玉婵.基于写数据页聚簇的固态硬盘缓冲算法[J].计算机系统应用.2014
[5].李顺芬,陈小刚,周密,李鸽子,王玉婵.基于PCRAM数据页聚簇的缓冲算法[J].中国集成电路.2014
[6].刘洁.基于B*树聚簇索引数据库中加密字符串数据查询方法研究[D].江苏科技大学.2013
[7].庄嵩杰.基于P2P的空间矢量数据索引网络聚簇机制的研究[D].南京邮电大学.2013
[8].谷峪,于戈,胡小龙,王义.基于监控对象动态聚簇的高效RFID数据清洗模型[J].软件学报.2010
[9].陈光喜,徐健,成彦.一种聚簇消减大规模数据的支持向量分类算法[J].计算机科学.2009
[10].康宁,杨晓春,郭茜,于戈.传感器聚簇网络中一种面向感知数据的变长窗口动态调整技术[C].第二十五届中国数据库学术会议论文集(二).2008