导读:本文包含了频繁集论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:频繁,规则,数据挖掘,用项,算法,双数,数据。
频繁集论文文献综述
孙文桥,石磊,何健[1](2018)在《使用Apriori算法揭示脑卒中的频繁集》一文中研究指出目的:通过大规模脑卒中初筛数据分析,研究脑卒中发病的危险因素规则模式。方法:采集国家脑卒中筛查与防控数据中心的脑卒中危险因素初筛数据,运用关联规则挖掘方法,研究大范围人群中脑卒中发病相关的危险因素,选择最小支持度为0.1%,最小置信度为10%,挖掘脑卒中发病的模式规则。结果:在初筛表列举的9个危险因素中,既往有短暂性脑缺血发作(TIA)、高血压和脑卒中家族史与脑卒中发病呈弱相关。TIA、房颤或瓣膜性心脏病、脑卒中家族史、高血压以及糖尿病是影响脑卒中发病的最主要的危险因素。当年龄>60岁时,年龄则成为影响脑卒中发病的重要危险因素之一。结论:在21个大概率导致脑卒中发病规则模式中的一些危险因素组合此前并未得到足够的重视,脑卒中发病的危险因素规则模式为临床医学提供了新的有价值的诊断依据。(本文来源于《中国医学装备》期刊2018年03期)
汪峰坤,张婷婷[2](2016)在《一种改进的高效用频繁集挖掘算法》一文中研究指出运用(k-1)阶频繁集与1阶频繁集中较少项数的频繁集组合生成k阶频繁候选项、使用最大效用值系数、各阶频繁项集最大数目限制叁种方法,对高效用频繁集数据挖掘经典算法Two-Phase进行了改进,研究了在低维数据集上不同数据量、高维数据集上不同数据量和不同维数数据集改进算法了运行时间。结果表明:改进方法的算法在高数据量和高维数据集中提高了算法运行效率,减少了运行时间。实验表明,在高维和百万数据级的数据集上,执行时间相对于Two-Phase算法至少节约了50%。(本文来源于《宿州学院学报》期刊2016年07期)
赵秋实,史燕中,方志,蒋遂平[3](2016)在《基于频繁集的伴随车辆检测算法研究》一文中研究指出为从海量机动车行驶数据中找出车辆的伴随车辆信息,本文依据伴随车辆的行为特点及关联挖掘原理提出了一种基于频繁项集的伴随车辆检测算法。通过分析伴随车辆的行驶特点,设定频繁项集的支持度和时间阈值,实现了从单项集到多项集的迭代过程。利用流数据处理方法,添加了针对伴随车辆检测的流数据处理方法,最终使算法可以快速的在海量数据中检测到车辆的伴随车辆信息。经实验验证,本算法可以快速正确的检测出车辆的伴随车辆信息。(本文来源于《软件》期刊2016年04期)
纪怀猛,陆林花,黄风华[4](2016)在《基于支持矩阵的频繁集增量更新算法改进研究》一文中研究指出针对FUP算法在频繁集增量更新时,剪枝效率低下以及候选集验证速度慢的缺陷,提出了基于支持矩阵的频繁集增量更新的高效挖掘算法—SMFUP算法.该算法不仅采用支持矩阵进行整体剪枝来提高剪枝效率,而且进一步结合频繁2项集矩阵加快候选频繁集的验证速度,从而使算法的增量更新效率大大提高.最后通过实验证明了算法改进的有效性.(本文来源于《哈尔滨师范大学自然科学学报》期刊2016年02期)
张凯,寿志勤,郭亚光,马宗华,郑日新[5](2013)在《采用频繁集与关联规则挖掘《王仲奇医案》用药规律》一文中研究指出目的研究《王仲奇医案》用药规律并进行关联性分析,为临床用药提供参考。方法以"咳血"、"虚劳"以及"湿温"医案为研究对象,通过分析医案信息结构以对医案原文进行数据预处理,构建《王仲奇医案》数据库;通过整合Apriori关联规则算法,设计并实现"新安中医临证指导系统",完成数据挖掘结果的可视化,提供"临床查询应用"功能以及用药规律的关联性分析。结果药物关联性分析结果显示治疗"咳血"的常用药物为丝瓜络、茜根以及牡丹皮等,其中核心药对为丝瓜络和茜根;治疗"虚劳"的常用药物为石斛、牡蛎及甘草等,其中核心药对为石斛和牡蛎;治疗"湿温"的常用药物为茯苓、佩兰及杏仁等,其中核心药对为茯苓、佩兰。结论关联规则分析可用于挖掘医案的用药规律,本技术框架可应用于其他医籍的研究。(本文来源于《安徽中医学院学报》期刊2013年03期)
张志强[6](2011)在《基于分块频繁集抽取的Web文本关联分类》一文中研究指出以Web文档特征为基础,进行了分块加权的词频繁集抽取,并利用其生成的极大类频繁集设计了关联规则的文档分类算法,使并联文本分类方法在web文档上得以应用并取得较高的分类准确率与召回率。(本文来源于《福建电脑》期刊2011年11期)
马莉,耿风,韩崇[7](2011)在《一种基于位置向量挖掘最大频繁集的算法》一文中研究指出提出了一种新的挖掘最大频繁集的深度优先算法GMPV。该算法利用集合枚举树,并用位置向量来表示项目子集,挖掘过程中使用了超集检测和基于支持度的剪枝技术,减少了某些项目子集的支持度计算。(本文来源于《扬州职业大学学报》期刊2011年02期)
秘中凯,姜晓红,雷蕾[8](2011)在《一种稳定的并行分布式频繁集挖掘算法及其应用》一文中研究指出为解决大规模医药数据分析中的频繁集挖掘问题,提出一种稳定且具有良好扩展性的并行分布式算法P-FIM。该算法将挖掘任务分割成无相互依赖关系的同构子任务,实现有效的并行计算;并且充分利用Map/Reduce框架和集群环境的优势提高自身的鲁棒性和负载均衡能力。采用最大规模为512万条记录的中医药方剂数据进行算法性能分析实验,其结果表明,该算法在分布式集群环境中表现稳定,而且随着集群规模的增加其加速比接近线性。以P-FIM算法为基础设计实现的中医药数据相关性分析方案,可有效地从大规模临床数据中获得全面、可靠的病、症、药间相关性的信息。(本文来源于《计算机应用与软件》期刊2011年03期)
薛向阳[9](2010)在《双数组穷举法挖掘医药销售数据库频繁集》一文中研究指出为了挖掘医药销售数据库频繁集,采用双数组穷举算法DAEA。该算法主要使用两个数组和穷举算法,实现挖掘医药销售数据库的频繁集功能。该算法的优点是只需对医药销售数据库进行数据预处理就可以直接挖掘该数据库的频繁集,无需把医药销售数据库转换成相应的事务数据库。根据DAEA算法,开发了医药销售数据库频繁集挖掘系统,使用该系统挖掘医药销售数据库的频繁集,挖掘的结果与实际相吻合,说明该算法是可行的和有效的。(本文来源于《现代电子技术》期刊2010年18期)
李广水,李杨,马青霞,宋丁全[10](2010)在《基于频繁集的图像特征抽取》一文中研究指出在图像分析领域,已有不少研究探讨了通过构建图像相邻像素之间的事务数据集,对图像纹理关联规则进行挖掘,但纹理关联规则仅存留最大项的频繁项集会使得很多信息丢失。为此提出了基于频繁项集的图像特征抽取方法,该方法首先基于项集的频繁度及空间分布筛选候选频繁项集,再定义每一个频繁项集的空间表达能力值构建特征集。在遥感图像上进行仿真测试,针对EM算法对初始设置比较敏感的特点,采用了对同一特征集指定不同聚类数目并比较对数似然值确定最终聚类结果的方法。实验结果表明,提出的频繁集对图像特征具有较好的表达。(本文来源于《计算机工程与应用》期刊2010年20期)
频繁集论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
运用(k-1)阶频繁集与1阶频繁集中较少项数的频繁集组合生成k阶频繁候选项、使用最大效用值系数、各阶频繁项集最大数目限制叁种方法,对高效用频繁集数据挖掘经典算法Two-Phase进行了改进,研究了在低维数据集上不同数据量、高维数据集上不同数据量和不同维数数据集改进算法了运行时间。结果表明:改进方法的算法在高数据量和高维数据集中提高了算法运行效率,减少了运行时间。实验表明,在高维和百万数据级的数据集上,执行时间相对于Two-Phase算法至少节约了50%。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
频繁集论文参考文献
[1].孙文桥,石磊,何健.使用Apriori算法揭示脑卒中的频繁集[J].中国医学装备.2018
[2].汪峰坤,张婷婷.一种改进的高效用频繁集挖掘算法[J].宿州学院学报.2016
[3].赵秋实,史燕中,方志,蒋遂平.基于频繁集的伴随车辆检测算法研究[J].软件.2016
[4].纪怀猛,陆林花,黄风华.基于支持矩阵的频繁集增量更新算法改进研究[J].哈尔滨师范大学自然科学学报.2016
[5].张凯,寿志勤,郭亚光,马宗华,郑日新.采用频繁集与关联规则挖掘《王仲奇医案》用药规律[J].安徽中医学院学报.2013
[6].张志强.基于分块频繁集抽取的Web文本关联分类[J].福建电脑.2011
[7].马莉,耿风,韩崇.一种基于位置向量挖掘最大频繁集的算法[J].扬州职业大学学报.2011
[8].秘中凯,姜晓红,雷蕾.一种稳定的并行分布式频繁集挖掘算法及其应用[J].计算机应用与软件.2011
[9].薛向阳.双数组穷举法挖掘医药销售数据库频繁集[J].现代电子技术.2010
[10].李广水,李杨,马青霞,宋丁全.基于频繁集的图像特征抽取[J].计算机工程与应用.2010