导读:本文包含了分布式数据挖掘论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:分布式,数据挖掘,光伏,数据,热点,抗干扰,电站。
分布式数据挖掘论文文献综述
邹静昭,赵宁,卢翠荣,武琳[1](2019)在《复杂属性环境非关系型分布式大数据挖掘仿真》一文中研究指出对复杂属性环境的数据识别有利于充分挖掘大数据包含的信息与价值,提出一种非关系型分布式大数据挖掘算法。首先,引入分布式的最大频繁项算法模型,在物理分散逻辑下,对非关系型数据应用分布式方法进行数据分析,利用建立候选频繁项的搜索条件降低数据检测次数,并采取划分投影法,计算各频繁项对应的分区编号,将其规划到不同的分区中,从而优化冗余频繁项,然后针对数据库中大数据的数据特征建立各个属性的关联度,根据Boosting聚类方法,把由弱聚类得到的局部模型在每次迭代过程中升级为全局模型,再对其进行区块划分,并利用划分质量重新调整迭代采样率,最终得到聚类结果,完成数据挖掘。通过仿真验证了非关系型分布式大数据挖掘具有显着的准确性、稳定性和实用性。(本文来源于《计算机仿真》期刊2019年10期)
李艳红[2](2019)在《基于云计算的分布式数据挖掘系统设计研究》一文中研究指出在深入分析数据挖掘需求基础上,基于云计算环境,提出一个分布式数据挖掘系统设方案。通过充分考虑系统用户需求及数据挖掘特点,制定系统的总体架构,即:业务应用层、服务中间层、基础能力支持层,接着,提出各层实现细节,确保有效开展数据挖掘和分析工作。最后,对系统延迟性和吞吐量展开测试,测试结果表明,所设计系统平均查询延迟时间是2.43 s,表明延迟性、吞吐量均能达到实际要求,有利于提升数据挖掘工作的高效率、准确性。(本文来源于《电子设计工程》期刊2019年11期)
林春红,仲立军,彭斐,郑辉[3](2019)在《基于数据挖掘的分布式光伏结算管理研究》一文中研究指出分布式光伏近年来呈现爆发式增长趋势,供电公司面临用户服务、结算效率和支付安全等多重挑战。嘉兴供电公司通过对国网系统相关单位进行调研访谈,并借鉴大数据分析的理念,对大量非结构化数据进行汇总分析,确定了分布式光伏结算管理中存在的五类问题及每类问题的高频场景,通过整合业务流程、提升系统功能、强化部门协作等举措提升分布式光伏结算管理水平。(本文来源于《现代信息科技》期刊2019年06期)
贾丽,杜浩,赵一鸣,梁孝彬,吴思[4](2019)在《基于Hadoop分布式架构的数据挖掘与服务系统设计》一文中研究指出随着信息化技术和终端智能的迅猛发展,需要处理的数据呈现数据量大、非结构化等特点,使数据的存储、挖掘成为当前亟待解决的问题。本文基于Hadoop分布式架构设计了一套数据挖掘与服务系统,有效实现数据的分布存储、处理及深度挖掘,发挥数据的内在价值。(本文来源于《数字技术与应用》期刊2019年02期)
姜文秀[5](2019)在《基于分布式环境的数据挖掘算法研究》一文中研究指出随着海量数据处理的关注程度逐渐提升,分布式数据挖掘算法也成为一个热点研究领域。在实际挖掘特定兴趣时,会用到数据挖掘中的关联规则,数据的海量性必然要求采用分布式挖掘方法,以此减轻计算压力。分布式环境中的数据挖掘可以将数据分发到不同节点进行处理,最后将局部结果汇总,从而完成整个计算过程。(本文来源于《电脑知识与技术》期刊2019年02期)
何婕,赖敏[6](2018)在《云计算平台中分布式Hadoop数据挖掘关键技术研究(英文)》一文中研究指出云计算环境下的大数据特征挖掘是大数据统计及分析的基础。为了提高聚类的准确度和速度,设计了一种基于分布式Hadoop平台和熵加权特征选择的数据挖掘方案。该方案首先采用无回路有向图对Hadoop平台下的Map Reduce作业流调度问题进行了分析。然后采用并行Map Reduce执行过程完成分布式计算。最后,采用熵加权聚类算法实现海量数据挖掘。仿真结果显示,提出的数据挖掘方案具有较好聚类效果和运行效率。(本文来源于《机床与液压》期刊2018年24期)
张凯斐[7](2018)在《基于AGENT的分布式数据挖掘模型》一文中研究指出由于单个数据挖掘模型在处理复杂数据时不能得到精准的处理结果,为此提出并设计了基于AGENT的分布式数据挖掘模型。利用用户AGENT模块收集数据信息并产生交互行为,通过分布式数据挖掘模块对数据进行AGENT管理与挖掘,最后实现数据的AGENT预处理,并将处理后的数据在全局知识库内进行保存。实验论证结果表明,基于AGENT的分布式数据挖掘模型能够提高数据处理结果的精准性,具备有效性。(本文来源于《计算机产品与流通》期刊2018年10期)
朱贺,黄克清[8](2018)在《分布式数据挖掘算法在热点微博分析系统中的应用》一文中研究指出为了适应当前互联网时代大量数据待分析的需求,本文设计了将分布式贝叶斯分类算法和分布式K-Means聚类算法结合起来,设计了一套热点微博分析系统。并通过实验证明该系统性能的优越性,为进一步实现准备、快速的数据挖掘系统奠定了基础。(本文来源于《数字通信世界》期刊2018年10期)
杨珂[9](2018)在《基于数据挖掘的分布式光伏电站投建人细分模型研究》一文中研究指出简单以分布式光伏电站投建人的投资规模对投建人进行细分而未能充分考虑其潜在价值的方式,会低估投建人对电商平台的贡献。因此从投建人的当前价值和潜在价值两个维度构建了分布式光伏电站投建人价值评估体系。利用投建人的客观数据,借助聚类算法,建立了基于投建人当前价值和潜在价值的二维投建人细分模型。针对每种类型的投建人价值特征提出具体的营销策略,为电商平台的营销决策提供了科学依据。(本文来源于《数字中国 能源互联——2018电力行业信息化年会论文集》期刊2018-09-15)
党引,郭景维,李强[10](2018)在《基于大数据算法的NoSQL分布式数据挖掘技术研究》一文中研究指出本研究对通过分析大数据挖掘方法,对数据库的选择的挖掘方法重要性进行确定,并提出NoSQL分布式大数据挖掘方法。实验总运行时间130min,在进行到65min时,将转动、平移、收缩共3种干扰因素加入初始大数据矩阵中。实验表明,本研究采用的分布式挖掘方法的挖掘准确性最高,大数据属性的特征、位置、方向、长度均高于97%,挖掘准确性的平均值为98.21%;与MYSQL挖掘方法相比,本方法的错误挖掘很少存在,挖掘工作的准确性较强,抗干扰性较好;在大数据矩阵中,本研究方法的转动干扰、平移干扰、收缩干扰的抵御能力均较好,在挖掘工作稳定性较强;本研究的挖掘方法的实用性参数要高出MYSQL挖掘方法约161.54%,实用性较强。(本文来源于《第二届智能电网会议论文集》期刊2018-08-30)
分布式数据挖掘论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
在深入分析数据挖掘需求基础上,基于云计算环境,提出一个分布式数据挖掘系统设方案。通过充分考虑系统用户需求及数据挖掘特点,制定系统的总体架构,即:业务应用层、服务中间层、基础能力支持层,接着,提出各层实现细节,确保有效开展数据挖掘和分析工作。最后,对系统延迟性和吞吐量展开测试,测试结果表明,所设计系统平均查询延迟时间是2.43 s,表明延迟性、吞吐量均能达到实际要求,有利于提升数据挖掘工作的高效率、准确性。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
分布式数据挖掘论文参考文献
[1].邹静昭,赵宁,卢翠荣,武琳.复杂属性环境非关系型分布式大数据挖掘仿真[J].计算机仿真.2019
[2].李艳红.基于云计算的分布式数据挖掘系统设计研究[J].电子设计工程.2019
[3].林春红,仲立军,彭斐,郑辉.基于数据挖掘的分布式光伏结算管理研究[J].现代信息科技.2019
[4].贾丽,杜浩,赵一鸣,梁孝彬,吴思.基于Hadoop分布式架构的数据挖掘与服务系统设计[J].数字技术与应用.2019
[5].姜文秀.基于分布式环境的数据挖掘算法研究[J].电脑知识与技术.2019
[6].何婕,赖敏.云计算平台中分布式Hadoop数据挖掘关键技术研究(英文)[J].机床与液压.2018
[7].张凯斐.基于AGENT的分布式数据挖掘模型[J].计算机产品与流通.2018
[8].朱贺,黄克清.分布式数据挖掘算法在热点微博分析系统中的应用[J].数字通信世界.2018
[9].杨珂.基于数据挖掘的分布式光伏电站投建人细分模型研究[C].数字中国能源互联——2018电力行业信息化年会论文集.2018
[10].党引,郭景维,李强.基于大数据算法的NoSQL分布式数据挖掘技术研究[C].第二届智能电网会议论文集.2018