导读:本文包含了数据析取论文开题报告文献综述、选题提纲参考文献,主要关键词:数据,数据仓库,不确定,多维,数据挖掘,规则,统计学。
数据析取论文文献综述写法
梁珺,刘云[1](2016)在《基于析取规则对不确定数据挖掘的优化研究》一文中研究指出在商业、医疗等数据分析中,不知道存在或不存在的一些项目事件组成的数据叫做不确定数据,它的特点是离散型随机变量的概率分布,不确定数据中的挖掘算法研究是当前大数据分析中的重要方向.针对不确定数据的随机变量性特征,有效提高挖掘结果的置信度和提高算法运行时间,本文提出一种挖掘析取关联规则的算法DRUD,利用模糊集的方法选取2元频繁项集,对比最小支持度,完成有效的析取规则提取.经过在大量不同不确定数据库中仿真表明,对比类似算法UApriori和PFCIM,本文所提出的DRUD算法产生的规则置信度得到提高,算法效率有较好改进,新的算法更加适用于不确定数据中的大数据挖掘应用.(本文来源于《四川大学学报(自然科学版)》期刊2016年04期)
梁珺[2](2016)在《基于不确定数据中析取规则的挖掘优化研究》一文中研究指出随着信息时代和计算机技术的迅速发展,数据存储量和数据多样性不断增加,我们通过数据挖掘技术来处理这些数据,挖掘出它们之间的联系,从而获取有用的知识。关联规则是数据挖掘技术中一个重要的研究方向。特别是互联网应用的剧增,具有离散型随机变量概率分布特点的不确定数据不断涌现,成为数据集中的一个主要部分,同时,数据的存储量急剧增多,使得现存的关联规则挖掘方法不能很好的适应现在的数据模式。传统的关联规则研究大多都需要多次扫描整个事务数据集,在生成候选项集、项集支持度计算过程中都需要花费大量时间,且现阶段算法大多集中于提取类似X(?)Y1Y2…Yk-1的合取关联规则。对于不确定数据,提取合取规则时在很多现实情况下容易丢失小概率事件的信息,因此不能很好的给用户提供更全面的知识和事物之间的联系,在时空性能和效率方面都有待优化。针对传统算法的不足和不确定数据的随机变量性特征,本文提出了一种不确定性数据中挖掘析取关联规则的算法(Disjunctive rules mining from uncertain database, DRUD),只需扫描一次原始数据集,利用模糊集的概念选取2元频繁项集并计算各项的支持度,然后提取所有关于2元频繁项集的相关析取范式,对比最小支持度和最小置信度,完成有效的析取规则提取。在关联规则挖掘算法的验证中,由于算法的运行时间和所提取规则的置信度是两个通用的验证参数,本文与不确定数据中提取合取关联规则的类似常规算法进行类比研究。本文利用JAVA平台分别在标准的CHESS, MUSHROOM和T20I6D300K数据集中将所提算法DRUD与传统的U-Apriori算法、UFP-growth算法进行了类比仿真,仿真主要类比分析了算法运行时间和所生成规则的平均置信度两个指标。仿真结果表明,在不确定数据集中,与其他两个算法相比,DRUD算法仅需扫描整个事务数据集一次,算法挖掘频繁项目集的时间明显减小,且算法生成的析取规则的平均置信度有所提高。(本文来源于《昆明理工大学》期刊2016-05-01)
徐凤生,闫立梅,史开泉[3](2015)在《具有属性析取萎缩-扩张特征的动态数据智能挖掘》一文中研究指出S-粗集(singular rough sets)是把动态特征引入到Z.Pawlak粗集中对其加以改进而提出的,S-粗集具有动态特征。S-粗集具有3种形式:单向S-粗集(one direction singular rough sets)、单向S-粗集对偶(dual of one direction singular rough sets)与双向S-粗集(two direction singular rough sets);在一定条件下,单向S-粗集、单向S-粗集对偶与双向S-粗集被还原成Z.Pawlak粗集。利用单向S-粗集和单向S-粗集对偶给出具有属性析取特征的动态数据智能挖掘与应用;属性析取是数据具有的逻辑特征之一。主要结果是:利用单向S-粗集、单向S-粗集对偶结构,给出属性析取萎缩-扩张特征的动态数据生成与它的属性析取萎缩-扩张关系;给出数据推理与推理模型;利用数据推理给出动态数据智能挖掘定理;利用这些理论结果,给出动态数据智能挖掘-智能认知的应用。(本文来源于《计算机科学》期刊2015年05期)
周学君,杨敏[4](2005)在《面向高校就业的数据仓库中数据析取技术及实现》一文中研究指出数据仓库技术在零售、银行、保险等行业得到应用,产生了许多数据析取方法.利用大学生在校学习和生活积累的数据,以高校就业为主题,介绍应用系统建设主题数据仓库过程中采用的数据析取技术及实现方法,为系统的就业分析提供有用的数据.(本文来源于《叁峡大学学报(自然科学版)》期刊2005年03期)
陈焕东,余先川,侯景儒,俞晨[5](2005)在《一种数据挖掘方法-析取克立格法理论及其在品位估计中的应用》一文中研究指出非线性现象广泛存在于许多自然科学研究之中。非线性空间信息统计学主要包括对数正态克立格、指示克立格、析取克立格、条件期望等理论方法,已在矿床储量估计中显示出其强大的生命力。其中析取克立格法(DK)介于线性地质统计学和条件期望之间的新方法,其前提假设Z(x)服从一、二元正态分布,并利用厄尔米特多项式展开进行估计,该方法更有效、准确、易实现,并能很好地估计Z(x)的任意函数,解决可回采储量估计等现实问题。该文主要研究了二元高斯分布法、正态变换和埃尔米特多项式的应用,并实现了析取克立格的算法,再现了它在真值空间变异性上的优势。(本文来源于《计算机工程与应用》期刊2005年10期)
孙华梅,黄梯云[6](2004)在《数据析取系统的概念模式及其在客户关系管理中的应用》一文中研究指出本文对决策支持系统从管理信息系统析取数据的有关问题进行研究,提出了数据析取系统的四种模式,研究了它们的实现方式,并介绍了在客户关系管理中的应用。(本文来源于《预测》期刊2004年01期)
喻小光[7](2002)在《数据仓库的数据析取技术研究与实现》一文中研究指出本文描述了一个数据仓库通用数据析取软件的设计与实现。随着社会的进步和科技的发展,分析决策成为了各行各业的生命线。数据仓库技术凭借其在数据存储与组织结构上的优势为决策支持系统提供强有力的数据支持。本软件将来源数据经过集成、转换、清洗、优化后加载到数据仓库中,保障数据仓库拥有高质量的数据,为决策分析系统能有效地工作奠定基础。 本文第一章阐述本课题的意义并对数据仓库技术进行简要分析;二—六章介绍系统设计开发的思路和实现方法;最后一章进行总结和展望。 本软件采用了叁层体系结构,使用COM技术和MTS开发和管理中间层组件。我们将数据的集成、转换、清洁、优化等模块都以COM组件形式进行了封装,形成.DLL文件,这样有利于系统的升级、维护和移植。 本文分析了形形色色的数据析取方法,将其归纳为集成、转换、清洁,并提出有必要对数据进行优化,如数据平滑、规范化等,以期更好地支持数据挖掘。 本软件支持对大部分结构化和半结构化数据的析取,包括各种关系数据库,Excel表格,有分隔符的文本文件,XML文件。特别是对XML文件的析取,是本软件特色之一。我们提出了一种基于规则驱动的XML模式数据到关系模式的转换方法,用于完成对XML数据的析取。 系统将用户定义的析取过程封装为析取包(Package),实现一次定义多次使用。为了提高析取包的执行效率,我们采用了微软的DTS作为传输工具,它大大加快了数据析取的速度。(本文来源于《华侨大学》期刊2002-04-01)
陈晓云,郭朝珍[8](2002)在《数据仓库数据析取工具的设计与实现》一文中研究指出针对数据仓库中的数据析取问题 ,以通用性为目标 ,分析、设计并利用MicrosoftSQLServer 7.0的DTS编程接口实现了数据析取工具 ,从而实现了从各种类型OLTP数据库系统到数据仓库的数据析取(本文来源于《福州大学学报(自然科学版)》期刊2002年01期)
陈晓云,郭朝珍[9](2001)在《数据析取分类研究与设计》一文中研究指出对数据仓库体系结构进行分析的基础上给出了数据析取的定义 ,并对数据析取过程进行分类研究 ,分别对这几类数据析取过程进行了分析和描述 ,由此对数据析取工具进行总体设计。(本文来源于《计算机应用》期刊2001年08期)
陈京民[10](2000)在《数据析取技术与商业企业经营管理》一文中研究指出一、数据析取技术在商业企业营销活动中的应用 顾客是商业企业最为宝贵的资源,如何争取和留住顾客是商业企业营销工作的核心。为此,企业需要站在顾客的立场上,及时了解顾客的需求和变化,从而按照顾客的价值观念和需求来销售产品。在90年代诞生的新型营销策略:数据析(本文来源于《财金贸易》期刊2000年09期)
数据析取论文开题报告范文
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
随着信息时代和计算机技术的迅速发展,数据存储量和数据多样性不断增加,我们通过数据挖掘技术来处理这些数据,挖掘出它们之间的联系,从而获取有用的知识。关联规则是数据挖掘技术中一个重要的研究方向。特别是互联网应用的剧增,具有离散型随机变量概率分布特点的不确定数据不断涌现,成为数据集中的一个主要部分,同时,数据的存储量急剧增多,使得现存的关联规则挖掘方法不能很好的适应现在的数据模式。传统的关联规则研究大多都需要多次扫描整个事务数据集,在生成候选项集、项集支持度计算过程中都需要花费大量时间,且现阶段算法大多集中于提取类似X(?)Y1Y2…Yk-1的合取关联规则。对于不确定数据,提取合取规则时在很多现实情况下容易丢失小概率事件的信息,因此不能很好的给用户提供更全面的知识和事物之间的联系,在时空性能和效率方面都有待优化。针对传统算法的不足和不确定数据的随机变量性特征,本文提出了一种不确定性数据中挖掘析取关联规则的算法(Disjunctive rules mining from uncertain database, DRUD),只需扫描一次原始数据集,利用模糊集的概念选取2元频繁项集并计算各项的支持度,然后提取所有关于2元频繁项集的相关析取范式,对比最小支持度和最小置信度,完成有效的析取规则提取。在关联规则挖掘算法的验证中,由于算法的运行时间和所提取规则的置信度是两个通用的验证参数,本文与不确定数据中提取合取关联规则的类似常规算法进行类比研究。本文利用JAVA平台分别在标准的CHESS, MUSHROOM和T20I6D300K数据集中将所提算法DRUD与传统的U-Apriori算法、UFP-growth算法进行了类比仿真,仿真主要类比分析了算法运行时间和所生成规则的平均置信度两个指标。仿真结果表明,在不确定数据集中,与其他两个算法相比,DRUD算法仅需扫描整个事务数据集一次,算法挖掘频繁项目集的时间明显减小,且算法生成的析取规则的平均置信度有所提高。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
数据析取论文参考文献
[1].梁珺,刘云.基于析取规则对不确定数据挖掘的优化研究[J].四川大学学报(自然科学版).2016
[2].梁珺.基于不确定数据中析取规则的挖掘优化研究[D].昆明理工大学.2016
[3].徐凤生,闫立梅,史开泉.具有属性析取萎缩-扩张特征的动态数据智能挖掘[J].计算机科学.2015
[4].周学君,杨敏.面向高校就业的数据仓库中数据析取技术及实现[J].叁峡大学学报(自然科学版).2005
[5].陈焕东,余先川,侯景儒,俞晨.一种数据挖掘方法-析取克立格法理论及其在品位估计中的应用[J].计算机工程与应用.2005
[6].孙华梅,黄梯云.数据析取系统的概念模式及其在客户关系管理中的应用[J].预测.2004
[7].喻小光.数据仓库的数据析取技术研究与实现[D].华侨大学.2002
[8].陈晓云,郭朝珍.数据仓库数据析取工具的设计与实现[J].福州大学学报(自然科学版).2002
[9].陈晓云,郭朝珍.数据析取分类研究与设计[J].计算机应用.2001
[10].陈京民.数据析取技术与商业企业经营管理[J].财金贸易.2000