导读:本文包含了数据立方体模型论文开题报告文献综述、选题提纲参考文献,主要关键词:立方体,数据,多维,舆情,模型,网络,分布式。
数据立方体模型论文文献综述写法
张晓杉[1](2014)在《基于多结构数据立方体的多维分析挖掘模型》一文中研究指出互联网技术的迅速发展促使现代社会进入到了“网络化社会”的时代。每天互联网上都会产生海量的数据,而以文本数据为代表的以半结构化或非结构化的形式产生和存储的数据占了其中绝大部分。如何科学有效的对这些文本数据进行处理、分析,进而获取其中有价值的信息成为了各大公司和组织亟待解决的问题。为此业界从不同方向进行了探索,其中使用OLAP (联机分析处理)操作对其进行分析挖掘是其中一种可行的研究方向。常规的数据立方体是构建在结构化数据之上的,难以有效的支持非结构化的数据。因此对非结构化数据的立方体构建方法进行研究是具有十分重要意义的。本文以对海量短文本热门主题的分析挖掘任务为研究背景,提出了一种构建文本立方体的方案。该方案在文本立方体的维度获取和度量计算两方面进行了研究:1、结合分布式聚类方法生成文本的主题,进而获得非结构化数据集的主题维度,该方法大大简少了文本立方体维度构建的人工成本。2、提出了一种基于文本TFIDF值的事实表度量单元计算方法,从而允许在文本立方体中应用常规的OLAP计算函数对文本集的主题热度进行度量,无需定义新的度量方法。针对本应用中文本数据集巨大,预处理过程复杂,单机处理效率低下的特点,本文设计并实现了一套基于MapReduce分布式并行计算框架下的预处理方案。实验结果表明,该方法具有较强的实用性和可扩展性,它能够高效的为大规模文本数据集构建立方体模型,在构建的文本立方体上使用OLAP操作进行分析能够有效的挖掘文本数据集中所包含的热门信息,大大提高了文本数据分析挖掘的效率(本文来源于《兰州理工大学》期刊2014-03-20)
古晓艳,王伟平,孟丹,杨秀峰,周江[2](2013)在《高效支持多维网络OLAP的数据立方体模型CI-DCG》一文中研究指出针对现有联机分析处理(OLAP)方法的空间开销随着数据维度增加呈指数级增长,因而不适用于维度较高的多维网络应用的问题,提出了一种新的多维网络数据立方体模型——封闭冰山双立方图(CI-DCG)。该模型通过引入邻接立方体的概念,将其实例化过程转化为两个计算传统数据立方体的阶段,从而可将传统数据立方体生成算法中较为成熟的空间优化技术引入到多维网络中。在保证多维网络上OLAP查询处理效率的同时,将多维网络数据立方体生成算法的空间复杂度降为多项式级别。理论分析和实验结果均表明,该模型在空间开销和查询性能方面均优于已有的多维网络OLAP模型,并且数据维度越高,这种优势就越明显。(本文来源于《高技术通讯》期刊2013年10期)
陈焱[3](2011)在《网络舆情话题的数据立方体模型分析》一文中研究指出通过详细分析网络舆情组成要素,利用数据仓库技术,建立网络舆情话题数据立方体模型。该模型涵盖网络舆情的大部分组成要素,而且可以根据实际需要进行扩展。实际案例分析表明,应用该模型可以对网络舆情话题进行多角度、深层次的挖掘分析,分析结果能比较客观地反映网络舆情变化发展的规律和趋势,有助于全面地了解网络舆情话题,并为网络舆情预警提供必要的信息。(本文来源于《图书情报工作》期刊2011年24期)
车飞[4](2010)在《基于数据立方体模型的叁维散点图快速可视化技术》一文中研究指出近年来,研究者越来越重视通过应用数据挖掘技术在海量数据中发现知识和规则。在数据挖掘过程中,数据可视化技术是保证挖掘结果便于用户理解数据和进行交互的重要途经,因此数据可视化技术的发展同样受到了广泛关注。目前在数据可视化技术领域中存在以下问题:数据规模不断增加,用户对数据分析的交互性要求不断提升使得在针对大规模数据可视化时,加快可视化过程和丰富用户交互性操作成为可视化技术中亟待解决的问题。本文针对以上问题针设计了面向叁维散点图的数据立方体可视化模型,其主要思想是在尽量保证原始数据分布不变的情况下,使用质量较高的可视化样本,通过对约简后的数据集进行可视化,来达到有效减少可视化时间的目的。同时本模型还支持使用多种用户交互性操作。本文的主要工作有如下几个方面:首先本文提出了面向叁维散点图的数据立方体可视化模型。此模型的设计思想是将数据空间划分成若干个元数据立方体空间。每一个元数据立方体作为一个结点,构成一棵立方体树。通过对立方体树的操作进行数据空间的搜索和相关参数的计算,以此来加快对可视化数据的处理速度。然后基于对数据立方体可视化模型的操作来获取局部数据的分布情况。在此基础上本文使用改进的密度偏差抽样算法来对原始可视化数据集进行抽样,实现数据集的约简。在尽量保证原始数据分成的情况下,有效缩小了可视化数据的规模,实现了效率与效果双向目标。最后本文设计并实现了可视化原型系统。在此原型系统中将数据立方体可视化模型在叁维散点图中进行应用,并根据对比实验的结果进行了分析。在此可视化原型系统中,本文设计了多种交互操作,允许用户多角度观测局部数据,观测局部数据并可以对数据进行及时更新交互,同时在设计可视化原型系统时,考虑到操作简单,界面易于理解等问题。(本文来源于《哈尔滨工业大学》期刊2010-12-01)
潘明霞[5](2008)在《营口港数据立方体的关联分析模型研究》一文中研究指出在信息技术特别是数据库技术高速发展的背景下,目前各行各业都存储了大量的数据,港口企业也不例外。而这些数据往往呈现分散存储、数据结构不统一、数据冗余、数据不完整等特征,使得数据难以集成为统一的数据平台。面对大量纷繁复杂的数据,传统的数据分析手段难以应付大量的数据,从而导致越来越多的数据灾难。关系数据库提供的简单查询和报表生成功能,只能获得数据的表层信息,而不能获得数据属性的内在关系和隐藏的信息,即淹没了的信息乃至知识,造成了资源的浪费,因此怎样合理地利用这些数据成为了一个重要的信息资源管理问题。数据仓库、联机分析处理、数据挖掘技术的发展为解决这一问题提供了有效途径。关联规则挖掘作为数据挖掘领域的一个重要研究课题,它在许多实际应用中都发挥着重要作用。本文以营口港的港口生产交易数据为应用背景,在前人对数据仓库和关联规则挖掘研究的基础上,构建了港口数据仓库及其数据立方体模型,并且设计并实现了一个基于数据仓库和OLAP技术的关联规则挖掘。论文的主要研究工作如下:第一,介绍了论文的研究背景及研究意义,包括国内外在这一方面的发展现状及进一步研究方向,同时介绍了数据仓库、数据立方体、OLAF和关联规则的概念,关联规则挖掘的分类、方法及常用的经典算法;第二,详细阐述了港口运营分析数据仓库和数据立方体的构建过程,这部分包含了业务需求分析、数据分析、总体设计、数据模型设计、数据预处理、立方体维层次聚集表示等步骤,这是论文的一个研究重点,也是论文下一步关联规则挖掘研究的基础;第叁,详细阐述了基于数据仓库和OLAP技术的关联规则挖掘模型的设计与实现,这是论文的另一个研究重点。该模型在分析港口数据和现有关联规则挖掘FP-growth算法的基础上,提出了改进的适合现有港口数据的MD&ML FP算法,实现了在数据立方体基础上的多维多层关联规则挖掘,并对挖掘出来的规则从市场管理、船商管理和航运路线等多角度进行了分析,辅助了港口管理人员的决策。最后对全文的工作进行总结,并且对下一步的工作进行了展望。(本文来源于《大连理工大学》期刊2008-12-01)
陈基漓[6](2006)在《基于数据立方体的网络教学评价模型》一文中研究指出网络教学评价是网络教学的一个重要环节。提出了基于数据立方体的网络教学评价模型,以学生、教师为评价对象,构建相应的数据立方体。学生学习行为数据立方体及教师教学行为数据立方体均由六个维度构成,以访问时间作为主要的度量值。并讨论了模型中涉及的关键技术。(本文来源于《电脑知识与技术》期刊2006年08期)
陈传波,况湘玲,郑建国[7](2005)在《基于数据立方体的联机分析挖掘模型研究》一文中研究指出本文提出一种联机分析挖掘模型,该模型基于数据仓库和其他各种类型文件生成的工作仓库,同时综合了联机分析处理多维分析的在线性、灵活性和数据挖掘处理的智能化特点,提高了传统模型的灵活性和智能化程度。(本文来源于《计算机工程与科学》期刊2005年11期)
张辉鹏[8](2005)在《多维分析中数据立方体的模型研究》一文中研究指出本文从更灵活的角度出发,提出了一种崭新的构建数据立方体的方法。首先定义了各数据体的代数表示模型,然后在此基础上阐述了如何建立数据立方体的操作,而且定义了在数据立方体形成之后添加或删除一个维或度量的操作,以及维与度量在一个数据立方体中转换的操作。(本文来源于《福建电脑》期刊2005年05期)
陈基漓[9](2005)在《基于数据立方体的用户兴趣模型》一文中研究指出兴趣模型是个性化信息技术中的关键问题, 有效地获取用户兴趣信息, 能更好地为网络用户提供信息服务. 提出了基于数据立方体的兴趣模型, 说明了模型主要结构及其工作原理. 给出 1个具体实例, 该实例由 5个维表及 1个中心事实表组成, 5个维表包括用户标识、时间、浏览行为、访问的URL地址和访问资源类型. 介绍了模型中的一些关键技术, 如模型工作原理、用户标识确定、访问资源分类、客户端浏览行为获取等.(本文来源于《桂林工学院学报》期刊2005年01期)
涂建光,罗昌隆[10](2001)在《多维数据立方体模型及其基于关系的实现》一文中研究指出数据立方体模型是多维数据库和以多维分析为基础的联机分析处理技术的核心机制,本文参照当前对多维数据立方体模型的最新研究成果,提出了一种新的模型并且应用于OLAP服务器基于关系的实现。并且提出了实现的难点和改进的方向。(本文来源于《计算机工程与应用》期刊2001年02期)
数据立方体模型论文开题报告范文
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
针对现有联机分析处理(OLAP)方法的空间开销随着数据维度增加呈指数级增长,因而不适用于维度较高的多维网络应用的问题,提出了一种新的多维网络数据立方体模型——封闭冰山双立方图(CI-DCG)。该模型通过引入邻接立方体的概念,将其实例化过程转化为两个计算传统数据立方体的阶段,从而可将传统数据立方体生成算法中较为成熟的空间优化技术引入到多维网络中。在保证多维网络上OLAP查询处理效率的同时,将多维网络数据立方体生成算法的空间复杂度降为多项式级别。理论分析和实验结果均表明,该模型在空间开销和查询性能方面均优于已有的多维网络OLAP模型,并且数据维度越高,这种优势就越明显。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
数据立方体模型论文参考文献
[1].张晓杉.基于多结构数据立方体的多维分析挖掘模型[D].兰州理工大学.2014
[2].古晓艳,王伟平,孟丹,杨秀峰,周江.高效支持多维网络OLAP的数据立方体模型CI-DCG[J].高技术通讯.2013
[3].陈焱.网络舆情话题的数据立方体模型分析[J].图书情报工作.2011
[4].车飞.基于数据立方体模型的叁维散点图快速可视化技术[D].哈尔滨工业大学.2010
[5].潘明霞.营口港数据立方体的关联分析模型研究[D].大连理工大学.2008
[6].陈基漓.基于数据立方体的网络教学评价模型[J].电脑知识与技术.2006
[7].陈传波,况湘玲,郑建国.基于数据立方体的联机分析挖掘模型研究[J].计算机工程与科学.2005
[8].张辉鹏.多维分析中数据立方体的模型研究[J].福建电脑.2005
[9].陈基漓.基于数据立方体的用户兴趣模型[J].桂林工学院学报.2005
[10].涂建光,罗昌隆.多维数据立方体模型及其基于关系的实现[J].计算机工程与应用.2001