导读:本文包含了抽取转换装载论文开题报告文献综述及选题提纲参考文献,主要关键词:科学文本数据建模,数据抽取,映射转换模型,ETL技术
抽取转换装载论文文献综述
王永璨[1](2009)在《面向复杂科学文本数据抽取转换及装载技术的研究与应用》一文中研究指出科学数据是科研工作者从事各种研究的基础,他们在无穷无尽的科学数据中发现新的规律,发现新的知识。而对科学数据的管理则是进行科学研究工作的重要保障,良好的管理可以加速科学研究的进展。然而,关于科学数据的处理浩瀚而繁琐,学术界迫切需要处理科学数据的新方法。关于科学数据的存储是科学数据管理的一个重要方面。在科学数据的最初采集阶段,由于仪器、环境、性能等方面的原因,科学数据都是保存成文本格式,以一种半结构化的方式存储有其特有的方便、快捷等优势。而在科学数据的处理分析阶段,关系数据库技术避免了传统的以文件方式保存科学文本数据所具有的数据意义不明确、管理难度大、查询代价大、开发工具少等明显缺点,为科学数据提供了优秀的应用平台。这样,两个阶段中数据存储形式的差异矛盾就带来了如何将两种形式的数据形式进行有效的映射、转换的问题。首先本文对科学文本数据进行了特征分析,并根据其特点提出一种科学文本数据的模型及其形式化的表达方法,以及在此模型基础下科学文本数据的抽取方法。在这之后,针对文本数据和关系数据的各自特点,建立了连接两种数据格式下数据模型的映射和转换方法。接着,以上述方法为基础,本文设计并实现了基于上述内容的执行系统,该系统的总体结构按照ETL的架构设计,核心组件由抽取器、转换器和加载器组成,该系统同时也具有ETL系统的一些其他特点。最后结合海洋科学数据的特点,建立了针对海洋科学文本数据的抽取方法和映射模型,将复杂科学文本抽取转换装载系统应用到了海洋数据中,并经测试验证了其有效性和正确性。(本文来源于《东北大学》期刊2009-06-21)
王新英,陈语林[2](2004)在《数据抽取、转换、装载综述》一文中研究指出文章综述了ETL发展的背景、目前广泛研究的领域,论述了ETL在异构数据源集成和脏数据的检测与解决两方面面临的挑战,指出ETL将呈现出通用化、高效化、智能化3大发展趋势。(本文来源于《企业技术开发》期刊2004年08期)
抽取转换装载论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
文章综述了ETL发展的背景、目前广泛研究的领域,论述了ETL在异构数据源集成和脏数据的检测与解决两方面面临的挑战,指出ETL将呈现出通用化、高效化、智能化3大发展趋势。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
抽取转换装载论文参考文献
[1].王永璨.面向复杂科学文本数据抽取转换及装载技术的研究与应用[D].东北大学.2009
[2].王新英,陈语林.数据抽取、转换、装载综述[J].企业技术开发.2004