导读:本文包含了作业流引擎论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:引擎,工作流,作业,论文,OSGI,RPC,Hadoop。
张迪[1](2014)在《面向Hadoop作业的工作流引擎的设计和实现》一文中研究指出随着云计算服务的发展和应用范围的扩展,云计算服务已成为实际应用场景中工作流程的一部分,但传统的工作流引擎并不适用于提供云计算服务。随着Hadoop生态系统的快速发展与扩充,需要一个高可扩展的工作流引擎来集成各种开源工具,共同提供海量数据的处理和分析服务。在本文中,我们提出了一种基于Hadoop和OSGI的高性能和高可扩展性的工作流引擎-一个轻量级的并行和分布式的计算平台,提供了灵活和可扩展性接口,用户可以自定义数据处理功能和扩展Hadoop生态系统,主要包括以下核心组件:1.调用接口:本文设计本地调用和远程调用接口,它们能够保证工作流引擎和其他应用的无缝集成,其他应用程序可以本地或者远程调用工作流引擎提供的服务。2.工作流定义解析器:根据工作流定义语言描述,工作流定义解析器解析节点间的依赖关系和顺序关系,并在内存中生成相应的工作流实例对象。3.核心调度器:调度器根据Hadoop集群的当前状态将计算任务提交到远程的集群并监控任务的执行情况,根据任务的执行状态做出相应的处理。4.工作流优化器:本文针对Hadoop平台设计数据合并和垃圾回收两种优化机制,它们能自动优化工作流的执行性能,提高资源的利用率。5.容错管理器:针对并行计算任务,单点容错机制可以重新运行失败的任务,灾难恢复机制保证了工作流引擎的可靠性和高可用性。文章详细的阐述和介绍了引擎各核心组件的设计和实现策略、关键点以及各部分的关联。最后,我们的实验证明基于OSGI框架的工作流引擎在系统不重启的情况下,支持节点的动态加载与卸载,增强了系统的扩展性和灵活性;在高并发的应用场景中,工作流引擎能够快速的处理同时到达的操作请求;流程优化器和计算能力调度算法可以充分利用集群的计算资源,减少资源竞争,提高工作流的运行效率。(本文来源于《北京邮电大学》期刊2014-01-17)
[1].张迪.面向Hadoop作业的工作流引擎的设计和实现[D].北京邮电大学.2014
本文来源: https://www.lunwen90.cn/article/9b9c0f8b179de8842223fb79.html