流编程论文-彭林,张鹏,方建滨,黄春,唐滔

流编程论文-彭林,张鹏,方建滨,黄春,唐滔

导读:本文包含了流编程论文开题报告文献综述及选题提纲参考文献,主要关键词:多流编程,流水线,资源划分,hStreams

流编程论文文献综述

彭林,张鹏,方建滨,黄春,唐滔[1](2019)在《异构平台多流编程机制的性能模型研究》一文中研究指出多流编程机制为异构众核加速器提供流水、资源划分等多种资源使用方式,但如何选择有效使用方式目前缺乏指导。基于异构众核处理器Intel MIC上的hStreams,提出了针对单应用多流程序多硬件分区执行的性能模型,分析不同配置下多流程序性能差异的原因,指出了影响多流程序性能的关键因素,提出多流程序划分优化策略,同时所提性能模型能够帮助判断算法实现的效果。实验结果表明,性能模型与多流配置实际测试结果误差小于1%,根据性能模型指导调优稠密矩阵乘的多流程序,比单流程序获得了5.83%的性能提升。(本文来源于《计算机工程与科学》期刊2019年07期)

苏志超[2](2018)在《神威·太湖之光上数据流编程模型的设计与实现》一文中研究指出在片上集成大量异构的计算资源成为近几十年来众核处理器设计的主流。目前世界上浮点计算性能最高的超级计算机,神威·太湖之光,由40960个异构众核处理器SW26010构成;每个SW26010有260个计算核。受限于神威·太湖之光上现有的并行编程模型(MPI和Athread库等)的编程语义的描述能力,如何在神威·太湖之光上使用这些编程模型,来产生足够的计算任务提供给众多的计算核心、平衡异构计算资源间的任务负载、处理各计算任务之间的数据依赖关系,给用户带来了极大的挑战。Codelet模型是一种结合了数据流和控制流方法的细粒度程序执行模型,由特拉华大学的高光荣教授提出。本文的研究工作基于Codelet模型,在神威·太湖之光上设计了一种基于数据流的编程模型,SunwayFlow,并实现了其运行时系统,旨在为编程者提供一种有效地解决其计算问题、高效地利用片上计算资源的方法。本文通过基准测试程序HPCG作为研究实例,以验证SunwayFlow数据流编程模型及其运行时系统的有效性。本文主要研究内容和工作成果如下:(1)在神威·太湖之光上设计了一种基于数据流的编程模型,SunwayFlow。基于Codelet模型,提出了抽象机器模型到神威·太湖之光的映射方案,移除了Threaded Procedure结构、引入了预激发状态,并定义了编程模型的编程接口。(2)在神威·太湖之光上实现了 SunwayFlow编程模型的运行时系统。针对神威·太湖之光系统软硬件的特点来设计运行时系统的运行机制,采取了若干关键技术提高运行时系统的性能和适用性。用户通过使用运行时系统提供的接口函数,构建自己的数据流程序,然后运行时系统能够高效地、自动地完成该程序的调度和计算。(3)将HPCG所有的核心计算函数通过SunwayFlow编程模型进行重构。尤其是针对对称Gauss Seidel松弛(SymGS)算法,使用了一种全新的并行方法,即数据流方法。在单核组情况下,对比于HPCG参考版本的实现,我们的优化版本在SymGS执行时间和HPCG性能上分别取得了 11.79倍和10.31倍的加速。(本文来源于《中国科学技术大学》期刊2018-05-01)

杨瑞瑞[3](2017)在《面向多核CPU/众核GPU异构集群的数据流编程模型研究》一文中研究指出传统CPU多核处理器和CPU集群有时无法满足应用程序对大规模和超大规模计算的需求,图形处理器GPU正在以其特有的高性能浮点计算、并行计算的优势得到广泛应用。以“传统CPU处理器+GPU加速协处理器”为特征的CPU/GPU异构集群因其同时具有逻辑控制能力以及计算密集性优势而逐渐成为大数据和大规模计算的研究热点。异构并行体系架构内传统核CPU与计算核GPU协同工作,与数据流编程模型中数据通信与计算任务分离的特征相符合,能够充分暴露出数据流程序中能够并行化处理的功能模块,合理分配硬件资源。但是,传统CPU集群平台下的任务划分调度、软件流水线构造及数据通信等处理方式并不能简单复制到异构集群平台。针对异构集群硬件平台的多级并行结构,以数据流应用程序及CPU/GPU异构特性为基础,设计并实现了一个面向多核CPU/众核GPU异构集群的数据流编程模型。该数据流编程模型主要包括二级任务划分调度实现任务单元映射、层次性阶段赋值构造软件流水线、MPI/OpenCL混合编程模型以分布式存储和共享存储相结合的模式完成数据通信以及C++与OpenCL混合目标代码生成四个模块。该模型具有两个方面的优势:最大化挖掘多媒体领域数据流应用程序大规模运算的特点以及其潜在的并行性;充分发挥异构集群架构的硬件配置使得CPU与GPU协同工作,并通过层次性划分调度构造两级任务流水线提高程序整体执行性能。实验采用X86多核处理器和Amax混合架构处理器搭建异构集群平台,测试程序源于数字媒体领域应用相对广泛的典型算法,从多个角度分析验证了该CPU/GPU异构集群数据流编程模型的有效性。(本文来源于《华中科技大学》期刊2017-05-01)

杨秋吉,于俊清,莫斌生,何云峰[4](2016)在《面向Storm的数据流编程模型与编译优化方法研究》一文中研究指出数据流编程模型将程序的计算与通信分离,暴露了应用程序潜在的并行性并简化了编程难度。分布式计算框架利用廉价PC构建多核集群解决了大规模并行计算问题,但多核集群层次性存储结构和处理单元对数据流程序的性能提出了新的挑战。针对数据流程序在分布式架构下所面临的问题,设计并实现了数据流编程模型和分布式计算框架的结合——在COStream的基础上提出了面向Storm的编译优化框架。框架包括两个模块:面向Storm的层次性任务划分与调度,以及面向Storm的层次性软件流水与代码生成。层次性任务划分利用Storm的任务调度机制将程序所有子任务分配到Storm集群节点内的多核上。层次性软件流水与代码生成将子任务构造成集群节点间的软件流水和节点内多核间的软件流水,并生成相应的目标代码。实验以多核集群为目标平台,在集群上搭建Storm分布式架构,选取数字媒体处理领域典型程序作为测试程序,对面向Storm的编译优化后的程序进行实验分析。实验结果表明了结合方法的有效性。(本文来源于《计算机工程与科学》期刊2016年12期)

杨秋吉[5](2015)在《面向Storm的数据流编程模型与优化方法研究》一文中研究指出分布式计算框架利用廉价PC构建多核集群解决了大规模并行计算问题,但是在分布式计算框架上编程需要考虑程序子任务间的负载均衡和通信同步开销,编程难度大。数据流编程模型作为面向特定领域的编程模型,它将程序的计算与通信分离,暴露了应用程序潜在的并行性并简化了编程难度。但由于分布式架构下的多核集群含有层次性存储结构和处理单元,这为数据流程序的性能提出了新的挑战,并且数据流程序在分布式架构下的可编程性也为数据流编译器提出了更高的要求。针对数据流程序在分布式架构下所面临的问题,设计并实现了数据流编程模型和分布式计算框架的结合——在COStream的基础上提出了面向Storm的编译优化框架。面向Storm的编译优化方法包括二个步骤:面向Storm的层次性任务划分与调度,以及面向Storm的层次性软件流水与代码生成。层次性任务划分利用Storm的任务调度机制将程序所有子任务分配到Storm集群节点内的多核上,根据划分目标平台的不同可分为集群节点间的任务划分和节点内多核间的任务划分。层次性软件流水与代码生成利用多核集群节点间的并行性以及节点内多核间的并行性,将子任务构造成集群节点间的软件流水和节点内多核间的软件流水,并生成相应的目标代码。实验以多核集群为目标平台,在集群上搭建Storm分布式架构,选取数字媒体处理领域典型程序作为测试程序,对面向Storm的编译优化后的程序进行实验分析。实验结果表明了结合方法的有效性。(本文来源于《华中科技大学》期刊2015-05-01)

董小社,刘超,王恩东,刘袁,张兴军[6](2014)在《面向GPU异构并行系统的多任务流编程模型》一文中研究指出传统并行编程模型和框架不能有效利用和发挥GPU异构并行系统特点,应用开发难度大,性能优化困难,文中采用混合编程模型思想,建立了一种以协处理器为中心的GPU计算核心与CPU控制相融合的多任务流编程模型.模型将并行任务与CUDA流相结合,利用系统硬件并行性特点实现程序任务级和数据级并行;采用任务间消息通信和任务内数据共享通信方式,既保证对传统并行应用的继承又降低了不同存储空间给应用开发带来的复杂性和难度.基于该编程模型实现了一个运行时支持系统原型,测试结果表明可保证高效的数据通信,且能充分利用系统计算能力,提高了应用程序运行效率.(本文来源于《计算机学报》期刊2014年07期)

谭宏[7](2012)在《面向X10的多核处理器流编程框架与流语言设计》一文中研究指出随着半导体技术的发展,多核处理器逐渐取代单核处理器,成为新的工业标准。如何充分利用多核资源提供的计算能力,同时屏蔽底层细节以简化编程难度,是现今编译技术的研究热点和难点。传统的C/C++,Fortran等基于单指令流和单芯片集中式内存结构的传统编程模型已经无法适应多核处理器结构。数据流编程模型作为高效的并行编程模型被提出来,并广泛用于计算密集型应用。针对当前流编程模型的文法不易理解,编程复杂度高和可移植性差等问题,设计并实现了一种数据流编程模型,包括数据流编程语言COStream和相应的编译系统。COStream是一种数据流编程语言,文法设计基于C语言,并加入了具有数据流图特点的文法结构,文法易懂,具有可重用,扩展性好等特点。为了使COStream流程序运行于不同的多核处理器平台,设计并实现了COStream流编译系统。编译系统结合高效并行编程语言X10,利用同步数据流图作为相应的中间代码表示,同时根据目标系统结构特点,对数据流程序进行并行优化,并生成以软件流水方式执行的X10目标代码。实验以通用多核处理器和集群为平台,选取数字媒体领域典型的算法作为测试程序,从不同方面对COStream编译结果的性能进行测试与评估。实验结果表明,COStream具有较好的扩展性,在不同多核处理器平台上达到了接近线性的加速比,并保持了较高的负载率。(本文来源于《华中科技大学》期刊2012-01-01)

邓宇,杨学军,戴华东,王勐[8](2008)在《流编程模型下的存储一致性模型》一文中研究指出在流编程模型下建立了一个新的存储一致性模型——流一致性模型,它比传统的释放一致性模型更加松弛。讨论了流一致性模型对程序设计和系统设计的要求,给出了一个正确的系统实现,并且指出流一致性模型的编程和实现并不比现有的一致性模型复杂。(本文来源于《国防科技大学学报》期刊2008年01期)

刘松强[9](1994)在《数据流编程的图形软件Lab VIEW及其应用》一文中研究指出本文介绍着名的数据流编程的图形软件LabVIEW及其应用。并介绍作者使用LabVIEW开发的专用子程序库以及使用这个库编制的应用程序。(本文来源于《小型微型计算机系统》期刊1994年10期)

流编程论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

在片上集成大量异构的计算资源成为近几十年来众核处理器设计的主流。目前世界上浮点计算性能最高的超级计算机,神威·太湖之光,由40960个异构众核处理器SW26010构成;每个SW26010有260个计算核。受限于神威·太湖之光上现有的并行编程模型(MPI和Athread库等)的编程语义的描述能力,如何在神威·太湖之光上使用这些编程模型,来产生足够的计算任务提供给众多的计算核心、平衡异构计算资源间的任务负载、处理各计算任务之间的数据依赖关系,给用户带来了极大的挑战。Codelet模型是一种结合了数据流和控制流方法的细粒度程序执行模型,由特拉华大学的高光荣教授提出。本文的研究工作基于Codelet模型,在神威·太湖之光上设计了一种基于数据流的编程模型,SunwayFlow,并实现了其运行时系统,旨在为编程者提供一种有效地解决其计算问题、高效地利用片上计算资源的方法。本文通过基准测试程序HPCG作为研究实例,以验证SunwayFlow数据流编程模型及其运行时系统的有效性。本文主要研究内容和工作成果如下:(1)在神威·太湖之光上设计了一种基于数据流的编程模型,SunwayFlow。基于Codelet模型,提出了抽象机器模型到神威·太湖之光的映射方案,移除了Threaded Procedure结构、引入了预激发状态,并定义了编程模型的编程接口。(2)在神威·太湖之光上实现了 SunwayFlow编程模型的运行时系统。针对神威·太湖之光系统软硬件的特点来设计运行时系统的运行机制,采取了若干关键技术提高运行时系统的性能和适用性。用户通过使用运行时系统提供的接口函数,构建自己的数据流程序,然后运行时系统能够高效地、自动地完成该程序的调度和计算。(3)将HPCG所有的核心计算函数通过SunwayFlow编程模型进行重构。尤其是针对对称Gauss Seidel松弛(SymGS)算法,使用了一种全新的并行方法,即数据流方法。在单核组情况下,对比于HPCG参考版本的实现,我们的优化版本在SymGS执行时间和HPCG性能上分别取得了 11.79倍和10.31倍的加速。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

流编程论文参考文献

[1].彭林,张鹏,方建滨,黄春,唐滔.异构平台多流编程机制的性能模型研究[J].计算机工程与科学.2019

[2].苏志超.神威·太湖之光上数据流编程模型的设计与实现[D].中国科学技术大学.2018

[3].杨瑞瑞.面向多核CPU/众核GPU异构集群的数据流编程模型研究[D].华中科技大学.2017

[4].杨秋吉,于俊清,莫斌生,何云峰.面向Storm的数据流编程模型与编译优化方法研究[J].计算机工程与科学.2016

[5].杨秋吉.面向Storm的数据流编程模型与优化方法研究[D].华中科技大学.2015

[6].董小社,刘超,王恩东,刘袁,张兴军.面向GPU异构并行系统的多任务流编程模型[J].计算机学报.2014

[7].谭宏.面向X10的多核处理器流编程框架与流语言设计[D].华中科技大学.2012

[8].邓宇,杨学军,戴华东,王勐.流编程模型下的存储一致性模型[J].国防科技大学学报.2008

[9].刘松强.数据流编程的图形软件Lab VIEW及其应用[J].小型微型计算机系统.1994

标签:;  ;  ;  ;  

流编程论文-彭林,张鹏,方建滨,黄春,唐滔
下载Doc文档

猜你喜欢