导读:本文包含了可扩展并行计算论文开题报告文献综述、选题提纲参考文献,主要关键词:算法,机器,结构,微结构,通量,有限元,负载均衡。
可扩展并行计算论文文献综述写法
熊焕亮,曾国荪[1](2016)在《可变结构的并行计算中任务粒度细化可扩展方法》一文中研究指出首先评估并行任务及体系结构中影响可扩展性的关键因素,并对并行任务及体系结构进行图建模.然后,提出一种DAG任务粒度细化的可扩展方法,本质上是变换图的结构、调整图节点权值和边权值.进一步推导得出一些关于新扩展方法的有用结论.最后,应用网格模拟工具SimGrid开展实验,结果表明所提出的扩展方法,能实现可变结构并行计算的等速度效率扩展,对于并行计算扩展实践有指导意义.(本文来源于《同济大学学报(自然科学版)》期刊2016年10期)
张友良,谭飞,张礼仁,施明明[2](2016)在《岩土工程亿级单元有限元模型可扩展并行计算》一文中研究指出讨论了亿万单元有限元模型的可扩展并行计算方法。从软件和硬件两个方面提出了前处理、并行计算方法、程序算法、后处理实现等核心问题的解决方案。采用网格加密方法生成一亿单元的有限元模型,利用对偶原始有限元撕裂内联法(FETI-DP)求解系统方程。基于图论理论建立了子区域间的通讯拓扑关系,实现了子区域间点对点通讯,避免速度慢、通信量大的全局通讯。在自主开发程序基础上,增加相应模块,采用面向对象编程技术和MPI消息传递库开发程序。对一个一亿多单元的工程实例运用5000核并行计算,得到了超线性加速比。计算结果在专用图形工作站上进行后处理,显示和交互操作速度良好。研究在两方面实现了突破:一是将模型规模提高到了一亿多单元;二是同时调用了5000个计算核来并行运算,并得到了很高效率。高分辨率有限元并行模拟研究成果可为岩土工程中结构特别复杂、计算区域特别大、地质情况复杂等模拟提供很好的技术方法和实现手段。(本文来源于《岩土力学》期刊2016年11期)
李国杰,范东睿[3](2016)在《面向高通量计算的可扩展、高效能并行微结构研究立项报告》一文中研究指出体系结构面对很多挑战,例如微结构设计,片上资源管理,测试验证设计等。在这个项目中,为了解决如上这些挑战,做如下3方面的研究:(1)高通量计算应用的可扩展众核处理器结构研究;(2)高效能片上资源管理和控制;(3)纳米级高通量众核处理器芯片设计、测试和验证。(本文来源于《科技创新导报》期刊2016年09期)
刘智翔,方勇,宋安平,徐磊,王晓伟[4](2016)在《基于MRT-LBM方法的大规模可扩展并行计算研究》一文中研究指出在大规模叁维复杂流动的数值模拟中,针对具有良好数值稳定性的多弛豫时间模型格子Boltzmann方法(MRT-LBM),并结合大涡模拟湍流模型和曲面边界插值格式,分析了在D3Q19离散速度模型下的网格生成、流场信息初始化和迭代计算3部分的可并行性.采用MPI编程模型,从分布式集群的特点和计算量负载均衡的角度出发,分别提出了适合于大规模分布式集群的网格生成、流场信息初始化和迭代计算的并行算法.该并行算法也能有效适用于D3Q15和D3Q27离散速度模型.通过在国产神威蓝光超级计算机上的测试,分别针对求解问题总体计算规模固定和保持每个计算核中计算量一致的2种情况的并行性能分析,验证了该并行算法在十万计算核的量级下仍具有良好的加速比和可扩展性.(本文来源于《计算机研究与发展》期刊2016年05期)
熊焕亮,吴沧海,匡桂娟,杨文姬[5](2014)在《固定结构约束下并行计算关键路径不变的可扩展方法》一文中研究指出在固定结构的需求下,并行计算无法通过规模扩展提升其计算性能。针对此类并行计算可扩展问题,分析影响可扩展性的并行任务因素及体系结构因素,采用带权图对并行任务及体系结构进行建模,并提出一种关键路径不变的可扩展方法,其核心思想是固定图结构,仅合理地调整图节点权值和边权值。通过进一步推导,得出一些关于新扩展方法的性质结论。应用网格计算模拟工具Sim Grid开展的实验结果表明,所提出的扩展方法能有效解决此类扩展问题,且保持速度效率不变。(本文来源于《计算机应用》期刊2014年12期)
吴沧海,熊焕亮,姜火文,杨文姬[6](2014)在《固定结构约束下并行计算成比例的可扩展方法》一文中研究指出针对固定结构下并行计算无法通过规模扩展提升计算性能的问题,提出了一种成比例调整图权的并行计算扩展方法。该方法首先分析影响可扩展性的并行任务因素及体系结构因素;然后采用带权图对并行任务及体系结构进行建模;最后,对并行计算图模型中顶点和边的权值进行调整,实现并行计算的扩展。针对并行任务与体系结构是否具有相同的拓扑结构进行了两组实验,结果显示扩展前后的速度效率不变或近似相等。在上述两组实验的基础上,固定并行任务的算法结构及硬件系统的体系结构,仅调整性能参数,从特定的初始状态开始,以相同的比例作连续多次扩展,结果显示随着并行任务的连续扩展,体系结构资源被充分利用,速度效率逐渐提高,但并行任务扩展至一定程度后,速度效率提高缓慢;而如果并行任务及体系结构按一定的比例一同扩展,并行计算的速度效率近似不变。(本文来源于《计算机应用》期刊2014年11期)
闫争争,陈荣亮,赵宇波,蔡小川[7](2013)在《基于数千核计算平台的汽车外流场可扩展并行数值模拟》一文中研究指出针对汽车外流场等典型的大雷诺数非定常不可压缩复杂流动,目前主要有叁类算法:雷诺时均N-S方程方法,大涡模拟(LES)以及直接数值模拟(DNS)。由于末采用流体流动简化模型,DNS方法能够精确模拟复杂流体的流动,因此可获得流场中的各个参数的准确信息。然而由于计算规模过于庞大,该方法往往需要借助大型并行计算机才能实现。本文基于Newton-Krylov-Schwarz全隐算法构造了一种数千核平台上的高效并行算法并应用于某真实汽车外流场的数值模拟。数值结果显示,该算法在超过2000个处理器及求解千万量级自由度问题时仍具有很好的并行可扩展性。(本文来源于《第九届中国CAE工程分析技术年会专辑》期刊2013-07-27)
陈起[8](2013)在《高性能计算中并行文件系统可扩展元数据服务的研究》一文中研究指出随着计算能力的增强、应用课题规模和复杂度的增加,高性能计算机对并行文件系统性能要求越来越高,在海量小文件频繁创删和大规模并发I/O操作的应用场景中,文件系统元数据吞吐率成为限制其性能的关键因素。针对I/O转发架构,提出了一种基于元数据代理的高可扩展元数据服务的方案,结合作业调度系统,将文件系统元数据请求分散到多个元数据代理上,加速作业的文件系统元数据访问。并行I/O是高性能计算系统中主要的I/O使用方式,可分为单数据流模式和共享文件模式。其中单数据流模式给元数据服务带来很大负载,元数据可扩展性方案面向该I/O模式提出的,主要包括元数据代理MDDS(MetaData Delegation Service)和基于MDDS的作业调度两部分。元数据代理基于Lustre元数据集群架构CMD(ClusterMetaData)实现的,通过降低多个元数据服务间的耦合度,保证元数据集群的高可用性;使用目录子树方式管理元数据代理空间,避免跨节点目录引入的分布式原子操作的复杂性和低效性;实现元数据迁移避免跨元数据服务器间文件迁移造成的数据对象移动;通过元数据代理动态增删机制实现元数据代理的灵活部署。针对高性能计算中I/O转发架构作业调度特点,提出基于元数据代理的两种作业调度策略——单作业独占单元数据代理调度和多作业共享多元数据代理调度。前者实现了对传统作业I/O访问模式的支持,避免了多作业间元数据竞争;后者将单个作业的元数据访问分散到多个元数据代理上,实现了作业内的元数据负载均衡。在116台存储服务器上对元数据代理进了测试,同时通过模拟I/O转发架构中作业的文件系统元数据访问负载对两种作业调度方法进行评估。结果表明,元数据代理提供了拟线性的元数据性能,在大规模的环境中较CMD方案有较好的扩展性;两种调度方式有效分散了作业元数据的负载,改善了高性能计算中的元数据瓶颈问题。(本文来源于《华中科技大学》期刊2013-01-01)
王之元,杨学军,周云[9](2012)在《大规模MPI并行计算的可扩展叁模冗余容错机制》一文中研究指出随着系统规模的扩大,并行计算的性能不断提高,但可靠性却也在不断下降,因此需要采用某种容错机制来容忍或恢复硬件故障和数据错误.目前常用的容错机制Checkpoint/Restart和多模冗余均引入了额外的开销,这些开销均在某种程度上制约了并行计算的可扩展性.因此,在高性能计算需求不断增长的今天,可扩展容错机制的设计显得尤为迫切和重要.以叁模冗余(triple modular redundancy,简称TMR)为典型案例,描述了传统TMR在大规模MPI并行计算上的实现方法,分析了该机制所面临的实际问题,进而指出传统TMR制约了并行计算的扩展.根据该技术所面临的问题,设计了可扩展叁模冗余(scalable triple modular redundancy,简称STMR),并进一步验证了其有效性和可扩展性.该机制不仅能够处理Checkpoint/Restart针对的fail-stop故障,还能够解决绝大部分硬件不能直接感知的数据错误.最后,借用BlueGene/L的系统参数进行模拟,预测当系统规模增大时,在分别采用TMR和STMR的情况下并行计算可扩展性的变化,结果进一步验证了STMR是可扩展的容错机制.(本文来源于《软件学报》期刊2012年04期)
刘嘉辉,张宏莉[10](2011)在《基于可扩展精度的Logistic混沌随机序列的并行计算方法》一文中研究指出在有限计算精度下的混沌特性退化问题一直是困扰数字混沌系统的关键问题.采用可扩展精度并行方法计算Logistic映射,对混沌函数进行分步计算,利用动态数组保存计算结果.基于可扩展精度计算混沌,打破了计算机内有限精度的限制,用户可以自由指定计算精度.实验结果表明,基于可扩展精度的混沌随机数列,随着精度的增加,映射空间扩大,得到的混沌序列更加接近于理想的混沌状态.(本文来源于《中国科学技术大学学报》期刊2011年09期)
可扩展并行计算论文开题报告范文
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
讨论了亿万单元有限元模型的可扩展并行计算方法。从软件和硬件两个方面提出了前处理、并行计算方法、程序算法、后处理实现等核心问题的解决方案。采用网格加密方法生成一亿单元的有限元模型,利用对偶原始有限元撕裂内联法(FETI-DP)求解系统方程。基于图论理论建立了子区域间的通讯拓扑关系,实现了子区域间点对点通讯,避免速度慢、通信量大的全局通讯。在自主开发程序基础上,增加相应模块,采用面向对象编程技术和MPI消息传递库开发程序。对一个一亿多单元的工程实例运用5000核并行计算,得到了超线性加速比。计算结果在专用图形工作站上进行后处理,显示和交互操作速度良好。研究在两方面实现了突破:一是将模型规模提高到了一亿多单元;二是同时调用了5000个计算核来并行运算,并得到了很高效率。高分辨率有限元并行模拟研究成果可为岩土工程中结构特别复杂、计算区域特别大、地质情况复杂等模拟提供很好的技术方法和实现手段。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
可扩展并行计算论文参考文献
[1].熊焕亮,曾国荪.可变结构的并行计算中任务粒度细化可扩展方法[J].同济大学学报(自然科学版).2016
[2].张友良,谭飞,张礼仁,施明明.岩土工程亿级单元有限元模型可扩展并行计算[J].岩土力学.2016
[3].李国杰,范东睿.面向高通量计算的可扩展、高效能并行微结构研究立项报告[J].科技创新导报.2016
[4].刘智翔,方勇,宋安平,徐磊,王晓伟.基于MRT-LBM方法的大规模可扩展并行计算研究[J].计算机研究与发展.2016
[5].熊焕亮,吴沧海,匡桂娟,杨文姬.固定结构约束下并行计算关键路径不变的可扩展方法[J].计算机应用.2014
[6].吴沧海,熊焕亮,姜火文,杨文姬.固定结构约束下并行计算成比例的可扩展方法[J].计算机应用.2014
[7].闫争争,陈荣亮,赵宇波,蔡小川.基于数千核计算平台的汽车外流场可扩展并行数值模拟[C].第九届中国CAE工程分析技术年会专辑.2013
[8].陈起.高性能计算中并行文件系统可扩展元数据服务的研究[D].华中科技大学.2013
[9].王之元,杨学军,周云.大规模MPI并行计算的可扩展叁模冗余容错机制[J].软件学报.2012
[10].刘嘉辉,张宏莉.基于可扩展精度的Logistic混沌随机序列的并行计算方法[J].中国科学技术大学学报.2011