导读:本文包含了并行计算机系统论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:计算机系统,多核,算法,重构,系统,结构,定量分析。
并行计算机系统论文文献综述
王俊昌,高亮,李涛[1](2017)在《并行计算机系统中的计数算法研究》一文中研究指出计数算法是计算机程序设计中的基础算法。然而,传统计数算法在新兴的多核并行计算机系统中存在计数效率低下以及计数不准确的问题。文中首先对这些问题进行深入量化分析,之后提出了一种适用于并行计算机系统的确定性高速计数算法。该算法采用对计数器数据先进行快照再进行统计计数的方法,有效避免了计数算法中读者线程与写者线程之间的相互干扰,保证了计数数据的准确性;同时,通过采用无锁链表队列存储计数数据快照,实现了并发读取情况下的无阻塞计数统计,保证了计数算法的效率。实验论证和性能分析结果表明:在新一代的多核并行计算机中,本计数算法计数效率高且计数准确,综合性能优于现有算法。(本文来源于《南京邮电大学学报(自然科学版)》期刊2017年06期)
黄晨,汪文明,张义超,岳玮[2](2017)在《基于国产CPU的并行冗余计算机系统研究》一文中研究指出目前国家不断推进的国产自主可控信息系统建设,其核心国产计算机系统由于技术成熟度低、市场推广晚等原因,暴露出可靠性低、稳定性差的问题,直接导致系统功能无法成功应用;围绕国产化计算机系统的并行冗余架构开展研究,通过计算机系统架构的软硬件设计,以及高速缓存一致性架构、高速互联总线和叁状态转换机制方法的应用,基于国产CPU并行冗余计算机系统,可以有效消除备份计算机系统进行当班切换时,存在的切换时间延时和切换过程数据丢失的问题;通过试验验证,该系统可以完成计算机系统中CPU处理器和功能桥片故障模式的容错处理,并保障信息数据的完整性和实时性,有效提高设备中计算机系统的工作可靠性与稳定性。(本文来源于《计算机测量与控制》期刊2017年07期)
夏春梅,虞翔[3](2016)在《探讨多处理器并行的计算机系统开发设计》一文中研究指出多处理器并行的计算机必然会比单处理器的计算机运行效率高很多,它可以突破单处理器计算机计算数据的极限,如果采用多处理器并行,可以减少整个计算机系统所占用的体积,不仅减少了计算机系统开发的时间,而且也降低了计算机运行的成本。对多处理器并行的计算机系统开发设计展开探讨。(本文来源于《电脑编程技巧与维护》期刊2016年23期)
闫雨石[4](2016)在《可重构并行计算机系统计算机体系结构研究的进展》一文中研究指出伴随社会经济与科技的全面发展,近年来计算机技术已渗透到了生产生活的各个领域,而对可重构及算计系统的研究也势在必行。可重构并行计算机系统要依附于软件控制,通过可重用的资源,重构及重组转换为另一个计算体系,以匹配于差异化的相关需要。其具备可重构特性的计算机制我们称其为可重构计算系统.分析了可重构的基本概念、可重构计算体系的核心结构等;在此基础上探究了可重构并行计算机系统计算机体系结构研究的进展。(本文来源于《数字技术与应用》期刊2016年11期)
杜文晟[5](2015)在《MIMD并行计算机系统结构与定量分析》一文中研究指出并行计算是高性能计算的主要方式,在可以预计的未来,MIMD模式仍将是并行计算系统的主要构建方式。对于MIMD结构的定量分析是评估此种结构在实际环境中运行效率和性能表现的主要理论基础。讨论了主要的并行计算机系统结构,并且做了一些定量的分析。(本文来源于《湖北师范学院学报(自然科学版)》期刊2015年03期)
乔峰[6](2015)在《一种适于多核计算机系统的并行压缩方法》一文中研究指出当前随着多核计算机硬件系统已经成为应用主流,软件开发者需要设计适合多核计算机硬件系统的软件系统。然而如何有效地使用多核硬件系统将成为很大的挑战。开发人员使用基于操作系统线程级开发模型将遇到很大的挑战。为有效地应对以上问题,Intel公司开发出了适合多核计算机硬件系统的开发编程模型:TBB,ArBB and Cilk等编程模型。最近一种新型的简单而有效的适合多核计算机硬件系统编程的模型"Concurrent Collections"简称"CnC"被Intel公司开发出来。CnC采用声明式编程语言允许应用程序开发者表达一个高层次的计算方法。在本文中,我们将描述如何使用这个新型的编程模型实现一个高性能的数据压缩程序,同时与其他方式实现的并行实现方法进行比较。本文采用双至强处理器X5460 3.16GHz 8-thread CPUs,通过本文说明的方法实现的并行压缩应用程序运行加速度超过8倍。通过与其他并行实现方式比较OpenMP,TBB and Cilk,本文实现的性能比其他实现方式有5%~10%的性能提升。(本文来源于《电子科学技术》期刊2015年03期)
朱小东[7](2013)在《大规模计算机系统并行仿真技术研究》一文中研究指出传统的串行仿真技术无法有效的解决大规模计算机系统仿真的性能与资源开销问题,并行仿真技术已成为大规模计算机系统仿真的必然选择。然而节点间的同步极大的阻碍了仿真器达到理想性能,不当的同步通常会造成并行仿真器的性能下降一至两个数量级。而且同步的消极影响会随着仿真规模的增加而扩大,因此同步是大规模并行仿真器取得较高性能的关键所在。同步问题的解决必须考虑仿真的需求约束。在时钟精确仿真环境中同步机制需要在严格保证节点间时序关系的条件约束下挖掘仿真器的并行性;而非时钟精确仿真则允许因果关系错误存在,同步机制可以适当的突破限制、放大前瞻量,但是由此带来的精确度损失又成为并行仿真技术必须面临的另一项挑战。本文针对时钟精确与非时钟精确两类仿真需求,面向多核处理器与数据中心系统两类典型的大规模计算机系统,在分析总结了当前体系结构并行仿真技术存在的性能与精确度问题的基础上给出整体性的解决方案,并围绕关键的同步问题深入开展研究工作,提出了精确度与性能达到较优平衡的多种同步机制。本文的研究内容包括以下四个方面:1.多核处理器时钟精确并行仿真技术的研究。面向多核处理器并行仿真设计实现了一种能够保证仿真器时钟精确性的悬挂路障同步机制以及针对多线程环境的多种性能优化方法。悬挂路障同步机制通过提前设置的悬挂路障保证逻辑处理器能够及时接收到一些零延迟事件,在可忽略性能损失的情况下提高了传统保守同步协议的能力;多种性能优化方法包括针对共享存储模拟问题的存储访问Hash加锁方法,针对高速缓存假共享问题的私有存储变量、局部动态存储分配方法,针对线程间通信问题的无锁化队列通信方法。实验结果表明采用了上述同步机制及优化方法的多核处理器并行仿真器PCASim在17条宿主线程规模时相对串行仿真达到了平均8.66倍的加速比。2.众核处理器时钟精确并行仿真技术的研究。针对众核处理器时钟精确并行仿真时性能受同步限制的问题,提出一种充分挖掘仿真器并行性的两级同步机制。两级同步机制将仿真器的处理器核心模型与下级高速缓存与片上路由器等组件模型分割成两种模块,利用叁种与对象系统存储访问过程紧密结合的路障保证两种模块间时序关系的一致性,使得仿真性能提高的同时时钟精确性不被破坏。理论分析指出,两级同步在性能上介于相同前瞻量Quantum同步的1至2倍之间,而且两级同步保持了存储层次及片上网络足够的细节。实验结果表明实现了两级同步的众核处理器并行仿真器MCASim相对串行仿真的平均加速比在使用16线程时达15.2倍,32线程时达22.0倍,亦证实了两级同步与Quantum同步的性能关系。3.放松同步技术的研究。针对放松同步扩大同步周期时长后带来的精确度大幅下降问题,通过分析放松同步中因果关系错误产生的主导因素,指出将所有节点调节成一致的速度后能够降低因果关系错误量,据此提出一种基于墙钟时间的高效非时钟精确同步技术。墙钟同步在松弛同步周期内新增一层同步逻辑时间与墙钟时间的协议,把仿真器所有执行实体调制出细粒度一致的速度,在获得了松弛同步性能收益的同时提高了仿真精确度。进而分析了真实仿真环境对墙钟同步的多种影响因素,给出了墙钟同步的适用条件。在众核处理器并行仿真器中实现了墙钟同步,实验结果表明,在精确度接近的条件下,墙钟同步与同期的Slack自适应同步技术相比,16条线程下平均提升20.3%的性能,32条线程下平均提升26.7%的性能。4.数据中心仿真技术的研究。基于全系统仿真技术与墙钟同步技术设计实现了一款面向数据中心的高效体系结构并行仿真器。仿真器支持包括10设备的各类主要组件的高精度建模,能够运行起完整的数据中心系统与应用程序;拆分了网络模型使其亦支持并行运行,所有节点可灵活部署,有效避免了性能热点的形成。通过分析数据中心仿真器的特性,指出其目标系统链路延迟与仿真速度的比例关系有利于墙钟同步机制降低逻辑时钟偏差,为同步周期时长拓宽了上升空间。实验表明墙钟同步控制下的数据中心并行仿真器具有优异的性能表现,在32节点的配置下相对严格路障同步平均速度提升达5.1倍,相对近期的自适应路障同步亦平均提升了49.8%。(本文来源于《中国科学技术大学》期刊2013-05-01)
刘杰,迟利华,蒋杰,徐涵,晏益慧[8](2013)在《大规模并行计算机系统性能测评体系》一文中研究指出复杂的大规模并行计算机系统需要能客观反映系统性能的测评方法,单个指标难以全面评价系统的性能特点。从用户需求出发,给出了大规模并行计算机系统用户适用性概念,利用适用性概念,建立了大规模系统性能测评体系,包括总体适用性、分项适用性、适用性概念、准则和Benchmark程序。整个测评体系尽量消除主观因素,做到客观定量,利用测评体系,借助性能分析数据获取工具,在得到量化的分项适用性的基础上,通过权重公式可以求出总体适用性,根据总体适用性的大小来判断不同大规模计算机系统是否满足用户的需求。(本文来源于《计算机工程与科学》期刊2013年03期)
李李[9](2011)在《集群计算机系统中基于协同设计的并行I/O模拟器研究》一文中研究指出近年来,由于集群计算机系统具有增强的可伸缩性、高度的可达性和较好的性能/价格比等特点,被广泛的应用于具有海量待处理或计算的信息、数据的复杂环境中。集群系统是一种能够达到高性能并行计算的系统,其主要思想是通过各种并行技术和设计技术与集群系统相融合,来解决并行计算速度与并行I/O存取速度相差太大这一瓶颈问题。本课题的目标是在集群计算机系统中实现基于协同设计的并行I/O模拟器,主要思想是在原有并行I/O模拟器设计方法的基础上实现对模拟器的各种参数的优化选择,提高了原模拟器的各项性能,再在协同设计的理论指导下实现了设计人员知识无差别性,使原系统的功能得以增强。通过对协同设计思想的理论研究和分析,从理论上提出一种在集群计算机系统上实现基于协同设计思想的并行I/O模拟器的设计思路。利用协同设计中的具体算法,并通过改进遗传算法将其融入其中来优化设计,最后在集群系统上设计了一个支持并行I/O模拟器的框架并实现了模拟器框架中的各个核心功能模块。同时,通过基于TRIE树的哈希表进行系统测试。测试结果表明基于协同设计的并行I/O模拟器在I/O吞吐量、并行散列计算能力方面较原有较大的提高。改进后的基于协同设计的集群系统并行I/O模拟器能较好地解决自动优化的设计问题,以达到改善集群系统的瓶颈问题。(本文来源于《湖南大学》期刊2011-06-15)
关旭[10](2011)在《为处理NP完全问题的MANIP并行计算机系统的研究》一文中研究指出在计算机科学的理论领域中,有一个尚未解决的着名的难题:NP(Non-deterministic Polynomial)问题,也就是多项式复杂程度的非确定性问题。一些计算问题可以通过公式的推导得出计算结果,这些问题被称之为确定性的。但是有些问题是无法通过计算来得到结果的,只能通过间接的方式,比如“猜想”来得到结果,这一类问题就称之为非确定性的。虽然非确定性问题没有算法可以为其来解答,但是对于某个可能的结果是正确的还是错误的仍然是有算法可以判断的。如果这个算法可以在多项式时间内计算出来,该问题就叫做多项式非确定性问题。而如果这个问题的所有可能答案,都是可以在多项式时间内进行正确与否的验算的话,该问题就叫完全多项式非确定问题。完全多项式非确定性问题可以用穷举法得到计算结果,但是这样算法的复杂程度是指数级了,因此计算的时间随问题的复杂程度成指数倍的增长,很快便变得不可计算了。为了研究这个问题,本篇论文从对NP完全问题研究的发展和国内外情况入手,提出并研究MANIP网络结构——一个处理完全多项式非确定问题的并行机。接着引出分支界定算法的概念,通过对分支界定算法的前序准备工作的筹备以及算法本生基本特征的研究分析得出单处理系统是用来解决广泛多样的NP完全问题最通用的技术,并且在NP完全问题中融入并行的思想,得出并行的分支界定算法。并行分支界定算法要求组合排序和合并,但是一个普通内存进行大量处理器的排序可能成为系统的瓶颈,针对这一问题,论文对并行分支界定算法的两种体系配套支持进行分析与讨论,并以urn模型为实例,对该实例的性能做出分析。通过对系统中完整式分布下限的复杂度的计算与分析,进行硬件优先队列的网络优化,最后得出一个分布式智能系统,以便可以进行分布式的排序,从而达到MANIP网络体系在处理NP完全问题效率上的改进。(本文来源于《湖北大学》期刊2011-05-01)
并行计算机系统论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
目前国家不断推进的国产自主可控信息系统建设,其核心国产计算机系统由于技术成熟度低、市场推广晚等原因,暴露出可靠性低、稳定性差的问题,直接导致系统功能无法成功应用;围绕国产化计算机系统的并行冗余架构开展研究,通过计算机系统架构的软硬件设计,以及高速缓存一致性架构、高速互联总线和叁状态转换机制方法的应用,基于国产CPU并行冗余计算机系统,可以有效消除备份计算机系统进行当班切换时,存在的切换时间延时和切换过程数据丢失的问题;通过试验验证,该系统可以完成计算机系统中CPU处理器和功能桥片故障模式的容错处理,并保障信息数据的完整性和实时性,有效提高设备中计算机系统的工作可靠性与稳定性。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
并行计算机系统论文参考文献
[1].王俊昌,高亮,李涛.并行计算机系统中的计数算法研究[J].南京邮电大学学报(自然科学版).2017
[2].黄晨,汪文明,张义超,岳玮.基于国产CPU的并行冗余计算机系统研究[J].计算机测量与控制.2017
[3].夏春梅,虞翔.探讨多处理器并行的计算机系统开发设计[J].电脑编程技巧与维护.2016
[4].闫雨石.可重构并行计算机系统计算机体系结构研究的进展[J].数字技术与应用.2016
[5].杜文晟.MIMD并行计算机系统结构与定量分析[J].湖北师范学院学报(自然科学版).2015
[6].乔峰.一种适于多核计算机系统的并行压缩方法[J].电子科学技术.2015
[7].朱小东.大规模计算机系统并行仿真技术研究[D].中国科学技术大学.2013
[8].刘杰,迟利华,蒋杰,徐涵,晏益慧.大规模并行计算机系统性能测评体系[J].计算机工程与科学.2013
[9].李李.集群计算机系统中基于协同设计的并行I/O模拟器研究[D].湖南大学.2011
[10].关旭.为处理NP完全问题的MANIP并行计算机系统的研究[D].湖北大学.2011