异构体系结构论文_开磊

导读:本文包含了异构体系结构论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:异构,体系结构,多核,资源,网络,处理器,基带。

异构体系结构论文文献综述

开磊[1](2019)在《异构多核处理器体系结构分析》一文中研究指出为了弥补单核处理器的不足而设计的多核处理器具有较强的运算性能,在提高多核处理器性能的过程中,依然面临很多问题。层次结构多核、异步多核及异构多核时多核处理器技术当下的主要发展方向。设计多核处理器是一项烦琐而艰巨的任务,需要不断进行测试及修改,设计工作不能只停留在硬件层面中,否则会出现效率低下、费用增大和资源浪费的后果。所以应借助软仿真技术来解决这一问题,在设计过程中要仿真软件,借助软件手段对设计方案进行测试,不断进行完善,对设计进行优化,使处理器设计效率得到显着改善。(本文来源于《大众投资指南》期刊2019年07期)

续欣,汤凯[2](2018)在《基于SDN的天地一体化弹性异构组网体系结构》一文中研究指出立足现有卫星通信系统的特点,围绕天地一体化网络的特点,主要从体系结构方面探讨目前在网络扩展性、可编程性方面能够提供卓越性能的软件定义网络SDN(Software Defined Network)和网络功能虚拟化NFV(Network Function Virtualization)技术在天地一体化网络中的设计和应用,提出一种基于SDN的天地一体化弹性异构组网体系结构,实现一体化网络的灵活、可靠、高效设计,使卫星网络在一体化过程中优化资源的使用,通信提高服务水平。(本文来源于《2018软件定义卫星高峰论坛会议摘要集》期刊2018-04-07)

刘恒良[3](2018)在《异构可重构计算体系结构及其实现技术》一文中研究指出在雷达、通信、深度学习、人工智能等领域,算法的复杂程度日益提高,算法的形式千变万化,越来越多的场合对低功耗小型化的异构、可重构计算平台提出了迫切需求。本文针对上述应用设计了一种结合了中心控制节点、数据交换节点和多GPU的异构可重构计算体系结构,并设计了遵循该体系结构的软硬件平台。通过采用先进的RC-MPSOC器件作为中心控制节点,使得该体系结构支持硬件可重构,并且通过采用同时支持星形和环形连接的互连网络设计,使得该体系结构支持异构运算节点间的灵活、高速互连。该体系结构及原型平台具有小型化、低功耗的特点,并且可以提供灵活、高效的算法实现能力。在硬件设计上,采用XILINX先进的Zynq SOC作为中心控制节点,除了软件的在线自适应重构,还可以通过ARM处理器对可编程逻辑做出硬件可重构;采用XILINX的Kintex-7系列FPGA作为运算节点互连网络的交换(Switch)节点,以实现GPU之间的环形高速连接,以及GPU和中心控制节点间的星形高速连接,使其能够支持灵活的算法结构;采用NVIDIA的TX1模块作为运算节点,提供灵活、高效的算法实现能力。基于所设计硬件平台,在软件上利用Zynq SOC提供的内部接口设计了可重构功能模块,通过实现PCIe和SRIO间的高速数据交换设计了交换节点逻辑,进而构建了运算节点互连网络,通过设计存储管理功能模块实现灵活的存储分配,并且对这些模块做了功能测试和性能评估,为所实现的异构可重构计算平台的工程应用提供了完整的接口驱动和基本的功能模块。最后,针对SAR回波模拟同心圆算法的大数据量、大运算量和算法结构复杂等特点,通过将斜距计算分配到4个GPU,然后在中心控制节点的PL完成卷积运算,该异构可重构计算平台与传统的异构计算平台相比,计算性能有了显着提高。本文提供的低功耗小型化的异构可重构计算平台还可以通过多板堆迭使用进一步提高运算能力,具备良好的可扩展性,具有一定的应用前景。(本文来源于《中国计量大学》期刊2018-04-01)

林恒[4](2017)在《基于超大规模异构体系结构的图计算系统研究》一文中研究指出图数据有着强大的表达能力,适用的领域包括社交网络、生物信息、网页搜索和运输系统等。图计算系统是处理图数据的强有力工具,目前公开的图计算系统已经能在数百台机器上处理上万亿条边的图数据。然而现实生活中的图数据规模高速增长,比如中文网页图的链接数在2017年初达到了十万亿规模。庞大的图数据规模,结合其数据依赖、幂律分布的特点,给图计算系统的硬件和软件均提出了更加严峻的挑战。本文主要的研究对象为超大规模图计算系统,采用的硬件平台为目前(2017年10月)世界上Top500[2]排名第一的超级计算机——神威·太湖之光。在本平台上,本文先从一个典型的图计算应用入手,研究了宽度优先搜索算法,接着扩展为更一般的图计算框架,进一步研究超大规模图计算问题。1.超大规模宽度优先搜索算法。针对神威·太湖之光的处理器SW26010的异构体系结构,提出了从核无锁数据分发技术,避免了原子操作给加速核带来的开销,充分利用了内存带宽。同时提出了流水化的功能映射技术,让加速核处理核心执行任务,发挥其高访存带宽的特点,而将繁琐的任务调度和通信任务交给通用核。针对超大规模网络环境下的不定长小消息问题,提出了基于分组的消息聚类技术,分两个阶段聚合发送消息,在4万节点时将消息数量降低了两个数量级。2.超大规模图计算框架——神图。相对于宽度优先遍历算法,其他图算法通常会有更多的通信消息和数据操作的原子性要求。神图提出了分化的消息传输技术,通过将图数据的边按照顶点出入度的不同分为互不相交的叁类,分别采用最优的方法来处理,以减少通信的消息量和提高负载均衡。针对数据更新操作的原子性,神图采用基于推送的顶点状态更新技术,分为两个阶段来解决数据过于离散访问的特性。通过以上两方面的研究,本文宽度优先搜索算法的实现在标准评测程序Graph500[3]的规范下,达到了 23755.7 GTEPS,成果在2016年11月的排行榜上排名设备第一、全榜第二。神图同时在真实数据和生成数据上进行了结果验证和性能分析,在12万亿边的搜狗中文网页链接图上每轮PageRank的时间仅为21秒。(本文来源于《清华大学》期刊2017-12-01)

原略超[5](2017)在《面向MIMO基带干扰消除的高灵活性异构多核体系结构设计与实现》一文中研究指出近年来,为了适应无线通信系统对数据容量需求的不断增加,无线通信协议的更新换代不断加速,造成了目前多种协议并存的局面。现有的应对方式是为每一个协议配备一套硬件系统,导致了巨大的资源浪费。为了能够节省硬件资源以及缩短面市时间,未来需要一种高灵活性的基带处理硬件平台,一方面能够支持现存的多种协议,另一方面能够适应未来通信协议的发展。本论文针对MIMO基带处理中变化最多且复杂度最高的干扰消除算法设计并实现了一款高灵活性的专用异构多核处理器。该处理器采用了自顶向下的设计思路,我们首先测试了多种典型干扰消除算法的性能并分析提取其计算特征;基于“分而治之”的策略,我们提出了一种运算与控制相分离的异构多核体系结构,分别设计了高灵活性的运算核和调度核及其编程模型;为了验证所提结构的灵活性,基于同样“分而治之”的策略,我们在该结构上映射了多种干扰消除算法;最后,我们给出了该结构的VLSI综合及版图实现结果。本文主要的工作及创新点体现在:1.在算法测试方面,为了获得接近于实测的效果,我们基于最新的无线局域网802.11ac协议及其室内信道模型,构建了一套多用户MIMO OFDM算法仿真平台,并在WARP平台上验证了在真实室内环境下该仿真平台的收发效果。基于该仿真平台,我们测试多种典型干扰消除算法在完全信道信息和非完全信道信息条件下的性能,并提出了一种低复杂度的提高干扰消除算法在非完全信道信息下鲁棒性的方法。2.在体系结构设计方面,针对已测试的算法,我们从浮点数值精度需求、可并行、计算复杂度等多个方面对其进行深入分析,并提取出其通用的计算模式和通信模式。根据这些分析结果,为了能够支持所有通用计算模式,我们首先提出了一种基于Ad-hoc互联的的高灵活性浮点计算核,通过改变基本运算部件的连接方式实现对多种计算模式的支持;其次,为了能够灵活调度计算核并为其提供数据服务,我们设计了调度核结构及其存储结构;除此之外,为了支持非线性干扰消除算法中的排序操作,我们设计了一套专用的排序系统来提高排序操作的效率。最后,为了协同调度核和计算核完成计算,我们设计了一套以FIFO缓存和中断控制为基础的协同机制。3.在编程模式设计方面,为了便于该多核结构的使用,基于“分而治之”的策略,我们为计算核和调度核分别设计了不同的编程模式。计算核的编程基于类似于软流水的方式,一个计算任务通过多条指令完成,每条指令可以同时执行多个计算任务的不同阶段;而调度核的编程采用双发射超长指令字(VLIW)模式。为了验证所提结构的实用性和灵活性,我们映射了多种计算特征迥异的应用,包括线性干扰消除中常见的多种矩阵求逆算法,以及非线性干扰消除中复杂的基于排序QR分解(SQRD)的THP算法等。根据我们有限的了解,这是基于SQRD的THP算法第一次在硬件上的实现。4.最后,为了验证本设计的可实现性,我们完成了该结构在90nm工艺下的门级综合,最高综合频率可达535MHz;并在综合考虑面积和功耗之后,在400MHz下完成了对该结构在90nm工艺下的版图实现,综合结果显示该结构占用271k等效门,版图结果显示该结构占用逻辑面积0.935mm2。与相关工作的比较显示,本论文所提结构在较少的额外面积开销下取得了最优的灵活性,能够支持多种具有不同计算特征的算法;相比于其他的可编程结构,对于相同的算法,本文所提结构能够取得更高的硬件利用率、更短的计算延时以及更低的功耗开销。尽管我们的设计主要面向于MIMO干扰消除算法,但是我们认为该结构具有很好的灵活性潜力,能够支持更多的算法,具有很强的实用价值。(本文来源于《国防科学技术大学》期刊2017-03-01)

王岳青,窦勇,吕启,李宝峰,李腾[6](2016)在《DLPF:基于异构体系结构的并行深度学习编程框架》一文中研究指出深度学习在机器学习领域扮演着十分重要的角色,已被广泛应用于各种领域,具有十分巨大的研究和应用前景.然而,深度学习也面临3方面的挑战:1)现有深度学习工具使用便捷性不高,尽管深度学习领域工具越来越多,然而大多使用过程过于繁杂,不便使用;2)深度学习模型灵活性不高,限制了深度学习模型发展的多样性;3)深度学习训练时间较长,超参数搜索空间大,从而导致超参数寻优比较困难.针对这些挑战,设计了一种基于深度学习的并行编程框架,该框架设计了统一的模块库,能可视化地进行深度学习模型构建,提高了编程便捷性;同时在异构平台对算法模块进行加速优化,较大程度减少训练时间,进而提高超参数寻优效率.实验结果表明,该编程框架可以灵活构建多种模型,并且对多种应用取得了较高的分类精度.通过超参数寻优实验,可以便捷地获得最优超参数组合,从而推断各种超参数与不同应用的联系.(本文来源于《计算机研究与发展》期刊2016年06期)

溥博文[7](2015)在《基于CPS的智能建筑无线网络异构体系结构研究》一文中研究指出本课题主要研究建筑智能化环境下CPS概念、特点、信息监测、异构网络融合算法及处理方法,从而提高建筑环境CPS的整体性能分析与决策依据。本文先阐述了CPS的研究目的意义,根据CPS概念和特点为理论基础,构建建筑环境下信息物理融合系统的叁层结构,在物理节点层实现建筑智能化的信息监测,在信息网络层优化异构网络的融合。针对建筑环境下布线复杂混乱的弊端,在CPS物理节点层中使用Zigbee技术来实现建筑环境信息的监测,通过CC2430射频芯片和SHT11温湿度传感器设备采集建筑环境下温湿度信息。为确保系统实时性,对节点数与延迟的关系进行测试,确定传感器入网延时与最佳距离关系,证实在建筑环境下用Zigbee技术通信以满足建筑智能化日益发展的需求,实现建筑环境下的信息监测,促进信息世界与物理世界的融合。针对CPS中的异构性特点,研究多种异构网络的融合是CPS网络进一步发展的重要任务。在建筑环境下CPS中为满足用户需求,提高通信服务质量(QoS),需要选择一个最佳接入网络,而最佳接入网络的选择受几个因素的影响。面对传统算法考虑参数单一问题,本文提出一种利用层次分析,计算权重再进行加权平均计算决策的异构无线网络选择算法。通过仿真结果证明,利用改进的异构网络融合算法可以提高通网络吞吐量,提升服务质量。在CPS的信息网络层中,异构无线网络环境下进行网络选择过程中的频繁切换会有大量切换处理开销,降低服务质量。为此本文研究了一个改进的垂直切换算法可减少在异构无线网络环境下进行的垂直切换次数。首先将带宽、信号强度等判决参数进行归一化处理,用层次分析法计算权重,权重系统用于代价函数,再根据最小代价函数选择最佳网络。以无线局域网(WLAN)和移动通信系统(UMTS)为例,进行仿真建模。仿真结果表明改进的垂直切换算法,在运行时间和不同移动速度的情况下,均能有效减少切换次数,选择最佳网络,提高服务质量。文章最后对工作进行总结,并对下一步管理服务层的研究工作做出展望。(本文来源于《沈阳建筑大学》期刊2015-11-01)

王金海,黄传河,王晶,何凯,史姣丽[8](2015)在《异构云计算体系结构及其多资源联合公平分配策略》一文中研究指出资源分配策略是当前云计算研究领域中的一个重要研究热点,异构云计算体系结构下的复杂应用问题研究中,最基本的问题在于如何将总体有限的资源分配给多个租户或应用,以达到效率或收效最大化.但是,在经典的资源分配问题中,任务或者用户往往是"贪婪"的;因此,在总体资源有限的前提下,资源分配的公平性就显得尤为重要.为了满足不同的任务需求,达到多种资源分配的公平性,设计了一个虚拟化的异构云计算体系结构,提出了该体系结构下基于占优资源的多资源联合公平分配算法(maximizing multi-resource fairness based on dominant resource,MDRF),并且证明了算法的帕累托等相关属性;给出了占优资源熵(dominant resource entropy,DRE)和占优资源权重(dominant resource weight,DRW)的定义,占优资源熵更加精确地刻画了用户资源请求与任务所调度到的服务器资源之间的适应程度,使系统的自适应能力更强同时提高了资源利用率.占优资源权重保障了用户优先获取资源的优先次序,协同所采用保障公平性的Max-Min Fairness策略,使资源的分配更加有序.实验表明,我们的策略有更高的系统资源利用率,并且使需求与供给更加匹配,进而使用户的占优资源获取更多,提高了服务质量.(本文来源于《计算机研究与发展》期刊2015年06期)

高玉励,周秀娟,张国凯[9](2015)在《基于CPU/GPU异构体系结构的混合编程模型》一文中研究指出随着计算机GPU硬件的快速发展,GPU编程环境变得友好,CPU/GPU异构体系结构也被广泛的应用。文章为了有效利用CPU/GPU异构体系结构的优点,并提出了基于该体系结构的两种并行编程模型,使得并行程序设计研究人员使用CPU/GPU异构体系结构的并行编程模型来对大量的程序进行设计,从而最大程度地提高程序的性能。(本文来源于《信息通信》期刊2015年04期)

杨博[10](2015)在《基于GPU异构体系结构的大规模图数据挖掘关键技术研究》一文中研究指出图(graph)作为最基本的数据结构之一,在生物信息学、化学数据分析、社交网络研究以及程序bug检测等众多应用领域被用于构建和表示对象之间的复杂关系。随着这些应用领域的不断发展,图数据挖掘作为这些应用领域的关键基础工具,重要性日益凸显,涉及领域和内涵不断扩展。由于这些领域应用图数据规模的不断增长,而且大多数图处理算法具有很高的计算复杂度,因此大规模的图数据挖掘急需高性能计算研究的支持。近些年来,相对通用CPU计算平台GPU异构计算平台由于在计算能力、访存带宽、性能功耗比方面的明显优势,逐渐被广泛的应用于众多通用计算领域,也为高效的处理大规模图数据提供了机遇。本文针对大规模图数据挖掘领域的几类重要问题,其中包括:图遍历、图分析、图同构与图挖掘,研究了其典型算法在GPU平台上的细粒度并行问题,提出了相应的基于GPU的并行算法,集中解决了基于GPU的细粒度并行算法设计中面临的若干技术难点,达到了提高大规模图数据挖掘性能的目的。本文取得的重要研究成果如下:1.基于GPU的大规模图遍历研究本文提出了基于优化的顶点前沿队列的GPU广度优先搜索算法,解决了已有基于顶点前沿队列的并行广度优先搜索算法在每层迭代内两个阶段中遇到的性能瓶颈。主要包括:针对已有算法邻居收集过程中采用的prefix-sum和warp-centric任务调度方法在GPU Warp内出现负载不均衡问题,提出了基于虚拟队列的任务调度方法更好的缓解邻居收集过程中的负载不均衡问题;其次针对已有的边前沿队列局部去重方法的不足,提出了一种新的全局去重方法,完全剔除边前沿队列的重复顶点,另一方面针对无尺度图的广度优先遍历中某几次迭代中边前沿队列冗余顶点多的问题,提出了一种正向和逆向混合的遍历方法,有效的减少了对冗余顶点的遍历。实验结果表明,本文提出的算法相对目前性能最好的GPU广度优先搜索算法Merrill算法,在基于Nvidia K40c GPU的异构计算平台上最高获得了3.2倍的性能加速比。2.基于GPU的大规模图分析研究本文提出了一种基于GPU的图中介中心度计算算法。针对中介中心度计算过程中的最短路径计算阶段和相关度累加阶段,首先结合前一章提出的基于虚拟队列的任务调度方法和全局去重方法给出一种基于前沿队列的方法,有效的解决了已有的基于前沿队列方法中遇到的负载不均衡问题,同时消除了其对原子操作的使用。此外,提出一种基于收集的最短路径数目计算方法,消除了最短路径数目统计中的数据竞争。其次,提出一种改进的基于顶点并行的方法,解决了已有基于顶点并行方法负载不均衡问题。最后,提出一种混合方法,有效的整合了前面两种算法各自的优势。实验结果表明,本文提出的算法相对目前性能最好的GPU中介中心度计算算法Mc-Sampling算法,在基于Nvidia K40c GPU的异构计算平台上获得了1.2-1.9倍的性能加速比。同时,该算法还具有良好的可扩展性。3.基于GPU的大规模子图同构查询研究本文首次提出了一种基于图遍历的GPU子图同构算法,该算法使用区域遍历方法确定匹配顺序,主要由GPU区域遍历和GPU子图匹配两部分组成。工作主要包括:首先,针对区域遍历过程,基于深度优先遍历过程中形成的部分子树映射树中不同分支上顶点(部分子树映射)之间的独立性和不同分支控制流的相似性,给出了一种递归计算模式的数据集细粒度并行方法,提出了一种细粒度的数据级并行的区域遍历算法,同时给出了一种高效的面向并行区域遍历的用于存储候选顶点集合的数据结构。其次,针对子图匹配过程,利用子图匹配迭代中不同的部分子图映射的独立性,提出了一种基于候选顶点扩展的GPU子图匹配算法。最后,针对图的不规则性带来的区域遍历和子图匹配过程中负载不均衡问题,提出了两种负载均衡的任务分配策略。研究结果表明,相比目前性能最好的CPU子图同构算法TurboISO算法,在基于Nvidia K40c GPU的异构计算平台上,本文提出的GPU算法获得了1.4-2.6倍的加速比。4.基于CPU/GPU异构平台的频繁子图挖掘研究本文提出了一种基于CPU/GPU异构平台的gSpan频繁子图挖掘算法,有效的挖掘了gSpan算法的粗粒度和细粒度并行性。工作主要包括:首先,针对模式图扩展,提出一种基于虚拟队列的并行子图映射扩展算法,解决了已有并行子图映射扩展的负载不均衡问题。其次,针对扩展边的支持度计算,提出两种相比已有方法时间复杂度更低的并行支持度计算算法,基于数据图收集的方法和基于扩展边排序的方法,分别用于处理两种不同类型图数据集的支持度计算。然后,针对最小DFS编码验证可并行性低的问题,提出了一种基于CPU的粗粒度并行的最小DFS编码验证算法,此外给出一种负载均衡的流水线协同计算方式,有效隐藏了CPU/GPU间通信开销。最后,针对子图映射的生长,给出一种并行子图映生长算法。相比经典的gSpan算法和已有的基于GPU的gSpan算法,在基于Intel E5-2670 CPU和Nvidia K40c GPU的异构计算平台上,本文提出的基于GPU的频繁子图挖掘算法最高分别获得了17倍和3.7倍的性能加速比。(本文来源于《国防科学技术大学》期刊2015-04-01)

异构体系结构论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

立足现有卫星通信系统的特点,围绕天地一体化网络的特点,主要从体系结构方面探讨目前在网络扩展性、可编程性方面能够提供卓越性能的软件定义网络SDN(Software Defined Network)和网络功能虚拟化NFV(Network Function Virtualization)技术在天地一体化网络中的设计和应用,提出一种基于SDN的天地一体化弹性异构组网体系结构,实现一体化网络的灵活、可靠、高效设计,使卫星网络在一体化过程中优化资源的使用,通信提高服务水平。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

异构体系结构论文参考文献

[1].开磊.异构多核处理器体系结构分析[J].大众投资指南.2019

[2].续欣,汤凯.基于SDN的天地一体化弹性异构组网体系结构[C].2018软件定义卫星高峰论坛会议摘要集.2018

[3].刘恒良.异构可重构计算体系结构及其实现技术[D].中国计量大学.2018

[4].林恒.基于超大规模异构体系结构的图计算系统研究[D].清华大学.2017

[5].原略超.面向MIMO基带干扰消除的高灵活性异构多核体系结构设计与实现[D].国防科学技术大学.2017

[6].王岳青,窦勇,吕启,李宝峰,李腾.DLPF:基于异构体系结构的并行深度学习编程框架[J].计算机研究与发展.2016

[7].溥博文.基于CPS的智能建筑无线网络异构体系结构研究[D].沈阳建筑大学.2015

[8].王金海,黄传河,王晶,何凯,史姣丽.异构云计算体系结构及其多资源联合公平分配策略[J].计算机研究与发展.2015

[9].高玉励,周秀娟,张国凯.基于CPU/GPU异构体系结构的混合编程模型[J].信息通信.2015

[10].杨博.基于GPU异构体系结构的大规模图数据挖掘关键技术研究[D].国防科学技术大学.2015

论文知识图

地质灾害综合监测自动传输网络2.6SpMV在离散GPU上的动态优...3.6CPU和GPU构成的异构典型CPU-GPU异构体系结构异构路由器集群CHR体系结构模型异构分布式联动体系结构

标签:;  ;  ;  ;  ;  ;  ;  

异构体系结构论文_开磊
下载Doc文档

猜你喜欢