导读:本文包含了异构计算论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:异构,神经网络,卷积,英特尔,数据,交通标志,热点。
异构计算论文文献综述
赵少东,王程斯[1](2019)在《基于异构计算与实时可视化技术的综合能源大数据平台研究与应用》一文中研究指出大数据技术是在复杂网络环境中处理海量数据的重要技术。产业的发展使得业务范围扩张,庞大的业务范围导致海量的数据,虽然以往的大数据技术能够有效对此进行处理,但在精确性、实时性上任然存在不足。为了实现可视化能源管控和提高大数据技术的应用价值,从电力企业的角度,提出一种基于异构计算机的实时可视化综合能源大数据平台,该平台能够以非侵入形式,与电力业务范围内各电力用户的异构计算机相互连接,以此获得更加准确的、与电力能源供给相关的数据,例如电力用户的用电习惯、用电特点等,以此在综合角度上对电力能源供给的状态进行可视化监控。(本文来源于《微型电脑应用》期刊2019年11期)
陈炳欣[2](2019)在《抢占竞争异构计算技术高点 3D封装格局叁足鼎立?》一文中研究指出近日,全球第二大晶圆代工厂格芯(GlobalFoundries)宣布,采用12nm FinFET工艺,成功流片了基于ARM架构的高性能3D封装芯片。这意味着格芯亦投身于3D封装领域,将与英特尔、台积电等公司一道竞争异构计算时代的技术主动权。放弃7(本文来源于《中国电子报》期刊2019-08-20)
贺超,郭大波,穆健健,马识途[3](2019)在《基于OpenCL/GPU异构计算的高速数据协调系统设计》一文中研究指出针对当前连续变量量子密钥分发时数据协调运算速度低的问题,本文提出一种采用GPU与OpenCL异构计算的多维数据协调方案,并提出了一种静态双向十字链表存储超大规模LDPC码的校验矩阵,以适应OpenCL平台特殊要求。实验仿真结果显示,当码长为2×105时,在保证有效数据协调且相同码率的前提下,GPU平均译码速率可达到CPU的4.2倍,但牺牲了部分精度。(本文来源于《量子光学学报》期刊2019年03期)
宋子恒[4](2019)在《基于异构计算架构的嵌入式交通标志牌识别系统的设计与实现》一文中研究指出近年来,随着人工智能时代的到来,汽车自动驾驶技术得到了飞速发展。无人送货等小型自动驾驶车辆亦逐渐普及,该类车辆体积小、携带能源有限,在其交通标志识别系统中通常存在两类问题。若使用通用CPU、GPU计算架构的硬件平台,存在功耗高影响车辆续航能力的问题;若使用低功耗的嵌入式CPU,功耗虽低但处理能力差,无法满足系统实时处理图像数据的需求。为了解决上述问题,本文基于嵌入式CPU+FPGA的异构计算架构设计并实现了一种新的交通标志识别系统。该系统由交通标志分割子系统和交通标志内容识别子系统两个子系统级联而成。交通标志分割子系统使用颜色阈值将交通标志从整体图像中分割出来,交通标志识别子系统使用Lenet-5卷积神经网络对分割后的交通标志图像进行识别。交通标志分割子系统使用FPGA对颜色阈值分割算法中的色域空间转换,以及模糊、膨胀、腐蚀等算法进行并行化和流水线化设计,实现了加速。交通标志内容识别子系统使用FPGA对卷积神经网络不同卷积核之间的计算进行了并行化,将卷积层和池化层之间设计为流水线结构,从而实现了系统的加速。最终,系统以低于6w的总功耗,实现了从30fps的视频流中实时识别国内红蓝底色交通标志的目标,包括方向指示、禁止、限速等共25类交通标志,识别准确率达92%。系统功耗仅为core i5 CPU的17%。(本文来源于《北京邮电大学》期刊2019-06-02)
梁頔男[5](2019)在《基于支持向量机的预测控制器FPGA异构计算及应用》一文中研究指出模型预测控制由于能够处理多输入、多输出、多目标问题,并且能够显示和主动地处理系统约束,因此得到了广泛的应用。由于模型预测控制的求解过程是在有限的采样时间间隔内反复计算完成的,而快速动态系统提出了高实时性、嵌入式、低成本约束和高集成度等要求,传统的控制器硬件实现方案已无法满足需求,因此模型预测控制的FPGA实现成为了研究热点。新应用领域的系统复杂度逐渐提高,对控制系统的集成度、调度能力、存储资源和通信方法等方面的要求迅速提升,传统的单一FPGA实现方案逐渐不能满足应用需求。为了提高系统的灵活性,增强系统性能,本文设计了预测控制器的FPGA异构计算实现方案,充分利用ARM和FPGA的优势,通过软硬件结合设计的方式,对系统进行数据访问设计、内存结构优化、系统端口设计和并行设计等,得到满足速度、面积和系统能力要求的高性能预测控制器。最后通过车辆路径跟踪控制的实时实验,验证了基于FPGA异构计算实现的预测控制器的实时性与有效性。本文进行的主要工作包括以下叁个方面:1.考虑模型预测控制是基于模型的算法,而新应用领域的被控对象例如车辆系统,具有强非线性、机理耦合等特点,难以建立面向控制器的机理模型,本文提出了基于支持向量机的预测控制方法,使用支持向量机算法训练被控对象模型,得到结构简单、包含被控对象全面信息的支持向量机模型。然后基于此模型设计预测控制器,并采用原始对偶优化求解算法对控制器的二次规划问题进行求解。最后以车辆路径跟踪问题为应用对象,在MATLAB中构建“基于支持向量机的模型预测控制器-车辆”闭环系统,完成车辆路径跟踪的离线仿真实验,初步验证了本文设计的基于支持向量机的预测控制器的有效性。2.由于预测控制算法需要在线进行求解,为提高预测控制器的在线计算能力,同时考虑汽车电控系统的实时性、小型化、低成本等需求,本文提出了FPGA异构计算加速方案,基于ZYNQ(ARM+FPGA)设计了软硬件结合的模型预测控制器。首先按照异构计算开发流程,对控制器进行ARM处理器上的软件设计,分析预测控制器算法结构并使用C/C++代码编写,针对各模块的数据精度需求进行定点数据结构设计,完成控制算法C/C++代码定点化,利用SDSoC将控制算法移植到ARM处理器中进行软件模块的板级开环验证,证明算法的准确性。然后分析算法结构,将原始对偶求解算法模块化移植到FPGA中,通过进行数据访问模式设计、内存结构优化、系统端口设计优化ARM与FPGA之间的数据通信,提高软硬件之间的通信效率;对矩阵运算模块进行流水线展开优化,提高FPGA上的计算速度。最后进行软硬件结合的控制器板级开环验证,证明了控制器的准确性。3.为验证基于FPGA异构计算加速的预测控制器的有效性与实时性,进行车辆路径跟踪控制的硬件在环实验。首先联合MicroAutoBox搭建车辆路径跟踪实时实验平台,其中ZYNQ上运行基于支持向量机的模型预测控制器,MicroAutoBox模拟实时的车辆系统,通过以太网进行通信形成闭环系统。在实时实验平台上完成车辆路径跟踪实验,并与纯软件方案即在ARM处理器上实现控制算法进行性能比较,其中基于FPGA异构计算加速方案的预测控制器一次求解时间为3.74ms,系统采样时间为10ms,相对于纯软件的求解时间10.8ms提升了2.88倍,实验结果验证了基于支持向量机的预测控制器FPGA异构计算方案的有效性与实时性。本文的研究工作得到了国家自然科学基金重大项目“极限工况下汽车主动安全协同控制及应用验证”(No.6179560010)、国家自然科学基金青年基金项目“非线性模型预测控制的快速计算方法研究及应用”(No.61703176)和吉林省省校共建计划专项“下一代乘用车的底盘电动化先进技术”(No.SXGJSF2017-2-1-1)的资助。(本文来源于《吉林大学》期刊2019-06-01)
周松江[6](2019)在《基于CPU与多FPGA架构的深度学习异构计算平台研究与实现》一文中研究指出近年来,深度学习的概念被提出并被广泛应用于诸多领域。目前深度学习仍处于发展衍化阶段,涉及到的神经网络具有规模大、结构复杂多变等特点,需要一种资源丰富、灵活性强的硬件平台来实现深度学习算法。本课题提出并研究了一种基于CPU与多FPGA架构的深度学习异构计算平台,通过在异构计算平台中引入多块FPGA开发板辅助计算来解决单个FPGA计算系统资源不足的缺陷,以实现大规模的深度学习算法。本文给出了该异构计算平台的整体架构,对平台设计中所用到的关键技术进行了介绍,并通过基于该平台实现一个用于音频事件检测的深度学习算法来对平台的性能进行测试。通过对基于CPU与多FPGA架构的深度学习异构计算平台的数据流和工作过程进行整体分析,本文提出了该平台的整体架构。按照自顶向下的顺序依次对平台中CPU子系统、总线通信子系统和FPGA子系统进行了设计。其中CPU子系统用于数据流传输控制,FPGA子系统使用一个通用架构来实现深度学习算法的核心计算,这两个子系统之间通过总线通信子系统进行连接。由于本文所提出的异构计算平台可以根据需求使用不同数量的FPGA开发板,故该平台具有计算力强、灵活性高的特点。FPGA作为本课题所提出的异构计算平台的核心计算单元,其计算速度直接影响系统的性能。本课题提出了叁项关键技术用于提高平台工作的并行度以达到高速数据处理的目的:多层次流水线技术、DDR3 SDRAM数据调度分配技术和总线数据传输技术。其中多层次流水线技术通过提高平台中FPGA之间和单个FPGA中计算模块之间的并行度来提高平台的数据处理速度;DDR3 SDRAM数据调度分配技术用以从外部DDR3 SDRAM中读取数据并分配到并行工作的各个计算模块;总线数据传输技术则采用数据预取的方式使得FPGA计算和数据传输以并行的方式进行工作。本课题最后利用所提出的深度学习异构计算平台实现了一个用于音频事件检测的深度学习算法,并对所提出平台的计算速度、能效比与CPU进行了对比。测试结果表明,尽管平台中PCIe总线消耗了约30%的功耗,但该平台的整体功耗仅仅为单独的CPU系统的1.6倍,同时平台在计算速度方面获得了15倍左右的加速。因此所提出的平台在能效比方面具有优势。基于上述实验结果,本课题所提出的深度学习异构计算平台能够适应不同数量的FPGA开发板,从而为平台实现不同规模的深度学习算法提供了必要的灵活性。(本文来源于《北京邮电大学》期刊2019-06-01)
李阳[7](2019)在《基于异构计算平台的推荐算法加速器的研究与实现》一文中研究指出在移动互联蓬勃发展的当下,任何与用户打交道并希望获得较好用户体验的系统都离不开一套完备的推荐系统。随着系统数据体量的增长,各种推荐算法需要花费更长的时间来处理来自用户的海量数据。为了让推荐系统对输入数据进行响应并处理后更快地将推荐结果呈现给用户,加快推荐算法的执行速度成为了亟待解决的问题。目前针对现有的各种推荐算法,主要采用云计算平台,分布式通用处理器平台,和图形处理器平台进行硬件加速。这些方法虽然在一定程度上提升了推荐算法的运行效率,但同时伴随而来的能效和成本等问题也是不容忽视的。本文选用一种由通用处理器(CPU)和现场可编程门阵列(FPGA)组成的异构计算平台来对推荐算法的硬件加速相关问题进行研究。它的主处理器(CPU)可以对整个系统进行控制,同时完成一些简单的数据处理任务;协处理器(FPGA)本身的功耗非常低,且拥有大量的逻辑运算单元可以用来执行耗时的任务。两者相互协作,获得算法执行时整体功耗的降低和效率上的提升。本文的研究工作主要包括以下几个方面:1.从目前较为流行推荐算法中,选取基于内容的推荐算法、基于协同过滤的推荐算法和基于关联规则推荐算法的原理进行研究,针对基于关联规则的推荐算法存在的问题进行优化,结合本文所设计的支持多种推荐算法的异构计算平台,提出了一种新的混合最近邻和关联规则的推荐算法,并进行了实验验证了其推荐效果。2.对几种推荐算法的计算热点进行研究,归结出四个计算热点,对它们的运算过程进行了并行和流水线的优化来加速其执行过程。3.将优化后的计算热点设计为四种硬件加速IP核,完成了对它们内部结构、IO接口、关键模块的执行过程的设计,并提出了针对性的HLS优化策略;同时,完成了整个硬件加速器的设备驱动层和用户接口层的设计。4.选用ZYNQ系列实验板作为异构计算平台实现了整个硬件加速器的原型,设计在异构计算平台和几种通用处理器(CPU)平台上完成几种相同推荐任务的对比实验,验证了对计算热点的并行和流水线优化的后的加速效果,得出了该异构计算平台在能效比较高的基础上有良好的加速效果的预期结论。(本文来源于《北京邮电大学》期刊2019-06-01)
张舸,张鹏远,潘接林,颜永红[8](2019)在《基于异构计算的语音识别解码加速方法》一文中研究指出提出一种基于异构计算方法加速基于神经网络声学模型的语音识别解码器的方法。该方法通过GPU和CPU协同计算,利用GPU的浮点运算能力和并行计算能力加速神经网络计算,从而加快语音识别解码过程。为了充分利用计算资源,本文实现了多卡多线程GPU-CPU协同解码系统,并对神经网络计算过程进行了优化,以提升计算并行程度。所提出的加速方法与仅使用CPU的解码方法相比,取得了3倍以上的解码加速比,并保持解码精度不变。(本文来源于《网络新媒体技术》期刊2019年03期)
谈兆年,计卫星,Akrem,Benatia,高建花,李安民[9](2019)在《面向异构计算平台的SpMV划分优化算法研究》一文中研究指出稀疏矩阵向量乘SpMV在科学计算和工程问题中有着广泛的应用。稀疏矩阵的非零元素分布会极大地影响SpMV的计算效率,针对不同的数据分布模式使用特定算法进行加速可以获得显着的性能提升。CPU的控制能力强,适用于通用计算,而GPU的计算核心多,并行度高,适用于数据密集型计算。根据CPU和GPU的不同特点,充分发挥二者的优势,可以使SpMV获得更大的性能提升。研究CPU-GPU混合架构上SpMV的任务划分与优化方法,针对2种主要的稀疏矩阵数据分布模式:Quasi-diagonal和Tetris,提出了一种基于SVR的任务二次分配算法。研究的2种稀疏矩阵模式具有很好的代表性,在实际科学工程应用中占比达到66%。实验评测结果表明,采用本文的算法之后,与GPU相比,异构平台上Quasi-diagonal和Tetris的加速比平均值分别达到1.74×和2.15×。(本文来源于《计算机工程与科学》期刊2019年04期)
刘运麒[10](2019)在《一体化异构计算处理系统设计与实现》一文中研究指出移动通信长久以来保持着高速发展,不同种类的信号处理方式不断地投入实际应用中。传统的信号处理平台的软硬件架构都只针对一种信号处理业务进行设计,因此随着通信技术的不断演进,对不同的软硬件平台进行维护的负担将会愈来愈重。因此,开发适用于多种信号处理场景、能够同时进行多种任务处理、具有可裁剪、可扩展特性的一体化信号处理平台成为趋势。本文展开了具有动态可重构特性的一体化计算平台的研究与验证,论文的主要工作包括以下方面:第一,设计了具有动态可重构特性、采用CPU+FPGA结构的一体化异构计算系统架构,并阐述了一体化系统的基本工作过程。介绍了一体化系统的硬件机箱架构、CPU软件架构和FPGA逻辑架构。第二,完成了以ZYNQ为计算核心的FPGA板卡与其管理系统的的设计与实现。板卡主要针对CPU+FPGA异构计算进行设计,预留了丰富的与CPU进行互联的40G以太网和PCIe接口,并支持动态可重构特性,提供充足的比特流缓存以及高速配置接口。第叁,提出了一种基于Chisel的通用数据交换结构描述方法。以通用、可重载、可伸缩的基础交换节点为基础单元,通过对基础单元的配置与互联实现数据交换结构。该方法能够快速完成数据交换结构的描述与部署,为根据需求和算法变动快速实现架构修改提供基础支撑。第四,提出了通用的FPGA动态可重构规划策略,并实现了动态可重构链路。动态可重构规划策略将FPGA划分为若干独立的资源块,各个资源块之间通过数据交换网络进行互联,每个独立的资源块能够独立地进行动态重配置。动态可重构链路实现了资源块配置的排序与高速配置接口。规划策略与重构链路共同实现了FPGA在运行期的高效动态配置特性。本文提出了一种一体化异构计算系统的架构,实现了用于一体化系统的FPGA板卡,提出了用于快速迭代的一致性数据结构描述方法,具有工程意义,为一体化系统的实现提供了参考。(本文来源于《电子科技大学》期刊2019-04-10)
异构计算论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
近日,全球第二大晶圆代工厂格芯(GlobalFoundries)宣布,采用12nm FinFET工艺,成功流片了基于ARM架构的高性能3D封装芯片。这意味着格芯亦投身于3D封装领域,将与英特尔、台积电等公司一道竞争异构计算时代的技术主动权。放弃7
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
异构计算论文参考文献
[1].赵少东,王程斯.基于异构计算与实时可视化技术的综合能源大数据平台研究与应用[J].微型电脑应用.2019
[2].陈炳欣.抢占竞争异构计算技术高点3D封装格局叁足鼎立?[N].中国电子报.2019
[3].贺超,郭大波,穆健健,马识途.基于OpenCL/GPU异构计算的高速数据协调系统设计[J].量子光学学报.2019
[4].宋子恒.基于异构计算架构的嵌入式交通标志牌识别系统的设计与实现[D].北京邮电大学.2019
[5].梁頔男.基于支持向量机的预测控制器FPGA异构计算及应用[D].吉林大学.2019
[6].周松江.基于CPU与多FPGA架构的深度学习异构计算平台研究与实现[D].北京邮电大学.2019
[7].李阳.基于异构计算平台的推荐算法加速器的研究与实现[D].北京邮电大学.2019
[8].张舸,张鹏远,潘接林,颜永红.基于异构计算的语音识别解码加速方法[J].网络新媒体技术.2019
[9].谈兆年,计卫星,Akrem,Benatia,高建花,李安民.面向异构计算平台的SpMV划分优化算法研究[J].计算机工程与科学.2019
[10].刘运麒.一体化异构计算处理系统设计与实现[D].电子科技大学.2019