异构多核处理器论文-余世干,唐志敏,叶笑春,范东睿

异构多核处理器论文-余世干,唐志敏,叶笑春,范东睿

导读:本文包含了异构多核处理器论文开题报告文献综述及选题提纲参考文献,主要关键词:异构多核,处理器,推测机制,容错

异构多核处理器论文文献综述

余世干,唐志敏,叶笑春,范东睿[1](2019)在《基于推测机制异构多核处理器容错方法与仿真》一文中研究指出异构多核是处理器重要方向之一,却面临着瞬态故障频发问题,传统TMR(叁模冗余)是主要解决办法,但有效率低,功耗高特点,提出基于推测机制高性能容错调度算法FTSAS。各异构核独立执行任务,记录最先完成核的状态值,采用前向推测法继续执行下一任务,采用多数一致原则,由落后的核完成结果比较,保障系统可靠性。仿真实验表明,FTSAS比当前容错方法平均性能提高了12.9%,注入200个错误时,具有相近的容错效果,但FTSAS平均执行性能提高了11.4%,平均功耗降低了15.8%。(本文来源于《系统仿真学报》期刊2019年12期)

孙嘉鸿[2](2019)在《针对细胞图像处理的异构多核处理器研究》一文中研究指出随着细胞图像处理在临床医疗诊断中的广泛应用,细胞图像处理的实时性要求越来越高。由于同构多核处理器在处理细胞图像时运算速度提升受限,因此研究含有不同加速指令的异构多核处理器对细胞图像处理具有重要意义。通过对多核处理器及细胞图像处理算法的研究,设计了一款应用于细胞图像处理的异构多核处理器。该处理器共有八个内核,每个内核均是两级流水处理器,第0个内核前设置输入缓冲作为细胞图像的缓存,八个内核通过交叉开关矩阵访问具有四个存储块的共享数据存储池。交叉开关矩阵对内核地址低的数据进行优先编码,当两个内核同时访问同一存储块时,地址较低的内核优先进行访问。多核处理器采用了无锁结构的生产者-消费者并行编程模型,实现多个内核存储及读取数据的配合。针对细胞图像处理的算法选用K近邻平滑滤波、全等级直方图灰度拉伸、高斯模糊、USM锐化、最大类间方差法及连通域标记等算法,并在不同内核中设计Absort指令、Inireg指令、Sumreg指令、Sum4指令、Abs指令、Mulsub指令及Mulpow指令对算法进行加速,使得运行K近邻平滑滤波算法的内核速度提升了2.66倍,运行全等级直方图灰度拉伸及高斯模糊算法内核的速度提升了1.21倍,运行USM锐化算法内核的速度提升了1.36倍,运行最大类间方差法内核的速度提升了1.17倍。异构多核处理器在UMC110nm的工艺下完成仿真及综合,其在各个内核运行对应算法时处理细胞图像速度为每秒203.11帧,相比于单核结构速度提升了10.83倍,最高时钟频率为136.98MHz,总面积为19.0mm~2。(本文来源于《西安理工大学》期刊2019-06-30)

开磊[3](2019)在《异构多核处理器体系结构分析》一文中研究指出为了弥补单核处理器的不足而设计的多核处理器具有较强的运算性能,在提高多核处理器性能的过程中,依然面临很多问题。层次结构多核、异步多核及异构多核时多核处理器技术当下的主要发展方向。设计多核处理器是一项烦琐而艰巨的任务,需要不断进行测试及修改,设计工作不能只停留在硬件层面中,否则会出现效率低下、费用增大和资源浪费的后果。所以应借助软仿真技术来解决这一问题,在设计过程中要仿真软件,借助软件手段对设计方案进行测试,不断进行完善,对设计进行优化,使处理器设计效率得到显着改善。(本文来源于《大众投资指南》期刊2019年07期)

安鑫,张影,康安,陈田,李建华[4](2019)在《基于机器学习的异构多核处理器系统在线映射方法》一文中研究指出异构多核处理器(HMPs)平台已成为现代嵌入式系统的主流解决方案,其中在线映射或调度对充分发挥其高性能和低功耗的优势起着至关重要的作用。针对HMPs的应用任务动态映射问题,提出了一种基于机器学习预测模型的在线映射调度解决方案。一方面,构建了一个可以快速高效地预测和评估不同映射方案性能的机器学习模型,为在线调度提供支持;另一方面,将该机器学习模型整合到遗传算法中以高效地找到(接近)最优的资源分配方案。最后,通过一个M-JPEG解码器验证了所提方法的有效性。实验结果表明,该方法的平均执行时间相较于常见的轮询调度和抽样调度方法分别降低了28%和19%左右。(本文来源于《计算机应用》期刊2019年06期)

鲁湛,代作晓[5](2018)在《基于异构多核处理器的实时红外人体目标检测技术》一文中研究指出红外实时人体目标检测因无需主动光源、易于去除环境干扰等优点成为近年来人工智能领域的一个研究热点。当前主流实时红外嵌入式图像采集处理方式因图像传输、接口速度、工程量等技术局限,制约了红外人体目标检测的便捷实现和实时利用。针对传统嵌入式处理器难以同时采集和处理红外数据这一影响红外人体目标检测实时性的技术问题,研究了基于ZYNQ异构多核处理器的实时检测技术。采用FPGA+多核ARM架构,由FPGA端实现人体红外图像的VDMA采集、预处理及显示,由多核ARM端完成HOG-SVM算法处理,并使用TBB进行加速。实验结果表明:该技术能够完成人体目标的实时有效检测,兼具功耗低、开发简单、实用性强和集成度高等优点。(本文来源于《半导体光电》期刊2018年05期)

楚要钦,施辰光,刘永强[6](2018)在《一种基于异构多核处理器的小型综合化弹载计算机设计》一文中研究指出随着智能化导弹的发展,对弹载计算机的小体积、低功耗、轻重量、高性能提出了更高的要求。分析了小型化弹载计算机的技术需求,提出一种基于异构多核处理器的综合化弹载计算机设计,采用系统制导控制一体化设计,外部接口标准化、模块化设计,提高了系统集成度,缩短了研制周期,降低了开发成本。经地面环境验证,能够满足弹载电子系统的研制要求,适用于小型化弹载电子系统。(本文来源于《航空计算技术》期刊2018年05期)

罗殊彦,朱怡安,曾诚[7](2018)在《嵌入式异构多核处理器核间的通信性能评估与优化》一文中研究指出随着嵌入式技术的不断发展,越来越多的平台采用异构多核处理器(Heterogeneous Multi-Processor Unit,HMPU)进行高性能计算,但多核处理器的核间通信效率严格地制约着系统的高性能计算能力。针对HMPU的核间通信性能难以量化的问题,提出了基于通信粒度、通信缓存和消息传输机制的阶段评价模型,并通过实验验证了这3个影响因子对不同阶段的核间通信性能的影响。此外,由于嵌入式系统环境多变、资源有限,使得静态通信策略对系统性能优化具有局限性。针对该问题,提出了基于系统内存约束、时间约束和性能目标的动态通信策略优化模型(Dynamic Communication Strategy Optimization Model,DCSOM)。通过实验证明:在数据量较小、通信周期较长的异构多核处理器中,DCSOM更具优越性。(本文来源于《计算机科学》期刊2018年S1期)

郑晶晶[8](2018)在《面向动态异构多核处理器的资源分配及多智能体协同优化研究》一文中研究指出异构多核处理器的资源分配问题是一系列的决策问题且较为复杂,为了在给定的预算功率约束下实现最佳的性能,需要对系统的各种资源进行有效地分配。运行时的应用程序资源需求与分配间的任何误匹配都会导致次优的EDP(Energ y-Delay-Product,EDP)。针对系统资源的动态需求与运行时分配的不匹配问题,现有的工作也存在不同的优化技术。由于非迭加效应,系统运行时选择多目标进行优化较为复杂。基于此,本文主要对运行时的异构多核处理器资源分配及多智能体协同优化进行研究,主要研究工作如下:1.在算法的选取上,本文探索和评估了TD方法、Sarsa算法和Q-learning叁种强化学习技术,比较了叁种方法的优缺点,并结合本文所研究的问题,最终选取了Q-learning算法来对该问题进行优化。2.针对核与非核区的DVFS控制器,将核的DVFS控制器状态进行量化,并选取EDP作为奖励函数;而非核区,由于其性能主要受频率影响,故而对非核区建立了类似核的DVFS控制器,并对其进行量化。针对末级缓存的动态分配,由于其分配方式存在大量的可能性,本文通过在线强化学习对其进行了高效地分配。3.针对多核处理器的整体资源分配,由于MLM(Machine Learned Machines,MLM)模型并不能保证系统总是达到全局最优,因此,本文对其进行探索改进,建立JAMCL模型。JAMCL模型能使控制器之间相互协调,相互共享信息,实现更有效的重新配置,同时,多智能之间能协调联合地进行高效搜索,从而确保系统达到全局最优。实验中,本文通过Sniper模拟仿真器对基于ANN、XChange、MLM1、MLM2、MLM3、CMLM及JAMCL资源分配优化模型进行了验证,实验结果显示,系统EDP经过协同优化(MLM、CMLM、JAMCL)的结果比所有单独应用优化技术都要低得多。就平均而言,JAMCL除了个别少数(Mix19)的工作混合负载变现较差外,绝大部分的混合工作负载表现要优于XChange,同时在EDP改善率,吞吐量与公平性下降率叁个度量标准上表现为最优;从多线程工作负载角度来看,JAMCL协同优化也优于XChange,表现出15.6%的EDP改善率,6.5%的吞吐量下降率,而XChange变现出非常高的(19.5%)吞吐量下降率;就存储时间与搜索时间而言,本文分别对基于ANN、XChange、MLM、CMLM、JAMCL模型的存储开销和搜索时间进行分析计算,JAMCL的存储开销(1.76KB)最小,搜索时间(<2000 cycles)较短,但依旧远小于ANN(25000 cycles)和XChange(6000 cycles)的搜索时间。(本文来源于《广东工业大学》期刊2018-05-01)

吴志佳[9](2017)在《基于异构多核处理器的双目视觉系统设计与实现》一文中研究指出双目视觉是计算机视觉领域的重要分支,其通过计算出同一场景下同一空间点在双目图像上的视差来恢复深度信息,这种深度信息恢复方式具有非接触式和被动式两大优点。近年来,随着对双目匹配算法的深入研究,许多算法虽然在准确性上有了很大提高,但它们都以较理想的双目图像为前提。事实上由于现实成像因素的影响,常会导致双目图像在亮度等属性上具有偏差,这就要求算法还应具备较高的鲁棒性,另外,目前准确性较高的算法均具有计算量大、实时性差的特点,使其在要求实时处理的应用中很难运用。SGBM(Semi-global block matching)算法是一种半全局匹配算法,具有较高的准确性,但其鲁棒性与实时性依然有待提高。因此本文对SGBM算法做了改进研究和并行加速方法研究,并将改进后的算法应用到本文双目测距系统中。针对SGBM算法中BT匹配代价对亮度偏差不够鲁棒的问题,提出了一种联合Census匹配代价的BT-Census匹配代价。由于Census匹配代价很好的保留了邻域像素间的结构特性,因此在匹配时提高了对亮度偏差的鲁棒性。为了提高实时性,本文对改进后的算法做了并行加速方法的研究,并基于OpenCL(Open Computing Language)异构并行计算框架做了实现。首先对该算法中匹配代价、代价优化、视差计算及视差精细化模块的主要算法做了并行化分析,然后在OpenCL框架下,对算法的数据存储结构、OpenCL内核做了设计,并结合内核性能评估与算法优化,实现了异构并行加速的算法。实验表明,在同一处理器(AMD APU A8-4555M)上,本文算法在保证准确性相近的前提下,相比于经过SSE2指令集加速的SGBM算法,在实时性能上依然有2.2倍的提升。本文以上述改进的算法为核心,设计与实现了双目测距系统。该双目测距系统,采用了基于异构多核处理器的计算平台,不但减小了多核间的数据传输延迟,而且有效的控制了系统功耗。实验表明,在双目图像尺寸为640×480,最大视差层级为64的条件下,该双目测距系统平均测距周期为110ms,在0.5~5米以内的深度测量误差小于9.6%,初步实现了一套低功耗、近实时的双目测距系统。(本文来源于《北京交通大学》期刊2017-06-07)

田辉[10](2017)在《混合粒子群算法的异构多核处理器间任务调度》一文中研究指出针对异构多核处理器间的任务调度问题,为了更好地发挥异构多核处理器间的平台优势,提出一种基于将有关联的且不在同一处理器上的任务进行复制的思想,从而使每个异构多核的处理器能独立执行任务,来减少不同处理器之间的通信开销,并且通过混合粒子群算法(HPSO)来调度异构多核处理器中的任务,避免由于当任意一个异构多核处理器由于任务分配过多而导致计算机不能及时且准确地得出结果。最后实验证明,对比传统的启发式分配方案和常见的遗传算法(GA),基于任务复制思想分配方案和混合粒子群算法(HPSO)具有更好的求解能力,并且可以提供执行时间更少的调度分配方案,具有较好的应用价值。(本文来源于《单片机与嵌入式系统应用》期刊2017年05期)

异构多核处理器论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

随着细胞图像处理在临床医疗诊断中的广泛应用,细胞图像处理的实时性要求越来越高。由于同构多核处理器在处理细胞图像时运算速度提升受限,因此研究含有不同加速指令的异构多核处理器对细胞图像处理具有重要意义。通过对多核处理器及细胞图像处理算法的研究,设计了一款应用于细胞图像处理的异构多核处理器。该处理器共有八个内核,每个内核均是两级流水处理器,第0个内核前设置输入缓冲作为细胞图像的缓存,八个内核通过交叉开关矩阵访问具有四个存储块的共享数据存储池。交叉开关矩阵对内核地址低的数据进行优先编码,当两个内核同时访问同一存储块时,地址较低的内核优先进行访问。多核处理器采用了无锁结构的生产者-消费者并行编程模型,实现多个内核存储及读取数据的配合。针对细胞图像处理的算法选用K近邻平滑滤波、全等级直方图灰度拉伸、高斯模糊、USM锐化、最大类间方差法及连通域标记等算法,并在不同内核中设计Absort指令、Inireg指令、Sumreg指令、Sum4指令、Abs指令、Mulsub指令及Mulpow指令对算法进行加速,使得运行K近邻平滑滤波算法的内核速度提升了2.66倍,运行全等级直方图灰度拉伸及高斯模糊算法内核的速度提升了1.21倍,运行USM锐化算法内核的速度提升了1.36倍,运行最大类间方差法内核的速度提升了1.17倍。异构多核处理器在UMC110nm的工艺下完成仿真及综合,其在各个内核运行对应算法时处理细胞图像速度为每秒203.11帧,相比于单核结构速度提升了10.83倍,最高时钟频率为136.98MHz,总面积为19.0mm~2。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

异构多核处理器论文参考文献

[1].余世干,唐志敏,叶笑春,范东睿.基于推测机制异构多核处理器容错方法与仿真[J].系统仿真学报.2019

[2].孙嘉鸿.针对细胞图像处理的异构多核处理器研究[D].西安理工大学.2019

[3].开磊.异构多核处理器体系结构分析[J].大众投资指南.2019

[4].安鑫,张影,康安,陈田,李建华.基于机器学习的异构多核处理器系统在线映射方法[J].计算机应用.2019

[5].鲁湛,代作晓.基于异构多核处理器的实时红外人体目标检测技术[J].半导体光电.2018

[6].楚要钦,施辰光,刘永强.一种基于异构多核处理器的小型综合化弹载计算机设计[J].航空计算技术.2018

[7].罗殊彦,朱怡安,曾诚.嵌入式异构多核处理器核间的通信性能评估与优化[J].计算机科学.2018

[8].郑晶晶.面向动态异构多核处理器的资源分配及多智能体协同优化研究[D].广东工业大学.2018

[9].吴志佳.基于异构多核处理器的双目视觉系统设计与实现[D].北京交通大学.2017

[10].田辉.混合粒子群算法的异构多核处理器间任务调度[J].单片机与嵌入式系统应用.2017

标签:;  ;  ;  ;  

异构多核处理器论文-余世干,唐志敏,叶笑春,范东睿
下载Doc文档

猜你喜欢