导读:本文包含了可重构计算技术论文开题报告文献综述、选题提纲参考文献,主要关键词:重构,粒度,阵列,技术,基带,视频,体系结构。
可重构计算技术论文文献综述写法
刘恒良[1](2018)在《异构可重构计算体系结构及其实现技术》一文中研究指出在雷达、通信、深度学习、人工智能等领域,算法的复杂程度日益提高,算法的形式千变万化,越来越多的场合对低功耗小型化的异构、可重构计算平台提出了迫切需求。本文针对上述应用设计了一种结合了中心控制节点、数据交换节点和多GPU的异构可重构计算体系结构,并设计了遵循该体系结构的软硬件平台。通过采用先进的RC-MPSOC器件作为中心控制节点,使得该体系结构支持硬件可重构,并且通过采用同时支持星形和环形连接的互连网络设计,使得该体系结构支持异构运算节点间的灵活、高速互连。该体系结构及原型平台具有小型化、低功耗的特点,并且可以提供灵活、高效的算法实现能力。在硬件设计上,采用XILINX先进的Zynq SOC作为中心控制节点,除了软件的在线自适应重构,还可以通过ARM处理器对可编程逻辑做出硬件可重构;采用XILINX的Kintex-7系列FPGA作为运算节点互连网络的交换(Switch)节点,以实现GPU之间的环形高速连接,以及GPU和中心控制节点间的星形高速连接,使其能够支持灵活的算法结构;采用NVIDIA的TX1模块作为运算节点,提供灵活、高效的算法实现能力。基于所设计硬件平台,在软件上利用Zynq SOC提供的内部接口设计了可重构功能模块,通过实现PCIe和SRIO间的高速数据交换设计了交换节点逻辑,进而构建了运算节点互连网络,通过设计存储管理功能模块实现灵活的存储分配,并且对这些模块做了功能测试和性能评估,为所实现的异构可重构计算平台的工程应用提供了完整的接口驱动和基本的功能模块。最后,针对SAR回波模拟同心圆算法的大数据量、大运算量和算法结构复杂等特点,通过将斜距计算分配到4个GPU,然后在中心控制节点的PL完成卷积运算,该异构可重构计算平台与传统的异构计算平台相比,计算性能有了显着提高。本文提供的低功耗小型化的异构可重构计算平台还可以通过多板堆迭使用进一步提高运算能力,具备良好的可扩展性,具有一定的应用前景。(本文来源于《中国计量大学》期刊2018-04-01)
王也文[2](2016)在《清华微电子助力集成电路技术领域发展》一文中研究指出项目名称:高能效动态可重构计算及其系统芯片关键技术项目主要完成人:魏少军、刘雷波、毛志刚、时龙兴、尹首一、邓玉良项目介绍:本项目发明了硬件随软件变化而变化、软硬件双编程的高能效动态可重构计算技术,突破了传统的基于硬件进行软件编程的计算(本文来源于《新清华》期刊2016-11-04)
韩佳[3](2016)在《基于可重构计算硬件的HEVC运动估计算法实现技术研究》一文中研究指出HEVC(High Efficiency Video Coding)视频编码标准面向高清、超高清视频应用,采用更加高效的视频编码工具,与H.264编码标准相比较,HEVC对高质量视频编码的压缩率提高了约一倍,同时编码器的计算复杂度增加了数倍,其中运动估计计算复杂度最高。因此,研究运动估计算法实现,加速算法执行具有很重要的意义。可重构计算硬件既具有通用处理器的灵活性又具有专用集成电路的高性能、低功耗的优点,适合用来加速计算密集型任务。HEVC运动估计算法是典型的计算密集型任务,非常适合在可重构计算硬件上实现。本文研究HEVC运动估计全搜索算法在可重构计算硬件上的映射方法,着重解决算法映射面临的访存冲突问题和数据搬运时间优化问题。首先提出采用PU(Prediction Unit)间复用SAD(Sum of Absolute Difference)策略的基础架构;其次针对最小尺寸PU SAD生成模块的映射,提出两种减少存储器访问的映射方式:算法映射结构方式与基本计算单元并行方式;再次探讨减少存储器访问的加法树模块映射方法,并提出多级PU处理架构;最后研究当前块数据、参考块数据在可重构计算硬件的存储系统中的缓存与复用策略,降低对存储器的访问,减少数据搬运时间。本文采用提出的映射方法,在可重构计算硬件电子系统级模型上实现HEVC运动估计全搜索算法,支持8×8搜索区间,并支持从8×8到64×64全部对称PU划分方式,获得8.71的加速比,与编译器自动编译相比,该实现可以得到更好的加速效果,分析结果表明,本文提出的方法可以充分的利用可重构计算硬件的并行计算能力,较好的加速HEVC运动估计算法执行。为了满足格式为1920×1080@30fps高清视频实时编码要求,本文根据性能测试结果进行计算资源扩展分析,在此基础上,提出可重构计算硬件计算资源扩展方案。(本文来源于《上海交通大学》期刊2016-04-01)
陈剑东[4](2016)在《基于可重构计算的智能相机关键技术的研究》一文中研究指出智能相机是当前机器视觉领域的研究热点之一,智能相机集图像采集、处理、传输功能于一体,具有模块化、小型化、分布式、简单易用等优点,在先进制造的目标识别与定位、尺寸测量、缺陷检测等方面的应用日益广泛。论文重点研究了基于可重构计算的智能相机系统,探讨了可重构图像处理流水线架构及FPGA实现、异构计算平台的协同设计、图像处理IP核设计、图像采集前端电路设计等关键技术。主要工作包括:针对基于ZYNQ平台的智能相机,提出了可重构流式图像处理架构,设计了与图像采集模块连接的可重构图像预处理流水线,通过FPGA内部逻辑电路的重新配置实现了可重构计算。针对像素点操作、滤波、边缘检测、形态学处理等代表性图像处理算法设计了算法IP核并初步形成了图像处理IP库。对图像预处理流水线进行了测试,重构时间约为2毫秒,并且与ARM、PC平台的算法时间开销进行了对比,结果表明预处理流水线技术能够明显提高图像处理速度。针对智能相机中图像特征检测与匹配的计算开销大的特点,根据算法的具体特性对计算任务进行拆分,以硬件加速器配合ARM处理器协同处理图像处理任务,实现了ARM-FPGA异构计算平台的协同设计及可重构计算。并进行了时间测试,重构时间为毫秒级。在深入分析CCD复杂驱动时序基础上,设计开发了CCD驱动及接口电路,生成同步时序驱动CCD工作,设计了图像采集前端的控制IP核,实现了200万像素CCD图像传感器的接口与控制,图像采集效果良好。实验结果表明,采用可重构计算的图像处理架构能够明显提高图像处理速度,图像采集与处理系统满足智能相机的实时性的要求。(本文来源于《华南理工大学》期刊2016-01-06)
梅晨[5](2015)在《面向通信基带信号处理的可重构计算关键技术研究》一文中研究指出随着通信、计算机、微电子等技术的飞速发展,无线通信标准呈现出不断演进、多种标准兼容的发展趋势,对基带处理架构的计算能力和灵活性提出了更高的要求,给架构设计人员和芯片研发人员提出了巨大的挑战。目前主流的通信协议,如LTE-A、WiMAX、Wi-Fi等,均采用了多天线MIMO技术和正交频分复用OFDM技术作为核心的基带信号处理方案。粗粒度可重构架构具备硅后功能定制的特征,通过对结构可变的硬件进行配置以适应不同算法的处理需求,兼备通用处理器的灵活性和ASIC的高能效性,是实现通信基带信号处理算法的理想硬件平台。论文在细化并扩展传统模型的基础上,建立了系统、精确的可重构架构解析模型,指导并优化面向通信基带的领域专用粗粒度可重构计算架构RaSP-BB(ReconfigurAble Signal Processor-BaseBand)的设计,在实现MIMO-OFDM核心算法时获得较高的阵列计算效率和存储访问性能。论文的主要工作与创新点为:(1)建立了可重构架构解析模型,包括基于流水线气泡分析的循环内核模型、基于访存权重分析的片上存储访问模型和基于算法配置流分析的多任务同步模型。在对算法特征参数与硬件微结构参数抽象的基础上,模型通过定量分析各类参数与系统性能解析关系的建模方法,完成对程序执行时间的准确评估;同时,模型提供程序执行CPI(Cycles per Instruction)栈,定位系统性能瓶颈,从而指导架构设计。(2)优化了RaSP-BB的计算阵列,提出了多组织结构的路由形态,改进了阵列接口结构:在传统crossbar结构的基础上增加同层累加互联以适应基带算法数据流,并利用不同数据局部性特性设计基于访问特性自适应的阵列多输入输出源接口,从而在有效提高阵列利用率的同时减少阵列执行的流水线气泡。(3)优化了RaSP-BB的层次化存储结构,提出了基于地址重映射的无冲突共享存储结构,改进了多模态自适应的本地存储:通过改变共享存储体中的算法分配机制和阵列/存储间硬件步长映射逻辑,以及利用多模态自适应存储支持转置、交迭、拼接等访存模态,从而在处理基带算法时有效地避免计算引擎间数据传输,降低访存冲突和访存模态带来的访问延时。为了验证上述面向通信基带信号处理可重构架构的设计方法,论文实现了基于RaSP-BB的RTL模型并进行了仿真验证。通过对比RTL仿真及解析结果,解析模型在可重构架构REMUS-Ⅱ和RaSP-BB上的评估精确度较高,分别为94.52%和93.83%。基于TSMC 45nm工艺,RaSP-BB在工作主频为400MHz时,处理无线通信基带信号处理核心算法的RTL仿真性能如下:4096点FFT的处理周期为3295 cycles(8.23 ns),采用K-best算法处理4×4 MIMO检测的吞吐率达1072 Mbps(K=3时),Mapping和De-mapping映射时间为0.55和0.28 cycle/symbol,32-Tap FIR的处理速度平均为2.4 cycle/symbol。与REMUS-Ⅱ相比,RaSP-BB核心算法性能平均提升39.98%。与当前主流可重构架构相比,RaSP-BB架构针对计算、访存较复杂的算法如FFT、MIMO检测等,可以获得较优的算法性能;同时也能较好的支持调制映射、FIR等其他通信基带算法,具有足够的灵活性。(本文来源于《东南大学》期刊2015-08-28)
高俊丽[6](2015)在《清华与英特尔联手研发融合可重构计算技术的新型x86处理器》一文中研究指出本报讯4月9日,我校与英特尔公司签署战略合作备忘录,宣布以英特尔的处理器架构和我校的可重构计算研究成果为基础,携手推动拥有自主知识产权的、基于可重构计算技术的新型计算硬件和软件研发,以服务中国及全球市场。 科技部副部长曹健林、工信部电子司副司长(本文来源于《新清华》期刊2015-04-17)
唐世卓[7](2013)在《面向通用可重构计算系统的任务编译关键技术研究》一文中研究指出半导体行业的不断发展对硬件的灵活性和性能提出了新的挑战,可重构计算系统因其对两者的较好折中而得到飞速发展,并逐渐从针对单一领域的应用转向面向多领域的应用。但由于缺乏通用的编程模型、相应的编译架构和并行化的编译方法,任务编译器的开发一直是可重构计算发展的难点所在。本文从可重构处理器的硬件架构出发,抽象出基于Remus-II的编程模型,建立了相应的任务编译架构。并针对代码并行度不高,硬件执行效率低等问题,提出了基于循环展开的迭代编译技术来优化编译性能,并通过模板库的开发与集成来降低迭代编译带来的额外编译开销。集成模板的迭代编译任务编译器前端通过标注选择将高级语言程序转化为中间表示或调用迭代编译模板;若调用模板,后端直接提取配置信息和接口文件,否则通过中间表示的解析、时域划分、存储约束生成重构配置信息和接口文件,最终整合主程序映射到主控核和重构阵列执行。本文对通过软件模拟和硬件仿真对任务编译器进行功能测试和性能分析。测试结果表明任务编译器的配置信息生成功能正确,对于媒体应用典型算法,如H.264解码中的IDCT、MC、ME等,其核心平均加速比达到15,而集成模板库后的模板调用平均编译时间减少90%。(本文来源于《上海交通大学》期刊2013-12-01)
魏少军,刘雷波,尹首一[8](2012)在《可重构计算处理器技术》一文中研究指出本文首先分别分析了基于指令流驱动和基于数据流驱动的传统计算技术所面临的问题,并介绍了可重构计算处理器的发展趋势;接着,讨论了可重构计算处理器的硬件架构和编译技术,重点分析了其在软硬件架构及系统应用上所面临的挑战;然后,介绍了所设计的REMUS(REconfigurable MUltimedia System)可重构计算媒体处理器及其相应的集成开发工具;最后,展望了面向通用计算的可重构技术的发展前景.(本文来源于《中国科学:信息科学》期刊2012年12期)
宋奂寰,王树宗,邵利兵[9](2012)在《基于可重构计算技术的ASIP设计与实现》一文中研究指出为了加速计算密集或数据密集类算法,设计了Kahn线程定义的虚拟指令,以及嵌入式粗粒度可重构阵列流水线处理器的体系结构。通过指令流水线设计,实现虚拟指令的并行执行,将指令级并行扩展为线程级并行。系统运行时,采用订阅/发布机制作为可重构阵列的通信机制,利用可重构系统可重复配置的特点,提高了系统的计算效率。通过仿真实验验证了基于可重构计算技术的流水线处理器结构的有效性。(本文来源于《舰船科学技术》期刊2012年05期)
孙香花[10](2011)在《基于动态可重构计算技术的高清视频研究》一文中研究指出首先介绍可重构技术以及基于过程级的动态可重构计算技术,阐述对动态可重构技术研究的理论价值,接下来介绍高清视频的标准和在社会生活中的应用,进一步介绍目前高清视频最先进的标准之一H.264,阐述国内外相关研究近况,为高清视频技术提供一种新的解决方向进行探讨.(本文来源于《微电子学与计算机》期刊2011年08期)
可重构计算技术论文开题报告范文
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
项目名称:高能效动态可重构计算及其系统芯片关键技术项目主要完成人:魏少军、刘雷波、毛志刚、时龙兴、尹首一、邓玉良项目介绍:本项目发明了硬件随软件变化而变化、软硬件双编程的高能效动态可重构计算技术,突破了传统的基于硬件进行软件编程的计算
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
可重构计算技术论文参考文献
[1].刘恒良.异构可重构计算体系结构及其实现技术[D].中国计量大学.2018
[2].王也文.清华微电子助力集成电路技术领域发展[N].新清华.2016
[3].韩佳.基于可重构计算硬件的HEVC运动估计算法实现技术研究[D].上海交通大学.2016
[4].陈剑东.基于可重构计算的智能相机关键技术的研究[D].华南理工大学.2016
[5].梅晨.面向通信基带信号处理的可重构计算关键技术研究[D].东南大学.2015
[6].高俊丽.清华与英特尔联手研发融合可重构计算技术的新型x86处理器[N].新清华.2015
[7].唐世卓.面向通用可重构计算系统的任务编译关键技术研究[D].上海交通大学.2013
[8].魏少军,刘雷波,尹首一.可重构计算处理器技术[J].中国科学:信息科学.2012
[9].宋奂寰,王树宗,邵利兵.基于可重构计算技术的ASIP设计与实现[J].舰船科学技术.2012
[10].孙香花.基于动态可重构计算技术的高清视频研究[J].微电子学与计算机.2011