多核多线程论文-刘海峰,王佳琪,梁星亮

多核多线程论文-刘海峰,王佳琪,梁星亮

导读:本文包含了多核多线程论文开题报告文献综述及选题提纲参考文献,主要关键词:超椭圆曲线加密,多核,多线程,并行算法

多核多线程论文文献综述

刘海峰,王佳琪,梁星亮[1](2019)在《基于多核多线程的HECC并行算法的实现与分析》一文中研究指出多核时代的到来以及人们对数据安全的需求,使得设计一个基于多核平台的并行加密算法变得尤为重要.通过将超椭圆曲线加密与多核多线程框架结合,设计基于多核多线程平台的超椭圆曲线并行加密方案,并对加密方案的性能进行理论分析.在实验测试中分别对文件大小为100~600K的文件进行并行加密处理,通过改变线程数目、CPU核数以及加密数据的大小对加密耗时进行汇总,实验结果表明在8核8线程框架进行数据并行处理时,并行加速比达到7.87.(本文来源于《陕西科技大学学报》期刊2019年02期)

周虎[2](2018)在《基于多核多线程的SAR成像算法DSP架构研究》一文中研究指出合成孔径雷达(Synthetic Aperture Radar,SAR)是雷达的一个重要分支,已经应用于多种高速运动平台。我国对于弹载SAR成像尤为重视,对于弹载运动平台而言,大前斜SAR成像算法必不可少,因该成像算法复杂,对成像分辨率要求很高,故对工程化实时性的要求十分严格。本文基于以上背景,针对弹载大前斜算法,对信号处理系统中的DSP架构进行设计。主要在以下几个方面进行改进,使信号处理系统更加稳定,成像效果最佳且实时性满足要求:1、针对弹载运动平台在末制导阶段处于大前斜工作状态的特点,提出一种高速运动平台下的大前斜高分辨频域成像算法,该算法是一种改进的非线性调频变标算法,通过构造高次频域相位滤波因子,消除方位空变项,提高方位聚焦效果,使成像分辨率更高。2、为达到弹载运动平台高实时性的要求,设计多线程多核的DSP编程方式,突破了多线程多核DSP内存管理、线程调度、动态内存开辟等关键技术,使任务之间的切换时间更短;核间多核同步方式设计为基于SYS/BIOS操作系统的Notify同步方式,以实时性最高的核间中断来进行核间通信,且基于实时性考虑,采用多板卡进行处理,板卡间结构设计为数据流流水结构。3、针对弹载复杂的环境,需保证DSP架构必须具备更高的稳定性,因此对信号处理板上DSP架构进行了设计,包括任务之间的切换和同步方式;对信处板上数据流模式进行设计,包括板卡上两个DSP芯片之间数据流和板卡之间数据流的流动方式。基于以上设计,保证任务之间的切换以及板卡之间数据交互更加稳定。其中不同任务之间的信息的传递和同步机制、多核同步方式、DSP芯片之间以及信号处理板之间数据流动是本文设计DSP架构的难点。利用设计的多线程多核DSP架构进行大量仿真实验,然后应用于机载挂飞实验,最终确定该架构的实时性和稳定性满足高速运动平台的成像要求。(本文来源于《西安电子科技大学》期刊2018-06-01)

戴卓臣,陆江东[3](2018)在《面向数据加密的多核多线程并行研究》一文中研究指出在使用新平台并行开发板实现大数据分组加密的基础上,结合多核多线程技术和AES加密算法,设计出一套高计算速率的并行加密系统。重点讨论了如何实现并行计算,分析了并行平台的数据传输速率,并行加密吞吐率,及平台性能。经实验表明,在并行上实现的多核并行加密方式相比单核串行加密有显着的加速效果,且随着数据量的增大效果逐渐明显。本地循环加密时,当加密数据量达450Kbyte,吞吐率峰值接近889.58Mbps。在以最高峰性能运作时,每瓦处理性能达70Gflops/W。并行为密集型计算提供了高效、低耗、处理能力强的新计算平台。(本文来源于《电子设计工程》期刊2018年08期)

朱欣[4](2017)在《基于单指令集异构多核架构的单核多线程性能建模》一文中研究指出嵌入式平台日益增长的性能-功耗矛盾催生了单指令集异构多核架构的出现。该架构可通过设计合理的任务调度策略达到最优化的系统能效比。准确评估和预测系统的性能与功耗是任务调度的前提和基础。因此,需要首先建立起精准的多线程性能模型,为系统的任务调度提供选择依据和判断标准。本论文提出一种针对单指令集异构多核架构、以每周期执行指令数为评估标准的多线程跨核性能模型。首先,理论推导出该模型的解析形式包含线程指令级并行度(Instruction-Level Parallelism,ILP)和线程负载两个因子。其次,提出以指令混合比、缓存缺失率、分支预测误判(包括误判次数和误判后的恢复代价)以及流水线每周期发射指令数作为ILP模型因子,通过一阶线性回归方程拟合,建立单线程跨核ILP模型。第叁,提出线程负载贡献跨核预估模型,并通过模拟Linux操作系统的负载分配策略,建立线程负载贡献与实际线程负载的推导关系,实现多线程跨核负载建模。本论文使用Gem5仿真器模拟ARM指令集架构,选取Minor顺序模型和arm_detailed乱序模型两种处理器类型,以SPEC CPU2000和线程负载贡献横跨1%~99%的自编程序为测试集。实验结果表明:线程ILP模型在两种处理器下的平均误差分别为6.26%和5.9%;线程负载贡献预估模型在两种处理器下的平均误差分别为0.37%和0.39%。在arm_detailed模型下,线程负载分配预估的平均误差为1.64%,线程负载贡献推导的平均误差为1.11%,相比同类型负载模型在30%~70%的中等负载段减少了 20%~30%的误差值。在两种处理器下,多线程跨核性能模型的总误差在CPU满负荷时分别为9.34%和0.77%,在CPU未满负荷时分别为1.41%和12.22%。(本文来源于《东南大学》期刊2017-06-15)

陈健康[5](2017)在《多核下可伸缩的多线程模型》一文中研究指出基于共享地址空间的多线程是有效利用多核资源的重要方式。并发线程对一些共享数据的竞争,成为影响应用性能瓶颈之一。严重的共享地址空间竞争,限制了大量的多线程程序的性能。此外,在一些多线程的流处理应用中,共享队列的同步方式也极大地限制了此类应用的可伸缩性和性能。本文提出了一个线程模型 PMthreads(private virtual memory threads),旨在完全消除线程间的地址空间竞争。基于课题组已有的生产-消费共享内存模型,本文在PMthreads中设计和实现了多线程流式编程模型PMPL(PMthreads Pipeline),旨在解决流式应用可伸缩性差的问题。本文的主要贡献如下:1、详细分析了地址空间竞争影响应用性能的原因,以及共享队列同步方式的缺陷。本文通过实验以及性能分析工具发现,保护共享地址空间的全局读写锁是导致多线程程序性能下降的主要原因。本文进一步分析了粗粒度锁、细粒度锁、原子指令以及无锁化在同步共享队列上的各自缺陷。2、提出了一个基于隔离地址空间的线程模型,并且在Linux上实现了一个保持共享变量语义的原型系统PMthreads。为了完全消除线程间的地址空间竞争,PMthreads给每一个线程一个隔离的地址空间。通过自定义字符设备驱动和开发 IAmalloc(isolated address space malloc)堆分配器,PMthreads 保持了线程共享变量语义,并且PMthreads采用Pthreads接口以支持现有的Pthreads程序。3、在PMthreads上,本文设计和实现了线程之间可以高效传递数据的流式编程模型PMPL。基于生产-消费共享内存模型,本文在PMthreads上设计和实现了 PMPL,并且设计和实现了简单易用的发送和接收接口。4、在32核机器上对PMthreads和PMPL分别进行了性能评估。本文使用了 Phoenix和PARSEC中的10个测试程序评估了 PMthreads的性能。在32核下,实验结果表明:对于虚拟内存密集型应用,PMthreads相对于Pthreads性能提升了 2.17倍~3.19倍;PMthreads对NUMA的亲和性要优于Pthreads;以dedup流式应用为例,PMPL相对于使用共享队列的方式性能提升了 7.51倍。本文提出的PMthreads可以提升虚拟内存密集型多线程应用的可伸缩性和性能,并且Pthreads多线程程序可以无修改地调用PMthreads。同时本文提出的PMPL为程序员提供了一种简单高效的方式在线程之间传递数据,也使得流式多线程应用可以高可伸缩地执行。(本文来源于《中国科学技术大学》期刊2017-04-01)

李旭[6](2017)在《多核处理器中具有临界区的多线程调度方法研究》一文中研究指出随着多核技术以及多线程技术的发展,多线程在多核处理器上的调度问题成为研究热点。由于多核处理器结构的复杂性,使得资源管理更困难。当多线程在多核平台上运行时,怎样更好的利用多核资源,让多线程能够正确快速的执行,决定了系统性能的提高。一个优秀的针对多核处理器的线程调度算法可以有效利用资源,提高系统吞吐率,兼顾公平性,降低程序的响应时间和周转时间。对于多核多线程的调度方法的研究,一般都先提出一种多线程的模型,并在这种模型的基础上针对不同的多核平台提出不同的调度方法。在多线程模型上,很多人都选择DAG图,但是传统的DAG图有其自身的缺陷,例如不能对任务间的关系进行近一步的刻画。本文针对具有临界区的线程,提出一种基于Forest的多线程调度模型,通过该模型维护线程间的前后依赖、数据资源和共享资源关系。为有效的提高系统性能,减少计算资源空闲时间,提出了综合考虑线程共享资源情况以及前后依赖关系的调度方法CSTS算法。该算法以临界区作为线程间共享资源的依据,对具有相同临界区线程进行同核调度。并且由于临界区不可同时执行的特点,临界区成为限制系统整体性能的重要因素。为减少由临界区而造成的堵塞,算法提出了基于临界区的优先级计算方法,并且兼顾公平性。在多核处理器中,由于各核间计算能力的不同,异构多核处理器较同构多核处理器更具有实用性。因此,本文除针对一般多核处理器设计了多线程模型以及基于该森林模型的调度方法外,还针对异构多核处理器各核间处理能力的不同,优化了加速临界区算法。加速临界区算法可以有效缩短具有临界区的线程的执行时间,但是有可能会造成无关临界区串行化的问题。本文在加速临界区算法基础上提出改进加速临界区算法。该算法跟踪记录所有包含临界区的线程在核上的执行情况,对线程的优先级因子进行调整,通过该优先级因子指导线程在高速核与低速核间的动态迁移。该算法不仅加速了临界区的执行而且能有效解决加速临界区方法所造成的线程在高速核上的堵塞的问题。本文采用模拟实验的方法对基于森林线程模型的算法进行模拟验证。较同类算法对于临界区密集型任务具有较高的性能,核利用率也较高。针对于适应于异构平台改进临界区迁移算法,本文采用Simics仿真平台进行异构多核系统仿真,输入为12个临界区密集型负载,实验结果表明,该方法较原始加速临界区算法和朴素算法拥有更好的性能。(本文来源于《华北电力大学》期刊2017-03-01)

汤中睿[7](2016)在《NS2的多核多线程并行化设计与开发》一文中研究指出随着多核处理器的出现和迅速发展,为了更好利用多核体系结构提高性能,将以前经典的串行程序并行化,以及研究面向并行化程序的多线程任务调度问题,具有重要的意义。NS2是一种典型的基于单线程设计的网络仿真器。在进行大规模的网络仿真时,单核单线程处理器难以满足网络仿真对巨大计算能力的要求,网络仿真器的运行效率十分低下。可以利用多核多线程相关技术来提高NS2事件调度效率,减少大规模网络仿真所花费的时间。论文首先提出对典型网络仿真软件NS2的多核多线程设计方案,并使用OpenMP技术来实现。对NS2对象类中的事件类进行扩展,调度器类中添加事件池设计;接着重点针对NS2调度器中原有串行事件调度和派发机制进行并行化改造,分别添加了调度器并行取事件模块、并行事件识别模块以及并行派发事件模块,来实现调度器对事件的并行处理;最后对并行方案进行正确性验证和冲突控制。然后本文对并行化改造后的NS2并行执行时所涉及的多线程任务调度的问题进行抽象,从性能优化的角度提出一种面向多核平台的多线程划分及负载均衡任务调度策略。根据测试出各任务块的粒度值,对一个任务是否适合多线程并行进行判断。对于适合多线程并行的任务,结合任务块粒度值,根据一定条件分成两种情况。针对分解出的任务块均匀这种情况,使用一般静态调度策略。而针对分解出的任务块不均匀时的情况,设计出一种启发式调度算法。最后基于本文提出的NS2多核多线程设计方案,进行仿真实验验证和加速性能测试。实验分为小规模场景实验以及规模化实验,验证了并行改造方案的正确性以及较显着的加速效果。(本文来源于《南京邮电大学》期刊2016-11-18)

宁津钏,贺细平[8](2016)在《BBP算法的多核多线程并行运算时间比较》一文中研究指出随着计算机技术的发展,多核计算机已经普及,并行计算已经运用到现实生活中。本文在多核计算机上利用Java对不同线程数量下的BBP算法的运行时间进行分析,得出在现实运用中线程的数量与运行时间不是简单的反比关系,还受很多因素影响。(本文来源于《电脑与信息技术》期刊2016年03期)

乔少明[9](2016)在《龙芯多核处理器多线程故障恢复系统设计与实现》一文中研究指出目前,大数据和物联网进入了高速发展时代,离不开的一个背景就是多核处理器与多线程技术的越发成熟。这也对多核处理器环境下多线程程序运行的稳定性和健壮性提出越来越高的要求。但在实际应用环境中,设备程序在运行阶段不可避免的总会遇见设计之初不曾考虑到的故障。其中,瞬态故障是导致程序不能正常运行的最常见原因。由于实际环境的复杂性,要完全避免瞬态故障的出现需要及其高昂的成本代价。因此,在目前技术基础之上,及时的故障恢复技术变得极具研究价值。本文针对多核处理器多线程故障恢复技术展开研究。首先对现存的故障恢复技术进行了介绍以及分析,接着对内核进程的实现以及多线程的实现机制进行了分析,确定了为实现完整的故障恢复功能需要对多线程程序进行保存的信息,包括寄存器、内存、信号、文件等。通过以上研究分析,本文设计了一种基于检查点的操作体统级的故障恢复系统,即在正常运行阶段对多线程程序设定检查点文件,一旦故障出现就可以根据检查点文件对多线程程序进行恢复。该系统在对程序信息进行保存与恢复过程中对应用层程序透明。关于检查点设置,寄存器、内存地址、当前工作目录、文件等数据可直接保存到设定的数据结构中,然后以页为单位写入内核缓冲区中。而对于内存中的数据,则需要拷贝物理内存页框中的数据。内核缓冲区中的数据由内核线程负责写入非易失磁盘中。另外,针对检查点设置的时间,本文提出了一种新的思路,即通过对包含数据传输的系统调用进行计数来决定检查点设置的时间,而不再采取时间间隔的方式。在进行故障恢复的时候,对于文件、内存等共享信息只需在一个线程中进行恢复,而线程寄存器、信号等私有信息则需要在所有线程中进行恢复。最后,对实验环境和编译方法进行了说明,对系统的基本功能进行了测试,并在线程数量、数据规模和时间间隔叁个方面选择不同的测试程序对系统性能进行了测试,实验结果表明线程数量和时间间隔更能引起性能损失的变化,而数据规模对性能损失的变化影响较小。(本文来源于《哈尔滨工业大学》期刊2016-06-01)

杨际祥[10](2016)在《UCMLib:一种多核多线程编程库》一文中研究指出多核并行编程的开发效率和加速比是影响多核进一步发展的两个重要问题。针对这两个问题,设计并实现了一个轻量级的多核多线程库(UCMLib)。该库基于任务原语概念,提供了数据并行性和任务并行性两种表达逻辑并行性的模式;对多线程编程的复杂性进行了封装和抽象,为开发者提供了高级的编程方法而不必显式地考虑锁和竞争,并降低了并行编程难度以提高开发效率。UCMLib的任务调度器基于对任务队列和工作者线程的有效构建和管理来提高并行程序的加速比。性能测试表明,当计算规模增大时,UCMLib在数据并行性与任务并行性两方面获得了比TPL库略优的加速比。最后给出了可能的性能改进方法以及需要进一步研究的问题。(本文来源于《计算机科学》期刊2016年04期)

多核多线程论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

合成孔径雷达(Synthetic Aperture Radar,SAR)是雷达的一个重要分支,已经应用于多种高速运动平台。我国对于弹载SAR成像尤为重视,对于弹载运动平台而言,大前斜SAR成像算法必不可少,因该成像算法复杂,对成像分辨率要求很高,故对工程化实时性的要求十分严格。本文基于以上背景,针对弹载大前斜算法,对信号处理系统中的DSP架构进行设计。主要在以下几个方面进行改进,使信号处理系统更加稳定,成像效果最佳且实时性满足要求:1、针对弹载运动平台在末制导阶段处于大前斜工作状态的特点,提出一种高速运动平台下的大前斜高分辨频域成像算法,该算法是一种改进的非线性调频变标算法,通过构造高次频域相位滤波因子,消除方位空变项,提高方位聚焦效果,使成像分辨率更高。2、为达到弹载运动平台高实时性的要求,设计多线程多核的DSP编程方式,突破了多线程多核DSP内存管理、线程调度、动态内存开辟等关键技术,使任务之间的切换时间更短;核间多核同步方式设计为基于SYS/BIOS操作系统的Notify同步方式,以实时性最高的核间中断来进行核间通信,且基于实时性考虑,采用多板卡进行处理,板卡间结构设计为数据流流水结构。3、针对弹载复杂的环境,需保证DSP架构必须具备更高的稳定性,因此对信号处理板上DSP架构进行了设计,包括任务之间的切换和同步方式;对信处板上数据流模式进行设计,包括板卡上两个DSP芯片之间数据流和板卡之间数据流的流动方式。基于以上设计,保证任务之间的切换以及板卡之间数据交互更加稳定。其中不同任务之间的信息的传递和同步机制、多核同步方式、DSP芯片之间以及信号处理板之间数据流动是本文设计DSP架构的难点。利用设计的多线程多核DSP架构进行大量仿真实验,然后应用于机载挂飞实验,最终确定该架构的实时性和稳定性满足高速运动平台的成像要求。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

多核多线程论文参考文献

[1].刘海峰,王佳琪,梁星亮.基于多核多线程的HECC并行算法的实现与分析[J].陕西科技大学学报.2019

[2].周虎.基于多核多线程的SAR成像算法DSP架构研究[D].西安电子科技大学.2018

[3].戴卓臣,陆江东.面向数据加密的多核多线程并行研究[J].电子设计工程.2018

[4].朱欣.基于单指令集异构多核架构的单核多线程性能建模[D].东南大学.2017

[5].陈健康.多核下可伸缩的多线程模型[D].中国科学技术大学.2017

[6].李旭.多核处理器中具有临界区的多线程调度方法研究[D].华北电力大学.2017

[7].汤中睿.NS2的多核多线程并行化设计与开发[D].南京邮电大学.2016

[8].宁津钏,贺细平.BBP算法的多核多线程并行运算时间比较[J].电脑与信息技术.2016

[9].乔少明.龙芯多核处理器多线程故障恢复系统设计与实现[D].哈尔滨工业大学.2016

[10].杨际祥.UCMLib:一种多核多线程编程库[J].计算机科学.2016

标签:;  ;  ;  ;  

多核多线程论文-刘海峰,王佳琪,梁星亮
下载Doc文档

猜你喜欢