导读:本文包含了指令级并行性论文开题报告文献综述、选题提纲参考文献,主要关键词:指令,谓词,能量,索引,数据,寄存器,执行时间。
指令级并行性论文文献综述写法
宋省身,杨岳湘,江宇[1](2018)在《基于单指令级并行的快速求交算法》一文中研究指出布尔查询中的求交操作被广泛应用于各种信息系统中,是进行文档检索的基本操作之一。其基本形式可以视作多个有序整数序列的交集问题,而提高求交运算的效率是当前研究的重点。在传统求交算法的基础上,利用单指令多数据流(single instruction multiple data,SIMD)并行指令集,针对其核心的搜索步骤,提出了两种基于SIMD的跳跃式搜索算法。该算法在提高性能的同时,能有效适配在传统多倒排链求交算法中。实验证明,优化后的算法相比未使用SIMD的情况下有了很大的提升,甚至优于SIMD优化后的两两相交算法,性能最高提升37.3%。(本文来源于《山东大学学报(理学版)》期刊2018年03期)
刘有耀,张仲伟[2](2017)在《基于SIMD体系结构的指令级并行结构设计》一文中研究指出通过对多核处理器体系结构、多核单元内部结构设计及指令级并行运行模式等方面进行深入研究,探索适用于无线通信的多核并行处理器。在分析SIMD体系结构的基础上,从体系结构系统设计到处理单元PE内部电路设计,给出一种多核处理器体系结构,在处理单元中能够实现指令级并行(Instruction-level Parallelism,ILP)和数据级并行(Data-level Parallelism,DLP)处理。(本文来源于《电子设计工程》期刊2017年21期)
佟玉凤,梁煜,马咏程,张为[3](2017)在《一种应用于指令级并行处理器的低功耗并行度调整方案(英文)》一文中研究指出对于指令级并行处理器(ILP,instruction level parallelism),在执行不同应用程式时,硬件资源的需求量差异很大,甚至在同一支程式中也是如此,某些空闲的硬件资源会产生额外的静态能量,提出重新设置应用程式中不同区块的执行并行度,把空闲的硬件资源关断来降低静态能量的方案,利用Core Mark Pro的标准测试集中的应用程式进行测试,静态能量降低超过40%且执行时间增加少于10%.(本文来源于《南开大学学报(自然科学版)》期刊2017年05期)
闫宏飞,张旭东,单栋栋,毛先领,赵鑫[4](2015)在《基于指令级并行的倒排索引压缩算法》一文中研究指出文本信息数量的快速增长给传统的信息检索技术带来了新的挑战.搜索引擎通常使用倒排索引来高效地处理查询.为了减少存储开销和加快访问速度,倒排索引通常被压缩存储.因此,如何选择一个高性能的压缩算法对高效查询处理是非常有必要的.在已有倒排链压缩算法PackedBinary和PForDelta的基础上,利用CPU的超标量特性和SIMD向量指令集,将其压缩和解压缩中的关键步骤并行化,提出了2种指令级并行压缩算法SIMD-PB和SIMD-PFD.基于GOV2和ClueWeb09B两个公开数据集的实验表明,SIMD-PB和SIMD-PFD算法在压缩率不变的情况下,压缩和解压缩速度比现有的压缩算法均有非常明显的提升.其中解压缩速度比起目前最好的倒排链压缩算法,最高能提升17%.此外,实验表明算法在较长的倒排链、较大的压缩块单位上有更好的解压缩性能.(本文来源于《计算机研究与发展》期刊2015年05期)
高飞,李红燕,张永福[5](2010)在《密码协处理器指令级并行编译研究》一文中研究指出立足于处理器体系结构的研究,结合可重构设计技术以确保密码处理的灵活性是密码协处理器研究的重要方法,其中如何提升密码协处理器的性能是至关重要的问题。基于VLIW体系结构以及可重构设计技术,设计专用指令密码协处理器。编译器作为密码协处理器的重要组成部分,重点研究了密码协处理器指令级并行编译技术,通过提高指令级并行度来提升密码协处理器的性能。(本文来源于《计算机应用研究》期刊2010年05期)
方芳[6](2009)在《基于循环程序的指令级并行》一文中研究指出本文阐述了一个新的观点基于软流水,我们从一维向量到二维矩阵将软流水作为一个指令级转换。这样,软流水问题自然地就被分为两个子问题,其中一个决定矩阵中的行操作,另外一个决定列操作。基于这种观点,我们探索了一个称为分解的软流水的新循环调度方法。(本文来源于《科技信息》期刊2009年16期)
董立平,胡苏太[7](2006)在《创新型多核处理器的发展》一文中研究指出仅靠扩充目前占主流的超标量和VLIW技术,要实现新一代处理器是十分困难的,其中一个主要原因是布线延迟问题。随着芯片制造技术的发展,一个时钟周期中信号在芯片内所能传输的范围越来越小。特别当未来采用35纳米以下设计技术时,在一个时钟周期内信号所能传输的范围仅(本文来源于《计算机世界》期刊2006-06-05)
芦运照,张兆庆,连瑞琦[8](2003)在《指令级并行中谓词分析技术的研究》一文中研究指出谓词支持是IA 6 4体系结构的新特征 ,它为发掘指令级并行提供了更多的机会 ,同时给编译器的设计者增加了难度 .谓词是条件执行的依据 ,是提高指令级并行的新途径 .该文介绍在ORC(IA 6 4OpenResearchCompiler)中首次设计实现的基于谓词划分图的谓词分析技术及其在指令调度中的应用 .利用谓词分析技术建立了谓词关系数据库、指令调度查询谓词关系数据库提高指令级并行 .文章着重论述了谓词关系数据库的核心———谓词划分图的建立 ,在谓词划分图的基础上实现了谓词关系的计算和查询 ,实际结果表明谓词分析技术有显着优化效果 .(本文来源于《计算机学报》期刊2003年10期)
王晓华,庞春江,孟建良[9](2002)在《基于指令并行性的VLIW的控制流》一文中研究指出该文简要分析了影响VLIW指令级并行性发挥的控制相关问题,提出了相应的解决方法。(本文来源于《计算机工程与应用》期刊2002年15期)
王蓉晖[10](2002)在《指令级并行性开发关键技术的研究与实现》一文中研究指出二十多年以来,微处理器的性能已经有了巨大的提高,但是由于新应用的产生,人们对于微处理器性能的要求也越来越高。目前微处理器基本上都是以超标量技术为基础进行设计的,但这一技术已经很难进一步大幅度地提高性能。据估计,下个世纪初,微处理器将完成结构换型。因此研究新的适合于微处理器的体系结构技术迫在眉睫,是国际上研究的热点,也具有极大的科研、经济和社会意义。 当前,在微处理器体系结构研究中,为了充分提高微处理器的处理性能,主要采用了指令级并行技术(ILP),指令级并行性的开发程度对发挥微处理器的硬件特性,提高程序运行性能至为关键。开发更多ILP的关键是:如何自动识别程序中的所有相关关系,并将能够并行执行的成分(指令)挖掘出来。 在目标代码中可以区别两类数据相关,一类是寄存器数据相关,一类是存储器数据相关。对于对寄存器指令数据相关的分析相对简单,它可以直接通过对指令序列进行数据流分析得到。而对于存储器访问指令而言,其相关性分析则相对复杂得多,关键问题是必须解决存储器访问地址的别名问题(aliasing problem),即必须判断出对存储器的两次访问是否针对同一个地址单元,然后在此基础上进行存储器访问的数据相关性分析。 与常用的基于数据流图的方法不同,我们提出了一种通过寄存器队列检测指令间寄存器数据相关的算法。该算法利用寄存器队列分析指令间的数据相关,能够分析出指令间的所有寄存器相关,其特点是:数据流驱动;算法简单、实现效率高;并行成分的表示直观。该算法的执行效率远远高于经典的基于图的相关性分析算法。 当前大多数指令调度算法只判断出寄存器指令的数据相关,而忽略了存储器指令数据相关。它们大多数是在分析时将存储器作为一个数据单元,进而假设任何两次对存储器的访问之间都存在数据相关。我们通过一种值预测及传播算法检测存储器指令数据相关。这种方法有助于提高与存储器访问相关的指令的执行效率。模拟结果表明,该算法能够获得8.7%的加速比。(本文来源于《国防科学技术大学》期刊2002-01-01)
指令级并行性论文开题报告范文
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
通过对多核处理器体系结构、多核单元内部结构设计及指令级并行运行模式等方面进行深入研究,探索适用于无线通信的多核并行处理器。在分析SIMD体系结构的基础上,从体系结构系统设计到处理单元PE内部电路设计,给出一种多核处理器体系结构,在处理单元中能够实现指令级并行(Instruction-level Parallelism,ILP)和数据级并行(Data-level Parallelism,DLP)处理。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
指令级并行性论文参考文献
[1].宋省身,杨岳湘,江宇.基于单指令级并行的快速求交算法[J].山东大学学报(理学版).2018
[2].刘有耀,张仲伟.基于SIMD体系结构的指令级并行结构设计[J].电子设计工程.2017
[3].佟玉凤,梁煜,马咏程,张为.一种应用于指令级并行处理器的低功耗并行度调整方案(英文)[J].南开大学学报(自然科学版).2017
[4].闫宏飞,张旭东,单栋栋,毛先领,赵鑫.基于指令级并行的倒排索引压缩算法[J].计算机研究与发展.2015
[5].高飞,李红燕,张永福.密码协处理器指令级并行编译研究[J].计算机应用研究.2010
[6].方芳.基于循环程序的指令级并行[J].科技信息.2009
[7].董立平,胡苏太.创新型多核处理器的发展[N].计算机世界.2006
[8].芦运照,张兆庆,连瑞琦.指令级并行中谓词分析技术的研究[J].计算机学报.2003
[9].王晓华,庞春江,孟建良.基于指令并行性的VLIW的控制流[J].计算机工程与应用.2002
[10].王蓉晖.指令级并行性开发关键技术的研究与实现[D].国防科学技术大学.2002