全局指令调度论文-王昊,王向前

全局指令调度论文-王昊,王向前

导读:本文包含了全局指令调度论文开题报告文献综述及选题提纲参考文献,主要关键词:全局指令调度,算法

全局指令调度论文文献综述

王昊,王向前[1](2014)在《一种平衡的全局指令调度新框架研究》一文中研究指出全局指令调度可以分为结构驱动和剖析驱动两类。我们展示了一种新算法,尝试结合以上两类方法各自的特点,同时避免它们的一些缺点。该算法可以在寄存器分配之前和之后调用,它已经在Open64编译器上实现,其结果在BWDSP100处理器上得到了评估。(本文来源于《中国集成电路》期刊2014年12期)

刘飞[2](2013)在《YHFT-Matrix编译器全局指令调度相关技术的研究与实现》一文中研究指出Matrix DSP处理器是一款由国防科学技术大学计算机学院微电子所研发的有自主知识产权的高性能DSP处理。该处理器有较强的数据计算能力,因此可以应用于软基站无线通信、水声计算等领域。为了能够推广这款处理器,一套正确的、性能优越的编译器系统是必须的。为了使所开发的Matrix编译器性能更优,就必须要做好Matrix编译器的优化措施,特别是针对于Matrix体系结构的优化措施会更有效。本文根据Matrix体系结构的特点,提出了提出了几种适合Matrix编译器的优化措施,有的已经在Matrix编译器中实现并根据Matrix体系结构做了相应的改进,在很大程度上提高了Matrix编译器的优化性能。本文主要介绍和实现的优化措施如下:(1)基于选择调度的全局指令调度。Matrix处理器是一款能够同时发射10条指令的VLIW DSP,所以指令级的并行可以充分挖掘Matrix处理器的性能。全局指令调度能够使编译器更好的实现指令级的并行。在基于GCC选择调度的基础上,Matrix编译器中实现了正确的选择调度算法,并且根据自身体系结构改进后的算法效果更加明显。(2)if转换。if转换能够把控制流图转换为数据流图,进而可以服务于后续的优化,特别是对于指令调度有关的优化。Matrix处理器可以支持全谓词执行的,所以为Matrix编译器开发if转换可以更好的利用Matrix体系结构的特点挖掘处理器的性能。在基于GCC if转换实现的基础上,Matrix编译器中实现了同GCC一样的几种if转换情况,并且根据特定的应用程序添加了一些新的能够if转换的情况。通过添加if转换之后,Matrix编译器的性能得到了进一步提升,特别是在添加了一些新的能够if转换的情况之后,一些特定应用程序的执行效率有很大的提高。(3)分支延迟调度。Matrix指令集中所有的分支指令、跳转指令、函数调用指令都有四个延迟槽。如果在程序中不对这些延迟槽进行填充,就会造成流水线的空转,浪费了硬件资源。在基于GCC分支延迟调度实现的基础上,Matrix编译器正确实现了分支延迟调度功能,并且根据Matrix体系结构改进后的分支延迟调度算法,调度效果更好,延迟槽填充更加充分。(本文来源于《国防科学技术大学》期刊2013-03-01)

卫小鹏李沛,刘荣[3](2008)在《缺电不缺坚守 避峰不避困难》一文中研究指出红色预警有序供电压力传至调度2008年的夏天,不仅是一个炎热酷暑季节,更是一个令山西运城所有市民难以忘记的缺电季节。进入6月,受电煤紧缺影响,山西多台发电机组停机,电力供应严重不足。山西电网最大电力缺口达460万千瓦,运城电网电力(本文来源于《国家电网报》期刊2008-08-07)

杨书鑫,薛丽萍,张兆庆[4](2004)在《迭代式全局指令调度》一文中研究指出基于非线性控制流图的全局指令调度由于非线性控制流的控制流图的复杂性不易计算出一条指令在其所在控制流图中的优先级,因此也不易判断来自不同基本块的指令的优先顺序,从而导致在决定一条指令何时被调度出该指令所在的基本块以及调度到哪儿时倾向于保守和随意。例如D.Bernstetin的全局指令调度的启发性方法优先来自这些基本块的指令:调度器当前正在调度的基本块以及与当前基本块控制等价的基本块。然而,这种启发性方法往往导致处在关键路径上的指令被滞后。本文提出的迭代式全局指令调度算法基于D.Bernstein的全局调度算法。它采用与D.Bernstein相同的启发性方法,但有选择地多次调度一个基本块使得处在关键路径上的指令被尽早调度。实验结果表明该算法以增加10%的调度时间开销提高调度器8%的性能。(本文来源于《计算机科学》期刊2004年07期)

杨书鑫,张兆庆[5](2004)在《全局指令调度综述》一文中研究指出指令调度通过调整指令之间的顺序来提高指令级并行度(ILP)。然而基本块通常很小,因而潜在的ILP也很小。随着芯片设计技术的发展,现代的处理机所包含的资源却越来越丰富。指令调度只有跨越基本块的边界(即全局指令调度)才能够充分发挥处理机潜在的和程序中固有的ILP。全局指令调度可划分为有环和无环两种。该文介绍了无环全局指令调度的几种影响力较大的算法。同时还简单介绍了有关全局指令调度的新的热点。(本文来源于《计算机工程与应用》期刊2004年21期)

杨书鑫,张兆庆[6](2004)在《ORC的全局指令调度技术》一文中研究指出IA 6 4是一种崭新的体系结构 ,它为挖掘程序中潜在的指令级并行提供了丰富的硬件支持 ,例如 :大寄存器组、(控制 /数据 )投机、谓词等 .Itanium是IA 6 4的一个具体实现 .该文作者将Bernstein的基于超标量处理机的全局指令调度算法应用于显式并行 (EPIC)的Itanium处理机上 .在结合Itanium处理机特性的同时 ,作者对Bernstein的算法有以下两点创新 :(1)应用层次化区域 .相对于传统的扁平区域 ,这样的区域具有很强的灵活性并提供了调度器大小合适的调度范围 ,使其既能充分利用硬件资源又能够有效地控制调度的时间和空间开销 .(2 )集成P Ready指令调度 .P Ready是在与Bernstein算法框架差异很大的上下文中提出的 .P Ready指令调度能够把优先级高的指令尽早调度即使这条指令并没有在所有经过它的执行路径上解除数据依赖 .集成P Ready指令调度到Bernstein的算法框架上是十分有意义的 .作者在“基于Itanium处理机的开放源码编译器ORC”中实现了该文介绍的算法 ,实验结果显示全局指令调度器对CPU2 0 0 0int基准测试例平均有 8.4 %的运行时加速比 .作为应用层次化区域的优越性的一个反映 ,调度指令跨越嵌套循环最高可取得 12 .9%的运行时加速比 .此外 ,P Ready指令调度对CPU2 0 0 0int的测试例平均有 1.37%的运行?(本文来源于《计算机学报》期刊2004年05期)

杨书鑫[7](2004)在《全局无环指令调度研究》一文中研究指出指令调度是一种指令级并行技术。它既是一种微体系结构技术,也是一种编译技术。对于后者,指令调度指的是在保持程序语义的前提下通过重新排列指令的顺序来提高流水的或多发射处理机的指令级并行度。随着微体系结构和微电子技术的发展,现代处理机所包含的硬件资源越来越丰富。指令调度只有跨越基本块的边界才能够充分地发挥目标处理机的指令级并行的潜力。本文所研究的技术就是全局调度的一种,即无环的全局指令调度。本文的贡献包括以下几个方面: 1.在D.Bernstein的面向超标量目标机的全局调度算法基础上,提出了面向IA-64体系结构的全局调度框架。 2.在D.Bernstein的全局指令调度算法框架上提出了层次化区域上全局调度框架。传统的全局调度的区域是扁平的。扁平调度区域有许多缺点。一方面,由于调度器对调度的形状有许多特定的要求,因而常常导致区域偏小。另一方面,在控制流比较简单的情况下,扁平调度又有可能过大,因而导致过大的编译时空开销。层次化区域不存在上述缺点。因此,应用层次化区域到D.Bernstein的全局调度中是很有意义的。 3.在D.Bernstein的全局调度算法框架上集成P-ready调度技术。 4.改进了D.Bernstein的全局调度算法的启发性方法。提出了新的优先级函数来衡量指令优先级。 克服或减弱了该算法存在的以下3方面缺点:(1)偏袒控制等价调度从而抑制了指令投机。(2)过分高估指令复制的代价从而导致失去一些优化机会。(3)在指令的优先级的评估机制中,DelaySum()函数比DepHeight()重要从而不必要地延长了关键路径的长度。 5.提出了生成树调度算法,包括调度框架和启发性方法两个方面。传统的基于非线性控制流图的全局无环指令调度算法在评估指令的优先级别局限于基本块。而生成树调度则能够在整个控制流的最大生成树上评估指令的优先级,因而能够更加精确地评估指令的优先级,从而提高调度质量。 6.上述技术均在IA-64开放源码编译器ORC中实现。实验结果验证了这些技术的有效性,达到了先进水平的性能加速比。(本文来源于《中国科学院研究生院(计算技术研究所)》期刊2004-04-01)

吴承勇,连瑞琦,张兆庆,乔如良[8](2000)在《协作式全局指令调度与寄存器分配》一文中研究指出指令级并行是现代高性能处理器的重要特征 .对于发挥这类处理器所具有的并行处理能力来说 ,编译器有至关重要的影响 .文中讨论指令级并行编译中的核心问题——全局指令调度与寄存器分配 ,并以作者为一种新型的显式并行体系结构微处理器研制的编译系统为背景 ,介绍了此类编译器后端设计中面临的指令调度与寄存器分配的时序问题 ,以及为解决这一问题而提出的一种协作式全局指令调度与寄存器分配方法(本文来源于《计算机学报》期刊2000年05期)

全局指令调度论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

Matrix DSP处理器是一款由国防科学技术大学计算机学院微电子所研发的有自主知识产权的高性能DSP处理。该处理器有较强的数据计算能力,因此可以应用于软基站无线通信、水声计算等领域。为了能够推广这款处理器,一套正确的、性能优越的编译器系统是必须的。为了使所开发的Matrix编译器性能更优,就必须要做好Matrix编译器的优化措施,特别是针对于Matrix体系结构的优化措施会更有效。本文根据Matrix体系结构的特点,提出了提出了几种适合Matrix编译器的优化措施,有的已经在Matrix编译器中实现并根据Matrix体系结构做了相应的改进,在很大程度上提高了Matrix编译器的优化性能。本文主要介绍和实现的优化措施如下:(1)基于选择调度的全局指令调度。Matrix处理器是一款能够同时发射10条指令的VLIW DSP,所以指令级的并行可以充分挖掘Matrix处理器的性能。全局指令调度能够使编译器更好的实现指令级的并行。在基于GCC选择调度的基础上,Matrix编译器中实现了正确的选择调度算法,并且根据自身体系结构改进后的算法效果更加明显。(2)if转换。if转换能够把控制流图转换为数据流图,进而可以服务于后续的优化,特别是对于指令调度有关的优化。Matrix处理器可以支持全谓词执行的,所以为Matrix编译器开发if转换可以更好的利用Matrix体系结构的特点挖掘处理器的性能。在基于GCC if转换实现的基础上,Matrix编译器中实现了同GCC一样的几种if转换情况,并且根据特定的应用程序添加了一些新的能够if转换的情况。通过添加if转换之后,Matrix编译器的性能得到了进一步提升,特别是在添加了一些新的能够if转换的情况之后,一些特定应用程序的执行效率有很大的提高。(3)分支延迟调度。Matrix指令集中所有的分支指令、跳转指令、函数调用指令都有四个延迟槽。如果在程序中不对这些延迟槽进行填充,就会造成流水线的空转,浪费了硬件资源。在基于GCC分支延迟调度实现的基础上,Matrix编译器正确实现了分支延迟调度功能,并且根据Matrix体系结构改进后的分支延迟调度算法,调度效果更好,延迟槽填充更加充分。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

全局指令调度论文参考文献

[1].王昊,王向前.一种平衡的全局指令调度新框架研究[J].中国集成电路.2014

[2].刘飞.YHFT-Matrix编译器全局指令调度相关技术的研究与实现[D].国防科学技术大学.2013

[3].卫小鹏李沛,刘荣.缺电不缺坚守避峰不避困难[N].国家电网报.2008

[4].杨书鑫,薛丽萍,张兆庆.迭代式全局指令调度[J].计算机科学.2004

[5].杨书鑫,张兆庆.全局指令调度综述[J].计算机工程与应用.2004

[6].杨书鑫,张兆庆.ORC的全局指令调度技术[J].计算机学报.2004

[7].杨书鑫.全局无环指令调度研究[D].中国科学院研究生院(计算技术研究所).2004

[8].吴承勇,连瑞琦,张兆庆,乔如良.协作式全局指令调度与寄存器分配[J].计算机学报.2000

标签:;  ;  

全局指令调度论文-王昊,王向前
下载Doc文档

猜你喜欢