导读:本文包含了分支预测器论文开题报告文献综述、选题提纲参考文献,主要关键词:分支,神经网络,仿真器,多核,指令,处理器,译码。
分支预测器论文文献综述写法
王伟[1](2017)在《乱序处理器分支预测器性能建模》一文中研究指出随着移动智能应用需求的不断变化和工艺设计的不断改进,分支预测器作为缓解微处理器控制冒险和降低流水线气泡的关键技术被引入。相应的,如何评估分支预测器的性能成为研究热点,主要包括分支缺失次数与分支确定时间的研究。分支缺失次数方面,研究人员挖掘软件微结构无关特征参数与分支预测机制之间的关系,并构建解析模型,但与分支预测仿真模型相比,预测精度较差。分支确定时间方面,现有的分析和模型无法覆盖所有的影响因素,且在跨程序预测上精度较差。本文构建了分支预测仿真器与基于神经网络的分支确定时间模型,提高了分支预测器性能评估的精度。主要工作分为叁个部分,第一,采用Python语言构建了 Gshare、Bimode和Tournament叁种分支预测器的仿真模型,并提供了多种配置选项,可以准确模拟分支预测器的行为。第二,分析了影响分支确定时间的因素及其之间的耦合关系,并通过构建神经网络模型,实现了跨程序的分支确定时间预测。第叁,将前两部分的工作整合成一个完整的工具,提供了易于操作的可视化图形界面。在SPEC CPU2000测试集以及9种分支预测器配置下,本文实现的分支预测仿真器的缺失次数预测与原子模式下Gem5仿真结果相比,平均精度在98%左右,与前期的解析模型相比,平均精度提升了 28%。在时间方面,Trace流具有一次仿真,多次使用的特点,因此所考察的微架构越多,单位时间成本就越低,即分支预测仿真器的加速比与分支预测器的微结构配置种类成正比。在MobyBench测试集以及9种分支预测器配置下,基于神经网络的分支确定时间模型的平均精度在82%,相比于前期的非线性拟合模型与精简假设模型,平均精度分别提升了 19%和27%。(本文来源于《东南大学》期刊2017-06-14)
戎越[2](2016)在《面向Android应用的分支预测器对比与分析》一文中研究指出超标量超深流水线技术被普遍应用到现代嵌入式处理器中。其中,分支指令的高效执行是充分发挥硬件潜能的前提,因此现代处理器普遍采用分支预测技术降低分支指令造成的性能损失。另一方面,随着Android设备的普及,Android应用也越来越丰富。Android应用与传统benchmark存在差异,在Android应用下对比不同分支预测器的预测准确率、探索微结构参数对预测准确率的影响,可以为面向Android平台的移动设备的处理器设计提供参考。本文详细分析了Gem5仿真器中的CPU模型,通过对CPU模型的修改,从Gem5仿真器中提取出Android应用分支Trace流并用于后续Trace仿真。本文在Android应用场景下分析了微结构参数对GShare和Bimode两种分支预测器的预测准确率的影响,并在多种微结构参数下对比了两者的预测准确率。论文还分析了微结构参数对BTB预测准确率的影响以及BTB预测错误的原因。针对BTB无法有效预测间接分支目标地址的问题,本文实现了VPC间接分支预测机制,并通过对比实验验证了该机制的有效性。实验结果表明在Android应用下,Bimode比GShare分支预测器在多种微结构参数下都有更高的预测准确率。对于GShare预测器,在PHT小于4K时增大PHT可以有效增加预测准确率:Bimode预测器在PHT小于6K时增大PHT可以有效提升预测准确率:在假设跳转方向预测完全正确的情况下,BTB在4K以下时能够通过增加表项有效提升预测准确率。BTB增大后,无法有效预测具有多个跳转目标的间接分支成为主要瓶颈。VPC预测机制在AsimBench下,与Bimode加BTB的预测方式相比,平均分支预测正确率从90.14%提升到92.16%,分支错误引起的开销下降20.5%。(本文来源于《东南大学》期刊2016-05-01)
肖建青,沈绪榜,李伟,张洵颖[3](2015)在《一种组合延迟槽和预译码技术的新型分支预测器》一文中研究指出分支预测是现代微处理器普遍用于提高指令吞吐率的关键技术,随着处理器性能需求的不断增长,分支预测结构越来越复杂,其功耗问题也日益突出.针对SPARC V8架构嵌入式处理器的结构特点和应用需求,设计了一种基于延迟槽的动态分支预测器,以此来提高处理器的预测性能;另外,通过分析动态预测器的几种设计空间,提出采用预译码机制来消除无效访问的电路结构,从而降低预测器的功耗开销.该设计在SMIC 0.13μm工艺下实现,分支预测准确度相比于之前的静态算法提高了21%,动态预测器本身的功耗降低了58%,而整个处理器的面积仅增加1.73%.结果表明,这种组合延迟槽和预译码技术的分支预测思想对SPARC处理器的性能和功耗都达到了很好的优化效果.(本文来源于《小型微型计算机系统》期刊2015年04期)
李静梅,关海洋[4](2012)在《基于同时多线程的TBHBP分支预测器研究》一文中研究指出针对传统处理器分支预测器存在分支预测信息混乱、分支指令别名冲突和容量冲突率高的缺点,提出基于同时多线程处理器的分支预测器TBHBP。该分支预测器采取线程历史信息与基于地址索引的局部历史信息相结合的综合历史信息作为模式匹配表PHT的索引,并采取线程独立拥有线程历史寄存器和分支历史寄存器的方式,通过新增分支结果输出表来提高指令的分支预测执行速度。研究结果表明,TBHBP分支预测器有效解决了分支信息过时、分支指令别名和容量冲突的问题。与Gshare分支预测器相比,其指令吞吐率提升了12.5%,分支误预测率和误预测路径取指率分别下降了0.5%和2.1%。(本文来源于《计算机科学》期刊2012年09期)
刘洋徐瑞,陈书明,李勇[5](2011)在《一种低开销的复合神经网络分支预测器》一文中研究指出为提高神经网络分支预测器的预测正确率,提出一种将神经网络算法与2位分支预测的优点相结合的新的预测器。实验结果表明,该预测器能够弥补神经网络算法学习时间较长的缺陷,提高分支预测器在神经网络算法学习阶段的预测正确率。(本文来源于《计算机工程》期刊2011年S1期)
张筱,史战果,吴迪[6](2011)在《基于SimpleScalar的动态分支预测器研究》一文中研究指出分支预测精度是影响当代处理器性能的重要指标,在近十年内一直是学术界和工业界的研究热点。为给不同应用场合的处理器动态分支预测器设计提供性能参考,针对处理器架构设计中应用广泛的几种动态分支预测器,使用SPEC CPU2000在SimpleScalar模拟器中进行仿真及测试分析。测试结果以预测精度和指令/时钟周期作为指标,并结合硬件开销,分析了不同种类分支预测器的适用对象和场合。(本文来源于《微型电脑应用》期刊2011年11期)
金玉苹,焦平,佟阳[7](2011)在《异构多核处理器分支预测器研究与设计》一文中研究指出为解决单核处理器时钟频率难以提高、处理器功耗逐渐增加等问题,文中提出了一种新型异构多核处理器的设计方案.该结构中增加了B-Cache结构和C-Core控制器,这种新型异构多核处理器避免了流水线因分支预测失误而flush,提高了整个处理器执行效率.(本文来源于《微电子学与计算机》期刊2011年11期)
焦永[8](2011)在《双模式分支预测器的改进》一文中研究指出双模式的分支预测器把两位计数器表分成了两半,每一半都有一个计数器,其中的一个有更多的历史位,实现了以历史为索引的机制;另一个则实现了地址索引的机制。经过模拟发现预测准确率并没有达到预期效果,故对索引机制进行改进,将其中的一个方向预测器的索引方式改为由地址索引,而不与全局历史信息进行异或。模拟结果显示,改进后的双模式分支预测器比改进前预测失效率降低2.4%。(本文来源于《2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集》期刊2011-11-02)
喻明艳,张祥建,王晨旭[9](2010)在《分支指令特性与分支预测器的性能研究》一文中研究指出根据分支指令的特性,分析了分支行为与分支预测技术对单发射嵌入式处理器CPI栈(CPI stacks)组成的影响,并在RTL级设计了分支预测器的时序精确模型,通过硬件模拟方法对分支指令特性和分支预测器的性能进行了研究.实验考察了分支指令在分支预测器命中或缺失时的不同跳转统计特性,验证了分支预测器对CPI栈影响的理论推导,为单发射嵌入式处理器中分支预测器的设计与优化提供了精确的实验依据.(本文来源于《微电子学与计算机》期刊2010年06期)
蒋冠军[10](2010)在《记录式分支预测器》一文中研究指出分支预测技术的不断改进使得处理器的性能得到极大的提升,两级模式分支预测器以其简单结构和高效性能被广泛应用。但是该类预测器存在几个严重的缺陷,它们分别是分支别名、历史噪音和多路存取。前人对分支别名和历史噪音问题作出了大量的研究,取得了非常大的改进,但是并没有完全解决这两个问题,还有改进的空间。同时以前的研究并没有考虑由于多路存取而造成的预测错误。本文总结了分支别名和历史噪音的问题,提出模式分支预测中多路存取的问题,描述了由于多路存取带来的分支预测错误问题,分析了循环和函数调用对分支历史的影响,提出了基于循环和函数调用的栈式分支预测结构,它过滤循环和函数体外的分支对循环和函数体内分支预测的干扰。然后又根据栈式结构提出了记录式分支预测结构。记录式分支预测结构是在分支预测时维护和选择GHR值的硬件结构,它不影响原来预测器的更新过程,不需要改变原来预测器的组织结构,能够被使用在任何的模式预测器上。记录式结构有3条分支预测原则,这3条原则通过保证预测过程中遇到多路存取时访问相同分支修改的PHT项,减少了历史噪音对分支预测的错误影响。记录式结构对分支别名无效。本文在simplescalar模拟器上修改了Gshare预测器,实现了记录式Gshare预测器,同时还实现了2Bc-gskew预测器和记录式2Bc-gskew预测器。实验结果显示,具有记录式分支预测结构的预测器比原来预测器具有更少的分支预测错误。而且在一般情况下,随着记录式结构PC记录的长度变长和PHT容量增大,记录式结构能够减少更多的预测错误比例。当PC记录为20项,PHT容量为4096项时,记录式Gshare能够比Gsharep平均减少7.6%的分支预测错误,记录式2Bc-gskew能够比2Bc-gskew平均减少1 4.5%的分支预测错误。(本文来源于《浙江大学》期刊2010-01-01)
分支预测器论文开题报告范文
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
超标量超深流水线技术被普遍应用到现代嵌入式处理器中。其中,分支指令的高效执行是充分发挥硬件潜能的前提,因此现代处理器普遍采用分支预测技术降低分支指令造成的性能损失。另一方面,随着Android设备的普及,Android应用也越来越丰富。Android应用与传统benchmark存在差异,在Android应用下对比不同分支预测器的预测准确率、探索微结构参数对预测准确率的影响,可以为面向Android平台的移动设备的处理器设计提供参考。本文详细分析了Gem5仿真器中的CPU模型,通过对CPU模型的修改,从Gem5仿真器中提取出Android应用分支Trace流并用于后续Trace仿真。本文在Android应用场景下分析了微结构参数对GShare和Bimode两种分支预测器的预测准确率的影响,并在多种微结构参数下对比了两者的预测准确率。论文还分析了微结构参数对BTB预测准确率的影响以及BTB预测错误的原因。针对BTB无法有效预测间接分支目标地址的问题,本文实现了VPC间接分支预测机制,并通过对比实验验证了该机制的有效性。实验结果表明在Android应用下,Bimode比GShare分支预测器在多种微结构参数下都有更高的预测准确率。对于GShare预测器,在PHT小于4K时增大PHT可以有效增加预测准确率:Bimode预测器在PHT小于6K时增大PHT可以有效提升预测准确率:在假设跳转方向预测完全正确的情况下,BTB在4K以下时能够通过增加表项有效提升预测准确率。BTB增大后,无法有效预测具有多个跳转目标的间接分支成为主要瓶颈。VPC预测机制在AsimBench下,与Bimode加BTB的预测方式相比,平均分支预测正确率从90.14%提升到92.16%,分支错误引起的开销下降20.5%。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
分支预测器论文参考文献
[1].王伟.乱序处理器分支预测器性能建模[D].东南大学.2017
[2].戎越.面向Android应用的分支预测器对比与分析[D].东南大学.2016
[3].肖建青,沈绪榜,李伟,张洵颖.一种组合延迟槽和预译码技术的新型分支预测器[J].小型微型计算机系统.2015
[4].李静梅,关海洋.基于同时多线程的TBHBP分支预测器研究[J].计算机科学.2012
[5].刘洋徐瑞,陈书明,李勇.一种低开销的复合神经网络分支预测器[J].计算机工程.2011
[6].张筱,史战果,吴迪.基于SimpleScalar的动态分支预测器研究[J].微型电脑应用.2011
[7].金玉苹,焦平,佟阳.异构多核处理器分支预测器研究与设计[J].微电子学与计算机.2011
[8].焦永.双模式分支预测器的改进[C].2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集.2011
[9].喻明艳,张祥建,王晨旭.分支指令特性与分支预测器的性能研究[J].微电子学与计算机.2010
[10].蒋冠军.记录式分支预测器[D].浙江大学.2010