5%跳转和调用20%(其中60%是成功的)条件分支Quiz3假设各种分支占所有指令数的百分比如下表所示:现有一5段流水线,每段延迟时间均为一个时钟周期,分支转移地址在第3个时钟周期结束时才能计算出来,条件分支的转移条件在第4个时钟周期才能确定.
假设第一个流水段是取指阶段,第二个流水段是指令译码阶段,理想CPI值为1.
试通过计算说明应该采用哪种控制相关处理策略(冻结技术、预测分支成功策略以及预测分支失败策略)性能最高第4章指令级并行Review:基本流水线流水线提高的是指令带宽(吞吐率),而不是单条指令的执行速度相关限制了流水线性能的发挥结构相关:需要更多的硬件资源数据相关:需要定向,编译器调度控制相关:尽早检测条件,计算目标地址,延迟转移,预测增加流水线的级数会增加相关产生的可能性异常,浮点运算使得流水线控制更加复杂编译器可降低数据相关和控制相关的开销Load延迟槽Branch延迟槽Branch预测指令级并行的概念计算机系统的并行性,从执行程序的角度,分为:指令内部并行:指令内部的微操作指令级并行:并行执行两条或多条指令任务级或过程级并行:并行执行两个或多个过程或任务作业或程序级并行:在多个作业或程序间并行从处理数据的角度,并行性等级分为:字串位串字串位并字并位串全并行提高并行的三种途径时间重叠资源重复资源共享4.
1先进流水线技术和指令级并行(InstructionLevelParallelism)ILP:无关的指令重叠执行流水线的平均CPIPipelineCPI=IdealPipelineCPI+StructStalls+RAWStalls+WARStalls+WAWStalls+ControlStalls本章研究减少停顿(stalls)数的方法和技术基本途径软件方法(编译器优化)Gcc:17%控制类指令5instructions+1branch在基本块上,得到更多的并行性挖掘循环级并行硬件方法动态调度方法以DLX的浮点数操作为例采用的基本技术本章遵循的指令延时产生结果的指令使用结果的指令所需延时FPALUopAnotherFPALUop3FPALUopStoredouble2LoaddoubleFPALUop1LoaddoubleStoredouble0IntegeropIntegerop0(当使用结果的指令为BRANCH指令时除外)基本块内的指令级并行基本块的定义直线型代码,无分支单入口整个程序是由分支语句连接基本块构成循环级并行for(i=1;iout-of-ordercompletion硬件方案之一:记分牌记分牌的基本概念示意图记分牌技术要点(1/2)Out-of-orderexecution将ID段分为:Issue—译码,检测结构相关Readoperands—等待到无数据相关时,读操作数起源于1963年推出的CDC66004FPU5MemoryReference7IU集中相关检查,互锁机制解决相关CDC6600:顺序发射,乱序执行,乱序完成,CDC6600流水线没有采用定向技术,只实现非精确中断Load/store结构采用这种技术的微处理器企业MIPS,HP,IBMSun公司的UltraSparcDECAlpha记分牌技术要点(2/2)Out-of-ordercompletion=>WAR,WAWhazardsWAR的一般解决方案对操作排队仅在读操作数阶段读寄存器对WAW而言,检测到相关后,停止发射前一条指令,直到前一条指令完成要提高效率,需要有多条指令进入执行阶段=>必须有多个执行部件或执行部件是流水化的记分牌保存相关操作和状态记分牌用四段代替ID,EX,WB三段带有记分牌控制的DLX记分牌控制的四阶段(1/2)1.
Issue—指令译码,检测结构相关如果当前指令所使用的功能部件空闲,并且没有其他活动的指令使用相同的目的寄存器(WAW),记分牌发射该指令到功能部件,并更新记分牌内部数据,如果有结构相关或WAW相关,则该指令的发射暂停,并且也不发射后继指令,直到相关解除.
Readoperands—没有数据相关时,读操作数如果先前已发射的正在运行的指令不对当前指令的源操作数寄存器进行写操作,或者一个正在工作的功能部件已经完成了对该寄存器的写操作,则该操作数有效.
这不端午节和大家一样回家休息几天,也没有照顾网站的更新。今天又出去忙一天没有时间更新,这里简单搜集看看是不是有一些商家促销活动,因为我看到电商平台各种推送活动今天又开始一波,所以说现在的各种促销让人真的很累。比如在前面我们也有看到PacificRack 商家发布过年中活动,这不在端午节(昨天)又发布一款闪购活动,有些朋友姑且较多是端午节活动,刚才有看到活动还在的,如果有需要的朋友可以看看。第一、端...
HostKvm也发布了开年促销方案,针对香港国际和美国洛杉矶两个机房的VPS主机提供7折优惠码,其他机房业务提供8折优惠码。商家成立于2013年,提供基于KVM架构的VPS主机,可选数据中心包括日本、新加坡、韩国、美国、中国香港等多个地区机房,均为国内直连或优化线路,延迟较低,适合建站或者远程办公等。下面列出几款主机配置信息。美国洛杉矶套餐:美国 US-Plan1CPU:1core内存:2GB硬盘...
hostwebis怎么样?hostwebis昨天在webhosting发布了几款美国高配置大硬盘机器,但报价需要联系客服。看了下该商家的其它产品,发现几款美国服务器、法国服务器还比较实惠,100Mbps不限流量,高配置大硬盘,$44/月起,有兴趣的可以关注一下。HostWebis是一家国外主机品牌,官网宣称1998年就成立了,根据目标市场的不同,以不同品牌名称提供网络托管服务。2003年,通过与W...