指令SNB有多强 AVX指令集的出现慢慢引起质变

avx指令集  时间:2021-03-10  阅读:()

S N B有多强AVX指令集的出现慢慢

引起质变

目前对于Sandy Bridge架构下AVX指令集的评价主要有两个方面一是说AVX完全没有摆脱X86的阴影角度出发这个笔者可以理解。毕竟X86都沿用了这么多年了有些网友可能处于对新事物的期待。另外就是称其为革命性变革虽然有点夸张不过笔者还是比较认可后者。我也希望可以有一种更新进的模式颠覆X86的时代不过这种可能性实现起来很困难。

某种角度上笔者比较赞同颠覆说网友的看法。 AVX并不是x86CPU的扩展指令集而是可以实现更高的效率 同时也和CPU硬件兼容性也更好并且也有着足够的扩展空间这都和其全新的命令格式系统有关。更加流畅的架构就是AVX发展的方向换言之就是摆脱传统x86的不足在SSE指令的基础上AVX也使SSE指令接口更加易用。我们可以从以下两个方面来分析…

一、 AVX革新的指令格式

AVX的256bits SIMD扩展支持是其最具革新的设计部分 同时也代表了指令编码格式的变更。头部增加prefix让扩展成为可能而增强的寄存器也使指令头部分不断增加prefix成为了可能。这就似乎是由一个房子出来站到了院子里一般摆在他面前的是更宽广的世界。

二、 AVX最新的编码系统

针对AVX的最新的命令编码系统 Intel也给出了更加详细的介绍其中包括了大幅度扩充指令集的可能性。 比如Sandy Bridge所带来的融合了乘法的双指令支持。从而可以更加容易地实现512bits和1024bits的扩展。而在2008年末到2009年推出的meni ikoaCPU"Larrabee(LARAB)"处理器就会采用AVX指令集。从地位上来看AVX也开始了Inte l处理器指令集的新篇章。

基于这些Intel AVX带来的前景似乎非常明朗下面我们来看看AVX的未来剑指何方。

AVX的未来指令格式

支持16路SIMD指令

VEX是AVX的编码系统简称。 由于VEX的支持AVX的长指令可以变得更短而VEX的payload也有着1字节和2字节两种 VEXprefix为1字节payload的C5和2字节的C1 以及1字节的payload等情况 同样的指令和之前的指令格式比较beru的1字节分指令相比也更短。 Intel的Bob Valentine先生在IDF峰会上曾经介绍过AVX带来的蓝图。

VEX编码格式的另外一个重要点就是有着强大的指令集扩展支持而对于同样命令长度的指令也更加容易地实现这样就使不断增长的命令兼容变得更加容易。

其中5字节版的payload也专门有着指令扩展的3比特空间而3bits也以为着1000条新指令的支持全新的ficha和新的寄存器以及vector也都可以更加容易地增加。

除了VEX指令格式外还有着1,024bits的SIMD的支持。 同时多重prefix的支持和之前的beru比较全部的指令在格式上都更小之前的1字节C5通过C4也可以决定op code的长度。而从硬件上来看的话指令的puridekodo实现也更加容易。

VEX解决x86 CPU瓶颈

AVX的VEX的编码系统从某一侧面上也反应了Intel处理器今后的进化趋势 因为它解决了x86系列CPU在decoding上的不足。 Core MA有着4条命令的执行通道不过front end却存在着不足首先L1缓存fetch端口也有着16字节的长度。而fetch的命令次数也被得到了限制。首先IA-32/Intel 64命令的puridekodo也有着先天的瓶颈而操作数和地址长度的指令prefix"LCP(Length Changing Prefixes) 使得puridekodo变得更慢所以必须要改变长标注的算法。fetch&puridekodo的最优化设计

Core MA在puridekodo&decoding方面的不足从根本上来看是IA-32/Intel 64指令集架构本身的问题。 IA-32/Intel 64架构为了增强长命令而增设的缓存使命令fetch拜年的更长并且更加复杂的命令格式也由此产生。RISC(Reduced Instruction Set Computer)的命令格式也决定了其长度decoding虽然容易但x86系CPU也就要以牺牲资源为代价 同时也带来了电力的额外消耗。

实际上最新的Nehalem也有着类似Core MA的不足从某种程度上来看也延续了其不足如果明确了这一问题的话那么Nehalem就必须要改进其中16bytesfetch和puridekodo等方面的改进就势在必行了。而改进所需要的庞大晶体管增加也会带来功耗的增加。

Nehalem的fetch&decoding Nehalem的设计其实存在着疑问不过从VEX格式来分析的话其意图就非常明确了。 Intel在完善了CPU的puridekodo&decoding硬件设计的同时必须要改进指令格式本身。 fetch的指令变短的同时指令的标注却更加复杂了而解决的唯一办法就是改进指令格式。

在充分考虑硬件方面设计后 intel做出了VEX格式开始的决策。 IDF上Valentine先生也对VEX格式进行了详细的说明。他是Core MA的front end的fetch开发以及decoding的高级架构师 同时也是IA-32/Intel 64指令编码器的设计专家。

从整体来看AVX指令的话可以看出intel公司都CPU开发的全部脉络Intel公司在对比beru的话产生改进Drastic的指令集的微架构的想法就变得顺理成章了如果分析原因的话那就是微架构本身的改进了。全新的CPU必然要有更好的性能表现想要提高CPU的性能那么指令集是最行之有效的手段。

AVX扩展指令包含了SSE指令这也有助于像AVX时代的过度。 日前的SSEVEX格式也并不需要绝对的转换过程。 Intel公司的Benny Eitan先生也提到 出于整体的考虑 Intel公司对于AVX普及的进行并不会泰国迅速并且也不会立刻停止SSE时代。 Sandy Bridge也增强了解码器的支持和之前的IA-32/Intel 64prefix相比 decoding也有了全新的VEX格式的支持。其中

VEX指令对于decoding的命令数的支持上更加强劲 同时VEX在执行效率上也更加出色。不过这些和Sandy Bridge真正到来的时候可能还存在差异。

95IDC香港特价物理机服务器月付299元起,5个ip/BGP+CN2线路;美国CERA服务器仅499元/月起

95idc是一家香港公司,主要产品香港GIA线路沙田CN2线路独服,美国CERA高防服务器,日本CN2直连服务器,即日起,购买香港/日本云主机,在今年3月份,95IDC推出来一款香港物理机/香港多ip站群服务器,BGP+CN2线路终身7折,月付350元起。不过今天,推荐一个价格更美的香港物理机,5个ip,BGP+CN2线路,月付299元起,有需要的,可以关注一下。95idc优惠码:优惠码:596J...

华为云年中聚惠618活动,新用户专区,云服务器低至88元/年,3年仅580.98元,热销抢购中,最后2天!

华为云怎么样?华为云用在线的方式将华为30多年在ICT基础设施领域的技术积累和产品解决方案开放给客户,致力于提供稳定可靠、安全可信、可持续创新的云服务,做智能世界的“黑土地”,推进实现“用得起、用得好、用得放心”的普惠AI。华为云作为底座,为华为全栈全场景AI战略提供强大的算力平台和更易用的开发平台。本次年终聚惠618活动相当给力,1核2G内存1m云耀云服务器仅88元/年起,送主机安全基础版套餐,...

美国Cera 2核4G 20元/45天 香港CN2 E5 20M物理机服务器 150元 日本CN2 E5 20M物理机服务器 150元 提速啦

提速啦 成立于2012年,作为互联网老兵我们一直为用户提供 稳定 高速 高质量的产品。成立至今一直深受用户的喜爱 荣获 “2021年赣州安全大赛第三名” “2020创新企业入围奖” 等殊荣。目前我司在美国拥有4.6万G总内存云服务器资源,香港拥有2.2万G总内存云服务器资源,阿里云香港机房拥有8000G总内存云服务器资源,国内多地区拥有1.6万G总内存云服务器资源,绝非1 2台宿主机的小商家可比。...

avx指令集为你推荐
vc组合洛天依的组合都有谁firetrap你们知道的有多少运动品牌的服饰?mathplayerjavascript 如何判断document.body.innerHTML是否为空psbc.com邮政储蓄卡如何激活seo优化工具想找一个效果好的SEO优化软件使用,在网上找了几款不知道哪款好,想请大家帮忙出主意,用浙江哪款软件效果好百度关键词分析百度竞价关键词分析需要从哪些数据入手?同一服务器网站服务器建设:一个服务器有多个网站该如何设置?kb123.net股市里的STAQ、NET市场是什么?广告法中华人民共和国广告法中,有哪些广告不得发布?baqizi.cc讲讲曾子杀猪的主要内容!
沈阳虚拟主机 二级域名申请 腾讯云盘 cpanel 香港机房托管 哈喽图床 外国空间 evssl 华为网络硬盘 大容量存储器 什么是刀片服务器 怎么测试下载速度 泉州电信 ftp免费空间 1美金 lamp架构 七牛云存储 腾讯云平台 认证机构 godaddy域名 更多