插曲:AMD GCN架构 前面我们已经指出AMD历代GPU的瓶颈除了曲面细分以外,其实最重要的是SIMD超长指令集架构的效率问题,GCN架构的出现弥补了这一遗憾。2012年,AMD终于放弃沿用了5年的SIMD架构,借鉴NVIDIA的“通用运算”理念,将内部重新规划,设计出了GCN架构(次世代图形核心),首款旗舰产品正是1月9日发布的代号Tahiti的HD7970。
事实上,HD7970的GCN架构改变了AMD自R600以来一直坚持的VLIW打包吞吐模式,这个改动可以说彻底撼动了AMD GPU构架发展的基础。VLIW(超长指令字)是将很多条指令连在一起,建成一个超长指令,让GPU的运算单元可以一次启动连续执行,省去了很多调度指令、等待周期,从而提升运算效率,单线程执行密度很高。但VLIW在多个流处理器并行性上存在一些难以预料的指令打包、分派灵活性逻辑缺陷,在GPU这样规模越来越大的并行处理器上,数千个流处理器的整体吞吐率反而受到影响。 DirectX 11要求构架拥有更好的ALU灵活度和通用计算能力,而非传统意义上的单纯吞吐能力。VLIW模式高吞吐低灵活性的特点,在通用计算就是图形计算的今天已经显得有些呆板了。GCN架构的出现,正是AMD在意识到需要加强通用计算性能来获取更好的图形表现之后所做出的重大转变,放弃VLIW不仅意味着GPU领域超长指令与普通指令分庭抗礼时代的终结,普通SIMD吞吐模式统一江湖,更标志着AMD正式“重归”GPU高性能计算应用领域。 因此,在设计理念上,GCN架构已经不再单纯的追求图形渲染能力,而是更注重于为高性能运算优化,这个理念转变,更符合“通用计算就是图形计算”的今后趋势。GCN架构正是AMD加强通用计算性能思路的表现,而且高性能通用计算也能同时带来更高的图形性能。放弃VLIW不仅意味着GPU大规模并行框架内普通SIMD指令模式的回归,更标志着AMD理念转向GPU高性能计算。 HD7970架构中的2048个流处理器组成了32个并行计算单元,如此一来,每个计算单元内部就具有64个流处理器,这64个流处理器组成了4个矢量单元(Vector Unit),每个矢量单元搭配64KB矢量寄存器。GCN架构内,每4个计算单元组成一个运算小组,配备了数据寄存器和一些辅助性功能模块,从而组成了一个完整的运算中枢(类似于一个纯计算功用的核心集群)。 GCN架构中的这些计算单元,是基于SIMD普通指令集的结构模式,抛弃了以往的VLIW(超长指令字)的打包吞吐模式,单个计算单元灵活度、独立性更高,每个计算单元都能同时领取、执行指令,众多计算单元并行处理能力很高,架构利用率和指令吞吐量比VLIW模式更高。GCN架构下,HD7970的理论运算能力相比HD6970提升不过40%,但在GPU通用计算当中的性能提升却非常显著,普遍可达两倍以上,尤其在AES加密解密算法中,速度达到了前者的4倍。 NVIDIA从G80开始放弃SIMD架构,革命性地设计了MIMD,历经5年市场考验进化到“费米”,是一个很成功的设计方案,AMD借鉴了NVIDIA的成功方案,师夷长技以制夷,完成了一次华丽的转身反击,HD7970一发布,就拿下“单芯卡王”的宝座。由此开始,从“通用运算是未来”的设计理念出发,AMD、NVIDIA图形芯片为架构设计又归于相似。>>
|
正在阅读:NV独领风骚!开普勒GTX680显卡震撼首测NV独领风骚!开普勒GTX680显卡震撼首测
2012-03-22 20:51
出处:PConline原创
责任编辑:zhangqingle
键盘也能翻页,试试“← →”键
本文导航 | ||
|
浏览本产品的网友还关注:
-
NVIDIA GeForce RTX 2080Ti ¥9999
-
NVIDIA GeForce RTX 2080 ¥6499
-
NVIDIA GeForce GTX 1060 ¥1999
网友评论
登录|QQ微博微信
欢迎参与讨论,分享你的看法
热门评论
最新评论
为您推荐
IT热词