正在阅读:真正的玩家战舰:AMD HD7950显卡首发评测真正的玩家战舰:AMD HD7950显卡首发评测

2012-01-31 13:56 出处:PConline原创 作者:阿乐 责任编辑:zhangqingle

AMD HD7950显卡GCN架构解析

  我们前面说过,HD7950基本上可以认为是HD7970屏蔽了1/8的流处理器而来,其硬件规格依然非常强悍。HD7950芯片仍然基于AMD 28纳米GCN图形架构,由于只是屏蔽了部分流处理器,因此芯片内部晶体管数量仍然是43亿个。但借助先进的28纳米工艺,芯片核心面积仅365平方毫米,甚至小于上一代旗舰HD6970

AMD Radeon HD7970显卡

  AMD新一代GCN图形架构,是在上一代HD6000系列显卡的核心架构上大幅度优化改进而来,主要是提改进了核心内运算单元处理指令的灵活性,从而提升了效率。借助28nm工艺,GCN架构还可以达成更高的运行频率,而且发热量更小、芯片面积更小,从而可以提升芯片性能,并在日后成熟量产时降低芯片成本。

显卡
HD7900(Tahiti)图形芯片核心面积比HD6970(Cayman)还小

  GCN架构在最底层的流处理器管理模式上经历了大幅的优化重组,内部组织架构更灵活、更高效。在指令运行方式上,GCN也改变了AMD自R600以来一直沿用的VLIW打包吞吐模式,这个改动幅度可以说是对GPU运算模式基础的变更,对AMD GPU架构发展意义重大。VLIW(超长指令字)单线程执行密度很高,有高吞吐低灵活性的特点,但却在多个流处理器并行性上存在一些难以预料的指令打包、分派灵活性逻辑缺陷,在GPU这样规模巨大的并行处理器上,数千个流处理器的整体效率反而受到影响。

显卡
GCN驾构:为高性能运算优化

  因此,在设计理念上,GCN架构已经不再单纯的追求图形渲染能力,而是更注重于为高性能运算优化,这个理念转变,更符合“通用计算就是图形计算”的今后趋势。GCN架构正是AMD加强通用计算性能思路的表现,而且高性能通用计算也能同时带来更高的图形性能。放弃VLIW不仅意味着GPU大规模并行框架内普通SIMD指令模式的回归,更标志着AMD理念转向GPU高性能计算。

AMD HD7950显卡
HD7950的1792个流处理器被划分成了28个“GCN”并行执行单元

  HD7950的1792个流处理器被划分成了28个并行计算单元(Compute Unit),如此一来,每个计算单元内部就具有64个流处理器,这64个流处理器组成了4个矢量单元(Vector Unit),每个矢量单元搭配64KB矢量寄存器。GCN架构内,每4个计算单元组成一个运算小组,配备了数据寄存器和一些辅助性功能模块,从而组成了一个完整的运算中枢(类似于一个纯计算功用的核心集群)。在芯片高负荷时,每个计算单元都能同时分配、执行指令,架构利用率和吞吐量很高,更适合处理多线程多任务并行运算。

AMD Radeon HD7970显卡
GCN计算单元结构示意图

  GCN架构中的这些计算单元,是基于SIMD普通指令集的结构模式,抛弃了以往的VLIW(超长指令字)的打包吞吐模式,单个计算单元灵活度、独立性更高,每个计算单元都能同时领取、执行指令,众多计算单元并行处理能力很高,架构利用率和指令吞吐量比VLIW模式更高。 

AMD Radeon HD7970显卡
完整的GCN架构(居中是32个并行计算单元,HD7950屏蔽了其中4个)

  由此我们可以看出,由于设计理念的转变,GCN架构在为体系上已经与前代产品有很大的不同,GCN不再单纯的追求吞吐量,而是将重点转向了灵活性、效率提升,整个架构从最基层开始就更为灵活的运算优化,架构中层的运算单元在并行效率上也有针对性的效率改进,整个GCN架构更面向“通用计算就是图形计算”的未来趋势。GCN架构在规划上更为清晰、直接,组织规划更独立的并行运算单元,很有针对性的解决了寄存器端口的冲突问题,以高灵活度消除了很多潜在的逻辑死锁现象,从而使得芯片性能更稳定,实际性能表现更接近理论预测值。>>

键盘也能翻页,试试“← →”键

为您推荐

加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
热门排行

DIY论坛帖子排行

最高点击 最高回复 最新
最新资讯离线随时看 聊天吐槽赢奖品