正在阅读:NV独领风骚!开普勒GTX680显卡震撼首测NV独领风骚!开普勒GTX680显卡震撼首测

2012-03-22 20:51 出处:PConline原创 作者:阿乐 责任编辑:zhangqingle

第三步:“开普勒”登场

  NVIDIA这次发布的“开普勒”架构GK104芯片,流处理器数量1536个,达到了上一代旗舰GTX580的三倍,如此激进,令人始料未及。芯片集成了35亿个晶体管,核心面积却仅仅294平方毫米,TDP功耗更降到了195W,只是GTX580的一半稍多。由此看来,“开普勒”与“费米”在架构上有巨大的不同,明显更高效、更节能。


“开普勒”架构GK104芯片核心图

  GK104芯片内建的1536个CUDA流处理器,被分配成16组SM阵列,每组SM包含96个流处理器,接下来的GTX660、GTX650、GTX620...流处理器数量都有可能会比上代产品至少翻一倍。在核心规模上,GK104比GF110复杂很多,但借助28纳米工艺,GK104芯片核心面积只有294平方毫米,远远小于GF110 520平方毫米的规模,也小于对手HD7970的365平方毫米。


GK104芯片内部结构图

  GK104芯片的晶体管数量是35亿个,比GF110芯片30亿个的规模高不了多少,这就又产生了一个很的疑问:三倍的流处理器“建筑”规模,却只多用了1/6的晶体管“砖头”,NVIDIA是如何做到的?

GTX400
GF110芯片结构图

  正如大家所想,GK104采用了一种“简化CUDA核心”的设计方案。GK104的1536个流处理器,被划分为8个SM单元,每个SM单元内部具有192个流处理器,密度非常大。“开普勒”还在架构内部加入一些固定功能的模块,以提升光栅化、纹理渲染性能,统一调配流处理器的任务分派。“开普勒”还支持全新的GPU Boost 技术,能够动态调节运行频率,针对性能与功耗作出动态调整。


GK104芯片内部的一个SM单元结构示意图

  由此看来,“开普勒”内部的CUDA核心,是以“小组”的形式组织管理的,单个CUDA核心独立性低于“费米”架构,但却在统一的协调下,理论峰值运算性能、特别是图形运算性能有个巨大的进步。这可以说是对纯通用运算架构GPU的一种反思。

NVIDIA开普勒显卡
开普勒:对纯通用运算架构GPU的一种反思

  这种设计理念的转变,让“开普勒”看起来也有点像“GCN”,在经历漫长的设计理念分歧之后,GPU架构设计思路正在归于一致:通用运算是未来,但更强大的图形运算性能却是现实。新架构下,GTX680显卡游戏性能达到了上一代GTX580的1.5倍,交出了一份出色的答卷。

键盘也能翻页,试试“← →”键

为您推荐

加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
热门排行

DIY论坛帖子排行

最高点击 最高回复 最新
最新资讯离线随时看 聊天吐槽赢奖品