“开普勒”显卡第二步:费米 NVIDIA将2010年的GTX400系列显卡新架构命名为“费米”,是第二款以大物理学家命名的产品,通用运算理念再一次得到进化。后来的事实也证明,Fermi确实是NVIDIA最得意之作,甚至连对手AMD今年新推出的“GCN”架构也借鉴了不少“费米”的通用运算理念,这点我们后文再细说。 DX11与并行运算的结合:“费米”架构简析 2010年,NVIDIA声称Fermi GF100是一个全新架构并非没有道理。几乎每一个原有模块都进行了重组:有的砍掉了,有的转移了,有的增强了,还新增了光栅引擎和多形体引擎。完整的GF100核心总共有16组SM,每一组SM包含32个CUDA核心,ROP单元总共48个,分为六组,分别搭配一个64-bit显存通道。所有ROP单元和整个芯片共享768KB二级缓存(GT200里是独享)。 “费米”架构GF100芯片内建512个流处理器,NVIDIA将之称作“CUDA核心”,这512个核心分为16组SM单元,每组SM单元包含32个CUDA核心,核心晶体管数量达到了30亿个。设计如此大规模的GPU,在当时是一件近乎不可能的事情,因此“费米”芯片良品率低、功耗巨大。NVIDIA被迫在当时的旗舰GTX480显卡上,屏蔽了32个CUDA核心,但GTX480的性能依然达到了新高。 DX11一个很重要的特点就是细分曲面,细分曲面把游戏画面切割成更小的三角形,这样使得整个画面更加逼真细腻,而细分曲面的实现则需要用到多形体引擎,多形体引擎的数量也直接关系到显卡在DX11游戏中的表现。 GF110芯片与之前的GT200芯片在核心架构上有巨大的不同,“费米”加入多形体引擎以更适应DX11显卡的要求。多形体引擎负责顶点拾取、细分曲面、视口转换、属性设定、流输出等五个方面的处理工作,以符合DX11中最重要的曲面细分(Tessellator)特性。GF100中有16个多形体引擎,每组SM一个。 NVIDIA在GPU架构设计部分很出色,但是NVIDIA在芯片制造端掉了链子——由于GPU核心太大,台积电40nm工艺还不够成熟,导致GF100核心良品率低下,没能达到设计预期,最终的产品不仅功耗发热很大,而且规格不完整,外界对GTX480显卡的评价不是很高,让对手找到了攻击点。 这时候AMD已经意识到自己走错了路子,开始寻找挽救的方法,继续小核心策略。2010年底,AMD发布HD6800系列,超线程分配处理器从一个变成两个。SIMD的缺点就是流处理器执行效率比MIMD架构低,其效率高低完全依赖于分配单元的派发效率。因此Barts这种双线程分配处理器的设计意义重大,可以有效地提高SIMD执行效率。到了HD6900核心则更进一步,图形引擎也变成了两个,进一步提升性能。 根据AMD官方提供的数据来看,HD6870的曲面细分性能最多可达HD5870的两倍,这种情况出现在10级左右的中等细分程度,当曲面细分达到20级以上的时候,Tessellator本身的运算能力将成为瓶颈,此时线程派遣器的效率再高,也无济于事。 由此可见,AMD HD6800核心和HD6900核心的改进都是治标不治本,AMD如果不改变SIMD架构很难再有新的突破。NVIDIA GF100核心的架构是相当强大的,等到工艺成熟之后的GF110核心(GTX580显卡),就又站在了游戏与通用计算的性能之巅。 “费米”这代的竞争,NVIDIA先输了上半场,下半场漂亮地反击。
|
正在阅读:NV独领风骚!开普勒GTX680显卡震撼首测NV独领风骚!开普勒GTX680显卡震撼首测
2012-03-22 20:51
出处:PConline原创
责任编辑:zhangqingle
键盘也能翻页,试试“← →”键
本文导航 | ||
|
浏览本产品的网友还关注:
-
NVIDIA GeForce RTX 2080Ti ¥9999
-
NVIDIA GeForce RTX 2080 ¥6499
-
NVIDIA GeForce GTX 1060 ¥1999
网友评论
登录|QQ微博微信
欢迎参与讨论,分享你的看法
热门评论
最新评论
为您推荐
IT热词