谁才是真DX11?NVIDIA/AMD显卡评测分析

2010-05-18 09:25  出处:PConline原创  作者:佚名   责任编辑:zhanli 

此DX11非彼DX11!A/N DX11显卡架构对比分析

  在DX11时代来临之前,大家都认为NVIDIAATI双方会重新设计GPU架构。不过AMD推出DX11新品之快的确让人感到意外,也让人浮想联翩是否真的重新设计了DX11架构。反而一向产品更新换代速度成为行业标杆的NVIDIA却落后了半年推出,表面看似NVIDIA在“磨洋工”,但是事实并非如此。下面就从GPU架构的分析就能得出答案。

  首先是AMD的DX10.1与DX11两代核心架构的对比:

RV770架构
拥有800个流处理单元的Radeon HD 4870(代号:RV770)

  AMD-ATI当然意识到问题所在,于是在RV770上,首先对“TeraScale”架构进行了优化,并大幅度增加流处理单元,从R600的320个暴增到800个,也就相当于拥有了160个完整的流处理器,纹理单元也相应增加到40个,光栅单元保持16个。RV770性能也因此暴涨,HD 4850/4870在竞争中拥有不少优势。

RV880架构
拥有1600个流处理单元的Radeon HD 5870(代号:RV870)

  RV870,又被命名为Cypress,采用了第二代“TeraScale 2”核心架构,。为何叫“2”而不是新名称?RV870包括流处理器在内的所有核心规格都比RV770翻了一倍,也就是“双核心”设计,几乎是并排放置两颗RV770核心,另外在装配引擎内部设计有两个Rasterizer(光栅器)和Hierarchial-Z(多级Z缓冲模块),以满足双倍核心规格的胃口。所以架构上,RV870实质与RV770增加不多,并没有真正对DX11的核心技术,包括细分曲面等进行优化,只是区区增加DX11包括SM5.0等指令集而已。

 新的图形引擎
AMD对RV870图形引擎的官方介绍

  但是当今显卡的发展有一个隐晦的事实:发展了将近10年的GPU架构,渲染能力提升了150倍,但几何性能的增长居然连3倍都不到。这个问题此前未能得到重视,因为游戏中的几何图形转换大多交给CPU来计算,而到了DX11时代,新增的Tessellation技术对GPU几何图形处理能力提出了新的要求,此时如果继续沿用上代架构显然会制约DX11性能,成为新的瓶颈。

谁才是真DX11?AMD/NVIDIA显卡评测分析
GT200架构

GTX400
GF100核心架构

  NVIDIA并不急于跟随竞争对手发布DX11显卡,而是比较务实地做好自己计划而不是抢第一赚噱头。当NVIDIA的工程师通过计算机模拟测试得知几何引擎将会成为DX11新的瓶颈之后,毫不迟疑的选择了将单个控制模块打散,重新设计了多形体引擎和光栅化引擎,并分散至每组SM或每个GPC之中,从而大幅提升了几何性能,彻底消除了瓶颈。

  完整的GF100核心总共有16组SM,每一组SM包含32个CUDA核心,ROP单元总共48个,分为六组,分别搭配一个64-bit显存通道。所有ROP单元和整个芯片共享768KB二级缓存(GT200里是独享)。

GTX400系列显卡

GTX400系列显卡
GF100核心机构是经过了重新设计的

  倘若说RV870是“双核心”设计的话,那么GF100的流处理器部分就是“四核心”设计,因为GF100拥有四个GPC(图形处理器集群)模块,每个GPC内部包含一个独立的Raster Engine(光栅化引擎),而以往的GPU(比如RV870和GT200)都是整颗共享一个Raster Engine。我们知道RV870的Rasterizer和Hierarchial-Z双份的,而GF100则是四份的,虽然命名有所不同但功能是相同的。

谁才是真DX11?AMD/NVIDIA显卡评测分析
首批上市的Fermi架构显卡:七彩虹GTX480与GTX470

  很多对GPU技术感兴趣的玩家和Nfan们对NVIDIA的做法大加赞赏,认为Fermi架构完全针对DX11的几大关键技术优化设计,可谓是原生DX11架构。而HD5800的架构则是R600架构植入SM5.0指令集而已,相当于是胶水或者桥接DX11架构,双方在DX11性能方面自然差距较大,而且是越来越大。当然这种革命性的设计代价很大,消耗了NVIDIA工程师无数的精力、资源和时间。并产生了发热量居高不下的后遗症,事实上多形体引擎正是GF100核心最大的变化所在,也是它无法在去年及时发布的本质原因。

键盘也能翻页,试试“← →”键