正在阅读:演绎六芯混战!NV双卡双芯PK AMD双卡四芯演绎六芯混战!NV双卡双芯PK AMD双卡四芯

2010-04-29 03:00 出处:PConline原创 作者:登徒浪子 责任编辑:heminggui

GTX480显卡参数及架构介绍

GTX400系列显卡
GTX480显卡参数

  首先,从上面的GTX480参数介绍部分我们能了解到这款显卡基于GF100核心,显卡的CUDA核心(流处理器)为480个,也就是在GF100原有的512个屏蔽一组SM得来,该显卡核心/shader/显存部分的频率分别为700/1401/1848MHz,其中显存部分由GDDR5显存颗粒组成1536MB/384bit显存规格。在显卡供电方面则采用的是8+6pin,官方显卡功耗为250W,灵位显卡支持三路SLI。

GTX400
GF100核心架构

  完整的GF100核心总共有16组SM,每一组SM包含32个CUDA核心,ROP单元总共48个,分为六组,分别搭配一个64-bit显存通道。所有ROP单元和整个芯片共享768KB二级缓存(GT200里是独享)。

GTX400系列显卡

  在每一组SM阵列里,纹理单元、一二级缓存、ROP单元和各个单元的频率也都完全不同于以往。每组SM里四个纹理单元,合伙使用12KB一级纹理缓存,并和整个芯片共享768KB二级缓存。每个纹理单元每周期可计算一个纹理寻址、拾取四个纹理采样,并支持DX11新的压缩纹理格式。

GTX400系列显卡

  另外,我们都知道DX11一个很重要的特点就是细分曲面,细分曲面把游戏画面切割成更小的三角形,这样使得整个画面更加逼真细腻,而细分曲面的实现则需要用到多形体引擎,多形体引擎的数量也直接关系到显卡在DX11游戏中的表现。AMD在实现细分曲面时是整个核心共用一个多形体引擎,例如上图NVIDIA也可以在GT200的基础上加上一个多形体引擎来达到变身DX11显卡。

GTX400显卡

  NVIDIA这次并没有直接在GT200核心的基础上直接加入一个多形体引擎以达到DX11显卡要求,而是为了不使单一的多形体引擎成为显卡性能瓶颈在每一组SM中都加入了一个多形体引擎,这也是NVIDIA一直推迟GTX400系列显卡发布的重要原因。

GF100采用三级分层游戏架构

    我们已经知道,GF100采用台积电40nm工艺制造,集成大约30亿个晶体管,包含512个流处理器(CUDA核心)。32个这种核心组成一个流式多处理器阵列(SM),然后再四个组成一个图形处理集群(GPC)。GF100就是这样的三层分级架构:4个GPC、16个SM、512个SP。

  NVIDIA声称Fermi GF100是一个全新架构并非没有道理。不但是通用计算方面,游戏方面它也发生了翻天覆地的变化,几乎每一个原有模块都进行了重组:有的砍掉了,有的转移了,有的增强了,还有新增的光栅引擎(Raster Engine)和多形体引擎(PolyMorph Engine)。

    光栅引擎严格来说光栅引擎并非全新硬件,只是此前所有光栅化处理硬件单元的组合,以流水线的方式执行边缘/三角形设定(Edge/Triangle Setup)、光栅化(Rasterization)、Z轴压缩(Z-Culling)等操作,每个时钟循环周期处理8个像素。GF100有四个光栅引擎,每组GPC分配一个,整个核心每周期可处理32个像素。

    多形体引擎则要负责顶点拾取(Vertex Fetch)、细分曲面(Tessellation)、视口转换(Viewport Transform)、属性设定(Attribute Setup)、流输出(Stream Output)等五个方面的处理工作,DX11中最大的变化之一细分曲面单元(Tessellator)就在这里。GF100中有16个多形体引擎,每组SM一个,亦即每组GPC四个。需要说明的一点是AMD显卡在多形体引擎方面的设计采用的是所有SM共用一个多形体引擎,而NVIDIA采用的是每组SM一个,这样也就避免了多形体引擎称谓显卡性能瓶颈。

    多形体引擎绝非几何单元改头换面、增强15倍而已,它融合了之前的固定功能硬件单元,使之成为一个有机整体。虽然每一个多形体引擎都是简单的顺序设计,但16个作为一体就能像CPU那样进行乱序执行(OoO)了,也就是趋向于并行处理。NVIDIA还特地为这些多形体引擎设置了一个专用通信通道,让它们在任务处理中维持整体性。

    在每一组SM阵列里,纹理单元、一二级缓存、ROP单元和各个单元的频率也都完全不同于以往。每组SM里四个纹理单元,合伙使用12KB一级纹理缓存,并和整个芯片共享768KB二级缓存。每个纹理单元每周期可计算一个纹理寻址、拾取四个纹理采样,并支持DX11新的压缩纹理格式。

    ROP单元总共48个,分为六组,分别搭配一个64-bit显存通道。所有ROP单元和整个芯片共享768KB二级缓存(GT200里是独享)。

    除了ROP单元和二级缓存,几乎其他所有单元的频率都和Shader频率(NVIDIA暂称之为GPC频率)关联在一起:一级缓存和Sahder单元本身是全速,纹理单元、光栅引擎、多形体引擎则都是一半。对于GF100来说,想超频的话很多地方都要重新来过了。

    从NV30 GeForce FX 5800到GT200 GeForce GTX 280,NVIDIA显卡的几何性能只提高了不到3倍,而Shader性能提升了150多倍,但仅仅是从GT200到GF100,几何性能的增长倍数就达到了8x。

键盘也能翻页,试试“← →”键

为您推荐

加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
热门排行

DIY论坛帖子排行

最高点击 最高回复 最新
最新资讯离线随时看 聊天吐槽赢奖品