2 细析传统管线架构和统一渲染架构 传统的管线架构 1)像素渲染管线 在传统显卡的管线架构中,我们经常说道某张显卡拥有X条渲染管线和X个顶点着色单元。而像素渲染管线又称像素渲染流水线,这个称呼能够很生动的说明像素渲染流水线的工作流程。我们对于一条流水线定义是“Pixel Shader(像素着色器)+TMU(纹理单元)+ROP(光栅化引擎,ATI将其称为Render Back End)。 从功能上简单的说,Pixel Shader完成像素处理,TMU负责纹理渲染,而ROP则负责像素的最终输出,因此 ,一条完整的传统流水线意味着在一个时钟周期完成1个Pixel Shader运算,输出1个纹理和1个像素。像素渲染单元、纹理单元和ROP的比例通常为1:1:1,但是也不确定,如在ATi的RV580架构中,其像素渲染流水线就基于1:3的黄金渲染架构,每条像素渲染管线都有着3个像素着色器,因此一块X1900XT显卡中,具有48个像素渲染单元,16个TMU(纹理单元)和16个ROP。 在过去的显卡核心体系中,像素渲染管线的数量是决定显示芯片性能和档次的最重要的参数之一,在相同的显卡核心频率下,更多的渲染管线也就意味着更大的像素填充率和纹理填充率,因而我们在判断两张不同核心规格的显卡时,并不能单一只看它的核心/显存频率,像素渲染管线亦相当重要。 小知识: 像素填充率:像素填充率是指图形处理单元在每秒内所渲染的像素数量,是用来度量显卡的像素处理性能的常用指标。显卡的渲染管线是显示核心的重要组成部分,是显示核心中负责给图形配上颜色的一组专门通道。渲染管线越多,每组管线工作的频率(一般是显卡的核心频率)越高,那么显卡的像素填充率就越高,显卡的性能就越高,我们可以从显卡的象素填充率上大致判断出显卡的性能。一般像素填充率=显卡的核心运行频率 × 像素渲染单元的数量。从这点我们就很好理解,为什么级别较高的显卡有着更多的像素渲染管线(单元),就是因为像素单元越多,显卡的执行效率就会越高。 2)顶点着色引擎数 我们可以将像素渲染管线理解成为一张3D图形的上色过程,而这个3D图形的构建,则是由顶点着色引擎(Vertex Shader)来执行的。顶点着色引擎主要负责描绘图形,也就是建立几何模形,每一个顶点将对3D图形的各种数据清楚地定义,其中包括每一顶点的x、y、z坐标,每一点顶点可能包函的数据有颜色、最初的径路、材质、光线特征等。顶点着色引擎数目越多就能更快的处理更多的几何图形,目前许多新的大型3D游戏中,许多独立渲染的草丛和树叶由大量多边形组成,对GPU的Vertex Shader(顶点着色器)要求很大,在这个情况下,更多顶点着色引擎的优势就被体现出来。  传统的管线架构
统一渲染架构 这一概念的出现,其初衷就如前面说到,在目前许多新的大型3D游戏中,许多独立渲染的场景由大量多边形组成,对GPU的Vertex Shader(顶点着色器)要求很大,而这时相对来说,并不需要太多的像素渲染操作,这样便会出现像素渲染单元被闲置,而顶点着色引擎却处于不堪重荷的状态,统一渲染架构的出现,有助于降低Shader单元的闲置状态,大大提高了GPU的利用率。 所谓统一渲染架构,大家可以理解为将Vertex Shader、Pixel Shader以及DirectX 10新引入的Geometry Shader进行统一封装。此时,显卡中的GPU将不会开辟独立的管线,而是所有的运算单元都可以任意处理任何一种Shader运算。这使得GPU的利用率更加高,也避免了传统架构中由于资源分配不合理引起的资源浪费现象。这种运算单元就是现在我们经常提到的统一渲染单元(unified Shader),大体上说,unified Shader的数目越多,显卡的3D渲染执行能力就越高,因此,现在unified Shader的数目成为了判断一张显卡性能的重要标准。  步入DX10时代,shader单元数量成为衡量显卡级别的重要参数之一
好了,经过上面的基本知识介绍后,我们马上进入正题,下面将从目前市面上还有出售的GeForce 7系列核心规格说起。
|