NVIDIA在今天正式发布Geforce8800GTS 320M-一款令人期待的产品,彻底的将G80产品线蔓延到2500元人民币的高端显卡市场。 G80带来前所未有的设计,统一Shader架构(Unified Shader)带来强劲的性能。G80完全硬件支持DirectX10的各项先进特性,例如Geometry Shaders、stream out、Improved instancing和Shader Modle4.0,支持这些特性使得Geforce8800 GPU拥有极高性能。所有的DirectX9、OpenGL和先前的DirectX程序和游戏在Geforce8800 GPU的Unified 设计都有高性能的演出。 具备96-128个Unified Shader的G80具备万亿浮点处理能力(Teraflops of floating point)。GigaThread技术应用在G80,支持数千个线程并行运行。高品质的各向异性过滤、高效的Early-Z技术和动态分支、86.4GB/S(8800GTX)的恐怖显存带宽……
G80拥有足够强大马力应付在XHD分辨率和高画面质量设定下畅快进行游戏,16xAA所带来的效果也仅仅是带来相当于4xAA所带来的系统花销。SLI技术会带来接近翻倍性能的提升的表现。128bit精度的HDR和16x抗锯齿的结合带来顶级画质。内建的PureVideo HD功能的G80可以在低CPU占用率上面确保流畅完美的HD和SD Playback回放。有效的功耗占用和管理给Geforce8800带来更好的Performance per watt(每瓦特性能)和Performance per square millimeter(每平方毫米效能)表现。 经过三个月的等待,NVIDIA的G80家族再添一员,这款建议零售价在299美元(约合人民币2500元附近的)的高性能显卡会对高端显卡市场带来什么样的冲击呢?作为全国最权威最专业的PConline评测室,我们在Geforce8800GTS 320M发布的时候,同步推出6款8800GTS 320M的全面评测。 一、NVIDIA为何要推出8800GTS 320M 我们回顾一下《ATI你不是对手!NV统一架构G80全球首发》里面关于8800系列的总结和分析: “经过四年的研发,晶体管数目达到6.81亿、拥有128个unified shader的Geforce8800GTX性能并没有令我们失望。1600x1200成为8800GTX的入门分辨率这种说法并不过分,专门为满足XHD分辨率(2560x1600)流畅游戏而生的8800GTX即使是在1600x1200分辨率已经拉开跟7900GTX和X1950XTX拉开足够的距离。当然这种优势随着分辨率和AA/AF选项的打开而扩大。1600x1200 4xAA 16xAF环境,8800GTX在Farcry、Half life2和Doom3这三个经典FPS游戏中,相当于7900GTX的197%、 152%和162%。在2048x1536 HDR环境下,上古卷轴4:湮灭和细胞分裂两个游戏中,8800GTX拥有7900GTX 220%和159%的性能;最令人恐怖的则是在新近发布的极品飞车Carbon峡谷中,8800GTX拥有268%的7900GTX性能(1600x1200 4xAA 16xAF)。目前大屏幕液晶显示器的持续降价也迎合了高端显卡的显示需求。” “同样采用G80图形核心的8800GTS这是NVIDIA的高端产品,无论unified shader数量、时钟频率、ROP数目、显存带宽和显存容量都跟旗舰的8800GTX拉开了足够的距离。虽然8800GTS 500Mhz/1200Mhz的时钟频率较低,但是仍然拥有96个运行在1200Mhz的unified shader,性能自然不俗,在2048x1536的分辨率大幅领先于前代的7900GTX和X1950XTX,这种优势随着AA/AF选项打开而扩大。” 8800GTX/GTS性能强大,但是同样价值不菲。为了让更多的硬件发烧友和高端用户以更低的价格享受到G80家族的强劲性能,NVIDIA推出平价版本的8800GTS 320M,并且鼓励合作伙伴进行超频,299美元的零售价格将会对目前存在的高端显卡造成强大的冲击。在相近价位的7900GTX、 7950GX2和X1950XTX/XT将会收到沉重的打击。同时在主流的G86、G83推出之前,8800GTS 320M也起了很好的承上启下的作用。 二、Geforce 8800GTS 320M规格分析: 8800GTX采用90nm工艺制造,拥有6.81亿个晶体管,核心时钟频率为575Mhz,拥有128个运行在1350Mhz时钟频率的Unified shader(Steam Proccessor)和24个ROP,配备768M运行在1800Mhz的GDDR3显存,由于384bit的显存位宽,因而8800GTX一共拥有86.4GB/S的恐怖显存带宽。 同样采用90nm工艺制造的8800GTS属于G80系列的高端产品,同样拥有6.81亿个晶体管,核心时钟频率为500Mhz(实际运行频率为513Mhz),拥有96个运行在1200Mhz时钟频率的Unified shader(Steam Proccessor)和20个ROP,配备640M运行在1600Mhz的GDDR3显存,由于320bit的显存位宽,因而8800GTS一共拥有64GB/S的显存带宽。 我们可以看到实际上8800GTS 320M实际上是8800GTS 640M的显存精简版本,其他规格不变,拥有96个运行在1200Mhz时钟频率的Unified shader(Steam Proccessor)和20个ROP,配备320M运行在1600Mhz的GDDR3显存,由于320bit的显存位宽,因而8800GTS一共拥有64GB/S的显存带宽。通常在2048x1536 4xAA 16xAF环境下面, 游戏性能突然对显存容量有所要求,这在我们以前测试X1950XT 256M的时候就遇到过(《无视7950GT!蓝宝X1950XT显卡深入评测》),要在2048x1536 4xAA 16xAF环境流畅进行游戏,512M显存成为标准配置。 不过随着8800GTS 320M的出现,以上的情况可能得到改善,8800GTS拥有的320M 320bit可能是更加优化的组合,提供64GB/S的显存带宽依据超越X1950XTX。 7块8800GTS 320M显卡大合照: 三、Geforce8800系列 GPU技术分析: 1.Geforce8800系列采用Unified Shader架构: DirectX 10最大的革新就是统一渲染架构(Unified Shader Architecture)。目前的GPU架构还是沿用的分离式渲染架构,目前NVIDIA的G71和ATI的R580都是采用这样的架构,顶点渲染和像素渲染各自独立进行,而且一旦当架构确定下来,顶点和像素shader单元的比例就会固定下来。不过分离式渲染架构设计更为简便而且经验丰富,例如NVIDIA的NV40发成到后来的G70/G71,又或者是R420到R580,性能都得到显而易见的提升。 微软认为这种分离渲染架构不够灵活,不同的GPU,其像素渲染单元和顶点渲染单元的比例不一样,大大限制了开发人员自由发挥的空间。不同的应用程序和游戏对像素渲染和顶点渲染的需求不一样,导致GPU的运算资源得不到充分利用。微软在DirectX 10中提出了统一渲染架构,在通用和独立的shader单元中可以执行不同的shader程序,包括vertex、pixel和在DirectX 10中首次提出的geomery shader。而且随着这些通用独立的shader单元功能的不断完善,日后有望执行更多的shader程序,例如物理效果。 相对顶点渲染来说,像素渲染将面临大规模使用纹理所带来的材质延迟,这是统一渲染架构急待解决的问题。不过在Geforce880 GPU里面,这种情况得到很大的改善,分组的steam processor都用联立一定数量的texture单元和L1/L2高速缓存。 Shader Modle 4.0无论是vertex还是pixel指令,最大指令长度相当于Shader Modle 3.0的128倍(64K),越长越复杂的指令可以产生越真实的画面,Shader Modle 4.0的寄存器也激增到4096个,Constant寄存器采用16×4096阵列。input寄存器采用16/32规格等,上述指标都比以前的DirectX有明显的改进。Shader Modle 4.0允许程序员在渲染物体时使用128个纹理,而DirectX 9只提供4/16规格,更多的纹理意味着物体表面精度更真实,游戏开发者拥有更广泛的选择。 2.传统Pipeline模型 VS Unified Shader模型 Geforce8800 GPU的研发工作从2002年夏天正式开始。Geforce8800 GPU的设计当时有四大目标。显而易见的超过当代的GPUs、提升图像质量、提供强大的物理和浮点处理性能,适应DirectX的发展推出新概念的GPU Pipeline。
传统经典的Pipeline模型,不同种类属性的vertices,包括index、commands和textures,线性缓冲区的Setup引擎自上而下的经过vertex shading、 pixel shading和ROP,最后被写进frame buffer。事实上Geforce7系列GPU拥有超过200个连续的阶段。 显而易见的,采用了Unified pipeline设计的Geforce8800 GPU可以有效的减少pipeline的层数,同时将传统经典pipeline自上而下的线性顺序变成连续的循环导向的过程。input经过unified shader core作为output写进去寄存器,同时返回到shader core再进行下次操作。 在不同应用程序和游戏中,vertex shader和pixel shader的需求比例不尽相同, 十分不幸地在Geforce8800 GPU之前,GPU里面的vertex shader和pixel shader的比例是固定。显然unified的实际适应性更强,从下面的例子我们可以看到在unified shader架构的威力,大大提升了GPU的硬件使用率,尽量避免shader空闲的情况发生。 3.G80里面的核心部件-Streaming Processors 在Geforce8800 GPU的unified shader架构里面,Streaming Processors(SPs) 是最为核心的单位,Geforce8800GTX拥有128个streaming processor,运行在1350Mhz的频率下。每个streaming processor均能处理vertex、pixel、geometry等操作,是一个通用的浮点处理器。 这些浮点处理器都可以随时有计划的编排分组成不同的工作量。
geomery shading是DirectX10的新特性,streaming processors可以处理几何运算,大大减轻了CPU在几何运算的负载。GPU分派器和控制逻辑可以动态的指派streaming processpors进行vertex、pixel、geometry等操作,因为他们是通用的。显然unified shader设计可以建立更加平衡的shader工作机制,但是传统的pipeline定义不再适用,在未来,可能其他特性的预算也可以通过unified streaming processor去完成。我们看看geomery shader的情况。 4.Geometry shader Input Assembler(IA)从顶点缓冲区上的输入流中接收顶点数据,并且把数据项转换为规范的格式。vertex shader通常用来把顶点从模型空间变换到平面空间,vertex shader读取一个顶点,输出一个顶点。Pixel Shader读取单一pixel属性,输出包含颜色和Z信息的的片断。而geometry shader是DirectX10提出的,把同一区域的所有顶点作为输入,产生新的顶点或者区域。此外steam output把geometry shader输出的顶点信息复制为4个连续的输出缓冲子集。理论上来说,steam output的输出能力Input Assembler的输入能力相匹配。 Shader就是一段可以改变像素、顶点和几何学特征的小程序。Vertex Shader是专门处理多边形顶点的。那么Geometry shader就是专门用来处理场景中的几何图形。在过去Vertex Shader每一次运行只能处理一个顶点的数据,并且每次只能输出一个顶点的结果。在整个游戏场景中,绘制的几何图形的任务量非常庞大,如果仅仅依靠Vertex Shader单一来完成,效率会极其低下。 现在DX10的设计师们在顶点与像素的处理过程中又加入了Geometry shader几何着色器。它可以根据顶点的信息来批量处理几何图形,对Vertex附近的数据进行函数处理,快速创造出新的多边形。通过steam out将这些结果传递给其他Shader或buffer,将CPU从复杂庞大的几何运算中解放出来。大爆炸,粒子效果,瀑布流水等复杂又关联的场景都可以用Geometry shader很逼真的表现出来。 5.Steam Processing架构的运作 对geometry shader有了一定认识以后,我们现在具体看看Steam Processing架构的运作。 Geoforc8800 GPU通过一定数量的SP去完成shader操作,相邻的SP可以十分方便的分组发挥并行操作的威力,在Geforce8800 GPU架构中,每16个SP分为一组。 不同属性基础的数据流在整合了专门高速指令解和执行逻辑的SP和一些类似的操作中执行,内建的Cache快速的存储SP的输出,而这些Cache又可以作为input被其他的SP读取。SIMD操作非常高效地在已被分组的SP集合里面执行。 下图可以看到streaming processors和联立的texture Flitering(TF)和texture addressing(TA)。显然内建的L1/L2 Cache确保了平衡的设计,这是一个典型的Geforce8800 GPU unified shader设计。128个streaming processors并行构成了8800GTX的shader架构。每个SP都是通用的、不相关的和标量地,可以同时进行MAD和MUL操作,支持IEEE 754精度的浮点。 6.Texture和math-相互没有关联的多线程操作 Texture寻址、过滤和fetching都会耗尽相当多GPU的核心时钟。如果在架构需要在一个数学操作之前进行Texture的操作,例如是16x各向异性过滤,系统的延时将会大大增加。Geforce8800 GPU作出重大的改进,在进行相当的独立算术运算的时候,“隐藏”了Texture fetch的延迟。 在Geforce7系列的GPU中,Texture寻址计算是采用隔行扫描进行的,这种设计在遇到texture fetch的时候就会遇到瓶颈。Geforce8800 GPU可以完全独立的进行texture操作和shader算术运算。 在Geforce8800架构开发的初期,NVIDIA工程师分析了数百种包含越来越多的标量计算的shader程序以后发现,一些混合了矢量和标量的指令,特别是一些比较长的shader很难有效的在矢量的架构中处理操作。标量计算在矢量的流水线中编译非常困难。 NVIDIA和ATI的都可以处理两个指令,在R580中,ATI采用的3+1架构可以处理一个2x2的矢量指令和由1x3矢量指令和1x1标量指令的混合,在Geforce6/7中,可以操作2+2和3+1的双指令操作。但是这些跟Geforce8800 GPU的标量设计那么高效。NVIDIA的工程师作出评估,128个标量处理器的标量架构拥有两倍性能于32个复合的矢量处理器架构。 7.Early-Z技术 当代的GPU都会采用Z-buffer去记录哪些像素是可见,而哪些像素是被遮挡而不可见。一个3D Frame最终要转换成为2D图像才能表示在屏幕上面,来自GPU连续的顶点流(vertices)会构建这个frame,从这个顶点流获取相应的2D坐标去生成多边形。多边形的连续产生会覆盖原来的区域,因而Z-buffer的信息就是告诉ROP, 哪些像素是可见哪些是不可见的。提前进行的Early-Z对比可以节省大量资源,因为同一个区域被多个多边形覆盖的次数轻而易举地达到原来的四倍甚至更高。 目前甚少方法可以利用Z-buffer信息去挑选或者排出被遮挡像素的渲染,Z-Cull就是这样的一个方法。Z-comparision通常会发生在ROP的后期。问题就产生,意味着pixel要通过完整的ROP管线才能被发现是否可见。一些复杂的包含数千步骤的shader程序,即使是被遮挡的pixel也全部通过流水线,这显然浪费了GPU的性能。Early-Z移去不可见像素在它们进入流水线之前,这样显然会提高性能,NVIDIA认为这个操作提升22%附近的性能。 8.G80的填充率计算: 数据很方便的在不同的SP之间的output和input之间移动,例如vertex data处理完以后,output可以作为input发送到Geometry Theard。 每个在8800GTX运行的SP都运行在1.35Ghz,并能同时执行一个MAD和MUL的标量操作,因而8800GTX就用有520 gigaflops的shader处理能力,不过这并不是8800GTX的全部实力,因为指令发送100%适用于矢量操作, 而标量和矢量混合的shader程序编码比特定的组合指令发送更有效率(3+1或者2+2) texture过滤单元和SP互不相关的传送64 pixel每个时钟,这等于每个时钟完成32 pixel的寻址或者是32 pixels 2x各向异性过滤,或者是每时钟32pixels的双线过滤。 基本上,PF16双向材质过滤可以实现每时钟32pixel来操作,如果是FP2:1的各向异性过滤也可以每时钟16pixels来完成。texture单元运行在575Mhz的时钟频率,这也就是8800GTX的核心时钟频率。 在575Mhz的运行频率上面,双线过滤或者是2:1的各向异性过滤的填充率达到575Mhzx32=18.4billion texels/s的水准,2:1的各向异性过滤相当于两个双向过滤取样一起整体输出到一个像素,因而8800GTX拥有36.8billion texels/s的双向过滤的填充率。 9.G80的ROP(Raster Operation partitions) 8800GTX拥有6组ROP(Raster Operation partitions),每组可以处理4个像素,因而一共可以每时钟可以处理24个包含颜色和Z信息的像素。如果是Z-only处理,则可以实现每时钟192个单像素的处理。如果是4x multisampled antialiasing打开,则可以完成48个Z-only操作。 G80的ROP支持超级采样和多点采样和Adaptive的这三种antialiasing的模式, 因而G80是首个在单GPU环境下实现8x、 8xQ、16x和16xQ等antialiasing模式的GPU。NVIDIA引入了CSAA,Coverage Sampling Antialisaing-新的全屏抗锯齿选项,同时包含coverage取样和geometry取样。CSAA有新的选项分别是8x、8xQ、16x和16xQ, 全面提升了全屏抗锯齿的等级。得益于G80强大的性能,在某些游戏开启16x高质量的AA模式以后,速度并不会大幅降低,系统花销可以维持在4x AA的级别。 G80的ROPs支持FP16和FP32的混合,无论是FP16还是FP32都能够进行multisampled的antialiasing,因而从G80开始,NVIDIA的GPU首次实现HDR+AA的模式。8个支持DirectX10的MRTs(Multiple Render Targets)引用在G80,可以进行色彩和Z操作。DirectX10支持两种新格式的HDR、第一种格式是R11G11B10,特别的为存储texture的浮点格式优化,另外一种这是每个颜色通道占用9bit,RGB各占9bit,专门为render target而设计。 每组ROP拥有64bit的显存接口界面,完全支持DDR1、DDR2、DDR3、GDDR3和GDDR4显存,因而8800GTX一共拥有384bit的显存接口界面,也就是我们所说的384bit的显存位宽,8800GTX一共拥有784M的本地显存,运行在900Mhz时钟频率的GDDR3显存一共提供86.4GB/S的恐怖显存带宽。 10.Vista、XHD和PureVideo HD Geforce8800 GPU是为Windows Vista专门优化的第三代GPU架构。支持WDDM驱动、Vista's Desktop Windows Manager(DWM)和Aero 3D界面。 NVIDIA的Purevideo HD内建于Gefroce8800 GPU里面,良好的支持HD-DVD和Blu-ray的播放。最好的画面质量,完美平整的电影播放和更低的CPU占用率。 Purevideo HD包括视频处理器、 驱动软件和播放软件,加速H.264、VC-1、WMV/WMV-HD和MPEG-2 HD格式,在权威的HQV Benchmark测试中得到128分的好成绩。 在播放具有AACS版权保护的HD DVD,通过Cyberlink、InterVideo和Nero等播放器可以利用到PureVideo的特性。此外Geforce8800 GPU内建HDCP的支持。Geforce8800 GPU支持多重TV-OUT输出,包括composite、S-Video、Component和DVD,最高支持到1080P的电视输出。 此外Geforce8800 GPU专门针对XHD分辨率游戏而设计,在以往需要双GPU-7950GX2才能达到XHD分辨率游戏性能,现在Geforce8800 GPU就能实现。XHD拥有七倍于1080i电视和双倍1080P电影的精度,Dual-link DVI可以输出2560x1600的XHD分辨率。 四、Geofrce8800GTS 320M产品赏析: 1.讯景Geofrce8800GTS 320M 作为NVIDIA全球核心合作伙伴,XFX讯景在NVIDIA新产品的发布中可谓无人能敌。XFX讯景的中高端产品做工精良,用料讲究,大多以“超频版”的形式推出市场。XFX讯景Geofrce8800GTS 320M是最早进入评测室的Geofrce8800GTS 320M,频率一下从默认的513Mhz/1600Mhz提升到580Mhz/1800Mhz,性能提升不少。由于讯景送测两张Geofrce8800GTS 320M,因而我们有机会考察Geofrce8800GTS 320M的SLI性能。
2.富士康Geforce8800GTS 320M 富士康(FOXCONN)科技集团,位列世界五百强。是台湾鸿海精密投资兴办的专业研发生产精密连接器、电脑系统及零组件、消费性电子产品、液晶显示设备等产品的高新科技企业。现在中国、东南亚及美洲、欧洲等地拥有数十家子公司,员工总数超过30万人。在2006年6月的Computex上,富士康展出了最新一代旗舰产品Geforce7950GX2,并正式宣布选择NVIDIA为首要合作伙伴。而在2006年9月初,富士康正式发布全线NVIDIA产品,包括GeForce 7950GX2、7950GT、7900GTX等等产品。这次富士康也给我们带来超频版本的Geforce8800GTS 320M。
3.翔升权杖8800GTS 320M 作为国内拥有独立制造和研发实力的显卡厂商,翔升在Geforce7时代也是默默耕耘,产品推出和推广都相当及时,全系列NVIDIA产品线品种齐全。2006年翔升再接再厉,为追求高性能的的用户推出“G-max”系列产品,冀望打造主流市场的性价比佼佼者,力图为用户提供在品质、性能、功效以及价格上达到最佳平衡点的显卡产品方案。 这次翔升也第一时间送测权杖8800GTS 320M,运行在500MHz/1600Mhz的默认频率。
4.七彩虹天行GeForce 8800GTS-GD3 CH版 作为国内最大的显卡品牌,七彩虹推出天行GeForce 8800GTS-GD3 CH版 320M V11,并接受预定,显卡运行在默认频率。
5.富彩Geforce8800GTS 320M魔龙版 富彩作为香港的一个AIC,该公司原先的主要精力集中于OEM以及ODM业务,是NVIDIA全球29个最重要的合作伙伴之一,也是NVIDIA的官方发布伙伴(Official Launch Partner)之一。近期富彩在国内市场的动作颇多,在国内DIY市场的影响力逐渐增强。 富彩Geforce8800GTS 320M魔龙版属于不折不扣的公版产品,公版散热器和公版辅料。 显卡运行频率也是标准的500MHz/1600Mhz, 配备320M GDDR3显存。
6.精英Geforce8800GTS 320M 作为全球主板出货量最大的五大品牌之一的精英,其主板一直凭借着良好的稳定性和较低的售价受到不少消费者的的青睐。不满足于主板市场上的成功,精英在今年开始大规模进军显卡市场,把竞争已经相当激烈的显卡市场推向极至。 精英对Geforce8800GTS 320M也是非常重视,火速从台湾快递产品。 五、测试平台和方案介绍:
为了避免系统瓶颈,我们本次G80测试采用了游戏性能最强的Core 2 Extrme X6800,并搭配旗舰的975x和DDR2 800内存。 测试项目主要由3Dmark理论测试、HDR新游戏和经典游戏组成,当然本次8800GTS 320M测试也会加入目前最热门的极品飞车10 Carbon峡谷和《上古转轴4:湮灭》作为测试项目。根据G80的reviewer's guide,1600x1200已经成为G80系列显卡的Low end入门级分辨率,因而我们测试图表尽量采用2048x1536的分辨率,并且开启4xAA 16xAF选项来考察G80的性能。 我们也将目前非常热门的7900GS和X1950Pro放进去比较,看看跟旗舰产品的性能差距到底有多大。 六、测试成绩: 1.3Dmark06测试: 在3DMark05中,FutureMark使用了LiSPSM (Light Space Perspective Shadow Maps)来处理动态阴影,新一代3DMark06中加入了眩目的HDR特效、CSM动态阴影等等,画面更逼真细腻,光影效果更为炫目。 3DMark06的标准测试包括两个HDR测试两个SM3.0图形测试。很明显FutureMark想表达的意思是,未来PC系统的游戏性能最关健的是显卡的HDR/SM3.0效能。3Dmark06还首次使用了AGEIA公司的PhysX物理引擎,用CPU模拟物理引擎计算,这是3Dmark06的一个闪亮的特色。CPU测试的成绩被强制加入到总分里面去,Futuremark揭示了未来游戏发展的方向,CPU/GPU应该获得更好的平衡。 3Dmark06的几个场景令人印象深刻,原深居峡谷的白龙变得幻彩夺目,特别是在阳光的照射下更显状观,鳞片细节和颜色变化莫测,水波纹更加细腻真实。此外“极地深寒”场景是全新开发的Game Test,我们可在寒冷的极地中看到一天日出日落情景,随着太阳在空中慢慢滑过,物体阴影的会随太阳移动而变化。“极地深寒”场影同样使用了FutureMark非常自豪的CSM技术。 8800GTS 320M性能大幅抛离X1950XTX,跟640M相比差距也是非常小。非常抢眼,XFX超频版本轻而易举的领先640M版本的8800GTS。 2.2004年三大经典FPS: Farcry、Halflife2和Doom3,在G80面前完全变成跑分游戏,1600x1200分辨率下性能依然强劲。320M和640M两个版本的8800GTS几乎没有分别,而XFX超频版8800GTS 320M版本大幅领先640M版本有10%附近。 3.英雄萨姆2和F.E.A.R 在英雄萨姆2测试中,640M还是比320M版本显得优胜,在1600x1200分辨率有10FPS的优势,而在2048x1536分辨率也有不错的性能。不过显存容量更大的8800GTS并没有超频以后的8800GTS 320M来得抢眼。至于1950XTX,完全不是一个等级的产品。 640M版本的8800GTS终于在F.E.A.R测试中大发神威,几乎70%抛离320M版本。 4.细胞分裂3、上古转轴和极品飞车10 在极品飞车10和细胞分裂3两个测试中,X1950XTX强势反弹跟8800GTS 320M处于相同级别,而且稍有优势;但是在超频版8800GTS 320M目前还是力不从心。 常规的测试完成,我们发现640M和320M两个版本的8800GTS性能相差很小,在95%的场合只有非常微小的差别,那么640M版本岂不是成为鸡肋?而X1950XTX除了在英雄萨姆2、极品飞车10和细胞分裂3可以跟8800GTS 320M平起平坐以外,其他项目都是大幅落后。 为了验证640M和320M两个版本的8800GTS的终极性能,我们进行了1600x1200以上分辨率的AA/AF测试。 5.4xAA 16xAF性能测试: 首先我们测试了2004年三大经典FPS游戏:Farcry、Half life2和Doom的1600x1200 4xAA 16xAF性能,8800GTS 320M仍然表现强劲,几乎都640M版本毫无区别。 我们搬出了目前对显卡要求最为苛刻的两个游戏:《英雄萨姆2》和《上古转轴4:湮灭》,并将分辨率提升到2048x1536。在英雄萨姆2测试中,640M版本领先320M版本大概有8%的领先,最为欣慰的是在上古转轴4测试中,640M版本比320M版本快上45%。而一些负荷并不是很重的Quake4测试中,两个版本8800GTS并没有很大的区别。 七、测试总结和导购分析: 8800GTS 320M在95%的应用环境下跟640M版本几乎没有丝毫的差别, 到了2048x1536 4xAA 16xAF这样苛刻的环境下,640M版本8800GTS才发挥大容量显存的优势,在上古转轴4大胜320M版本。我们也发现如果玩家或者用户一般使用的分辨率为1600x1200或者更低的时候,两个版本的8800GTS可以说是没有分别。另外8800GTS 320M跟X1950XTX的较量中也是取得明显的优势,X1950XTX除了在英雄萨姆2、极品飞车10和细胞分裂3可以跟8800GTS 320M平起平坐以外,其他项目都是大幅落后。 8800GTS 320M的推出达到了预期的效果,8800GTS 640M版本的价格高达3500-3999元,而320M版本的推出马上将G80的价格门槛降落到2500元附近(299美元),而且性能不会有明显的降低(更加准确的说,几乎是相同性能)。象坐落在3500元附近的X1950XTX、3999元附近的7950GX2和2999元的7900GTX这些前代产品,在8800GTS 320M面前都变得不堪一击,毫无性价比。最大的亮点在于8800GTS 320M的超频版本,几乎在所有测试中完胜640M版本,我们推荐高端玩家购买这样的产品。 我们看到由于G80的显存位宽已经超过256bit,具体在320bit到384bit,提供足够大的显存带宽,显存的容量对性能的影响并不是很大,320M 320bit也成为目前高端显卡中性价比最高的组合,足够应付2048x1536,并开启AA/AF选项以后的苛刻环境。我们期待会有更加便宜的8800GTX推出,384M版本? |
正在阅读:全球首发!6款8800GTS 320M详细测试全球首发!6款8800GTS 320M详细测试
2007-02-12 11:15
出处:PConline原创
责任编辑:zhouxijian