1回顶部 6600GT成功了,接着7600GT也成功了,人们对NVIDIA今天发布的8600GTS和8600GT翘首以待,采用革命性统一架构(Unified Shader)的Geforce8600和8500两大系列到底会给我们带来什么惊喜? G80带来前所未有的设计,统一Shader架构(Unified Shader)带来强劲的性能。G80完全硬件支持DirectX10的各项先进特性,例如Geometry Shaders、stream out、Improved instancing和Shader Modle4.0,支持这些特性使得Geforce8800 GPU拥有极高性能。所有的DirectX9、OpenGL和先前的DirectX程序和游戏在Geforce8800 GPU的Unified 设计都有高性能的演出。 具备128个Unified Shader的8800GTX具备万亿浮点处理能力(Teraflops of floating point)。GigaThread技术应用在G80,支持数千个线程并行运行。高品质的各向异性过滤、高效的Early-Z技术和动态分支、86.4GB/S的恐怖显存带宽……
G80拥有足够强大马力应付在XHD分辨率和高画面质量设定下畅快进行游戏,16xAA所带来的效果也仅仅是带来相当于4xAA所带来的系统花销。SLI技术会带来接近翻倍性能的提升的表现。128bit精度的HDR和16x抗锯齿的结合带来顶级画质。内建的PureVideo HD功能的G80可以在低CPU占用率上面确保流畅完美的HD和SD Playback回放。有效的功耗占用和管理给Geforce8800带来更好的Performance per watt(每瓦特性能)和Performance per square millimeter(每平方毫米效能)表现…… 采用革命性统一架构(Unified Shader)的G80在06年11月份就跟我们面前,NVIDIA直到目前为止拥有100%的DirectX10显卡市场。经过漫长的等待,NVIDIA才在2007年2月份缓缓放出320M版本的8800GTS,这是一款高性能的显卡,AMD-ATI对于这款产品仍然无能为力;但这仍然不是重点,重点的重点今天发布:G84和G86--G80衍生出来的中低端产品线全面展开。 2回顶部 G84和G86规格分析: 我们在对G84和G86规格分析之前,先复习一下有关于G80的一些规格参数: 8800GTX采用90nm工艺制造,拥有6.81亿个晶体管,核心时钟频率为575Mhz,拥有128个运行在1350Mhz时钟频率的Unified shader(Steam Proccessor)和24个ROP,配备768M运行在1800Mhz的GDDR3显存,由于384bit的显存位宽,因而8800GTX一共拥有86.4GB/S的恐怖显存带宽。同样采用90nm工艺制造的8800GTS属于G80系列的高端产品,同样拥有6.81亿个晶体管,核心时钟频率为500Mhz,拥有96个运行在1200Mhz时钟频率的Unified shader(Steam Proccessor)和20个ROP,配备512M运行在1200Mhz的GDDR3显存,由于320bit的显存位宽,因而8800GTX一共拥有64GB/S的显存带宽。 目前的G80图形核心有两个时钟频率,一个是我们熟悉的核心时钟频率,一个则是Streaming Processor的速度。在Geforce8800 GPU的unified shader架构里面,Streaming Processors(SPs) 是最为核心的单位,Geforce8800GTX拥有128个streaming processor,运行在1350Mhz的频率,而Geforce8800GTS拥有96个streaming processor,运行在1200Mhz的频率。,其实让GPU的不同部分拥有不同速度这个设计早已经在7800GTX上面出现过,不过范围只是30Mhz附近。每个streaming processor均能处理vertex、pixel、geometry等操作,是一个通用的浮点处理器。 这些浮点处理器都可以随时有计划的编排分组成不同的工作量。提升Streaming Processor的速度也能显著提升性能。 核心时钟频率、核心Streaming Processor时钟速度、显存时钟速度和显存位宽直接影响G80的速度,当然对G84和G86这些从G80衍生出来的产品也是一样的。 3回顶部 Unified Shader架构更加容易区分产品:
8600GTS 核心频率675MHz ,显存频率2GHz,提供双 D-DVI接口,支持 HDTV, HDCP,由于功耗较大,需要外接独立供电电源支持, 8600GTS 的价格将在199-249美元之间。8600GT核心频率540MHz ,显存频率 1.4GHz ,它将拥有两个版本,分别是支持HDCP的 (G84-300)和不支持HDCP的 (G84-305),显卡不需要独立供电,其价格在149-169美元之间。8500GT 核心频率为450MHz ,显存频率为800MHz ,它配备的256MB DDR2 显存,同样也有支持HDCP (G86-300) 和不支持 HDCP (G86-305)两个版本,其售价将会在79至99美元。 4回顶部 从上面的裸卡照片和直接用直尺度量得出结论,G86芯片核心面积稍微比G73要大,而G84则稍微比G71要小。 5回顶部 G8X GPU技术分析: 1.G8X采用Unified Shader架构: DirectX 10最大的革新就是统一渲染架构(Unified Shader Architecture)。目前的GPU架构还是沿用的分离式渲染架构,目前NVIDIA的G71和ATI的R580都是采用这样的架构,顶点渲染和像素渲染各自独立进行,而且一旦当架构确定下来,顶点和像素shader单元的比例就会固定下来。不过分离式渲染架构设计更为简便而且经验丰富,例如NVIDIA的NV40发成到后来的G70/G71,又或者是R420到R580,性能都得到显而易见的提升。 微软认为这种分离渲染架构不够灵活,不同的GPU,其像素渲染单元和顶点渲染单元的比例不一样,大大限制了开发人员自由发挥的空间。不同的应用程序和游戏对像素渲染和顶点渲染的需求不一样,导致GPU的运算资源得不到充分利用。微软在DirectX 10中提出了统一渲染架构,在通用和独立的shader单元中可以执行不同的shader程序,包括vertex、pixel和在DirectX 10中首次提出的geomery shader。而且随着这些通用独立的shader单元功能的不断完善,日后有望执行更多的shader程序,例如物理效果。 相对顶点渲染来说,像素渲染将面临大规模使用纹理所带来的材质延迟,这是统一渲染架构急待解决的问题。不过在Geforce880 GPU里面,这种情况得到很大的改善,分组的steam processor都用联立一定数量的texture单元和L1/L2高速缓存。 6回顶部 2.传统Pipeline模型 VS Unified Shader模型 Geforce8800 GPU的研发工作从2002年夏天正式开始。Geforce8800 GPU的设计当时有四大目标。显而易见的超过当代的GPUs、提升图像质量、提供强大的物理和浮点处理性能,适应DirectX的发展推出新概念的GPU Pipeline。
传统经典的Pipeline模型,不同种类属性的vertices,包括index、commands和textures,线性缓冲区的Setup引擎自上而下的经过vertex shading、 pixel shading和ROP,最后被写进frame buffer。事实上Geforce7系列GPU拥有超过200个连续的阶段。 显而易见的,采用了Unified pipeline设计的Geforce8800 GPU可以有效的减少pipeline的层数,同时将传统经典pipeline自上而下的线性顺序变成连续的循环导向的过程。input经过unified shader core作为output写进去寄存器,同时返回到shader core再进行下次操作。 在不同应用程序和游戏中,vertex shader和pixel shader的需求比例不尽相同, 十分不幸地在Geforce8800 GPU之前,GPU里面的vertex shader和pixel shader的比例是固定。显然unified的实际适应性更强,从下面的例子我们可以看到在unified shader架构的威力,大大提升了GPU的硬件使用率,尽量避免shader空闲的情况发生。 7回顶部 3.为什么需要Unified shader架构? 在典型的HDR代表游戏《上古卷轴4:湮灭》中,7900GTX在2048x1536并开启HDR的情况下,FPS惨不忍睹。独立渲染的草丛或者树叶是由庞大数量的多边形构成,对GPU的vertex shader和geomery shader提出严酷要求,相对来说并不需要太多像素操作,如此一来大规模的像素渲染被闲置而顶点模块处于不堪重负状态。Unified shader架构则可以帮我们解决硬件资源上的限制,Unified shader架构也尽量降低了shader单元的闲置率。 8回顶部 4.G80里面的核心部件-Streaming Processors 在Geforce8800 GPU的unified shader架构里面,Streaming Processors(SPs) 是最为核心的单位,Geforce8800GTX拥有128个streaming processor,运行在1350Mhz的频率下。每个streaming processor均能处理vertex、pixel、geometry等操作,是一个通用的浮点处理器。 这些浮点处理器都可以随时有计划的编排分组成不同的工作量。
geomery shading是DirectX10的新特性,streaming processors可以处理几何运算,大大减轻了CPU在几何运算的负载。GPU分派器和控制逻辑可以动态的指派streaming processpors进行vertex、pixel、geometry等操作,因为他们是通用的。显然unified shader设计可以建立更加平衡的shader工作机制,但是传统的pipeline定义不再适用,在未来,可能其他特性的预算也可以通过unified streaming processor去完成。我们看看geomery shader的情况。 9回顶部 5.Geometry shader Input Assembler(IA)从顶点缓冲区上的输入流中接收顶点数据,并且把数据项转换为规范的格式。vertex shader通常用来把顶点从模型空间变换到平面空间,vertex shader读取一个顶点,输出一个顶点。Pixel Shader读取单一pixel属性,输出包含颜色和Z信息的的片断。而geometry shader是DirectX10提出的,把同一区域的所有顶点作为输入,产生新的顶点或者区域。此外steam output把geometry shader输出的顶点信息复制为4个连续的输出缓冲子集。理论上来说,steam output的输出能力Input Assembler的输入能力相匹配。 Shader就是一段可以改变像素、顶点和几何学特征的小程序。Vertex Shader是专门处理多边形顶点的。那么Geometry shader就是专门用来处理场景中的几何图形。在过去Vertex Shader每一次运行只能处理一个顶点的数据,并且每次只能输出一个顶点的结果。在整个游戏场景中,绘制的几何图形的任务量非常庞大,如果仅仅依靠Vertex Shader单一来完成,效率会极其低下。 现在DX10的设计师们在顶点与像素的处理过程中又加入了Geometry shader几何着色器。它可以根据顶点的信息来批量处理几何图形,对Vertex附近的数据进行函数处理,快速创造出新的多边形。通过steam out将这些结果传递给其他Shader或buffer,将CPU从复杂庞大的几何运算中解放出来。大爆炸,粒子效果,瀑布流水等复杂又关联的场景都可以用Geometry shader很逼真的表现出来。 10回顶部 6.Steam Processing架构的运作 对geometry shader有了一定认识以后,我们现在具体看看Steam Processing架构的运作。 Geoforc8800 GPU通过一定数量的SP去完成shader操作,相邻的SP可以十分方便的分组发挥并行操作的威力,在Geforce8800 GPU架构中,每16个SP分为一组。 不同属性基础的数据流在整合了专门高速指令解和执行逻辑的SP和一些类似的操作中执行,内建的Cache快速的存储SP的输出,而这些Cache又可以作为input被其他的SP读取。SIMD操作非常高效地在已被分组的SP集合里面执行。 下图可以看到streaming processors和联立的texture Flitering(TF)和texture addressing(TA)。显然内建的L1/L2 Cache确保了平衡的设计,这是一个典型的Geforce8800 GPU unified shader设计。128个streaming processors并行构成了8800GTX的shader架构。每个SP都是通用的、不相关的和标量地,可以同时进行MAD和MUL操作,支持IEEE 754精度的浮点。 11回顶部 7.Texture和math-相互没有关联的多线程操作 Texture寻址、过滤和fetching都会耗尽相当多GPU的核心时钟。如果在架构需要在一个数学操作之前进行Texture的操作,例如是16x各向异性过滤,系统的延时将会大大增加。Geforce8800 GPU作出重大的改进,在进行相当的独立算术运算的时候,“隐藏”了Texture fetch的延迟。 在Geforce7系列的GPU中,Texture寻址计算是采用隔行扫描进行的,这种设计在遇到texture fetch的时候就会遇到瓶颈。Geforce8800 GPU可以完全独立的进行texture操作和shader算术运算。 在Geforce8800架构开发的初期,NVIDIA工程师分析了数百种包含越来越多的标量计算的shader程序以后发现,一些混合了矢量和标量的指令,特别是一些比较长的shader很难有效的在矢量的架构中处理操作。标量计算在矢量的流水线中编译非常困难。 NVIDIA和ATI的都可以处理两个指令,在R580中,ATI采用的3+1架构可以处理一个2x2的矢量指令和由1x3矢量指令和1x1标量指令的混合,在Geforce6/7中,可以操作2+2和3+1的双指令操作。但是这些跟Geforce8800 GPU的标量设计那么高效。NVIDIA的工程师作出评估,128个标量处理器的标量架构拥有两倍性能于32个复合的矢量处理器架构。 12回顶部 8.Early-Z技术 当代的GPU都会采用Z-buffer去记录哪些像素是可见,而哪些像素是被遮挡而不可见。一个3D Frame最终要转换成为2D图像才能表示在屏幕上面,来自GPU连续的顶点流(vertices)会构建这个frame,从这个顶点流获取相应的2D坐标去生成多边形。多边形的连续产生会覆盖原来的区域,因而Z-buffer的信息就是告诉ROP, 哪些像素是可见哪些是不可见的。提前进行的Early-Z对比可以节省大量资源,因为同一个区域被多个多边形覆盖的次数轻而易举地达到原来的四倍甚至更高。 目前甚少方法可以利用Z-buffer信息去挑选或者排出被遮挡像素的渲染,Z-Cull就是这样的一个方法。Z-comparision通常会发生在ROP的后期。问题就产生,意味着pixel要通过完整的ROP管线才能被发现是否可见。一些复杂的包含数千步骤的shader程序,即使是被遮挡的pixel也全部通过流水线,这显然浪费了GPU的性能。Early-Z移去不可见像素在它们进入流水线之前,这样显然会提高性能,NVIDIA认为这个操作提升22%附近的性能。 13回顶部 9.G80的填充率计算: 数据很方便的在不同的SP之间的output和input之间移动,例如vertex data处理完以后,output可以作为input发送到Geometry Theard。 每个在8800GTX运行的SP都运行在1.35Ghz,并能同时执行一个MAD和MUL的标量操作,因而8800GTX就用有520 gigaflops的shader处理能力,不过这并不是8800GTX的全部实力,因为指令发送100%适用于矢量操作, 而标量和矢量混合的shader程序编码比特定的组合指令发送更有效率(3+1或者2+2) texture过滤单元和SP互不相关的传送64 pixel每个时钟,这等于每个时钟完成32 pixel的寻址或者是32 pixels 2x各向异性过滤,或者是每时钟32pixels的双线过滤。 基本上,PF16双向材质过滤可以实现每时钟32pixel来操作,如果是FP2:1的各向异性过滤也可以每时钟16pixels来完成。texture单元运行在575Mhz的时钟频率,这也就是8800GTX的核心时钟频率。 在575Mhz的运行频率上面,双线过滤或者是2:1的各向异性过滤的填充率达到575Mhzx32=18.4billion texels/s的水准,2:1的各向异性过滤相当于两个双向过滤取样一起整体输出到一个像素,因而8800GTX拥有36.8billion texels/s的双向过滤的填充率。 14回顶部 10.G80的ROP(Raster Operation partitions) 8800GTX拥有6组ROP(Raster Operation partitions),每组可以处理4个像素,因而一共可以每时钟可以处理24个包含颜色和Z信息的像素。如果是Z-only处理,则可以实现每时钟192个单像素的处理。如果是4x multisampled antialiasing打开,则可以完成48个Z-only操作。 G80的ROP支持超级采样和多点采样和Adaptive的这三种antialiasing的模式, 因而G80是首个在单GPU环境下实现8x、 8xQ、16x和16xQ等antialiasing模式的GPU。NVIDIA引入了CSAA,Coverage Sampling Antialisaing-新的全屏抗锯齿选项,同时包含coverage取样和geometry取样。CSAA有新的选项分别是8x、8xQ、16x和16xQ, 全面提升了全屏抗锯齿的等级。得益于G80强大的性能,在某些游戏开启16x高质量的AA模式以后,速度并不会大幅降低,系统花销可以维持在4x AA的级别。 G80的ROPs支持FP16和FP32的混合,无论是FP16还是FP32都能够进行multisampled的antialiasing,因而从G80开始,NVIDIA的GPU首次实现HDR+AA的模式。8个支持DirectX10的MRTs(Multiple Render Targets)引用在G80,可以进行色彩和Z操作。DirectX10支持两种新格式的HDR、第一种格式是R11G11B10,特别的为存储texture的浮点格式优化,另外一种这是每个颜色通道占用9bit,RGB各占9bit,专门为render target而设计。 每组ROP拥有64bit的显存接口界面,完全支持DDR1、DDR2、DDR3、GDDR3和GDDR4显存,因而8800GTX一共拥有384bit的显存接口界面,也就是我们所说的384bit的显存位宽,8800GTX一共拥有784M的本地显存,运行在900Mhz时钟频率的GDDR3显存一共提供86.4GB/S的恐怖显存带宽。 15回顶部 11.Vista、XHD和PureVideo HD Geforce8800 GPU是为Windows Vista专门优化的第三代GPU架构。支持WDDM驱动、Vista's Desktop Windows Manager(DWM)和Aero 3D界面。 NVIDIA的Purevideo HD内建于Gefroce8800 GPU里面,良好的支持HD-DVD和Blu-ray的播放。最好的画面质量,完美平整的电影播放和更低的CPU占用率。 Purevideo HD包括视频处理器、 驱动软件和播放软件,加速H.264、VC-1、WMV/WMV-HD和MPEG-2 HD格式,在权威的HQV Benchmark测试中得到128分的好成绩。 在播放具有AACS版权保护的HD DVD,通过Cyberlink、InterVideo和Nero等播放器可以利用到PureVideo的特性。此外Geforce8800 GPU内建HDCP的支持。Geforce8800 GPU支持多重TV-OUT输出,包括composite、S-Video、Component和DVD,最高支持到1080P的电视输出。 此外Geforce8800 GPU专门针对XHD分辨率游戏而设计,在以往需要双GPU-7950GX2才能达到XHD分辨率游戏性能,现在Geforce8800 GPU就能实现。XHD拥有七倍于1080i电视和双倍1080P电影的精度,Dual-link DVI可以输出2560x1600的XHD分辨率。 16回顶部 技术小结: NVIDIA的G80 GPU显然显得相当超前,就像当年的ATI R300一样,在发布当时都超前支持了尚未发布的DirectX版本;事实上已经证明这种做法早已经为日后的成功打下坚实的基础。作为首款支持DirectX10的图形芯片,拥有128个steaming processors和64 pixels texture过滤每时钟的8800GTX需要一个均衡的架构, 如果显存子系统不能及时足够的数据,或者是ROP系统在pixel操作时候遇到瓶颈,又或者是其他子系统并不是十分匹配,那么后果将会是不堪着想。 Unified Steam proccessors可以处理各种多样的shader程序,瞬时就能迎合需求而达到平衡,内建的高速缓存拥有极高性能和命中率,和高速的显存子系统相结合。和前代texture fetch和过滤的延迟相比,GIGAthrad技术可以迅速向texture unit派送有效的工作,texture unit进行的操作并不需要过多的等待。在复杂的vertex和pixel shader程序中,有相当多的时钟用来将这些shader合成,并进行Z运算,ROP子系统的总容量也要考虑在内,而900Mhz的时钟频率的显存子系统让更高阶的分辨率进行高质量过滤更加有效。除了硬件架构方面,NVIDIA的Forcware驱动也起了重要的作用,我们相信随着驱动的完善,Geforce8800系列的性能也会不断提高 。 17回顶部 翔升G84和G86显卡大汇合: 翔升最近推出的OF金刚版系列打破了两项世界记录。 翔升7600 OF和7300OF金刚版采用精挑细选的G73图形芯片,搭配256M最顶级的Samsung 1ns GDDR3显存,预设频率高达600MHz/2000Mhz,毫无争议的成为目前全球时钟速度最快的7600GS和7300GT。 作为目前国内为数不多的具备自主研发、独立生产能力板卡品牌,翔升已经成为NVIDIA在国内地区主板和显卡双重合作伙伴。2006年翔升再接再厉,为追求高性能的的用户推出“G-max”系列产品,冀望打造主流市场的性价比佼佼者,力图为用户提供在品质、性能、功效以及价格上达到最佳平衡点的显卡产品方案。G-Max是翔升研发的1GHz以上显存频率的显卡产品集合,当然随着Geforce7系列中高端产品的逐渐成熟,7950GT和7900GS双雄巩固高端,而7600GT起着中高端转折作用, 最后7600GS和7300GT携手紧握中端性能市场,翔升的G-MAx系列得以赋予新的概念-高清娱乐先锋。 在HD高清视频逐渐流行之际,翔升一口气发布了四款属于娱乐高清版系列并采用了80nm制程的主流显卡,它们分别是7300GT、7600GS、7600GT、7950GT。之所以叫“娱乐高清版”,是因为四款显卡均支持HDMI输出,为需要连接HDMI高清数字电视提供了可能。继“G-MAX”和“高清娱乐先锋”以后,翔升再次针对狂热玩家推出OF系列,其中运行频率惊人的金刚版就是OF系列的旗舰版本。 翔升这次在G86和G84两大系列上面准备相当充分,一口气推出三款OF金刚产品。 权杖8600GTS OF版本,运行频率为675Mhz/2000Mhz,配备256M GDDR3显存,SP单元运行速度高达1450Mhz。
18回顶部 爵豹8600 OF金刚版本,频率600Mhz/1800Mhz,搭配256M 1ns GDDR3显存,SP单元运行速度为1200Mhz,显然这是一款超频版本的8600GT显卡。
19回顶部 爵豹8500 OF金刚版本,频率600Mhz/1600Mhz,搭配256M 1.2ns GDDR3显存,SP单元运行速度为1200Mhz,显然这是一款超频版本的8500GT显卡。
爵豹8500GT,频率500Mhz/800Mhz,搭配256M 2.5ns GDDR2显存,SP单元运行速度为900Mhz,显然这是一款面对主流市场的产品。
20回顶部
为了避免系统瓶颈,我们本次G84/G86测试采用了游戏性能强大的Core 2 Extrme X6800,并搭配旗舰的975x和DDR2 800内存。测试项目主要由3Dmark理论测试、HDR新游戏和经典游戏组成,当然本次G84/G86测试也会加入目前最热门的极品飞车10 Carbon峡谷作为测试项目。真正支持DirectX10的游戏迟迟未能出现,在Vista下面测试G84和G86犹如鸡肋,因而本次测试并没有测试G84和G86在DX10环境下的性能。 在这里特别说明一下这次G84/G86评测方案。首先,由于G84/G86为NVIDIA新一代的中端主流DX10显卡,因而我们采用了非常有预见性并且公平的3Dmark06,同时我们认为历代的3Dmark测试软件已经没有参考意义。其次,目前主流LCD液晶显示器的分辨率已经由1280x1024(或者宽屏的1440x900)起跳,因而我们这次直接从1280x1024分辨率起跳。第三、2007年为DX9到DX10过渡的一年,DX9根深蒂固,恐怕需要较长时间才能实现过渡,因而玩家和用户不仅需要一款高性能的DX10显卡,同时也需要一款强劲的DX9C显卡,这是我们对新一代的DX10的基本要求,令人欣慰的是NVIDIA的G80在这方面做得非常出色。 此外NVIDIA在4月10日推出最新版本的Forceware 158.1x驱动作为发布的专用驱动;我们PConline评测室也火速进行了新旧两个版本驱动性能的对比,最后发现新版本的158.1X版本驱动能够明显提升3DMark06的分数,而在实际游戏的差距并不明显。下面的测试中,除了3Dmark06采用新版本驱动测试以外,其他项目均采用100.95进行测试,特此说明。 21回顶部 3Dmark06测试 3DMark06的标准测试包括两个HDR测试两个SM3.0图形测试。很明显FutureMark想表达的意思是,未来PC系统的游戏性能最关健的是显卡的HDR/SM3.0效能。3Dmark06还首次使用了AGEIA公司的PhysX物理引擎,用CPU模拟物理引擎计算,这是3Dmark06的一个闪亮的特色。CPU测试的成绩被强制加入到总分里面去,Futuremark揭示了未来游戏发展的方向,CPU/GPU应该获得更好的平衡。 新一代的DirectX10显卡在3Dmark06中表现抢眼,这也验证了3Dmark06的预见性。8600GTS轻而易举的将X1950Pro和7900GS抛离在后面,估计频率帮上不少的忙。同是拥有32个SP单元的8600GT在3Dmark06中仍然比7900GS跑得快,至于7600GT则是大幅落后。而针对Value市场推出的8500GT大概领先同频率7300GT 10%附近,同时跟7600GT保持相当的幅度。ATI的三款3:1显卡也是表现不错,X1950Pro可以压制7900GS,而X1650XT和X1650GT则可以制服7600GT以下级别的NVIDIA Geforce7显卡。 下面我们再看看3Dmark06的详细子项分析: 22回顶部
显然8600GTS在3Dmark06测试中大胜7900GS,无论是SM2.0还是SM 3.0/HDR都是如此;不过在细项测试中,8600GTS的Single-Texturing 填充率仅仅相当于7900GS的一半Pixel shader性能来说,8600GTS也是落后于7900GS,不过在vertex shader测试和两项SM3.0测试中,8600GTS都取得了明显的优胜,在Shader Partice SM3.0更是打出4倍性能的悬殊比分,足可以证明unified shader潜在的威力。
至于8600GT和7600GT两代产品的对决中,除了Pixel shader测试和填充率测试,8600GT小幅落后以外,其他所有项目都是大比分胜出,幅度从50%-400%。
只是拥有16个SP单元的8500GT在3Dmark06测试中成绩也不错。我们发现G84和G86两大系列在3Dmark06测试中都强烈的表现出几大特点:总分相当的高,SM2.0分数大幅领先SM3.0/HDR,Pixel shader效能不佳但是vertex shader性能强劲,最令人吃惊的是在单独进行的两项SM 3.0测试中(Partice和Perlin Noise),G84和G86都以惊人的优势抛弃前代的Geforce7产品。 3Dmark06成绩的不平衡性可以反映目前G84和G86的驱动并不太完善,仍然有相当大的空间可以通过驱动去提升性能。 23回顶部 Farcry和Half life 2 24回顶部 OpenGL游戏:Doom3和Quake4 25回顶部 Serious Sam2英雄萨姆2: 26回顶部 细胞分裂3:Chaos Theory 27回顶部 极品飞车10 Carbon和F.E.A.R 28回顶部 上古转轴4 湮灭:Oblivion 29回顶部 PConline评测室总结: 苦等半年的产品其实并没有令人失望,我们“未来”(因为DirectX10并没有普及)需要一张强劲的DX10显卡,但是这张显卡也拥有强悍的DX9性能,显然拥有这种设计的产品是最容易令人接受的,Gefore8800系列无疑就是这么一款性能强劲的产品。G84和G86在3Dmark06测试中的优异表现可以看到这两款图形核心在未来游戏的前景。3Dmark06测试中,8600GTS轻而易举的超越7900GS,而8600GT也是大幅超越前辈7600GT,即使只是拥有16个SP单元的8500GT也有不错的表现。 显然一个3Dmark06性能虽然权威,但是仍然不带表所有的说服力,G84强劲的DX9C性能在英雄萨姆2、细胞分裂3、极品飞车10、F.E.A.R和上古转轴4:湮灭,这些高水准而又苛刻的DX9C游戏大作中得到体现。8600GTS在这些对图形核心要求很高的游戏中,随着分辨率的提升,比7900GS性能更好;而在8600GT和7600GT两大中端型号上的对碰中,8600GT在这些新游戏的性能表现足够抛离7600GT。NVIDIA在向来的弱项游戏:英雄萨姆2、细胞分裂3、极品飞车10、F.E.A.R和上古转轴4:湮灭这五款游戏中吐气扬眉,无疑跟竞争对手AMD-ATI当头一棒。 从性能来说,G84可以说是成功,特别是8600GT这个型号;如果NVIDIA不推出8600GTS这个型号,8600GT的表现可以说是完美,轻松的领先前代的7600GT,拥有的也仅仅是32个SP单元,领先幅度在新游戏中超过40%或者更多。8600GT接班7600GT是完全没有问题的。不过可惜的是7900GS性能实在是比7600GT强上很多,至少有60%的幅度;将8600GT的540Mhz/1400Mhz频率“超频“到675Mhz的核心频率,SP单元频率也从1200Mhz提升到1450Mhz,并换上高速的GDDR4显存,试图拉开性能距离,这就是我们见到的8600GTS,能有跟7900GS持平的性能已经算不错。考虑到8600GTS和8800GTS规格和性能等方面相差过大,笔者预计中间还会有类似8800GT和8800GS这些产品。 不过也不能忽视的是,在Farcry、Half lfe2、Doom3和Quake4这些游戏中,Geforce7显卡表现出来的成熟和强劲;7900GS轻松干掉8600GTS,而7600GT也并不比8600GT逊色多少。本次横向评测最大发现就是G86-8500GT,这款只拥有16个SP单元的value型号,除了3Dmark06分数比较高以外,在绝大数游戏中的表现不如同频率的7300GT,这无疑令人大跌眼镜。 最后提提AMD-ATI,无论G84和G86如何强大,他们在Radeon X1950Pro面前也不得不俯首称臣,此外X1650XT和X1650GT在中端显卡的表现也不错,特别是英雄萨姆2、细胞分裂3、极品飞车10、F.E.A.R和上古转轴4:湮灭这些对显卡性能要求比较高的显卡。看来NVIDIA的8600GTS、8600GT和8500GT的定价并不能脱离AMD-ATI。 截稿为止,翔升8600GTS、8600GT和8500GT的参考价格是1699元、1099元和899元,翔升本次率先在国内发布高性价比的8系列主流显卡产品,相信会对市场造成相当强的冲击! |
正在阅读:全球首发:翔升Geforce8全系列显卡详尽评测全球首发:翔升Geforce8全系列显卡详尽评测
2007-04-18 11:24
出处:PConline原创
责任编辑:谢成明