1 前言:NVIDIA首款55nm显卡,9800GTX+登场 NVIDIA于2007年10月底发布了G92显示核心,而基于G92核心的首款显卡Geforce 8800GT也在11月初上市,它采用当时较先进的65nm制作工艺,是NVIDIA首款具备256bit显存位宽的中高端DX10显卡,性能上与旗舰显卡更为接近,但价钱相对来说更为亲民,G92的发布有着相当重要的市场意义,日后G92系列遍地开花以及良好的市场反映正好验证了这点。 在65nm制程的G92发布8个月后,NVIDIA于6月中正式发布了首款55nm制程的G92b显卡,命名为GeForce 9800GTX+。 Geforce 9800GTX+实际上就是Geforce 9800GTX转换制程的高频版,得益于先进的55nm工艺制程,9800GTX+的G92b核心在功耗发热量以及成本上都得到更好的控制,超频能力也更为强劲,因此9800GTX+的默认核心频率就达到了738MHz,比起9800GTX的675MHz要高出不少,在性能上有了一定的提升。
最近,诸多Geforce 9800GTX+已经上市,国内价钱直杀1399元,与对手Radeon HD 4850正面交锋。最近,NVIDIA针对Geforce 8/9/200系列的物理加速驱动已经发布,9800GTX+在竞争中又增加了一个优势。那么,在9800GTX稍败于HD 4850的情况下,更高频率的9800GTX+能否反败为胜呢?拥有CUDA、Geforce PhysX物理加速等优势的9800GTX+能否在将来主宰这个千元市场呢?针对这些问题,我们对9800GTX+与HD 4850进行详细的对比测试。 2 G92系列参数介绍
从上面的表格可以看出,GeForce 9800GTX+实际上就是GeForce 9800GTX转换制程的高频版,得益于先进的工艺制程,9800GTX+的G92b核心在功耗发热量上得到更好的控制,超频能力也更为强劲,因此9800GTX+的默认核心频率就达到了738MHz,比起9800GTX的675MHz要高出不少,在性能上有了不少的提升;9800GT在具体参数上和8800GT区别不大,仅是改进了核心制程,另外9800GT也加入了对3路SLi的支持,当然这还需要看开发厂商推出的98GT带不带MIO,因为市面上的9800GT都将会以非公版设计为主,由于现在还是过渡期,因此市面上的9800GT将会有65nm和55nm两个版本。 3 Geforce 9800GTX+显卡拆解赏析 NVIDIA Gefroce 9800GTX+是NVIDIA首款采用55nm制程的显卡。采用G92-420-B1核心,更先进的工艺使得Geforce 9800GTX+的核心面积比Geforce 9800GTX小了不少,从289mm缩小到231mm,同时有利于降低功耗与核心发热量。55nm/65nm的G92核心均集成了7.54亿个晶体管,核心由9800GTX的,集成128个流处理器,同样支持PureVideo HD高清解码,支持物理加速(驱动支持),支持3 WAY-SLI。同样采用公版设计,默认出厂核心/流处理器/显存频率为738/1836/2200MHz。 NVIDIA Gefroce 9800GTX+采用的是55nm G92核心,也是NVIDIA第一款55nm产品,发热与供耗比起之前的显存采用hynix推出的0.8ns DDR3显存颗粒,共8颗显存组成了512MB/256Bit的显存规格,默认显存频率高达2200MHz。 NVIDIA Gefroce 9800GTX+显卡供电部分采用了分体式供电设计,核心4相加显存2相供电。并提供双6PIN PCI-E供电接口。除了一个电容是日系三洋SVP固态聚合物电容之外,核心和显存供电全部采用日本化工PS系列高品质固态聚合物电容,且全部搭配封闭式电感。 4 9800GTX与9800GTX+的比较 无论从散热器、PCB板还是元件的使用上,9800GTX与9800GTX+都没有多大区别。 由于采用了55nm制作工艺,Geforce 9800GTX+的核心面积与Geforce 9800GTX相比,从289mm缩小到231mm。 5 G92两大优势:并行计算/物理加速 面向未来:CUDA并行计算的应用 随着显卡的发展,GPU越来越强大,第一代统一渲染架构的Geforce 9800GTX拥有128个单独的ALU,因此非常适合并行计算,而且浮点处理能力也远远优于目前的多核CPU,加上GPU为显示图像做了优化。在众多计算领域上已经超越了通用的CPU。如此强大的芯片如果只是作为显卡就太浪费了,因此NVidia推出CUDA,让显卡可以用于图像计算以外的目的。CUDA(Compute Unified Device Architecture)工具包是一种针对支持CUDA功能的GPU(图形处理器)的C语言开发环境,未来还将发布Fortran语言版本。 CUDA(Compute Unified Device Architecture)是一个新的基础架构,这个架构可以使用GPU来解决商业、工业以及科学方面的复杂计算问题。跟以往的GPGPU概念不同的是,CUDA是一个完整的解决方案,包含了API、C编译器等,能够利用显卡核心的片内L1 Cache共享数据,使数据不必经过内存-显存的反复传输,shader之间甚至可以互相通信。对数据的存储也不再约束于以往GPGPU的纹理方式,存取更加灵活,可以充分利用stream out特性。以上几点都将大大提高GPGPU应用的效率。例如,在游戏中我们可以使用CUDA来让GPU承担整个物理计算,而玩家将会获得另他们感到惊奇的性能和视觉效果。另外,用于产品开发和巨量数据分析的商业软件也可以通过它来使用一台工作站或者服务器完成以前需要大规模的计算系统才能完成的工作。这一技术突破使得客户可以任何地方进行实时分析与决策。同时,一些以前需要很先进的计算技术来达到的强大计算能力的科学应用程序,也不再受限在计算密度上;使用CUDA的计算可以在现有的空间里为平台提供更强大的计算性能。CUDA采用C语言作为编程语言提供大量的高性能计算指令开发能力,使开发者能够在GPU的强大计算能力的基础上建立起一种效率更高的密集数据计算解决方案。 CUDA工具包推出已有1年,它的推出马上受到了众多软件/游戏开发商以及科研机构和程序爱好者的欢迎,NVIDIA方面也将发布最新的CUDA 2.0版本。相信在未来,CUDA将会受到越来越多的领域的支持。目前,支持CUDA环境的GPU主要有采用统一渲染架构的显示核心。 更真实游戏效果:提供NVIDIA PhysX物理加速 随着NVIDIA收购AGEIA公司,业界最先进的PhysX物理加速技术的加入,让大家对于GPU支持物理加速期待已久。不久前,支持GeForce8/9/200系列的显卡PhysX物理驱动终于发布了,通过物理加速驱动,GPU能分担CPU的工作,从而提高游戏的执行效率,目前主要体现在3DMark Vantage测试中。按照NVIDIA自己宣称的PhysX是目前最先进的物理加速引擎。 PhysX是目前支持平台最多的物理加速引擎,他可以支持目前主流的X86处理器、AGEIA公司的PPU、东芝公司的Cell以及支持CUDA环境的GPU。其中,最令人期待的就是支持CUDA的版本。借助于目前强大的GPU并行运算能力,支持CUDA环境的PhysX物理加速引擎能给用户带来最为真实的性能体验。 随着物理引擎的加入,以后我们就可以在游戏中体验最为真实自然的服装、毛发、烟雾、爆炸等画面,可以进一步的解放目前不堪重负的CPU。目前已有数款游戏宣布支持NVIDIA Geforce PhysX,相信未来会有更多游戏支持物理效果,还原一个更真实的游戏世界。 从3DMark Vantage的测试中可以看出,安装物理驱动后,CPU成绩暴涨了两倍以上,使得整体的测试成绩也有了一定的提升,这是通过Geforce PhysX分担CPU计算的工作,提高效率的结果。 6 评测平台及评测方法简介
在测试平台上面,我们采用了目前的顶级的四核平台Intel Core 2 QX9770。根据这些显卡的定位,在分辨率上我们选择了1680x1050 0AA、1680x1050 0AA与1920x1200 4AA,以考察它们在低/高负载下的性能差距。NVIDIA驱动方面,由于我们选择的测试游戏均不支持Geforce PhysX物理加速,安装物理驱动后3DMark Vantage的测试结果也在争议之中,因此只安装ForceWare 177.83显卡驱动,不安装物理驱动进行测试。 7.1 DX9测试软件:3DMark06性能评测 3DMark06 分项计算公式: HDR/SM3.0 得分 = 100 x 0.5 x (SM3 GT1 fps + SM3 GT2 fps) * Sqrt即平方根 测试相关公式: SM3.0 硬件设备GS得分 = 0.5 x (SM2S + HDRSM3S) 3DMark06 总分的计算公式: 3DMark06 总分 = 2.5 x 1.0/(( 1.7/GS + 0.3/CPU得分)/2) (太平洋电脑网3Dmark06本地下载地址) 3DMark06的标准评测包括两个HDR评测两个SM3.0图形评测。3Dmark06还首次使用了AGEIA公司的PhysX物理引擎,用CPU模拟物理引擎计算,这是3Dmark06的一个闪亮的特色。CPU评测的成绩被强制加入到总分里面去,Futuremark揭示了未来游戏发展的方向,CPU/GPU应该获得更好的平衡。而评测中,我们选择了1920 × 1200的分辨率,4AA/16AF模式。 Geforce 9800GTX+在3DMark 06中的得分最高,超过了Geforce 9800GTX与Geforce 8800Ultra两款显卡700多分,SM3/HDR项目则以200多分差距落后于对手Radeon HD 4850。 7.2 DX10测试软件:3DMark Vantage测试 新的3DMark测试工具——3DMark Vantage并没有提供对显卡DirectX 9性能的测试部分,因为FutureMark认为,作为DirectX 9.0C的测试工具,3DMark 2006就已经很好的反映显卡的DirectX 9性能,因此3DMark Vantage是一款完全针对DirectX 10开发的测试软件,用户也需要安装支持DirectX 10的Windows Vista才能运行,看来Windows XP和DirectX 9显卡用户是和这款3D测试工具无缘了。 3DMark Vantage主要包括了Graphics Test和CPU Test两个测试部分,它们各自带有两个测试场景,其中Graphic Test包括Jane Nash、New Calico,主要针对显卡的3D图形渲染性能。而CPU Test就包括AI和Physics两个部分,分别测试处理器的AI运算和物理加速性能,在现在的游戏发展中,除了图形3D性能以外AI和物理运算都是游戏中极其重要的部分,在新的3DMark中对这四项目都进行了测试,无疑更能反映整个平台的游戏性能。 3DMark Vantage 总得分标准: 3DMark=1/(显卡权重系数 / 显卡总分+CPU权重系数 / CPU总分) 3DMark Vantage认为不同级别的测试模式,显卡和CPU之间的权重比例是不一样的,因此四个测评模式下的评分标准也不一致,下面我们来看看四个模式中,显卡和CPU的权重比为多少:
测试结果: 在3DMark Vantage的测试中,Geforce 9800GTX+稍落后于Radeon HD 4850。 7.3 DX10游戏对比评测:《World in conflict》冲突世界 游戏说明 本作是一款以虚拟全球冷战为故事背景的RTS游戏,游戏支持DX9与DX10特效间的转换。在这款游戏中,我们把画面选项设定为非常高(DX10),以自带BenchMark工具测试。 在该游戏测试中,不开AA的情况下9800GTX+领先;打开AA后,HD 4850反超,在高分辨率加AA的环境下更为明显。 7.4 DX10游戏对比评测:《孤岛危机》Crysis性能对比评测 测试画质说明 如果说著名的FarCry《孤岛惊魂》敞开了第一代DX9游戏的大门,那么同样是由CryTek公司制作的FarCry续集——Crysis《孤岛危机》,将很有可能为大家敞开DX10游戏的另一道大门。 由于Crysis是目前对显卡要求最高的DX10游戏,因此在本次评测中,我们将分辨率锁定在1280x1024、1600x1200、1920x1080所有的画面设置都调至高,同时关闭/开启AA和AF两组测试。为了避免测试误差,我们使用了目前最新的Benchmark测试,画质全部设置为HIGH。 在“显卡危机”Crysis中,在不开AA的情况下,9800GTX+继续领先。但开AA后,成绩下降严重,完全不敌HD 4850,以及上代王者8800U。 7.5 DX10游戏对比评测:《Decil May Cry 4》鬼泣4 游戏说明 鬼泣系列是家用游戏机上的百万销量大作,最新续作鬼泣4在推出不久便破百万销量。在PC平台推出的版本还支持DirectX 10,画面上有了进一步的提升,是3D动作爱好者的必玩之作。测试画面设置如上图所示,所有特效开至最高,关闭垂直同步。在本次测试中我们选择了游戏中的大雪纷飞的场景,跑动一段路程用Fraps记下平均帧数,取3次成绩的平均值为测试分数。 鬼泣4采用了失落星球的引擎开发,在这个测试场景中,NVIDIA显卡的架构更为占优,在高分辨率加4AA的环境下,NVIDIA显卡表现出色,其中成绩最高的是上一代的王者8800Ultra,而9800GTX+则排第二。 7.6 DX10游戏对比评测:《Company Of Heroes》性能对比评测 测试画质设定 上图是关于英雄连《Company Of Heroes》的测试画质设定:Shadow Quality设置为DirecetX 10模式、全部特效都开启至最高,分辨率为1680x1050、1920x1200 4AA,1920x1200 8AA,由于NVIDIA的显卡在该游戏中不提供8X MSAA支持,因此选择了8X的CSAA代替。 Geforce 9800GTX+在该游戏中表现出色,在所有分辨率下均以第一领先其他显卡。 7.7 DX10游戏对比评测:《Assassins Creed》《Assassins Creed》刺客信条的故事背景设定为12世纪末的欧洲,玩家扮演身手不凡的刺客Altair,为了结束帮派斗争而进行一项项暗杀任务。游戏已第三人称视角表现,游戏风格不乏《波斯王子》的熟悉感觉,不过本作将会以极为华丽的游戏画面重新包装起来,对于喜欢第三人称动作游戏的玩家本作绝对吸引。 测试画质设定如上:我们将所有画质调至最高,画面质量、阴影、图形细节等设置为参数"3",分辨率选择为1680x1050、1920x1200。 我们选择了画面一开头的场景为测试地点,利用Fraps记下平均帧数,反复测试3次取最大值为评测成绩。 在刺客信条的测试中,9800GTX+与对手HD 4850成绩非常接近,只是稍稍领先。 7.8 DX9游戏对比评测:《使命召唤4》Call OF Duty 4对比测试 画质说明 关于Call OF Duty4的画面设置如上,所有特效开至游戏能够支持的最高级别,同时关闭垂直同步。 我们选择了大雨滂沱的快乐歌运输号,在直升机至船上的那段场景,用Fraps记下平均帧数,每个分辨率跑两次以两次测试平均值的最大值为成绩。 在此游戏测试中,HD 4850性能最为出色,尤其是在高分辨率加AA下,以10多FPS领先9800GTX,更高频率的9800GTX+只能与之缩小差距,并不能反败为胜。 7.9 DX9游戏对比评测:《半条命2:第二章》 画质设置介绍 《半条命2:第二章》引擎在HDR和游戏解说系统上继续增强。《半条命2:第二章》引擎当中的游戏子引擎将支持豪华的室外场景,树叶渲染上将采用Alpha覆盖技术,提供更好的树叶细节和反锯齿效果。《半条命2:第二章》引擎引入全新的粒子系统,将提供动态软阴影效果。《半条命2:第二章》引擎当中的物理子引擎也经过重新设计,提供大场景大范围的物理效果。下面是关于《半条命2:第二章》的画质设定及评测说明。 我们将游戏的特效全部开至最高,同时关闭AA/AF。 《半条命2:第二章》的评测我们选择了崖边的场景,测试过程中,我们跑到崖边等待游戏画面的闪光至震荡完毕,用Fraps记下3次的成绩取其平均值的最大值为测试成绩。 在半条命2的开发引擎已经非常成熟了,现在的显卡支持非常良好,9800GTX+与HD 4850基本是平分秋色。 7.10 DX9游戏对比评测:《极品飞车11》 画质设置介绍 极品飞车系列相信玩家都非常熟悉了,现在已经推出了第11代,最新的作品是《极品飞车:专业街道赛》。评测画质如上面设置,所有特效开至最高,分辨率锁定1680x1050、1680x10504AA和1920x1200 4AA。 极品飞车11中,Radeon HD 4850的表现最为出色,无论开AA与否均相对较大的差距领先9800GTX/9800GTX+。 8 显卡温度与功耗测试 温度测试: 作为中高端显卡,温度也是用户关心的问题,我们采用ATITOOL进行烤机,10分钟后记录显卡最高温度为满载温度,然后待机5分钟,记录温度为待机温度。测试环境保持在26摄氏度。 测试中的公版HD 4850已经刷写了降温BIOS,详细可参考《免费大餐 3分钟令HD4850温度下降20度》一文。由于9800GTX与9800GTX+采用了相同的散热器,而9800GTX+采用了更为先进的55nm工艺,虽然频率更高,但满载温度还要稍低一点,而且风扇噪音控制也比较出色。HD 4850在刷写了降温BIOS后,风扇会随着显卡温度的上升而加快转速,满载时4000多转噪音比较明显。 功耗测试: 为验证NVIDIA的55nm与65nm的显卡耗电差距,我们进行了功耗测试。同样采用ATITOOL使显卡满载,待读数稳定时记录数据。 从上图中可以看出,65nm的9800GTX与55nm的9800GTX+处于同一水平,但不要忘记9800GTX+的频率更高,这说明了55nm制程使功耗有了一定的降低。而HD 4850满载功耗更低,与9800GTX/9800GTX+有15-20W左右的差距,说明HD 4850的能耗比更高。 9 PConline评测室总结
综合测试结果来看,Geforce 9800GTX+稍强于其对手Radeon HD 4850,但差距不太明显,两款显卡均有自己的优势游戏,9800GTX+在鬼泣4、英雄连中大幅领先,而Radeon HD 4850则在极品飞车11中远抛对手。当开启4AA后,有几款游戏出现了HD 4850反超的情况,说明了HD 4850的AA效率比9800GTX+更为出色。总的来说,在目前主流22寸和24寸显示器的最佳分辨率中,9800GTX+与HD 4850均能胜任大部分游戏,随着以后支持Geforce PhysX物理加速的游戏陆续上市,相信9800GTX+会有更大的优势。 从目前市场定位来看,大部分公版Radeon HD 4850、Geforce 9800GTX以及Geforce 9800GTX+均处于1399元的价位。当然,在相同价钱的情况下,9800GTX已经没选择的必要了,它也即将被工艺更先进、性能更强的9800GTX+所取代,9800GTX也会慢慢淡出市场。虽然9800GTX+拥有如CUDA、Geforce PhysX物理加速等诸多特性,获得大部分消费者的青睬。但由于9800GTX+做工用料相当豪华,成本相比对手HD 4850要高不少,而另一方面,HD 4850的COSTDOWN非公版已经出现,也就是说更廉价的HD 4850即将上市,性能上与9800GTX+相近,但价格方面COSTDOWN版HD 4850肯定占优。NVIDIA方面可开放更多的非公版9800GTX+的授权进行应对。 目前,国内已有不少9800GTX+已经上市了,拥有CUDA、Geforce PhysX物理加速等诸多优势的9800GTX+正于HD 4850进行正面竞争,虽然9800GTX+功能优势受到消费者的瞩目,但面对百花齐放的HD 4850,9800GTX+要解决的是供货与COSTDOWN问题,毕竟COSTDOWN的HD 4850即将大量上市,直杀1199-999元的价位,错位竞争将使9800GTX+的优势不再明显。但只要9800GTX+也拥有更廉价非公版的话,就能从价格也上取得优势。究竟9800GTX+与HD 4850谁能主宰千元之战呢?一切交给市场来验证吧。 |
正在阅读:NV的55nm力量!9800GTX+全方位对决HD4850NV的55nm力量!9800GTX+全方位对决HD4850
2008-08-21 10:38
出处:PConline原创
责任编辑:fanjunhui