收藏 (0) +1 (0) +1 (0) +1
收藏成功查看收藏>>

正在阅读:重夺性能王座!NV新旗舰GTX 295全面评测重夺性能王座!NV新旗舰GTX 295全面评测

2009-01-09 14:56 出处:PConline原创 作者:Hero Fan 责任编辑:fanjunhui
1前言回顶部

1 前言

  时间回到2008年6月,NVIDIA发布了基于GT200核心的新一代显卡Geforce  GTX 260和Geforce  GTX 280,其强大的性能把自家上代的9800GTX显卡远抛在后面。在同一个月里,AMD也发布了新一代显卡Radeon HD 4850和Radeon HD 4870,虽然它们的性能使用户刮目相看,但仍也不能威胁到GTX 280的王者地位;当很多用户认为GTX 280会长时间占据性能王座时,AMD推出了旗舰级显卡Radeon HD 4870 X2,由于集成了两个RV770显示核心,其性能大幅超过了GTX 280,夺取了NVIDIA占据多时的性能王座。

  对于双核HD 4870 X2显卡最直接的方法就是采用双核GT200,但由于GT200采用的是65nm制作工艺,发热量与功耗均较高,以这样的核心组建双核显卡,产能更是无法保证,所以NVIDIA在等待时机,那就是55nm制作工艺的成熟。半年后的今天,NVIDIA终于正式发布新一代旗舰显卡——Geforce GTX 295。

GTX 295
NVIDIA显卡新旗舰——Geforce GTX 295

  GeForce GTX 295作为NVIDIA新一代的旗舰显卡,拥有两个55nm GT200核心,在设计仍沿用9800GX2的风格,采用双PCB板,每块PCB板上有独立的核心和显存。每个核心均有完整的240个流处理器,两个核心加起来总数达到了480个;每块PCB上设有896MB/448bit的存显规格,显存总容量为1792MB。从GTX 280的性能表现来看,双核的GTX 295绝对是一款怪兽级显卡,其性能相当值得期待。

GTX 295
旗舰级的对决!GTX 295 VS HD 4870 X2

  NVIDIA发布Geforce GTX 295的目标很明确,就是要打败Radeon HD 4870 X2夺回性能王座,从两款显卡的规格来看,绝对是非常值得期待的怪兽级别对决,究竟GTX 295的性能有多强呢?能否打败Radeon HD 4870 X2重新登上最高的3D性能王座呢?答案将在本次评测中为大家揭晓。

2誓取性能王座!GTX295参数介绍回顶部

2 誓取性能王座!新旗舰GTX 295参数介绍

  自2008年竞争对手AMD的RV770显示核心发布后,基于该核心的Radeon HD 4850和Radeon HD 4870显卡以出色的性能、合理的价格定位,对NVIDIA的产品线造成了较大影响。之后发布的Radeon HD 4870 X2更是拿下了性能王座;当Radeon HD 4850 X2发布,基于RV770核心的家族到齐,形成非常立体的产品线:Radeon HD 4870 X2、Radeon HD 4850 X2对GeForce GTX 280、Radeon HD 4870 1G对GeForce GTX 260。

NVIDIA产品定位
NVIDIA 09年初新产品地位

  当然,NVIDIA不会让这种局面长存,很快便推出新产品加以应对,那就是基于55nm GT200核心的显卡:新版GeForce GTX 260、GeForce GTX 285和GeForce GTX 295,分别应对竞争对手的Radeon HD 4870 1G、Radeon HD 4850 X2和Radeon HD 4870 X2。其中GeForce GTX 295就是NVIDIA新一代旗舰。

GeForce GTX 295
NVDIA Geforce GTX 295

  Geforce GTX 295采用双PCB和双核芯设计,由两颗55nm GT200核心组成,共有480个流处理器,核心/Shader/显存频率分别为576MHz/1242MHz/1998MHz,显卡最大功耗为289W。从下面表格列出了Geforce GTX 295/285/260的具体参数:

显卡型号
Radeon HD 4870 X2
GeForce GTX 260
GeForce GTX 285
GeForce GTX 295

核心代号

R700

GT200

GT200

GT200

工艺制程

核心晶体管数量

9.56亿 *2
14亿
14亿
14亿

核心封装面积

260m㎡ *2

?

?

?

核心时钟频率

750Mhz

576Mhz

?

576Mhz

核心Shader频率

750Mhz

1242Mhz

?

1242Mhz

显存时钟频率

3600Mhz
1998Mhz
?
1998Mhz

显存类型

GDDR5

GDDR3

GDDR3

显存位宽

256bit *2

448bit

512bit

448bit *2

显存容量

2GB
1792MB

Stream Processor

800 *2

216

?

240 *2

纹理单元

40 *2

72

?

80 *2

ROPs

16 *2

28

?

28 *2

接口总线

PCI-E 2.0
PCI-E 2.0
PCI-E 2.0
PCI-E 2.0

Shader Model标准

4.1

4.0

4.0

4.0

DirectX标准

10.1

10.0

10.0

10.0

互联技术

CrossfireX
3-Way SLI
3-Way SLI
Quad SLI

视频回放技术

UVD2
PureVideo HD II/VP2
PureVideo HD II/VP2
PureVideo HD II/VP2

  Geforce GTX 295虽然采用的是GT200核心,但它的规格比较怪异,拥有240个流处理器、80个纹理单元,无疑符合完整GT200核心的规格,但ROPs却只有28个,比起完整个32个少了一组。

3技术回顾:GT200核心架构分析回顶部
  

3 技术回顾:GT200核心架构分析

  GeForce GTX 200系列带来了全新的第二代统一架构。而第二代统一架构最大的特点就是在全部继承第一代统一架构的优点后,提升各单元处理器能力的同时也提升了效率,真正意义上把同一架构发挥至极点。为了适应未来并行运算的需要,GeForce GTX 200系列显卡开创性提供了2种不同的架构——并行处理架构与图形处理器架构。

图片
完整的GT200架构

  从上面的架构图可以看出,GeForce GTX 200系列可以分为四个层,最上面一层包括了图形处理器所需要的几何着色器(Geometry Shader)、顶点着色器(Vertex shader)以及像素着色器(Pixel shader)。中间一层包括了10组TPCs(计算处理器群集),每组TPC里面又包含了3组SMs(流处理器组),每组SM里面就包含了8个流处理器单元或计算单元。这样一来,GeForce GTX 200显卡就一共包含了240个流处理器单元或计算单元。在TPCs下面就是纹理单元以Atomic单元(在并行计算中负责处理冲突的单元)。在下面就是ROPs(光栅化处理器引擎)以及显存接口。

优化的shader/TF比值 适应未来的需求

  在图形处理方面,GeForce GTX 200可以说有了成倍的性能增加,不仅在流处理数量方面的成倍增加,在跟图形处理器息息相关的几何着色器(Geometry Shader)及数据流输出(Stream Output)、ROPs、纹理填充率以及寄存器方面都有长足的进步。

图片
TPC(计算处理器群集)中多添加了一组SM

  目前,越来越多的游戏以及应用程序都需要大量的shaders,未来在shaders以及纹理单元上寻找一个最佳的平衡搭配,GeForce GTX 280显卡在每组TPC中,多添加了一次SM,然后保持TF的数量不变,这样一来shaders与TF的比值要比上代产品提高50%,非常适合目前以及未来的游戏和应用程序的需求。

提升几何着色器及数据流输出(Stream Output)的表现

  随着DX10游戏的流行,在DX10规范中首次引用的几何着色器(Geometry Shader)作用用来越显著。为了提升GT200的游戏表现,顶级GeForce GTX 280内部的输出缓冲限制已显著升至上代产品的6倍,提供了更快的几何着色器(Geometry Shader)速度以及数据流输出(Stream Output)表现。

图片
测试DEMO美杜莎很大程度上依赖几何着色器及数据流输出的表现

加倍的寄存器文件

  在上代旗舰G80核心中,在每组流处理集(SM)里面添加了高速的本地缓存用于存放shaders之间计算完的活跃数据。但随着编程的复杂度增加,shaders的处理器能力也得到了成倍的增加,一次可完成上千条指令。寄存器的容量就成为了整个核心的瓶颈,当SM内寄存器的容量不足以保存全部处理后的活跃数据时,溢出的数据就会直接存放到显卡的显存当中,而本地显存较大的延时会严重影响性能。为了解决这个问题,适应未来更复杂的编程需求,在GT200核心的寄存器容量直接提升至上代产品的2倍,大大减少了数据溢出到本地显存的机率,使GT200的运算性能更强,运算效率更高。

图片

升级ROPs(光栅化处理器)

  最新的 GeForce GTX 200系列GPU ROPs不仅全部支持上代产品的特性,而且还实现了最大32 pixels输出每时钟,等同于八个ROP分区中每个ROP分区输出4 pixels每时钟,同时每个ROP分区在8X MSAA下支持32 色彩和Z采样每时钟。像素方面采用了U8(未签名8 bit整数)数据格式,像素的混合比率是上代产品的2倍。跟仅有6个ROP分区以及支持24 pixels输出每时钟,12 pixels混合每时钟的上代产品相比,GTX 280提升到支持32 pixels输出和混合每时钟。能给用户带来更绚丽更真实的视觉效果。

提高了纹理表现

  GeForce GTX 200系列再次提升了纹理的过滤与寻址能力。在每个TPCs(流处理集组)中提供了一个双四纹理(共8个)处理单元,能够提供每时钟8 pixels的双线数寻址和过滤,FB16双向材质过滤可以实现每时钟4 pixel来操作,如果是FP2:1的各向异性过滤也可以每时钟4 pixels来完成。内部集成的10个TPCs能同时完成每时钟80 pixels的双线数寻找和过滤。除此之外,GeForce GTX 200系列还创建了一个非常高效的程序来管理,使其纹理过滤表现能达到理论最大值,性能上较上代GeForce 8800GTX显卡有不少的提升。

图片

4面向未来:CUDA并行计算的应用回顶部

4 面向未来:CUDA并行计算的应用

  随着显卡的发展,GPU越来越强大,第二代统一渲染架构的Geforce GTX 200系列拥有200多个单独的ALU,因此非常适合并行计算,而且浮点处理能力也远远优于目前的多核CPU,加上GPU为显示图像做了优化。在众多计算领域上已经超越了通用的CPU。如此强大的芯片如果只是作为显卡就太浪费了,因此NVidia推出CUDA,让显卡可以用于图像计算以外的目的。CUDA(Compute Unified Device Architecture)工具包是一种针对支持CUDA功能的GPU(图形处理器)的C语言开发环境,未来还将发布Fortran语言版本。

图片

图片

  CUDA(Compute Unified Device Architecture)是一个新的基础架构,这个架构可以使用GPU来解决商业、工业以及科学方面的复杂计算问题。跟以往的GPGPU概念不同的是,CUDA是一个完整的解决方案,包含了API、C编译器等,能够利用显卡核心的片内L1 Cache共享数据,使数据不必经过内存-显存的反复传输,shader之间甚至可以互相通信。对数据的存储也不再约束于以往GPGPU的纹理方式,存取更加灵活,可以充分利用stream out特性。以上几点都将大大提高GPGPU应用的效率。例如,在游戏中我们可以使用CUDA来让GPU承担整个物理计算,而玩家将会获得另他们感到惊奇的性能和视觉效果。另外,用于产品开发和巨量数据分析的商业软件也可以通过它来使用一台工作站或者服务器完成以前需要大规模的计算系统才能完成的工作。这一技术突破使得客户可以任何地方进行实时分析与决策。同时,一些以前需要很先进的计算技术来达到的强大计算能力的科学应用程序,也不再受限在计算密度上;使用CUDA的计算可以在现有的空间里为平台提供更强大的计算性能。CUDA采用C语言作为编程语言提供大量的高性能计算指令开发能力,使开发者能够在GPU的强大计算能力的基础上建立起一种效率更高的密集数据计算解决方案。

图片
并行处理器在各个方面都有优势

  CUDA工具包推出已有1年,它的推出马上受到了众多软件/游戏开发商以及科研机构和程序爱好者的欢迎,NVIDIA方面也将发布最新的CUDA 2.0版本。相信在未来,CUDA将会受到越来越多的领域的支持。目前,支持CUDA环境的GPU主要有采用统一渲染架构的显示核心。

下面是CUDA实现的GPU并行计算应用:

BadaBoom视频压缩

  一直以来,视频编码的转化都是令用户非常头疼的一件事,一款顶级的处理器在转换容量巨人的视频文件的时候,慢如蜗牛的速度令人难以忍受,这也主要受目前CPU性能的制约。目前,NVIDIA与许多软件开发商在推广支持GPU加速的视频压缩软件,Badaboom就是一款支持GPU加速的视频转换软件,可以把mpeg2的视频转换为ipod或者iphone这样的所使用的H.264视频格式,据称速度方面是目前CPU转化的10倍以上,为了验证其真实性,我们就做了一次相关的评测。

图片

图片

  由于目前这个版本仅支持GPU加速,所以我们并不能拿来与CPU进行同平台对比,考虑到目前参差不齐的编码软件,测试结果仅做主观参考,从软件显示的编码速度来看,编码帧数达到了130帧每秒,一个160M的MPEG-2文件压缩至iphone标准视频仅1分钟内就可以编码完成。这个速度相信已经超过了目前所有的CPU版本编码软件。

连PDF都需要GPU加速
  http://www.adobe.com/cn/

    早在2007年,Adobe就与NVIDIA展开合作,推出了支持GPU加速的PDF版本,Adobe Acrobat 8及Adobe Reader 8系列产品提供全新的页面显示着色技术,利用GPU来加速PDF格式下的绘图及显示功能,除了在效能上有所增进外,还可以利用GPU的可编程特性,进一步加强PDF文件中的2D内容展示效果。

图片

  据Adobe平台产品营销总Pam Deziel表示,NVIDIA GeForce与Quadro GPU使用者可利用PDF档案进行更多样的作业,同时也能更有效率。包括平移、卷动、缩放等,实际上Adobe Reader 8每一项运用到GPU的功能都有着显著的效能增进。使用者过去避免使用的一些应用,例如可进行极精细比例缩放的地图,现在都可以轻易地显示。

图片

图片
打开同样复杂的一幅图表,利用GPU加速你可能会获得更快的浏览速度

  同样一个容量达到50MB的期刊读物电子版PDF文件,在使用传统方式打开时,读取时间为8秒。而使用GPU硬件加速功能时,打开时间不超过3秒,且在浏览时不会有拖沓感,PDF文件也变得流畅异常了。

5新游戏支持PhysX物理加速回顶部

新游戏支持PhysX物理加速

  随着NVIDIA收购AGEIA公司,业界最先进的PhysX物理加速技术的加入,让大家对于GPU支持物理加速期待已久。不久前,支持GeForce8/9/200系列的显卡PhysX物理驱动终于发布了,通过物理加速驱动,GPU能分担CPU的工作,从而提高游戏的执行效率,目前主要体现在3DMark Vantage测试中。按照NVIDIA自己宣称的PhysX是目前最先进的物理加速引擎。

物理加速

  PhysX是目前支持平台最多的物理加速引擎,他可以支持目前主流的X86处理器、AGEIA公司的PPU、东芝公司的Cell以及支持CUDA环境的GPU。其中,最令人期待的就是支持CUDA的版本。借助于目前强大的GPU并行运算能力,支持CUDA环境的PhysX物理加速引擎能给用户带来最为真实的性能体验。

物理加速

  随着物理引擎的加入,以后我们就可以在游戏中体验最为真实自然的服装、毛发、烟雾、爆炸等画面,可以进一步的解放目前不堪重负的CPU。目前已有数款游戏宣布支持NVIDIA Geforce PhysX,相信未来会有更多游戏支持物理效果,还原一个更真实的游戏世界。

无物理驱动测试
不带物理驱动的测试成绩

带物理驱动测试
安装物理驱动的测试成绩

  从3DMark Vantage的测试中可以看出,安装物理驱动后,CPU成绩暴涨了两倍以上,使得整体的测试成绩也有了一定的提升,这是通过Geforce PhysX分担CPU计算的工作,提高效率的结果。

  不少新游戏开始提供NVIDIA PhysX物理加速的支持,如《雪域危机》和《镜之边缘》,只有NVIDIA的GeForce 8/9/200系列能提供最好的游戏体验。

雪域危机
雪域危机

镜之边缘
镜之边缘

6真正3D体验!GTX295搭配3D眼镜回顶部

6 真正3D体验!GTX 295搭配3D眼镜

  NVIDIA GeForce GPU是一个整合硬件软件的解决方案,实现了游戏立体3D效果的自动转换,把游戏提升到全新的高度。GeForce产品,不用特别的游戏套件或补丁程序,就能立即在350多款的3D立体情景游戏中获得极具临场感的震撼体验。NVIDIA GeForce GPU具备业界唯一支持Microsoft DirectX 10游戏的立体3D技术,让你尽情享受最新游戏带来的视觉盛宴。现在就购买GeForce GPU,当你的立体3D眼镜、高清电视投影仪以及平板液晶显示器一切就绪时,即可将你钟爱的游戏升级到逼真的3D境界,为你的闲暇时光增添无限欢乐。

3D Stereo

  由nVIDIA提供的3D EYES给我们一个体验亲历游戏世界的机会,在NVISION08大会上,nVIDIA提供了《Spore》、《Call of Duty 5》、《Race Driver Grid》、《Devil May Cry 4》以及《Unreal Tournament 3》等在内的几款游戏给试用用户体验。在这次试用体验上,nVIDIA官方提供了采用三菱(Mitsubishi)73英寸支持3D 的1080p DLP以及从未展示过的优派(ViewSonic)公司支持3D的120Hz液晶显示器上来显示这些游戏。

3D Stereo
3D眼镜

  NVIDIA GeForce Stereoscopic 3D 技术兼容现有350多款游戏,无需特殊的游戏补丁,搭配最强的GeForce GTX 295显卡,可以享受真正的3D游戏。

7二次爆发:NVIDIA 180系列驱动回顶部

7 二次爆发:NVIDIA 180系列驱动

180驱动为新游戏提速
180驱动为新游戏提速

  NVIDIA已经正式发布了ForceWare 180系列驱动,这一个具有里程碑意义的驱动,它在NVIDIA的文档中它被称为“Big Bang II”,这个系列的驱动对主流游戏进行了大量优化,激发Geforce 8/9/200系列显卡的性能,从而提升游戏速度。

  新驱动还带来了各种新功能,其中最重要的是可以在多屏幕环境下支持多卡SLI输出,对于有两个显示器的用户来说是一个非常实用的功能。另外一个重要功能就是可以指定一款Geforce显卡作PhysX物理加速卡,另一块显卡作为3D应用。

8影驰 GeForce GTX 295赏析回顶部

影驰 GeForce GTX 295赏析

影驰 GTX 295

影驰 GTX 295
影驰 GTX295

  影驰 GTX295显卡采用P656公版设计,是一款拥有双PCB和双核心的显卡,核心是两颗GT200,制作工艺为55nm,拥有240*2个处理器,纹理单元有80*2个,ROPs有28*2个。显存位宽为448bit,默认核心/显存频率为576/1998MHz,流处理器频率是1242MHz。从外观上看,这款GTX 295正面设有很多小孔,方便散热;显卡散热器位于两块PCB中间,类似之前的9800GX2设计。

影驰 GTX 295

影驰 GTX 295
金属外壳把GTX 295包裹着

  GTX 295显卡与前辈9800GX2类似,采用一体式散热器,并设置在两PCB之间,外观用一个金属外壳包裹着。不同的是,GTX 295背面没有采用底座,显卡顶部设有排风口,相信这些都是为提高散热效能而改变的。

影驰 GTX 295  影驰 GTX 295
显卡标签和供电接口

  从标签上可以看到,GTX 295的公版通过了ROHS等多方面的认证,PCB版本号为P656。作为双核心的顶级显卡,能量消耗绝对不容忽视,根据官方资料显示,GTX 295的最大功耗为289W,因此显卡设置有6PIN+8PIN的额外供电。

影驰 GTX 295  影驰 GTX 295
GTX 295的散热风扇和顶部散热片

  GTX 295的散热风扇在显卡背面抽风,散热片吸收了两个核心的发热量,通过风道,把热量从显卡背面和显卡顶部排出。相比之前的显卡只在背板排出热量,GTX 295在显卡顶部设有密密麻麻的小散热片,成为另一排风口,这样大大增强了显卡的散热效果。当然,缺点是用久了容易堆积灰尘。

影驰 GTX 295
GTX 295采用双DVI+HDMI接口设计

  影驰 GTX295采用主流的双DVI+HDMI输出接口,能满足大多数用户的需求,通过转接头可以对DisplayPort支持。

  作为顶级显卡,影驰在GTX 295上推出厂商直接面对用户“零距离的星级售后服务”,特意为购买GTX 295的用户开通了影驰VIP绿色通道,包括专人1对1为您解答问题,一级城市均实现收到卡的1个工作日内可返还等等措施,在服务上做到最贴心的解决方案,为这样的一款公版设计的产品注入真正的差异化。

9映众 GeForce GTX 295赏析回顶部

映众 GeForce GTX 295赏析

映众 GTX 295

映众 GTX 295

映众 GTX 295
映众 GTX 295 超频版

映众 GTX 295  映众 GTX 295

映众 GTX 295

映众 GTX 295

映众 GTX 295

10七彩虹 GeForce GTX 295赏析回顶部

10 七彩虹 GeForce GTX 295赏析

七彩虹 GTX 295

七彩虹 GTX 295
七彩虹 iGAME GTX 295

七彩虹 GTX 295

七彩虹 GTX 295

七彩虹 GTX 295

七彩虹 GTX 295

七彩虹 GTX 295

11微星 GeForce GTX 295赏析回顶部

11 微星 GeForce GTX 295赏析

微星 GTX 295

微星 GTX 295
微星 GTX 295

微星 GTX 295

微星 GTX 295  微星 GTX 295

微星 GTX 295

微星 GTX 295

12夸张的设计!GTX295暴力拆解回顶部

12 夸张的设计!GTX295暴力拆解

GTX 295
拆下金属外壳

  拆下GTX 295的金属外壳后,我们可以看到,即使是显卡正面,也是其中一块PCB的背面。显卡除了核心、PCB是X2设计外,连密密麻麻的螺丝也是X2设计,要拆下散热器还得花费一定的工夫。

GTX 295
GTX 295拆解图

  把X2的PCB背面螺丝取下后,我们可以看到金属外壳、两块PCB和中间的散热器,当然还有多不胜数的螺丝。这种类似“三文治”面包的设计早在9800GX2上已经采用,两片“面包”(PCB)把“夹心”(散热器)夹在一起,组合了美味可口的“三文治”(GTX 295)。

GTX 295
GTX 295两块PCB还是有一定的差异

  GTX 295显卡由两块PCB组成,而两块PCB上的芯片和元件不尽相同,如上图所示,上面的那块PCB上设置有金手指接口,一颗NVIO芯片和NF200桥接芯片,SLI接口,6PIN PCI-E供电接口;下面的PCB则没有桥接芯片,提供的是8PIN供电接口。每块PCB上均有14颗显存,显存容量/位宽为896MB/448bit,两块PCB上的显存容量加起来,GTX 295的显存容量便高达1792MB。因为GTX 295采用的互联技术依然是SLI,因此核心占用的显存是不能共用,虽然显卡具备了1792MB的显存容量,实际每个核心能用的也是896MB而已。

GTX 295  GTX 295

  Geforce GTX 295采用了两颗55nm GT200图形核心,编号为“G200-400-B3”,最后的B3则代表采用55nm制作工艺。每个核心拥有240个流处理器、80个纹理单元和28个ROP单元。

GTX 295  GTX 295
NF200连接芯片和NVIO芯片

  GTX 295由两个GT200核心所组成,为使这两个核心能更好地协同工作,便需要一个连接芯片,这次GTX 295则采用了“NF200-P-SLI-A3”芯片,如上图左。上图右为第二代NVIO芯片,主要作用是控制显卡信号的输入/输出功能,第二代NVIO在接口方面更丰富,支持DisplayPort接口,并且带来真正双Dual-Link XHD DVI 10bit每通道的色彩输出能力,拥有更为出色的2D显示效果。

GTX 295  GTX 295
GTX 295散热器的两面

  GTX 295散热器的两面区别不大,而其中一面有一个专为NF200桥接芯片而设的纯铜散热片。散热器的顶部有较为密集的散热片,涡轮风扇的风道能在这里将显卡的热量送出。

GTX 295  GTX 295
两块PCB的供电部分

  作为顶级显卡,GTX 295在供电上部分的用料相当豪华,采用了VT1165MF电路控制芯片,搭配VT1165SF多相供电芯片以对应双路电感,全部采用了陶瓷电感,为核心提供4相供电,显存方面也采用了2两相供电。

GTX 295  GTX 295
图左为GTX 295内部SLI桥接器,图右为SLI接口

  图左是GTX 295的内部SLI桥接器,共有两个,与NF200连接芯片协同工作。GTX 295还提供一个SLI接口,两块GTX 295显卡可组建Quad-SLI,提供最为顶级的3D游戏性能。

13评测平台及评测方法简介回顶部

13 评测平台及评测方法简介

评测平台
CPU

Intel Core i7 965(3.2G、8MB L3 Cache)

华硕 P6T Deluxe(X58+ICH10R)

内存

金泰克 DDR3-1600 1GB x 3 (7-7-7-20)

希捷 7200.10 SATA 500G

显卡

GeForce GTX 295(576/1998MHz,SP:1242MHz)
GeForce GTX 280(602/2200MHz,SP:1292MHz)
Radeon HD 4870 X2(750/3600MHz)

软件平台
系统软件

  Windows VISTA Ultimate SP1

驱动程序

 AMD显卡:AMD Catalyst 8.12 For Vista
    NVIDIA显卡:ForceWare 181.20 For Vista

评测软件

  • System:
  • 3DMark Vantage Ver:101 (DirectX 10)
  • Game:(DirectX 10)
  • FarCry 2
  • Company Of Heroes:Opposing Fronts 
  • Crysis Ver:1.1
  • Devil May Cry 4
  • Bioshock
  • Cryostasis (PhysX)
  • Game:(DirectX 9)
  • Call OF Duty:World At War
  • Half Life 2 EPISODE TWO

  本次评测的显卡是NVIDIA的新旗舰GeForce GTX 295,考虑到新旗舰显卡的定位,我们将加入竞争对手Radeon HD 4870 X2以及NVIDIA上代旗舰GeForce GTX 280进行对比参考。评测结果能充分反映新旗舰GTX 295相比上代旗舰GTX 280提升的幅度,以及与竞争对手HD 4870 X2的性能差异。

  在测试平台上面,我们采用了顶级平台Intel Core i7  965。根据顶级显卡的定位,在分辨率上我们选择了1680x1050 0AA / 1920x1200 4AA 以及2560x1600 4AA,以考察它们在低/高负载下的性能差距。考虑到兼容性等问题,开启AA的倍数是由游戏支持度决定,并没有在驱动强制开启。

  在游戏选择上除了传统的DX9和DX10游戏外,我们还加入了PhysX游戏的测试。由于加入物理加速的3DMark Vantage测试结果还在争议之中,因此在3DMark Vantage的测试过程将关闭PhysX物理加速,以更好反映显卡的3D性能。

14DX10测试软件:3DMark Vantage回顶部

14 DX10测试软件:3DMark Vantage测试

  新的3DMark测试工具——3DMark Vantage并没有提供对显卡DirectX 9性能的测试部分,因为FutureMark认为,作为DirectX 9.0C的测试工具,3DMark 2006就已经很好的反映显卡的DirectX 9性能,因此3DMark Vantage是一款完全针对DirectX 10开发的测试软件,用户也需要安装支持DirectX 10的Windows Vista才能运行,看来Windows XP和DirectX 9显卡用户是和这款3D测试工具无缘了。

  3DMark Vantage主要包括了Graphics Test和CPU Test两个测试部分,它们各自带有两个测试场景,其中Graphic Test包括Jane Nash、New Calico,主要针对显卡的3D图形渲染性能。而CPU Test就包括AI和Physics两个部分,分别测试处理器的AI运算和物理加速性能,在现在的游戏发展中,除了图形3D性能以外AI和物理运算都是游戏中极其重要的部分,在新的3DMark中对这四项目都进行了测试,无疑更能反映整个平台的游戏性能。

3DMark Vantage
主要分了四个测试项目

  3DMark Vantage 总得分标准:

  3DMark=1/(显卡权重系数 / 显卡总分+CPU权重系数 / CPU总分)

  3DMark Vantage认为不同级别的测试模式,显卡和CPU之间的权重比例是不一样的,因此四个测评模式下的评分标准也不一致,下面我们来看看四个模式中,显卡和CPU的权重比为多少:

 

Entry

Performance

High

Extreme

显卡权重系数

0.75

0.75

0.85

0.95

CPU权重系数

0.25

0.25

0.15

0.05

  测试结果:

3DMark Vantage

  在3DMark Vantage的测试中,我们没有开启PhysX物理加速,这样更能反映显卡的3D性能。NVIDIA的新旗舰表现非常出色,即使在最顶级的Extreme环境下,GPU得分也将近9000分,领先对手HD 4870 X2高达25%,领先自家上一款旗舰显卡GTX 280更是达到了65%。

15DX10游戏对比评测:《孤岛惊魂2》回顶部

15 DX10游戏对比评测:《孤岛惊魂2》

FRY2

FarCry 2 Benchmark

  FarCry2《孤岛惊魂2》是一款DX10游戏,我们采用自带BenchMark进行测试,模式为DirectX 10,品质为Ultra High,分辨率设定为1680x1050 0AA、1920x1200 4AA和2560x1600 4AA。

孤岛惊魂 2

  在FarCry2的测试中,GTX 295仍是全面领先对手HD 4870 X2。随着分辨率的提高,GTX 295的优势更为明显,到2560x1600 4AA的高负载下,GTX 295领先HD 4870 X2近35%,差距较为明显。

16DX10游戏对比评测:《孤岛危机》回顶部

16 DX10游戏对比评测:《孤岛危机》

  测试画质说明

Crysis《孤岛危机》

图片

  Crysis《孤岛危机》作为目前对显卡要求最高的DX10游戏,以出色的游戏画面著称。在本次评测中,我们将分辨率锁定在1680x1050、1920x1080、2560x1600 4AA所有的画面设置都调为HIGH,同时关闭/开启AA和AF,使用目前最新的Benchmark测试。

孤岛危机

  1年多前的“显卡危机”到现在还是“显卡危机”,在画质设定为Very High的情况下,顶级仍是跑不爽,因此我们设定为High。不开AA的情况下,GTX 295领先HD 4870 X2;当分辨率到达2560x1600 4AA的环境下,GTX 295的成绩惨不忍睹,FPS只有个位数,大幅落后于HD 4870 X2。造成这样的原因是GTX 295只有896MB的可用显存已经不能满足此分辨率的要求,拥有1GB可用显存的HD 4870和GTX 280成绩表现正常。

17DX10游戏对比评测:《鬼泣4》回顶部

17 DX10游戏对比评测:《鬼泣4》

  游戏说明

DevilMayCry4

DevilMayCry4

  鬼泣系列是家用游戏机上的百万销量大作,最新续作鬼泣4在推出不久便破百万销量。在PC平台推出的版本还支持DirectX 10,画面上有了进一步的提升。测试画面设置如图所示,所有特效开至最高,关闭垂直同步。在本次测试中我们选择了游戏过程中的场景进行测试,跑动一段路程用Fraps记下平均帧数,取3次成绩的平均值为测试分数。

DevilMayCry4
鬼泣4中选用的测试场景

鬼泣4

  鬼泣4采用失落星球的引擎开发,我们采用了实际游戏中的场景进行测试。该游戏已锁定最高FPS为120,三款显卡在1680x1050下均轻松应付。随着分辨率的提高与AA开启后,三款显卡的差距开始得以体现,GTX 295即使在最为分辨率2560x1600 4AA下,仍能保持100FPS,大幅抛离对手。

18DX10游戏对比评测:《英雄连》回顶部

18 DX10游戏对比评测:《英雄连:抵抗前线》

  测试画质设定

55nm核心9800GT评测

英雄连:抵抗前线
采用自带Benchmark测试,版本为2.201

  上图是关于英雄连《Company Of Heroes:Opposing Fronts》的测试画质设定:Shadow Quality设置为DirecetX 10模式、全部特效都开启至最高,分辨率为1680x1050、1920x1200 4AA,1920x1200 8AA,由于NVIDIA的显卡在该游戏中不提供8X MSAA支持,因此选择了8X CSAA代替。

英雄连

  在英雄连:抵抗前线测试中,GTX 295仍是一枝独秀,大幅度领先竞争对手。

19DX10游戏对比评测:《生化奇兵》回顶部

19 DX10游戏对比评测:《生化奇兵》

画质设置介绍

  《生化奇兵》是一款基于虚拟3引擎开发的游戏。游戏画质设置说明:测试期间我们采用全屏模式进行,关闭游戏的垂直同步功能,开启DX10模式,再将游戏特效设置为官方的高级特效水平。

测试设置及测试场景说明
测试选用的场景

  测试场景:测试场景我们选用游戏中的第一个Auto Save场景——Welcome to Rapture,当中主角又潜水仓进入Rapture浮出水面的一段。游戏速度监测部分我们采用Fraps进行平均帧数的监测,每个分辨率测试三次,选取平均值的作为测试成绩。

生化奇兵

  由于生化奇兵游戏中不提抗锯齿AA的支持,为考虑到兼容性问题,没在驱动中强制打开抗锯齿。拥有双核心的GTX 295与HD 4870 X2大幅领先只有单核的GTX 280,而GTX295又小幅领先HD 4870 X2。

20DX9游戏对比评测:《使命召唤5》回顶部

20 DX9游戏对比评测:《使命召唤:世界大战》

  画质说明

使命召唤5:世界战争
设置界面

使命召唤5
测试场景

  游戏所有特效开至游戏能够支持的最高级别,同时关闭垂直同步,分辨率为1680x1050 0AA、1920x1200 4AA和2560x1600 4AA。我们选择了第二关开头为测试场景,从开始直到运兵船靠岸结束,用Fraps记下平均帧数。

使命召唤5

  作为人气射击大作,使命召唤系列的最新作。我们选择了在第二关开头的测试场景,随着分辨率与AA的提高,单核心的GTX 280性能下降相对严重。而双核心的GTX 295和HD 4870 X2即使在最高分辨率下仍能超过60FPS,性能相当出色。

21DX9游戏对比评测:《半条命2》回顶部

21 DX9游戏对比评测:《半条命2:第二章》

画质设置介绍

Half Life2

Half Life2

    《半条命2:第二章》引擎在HDR和游戏解说系统上继续增强。《半条命2:第二章》引擎当中的游戏子引擎将支持豪华的室外场景,树叶渲染上将采用Alpha覆盖技术,提供更好的树叶细节和反锯齿效果。《半条命2:第二章》引擎引入全新的粒子系统,将提供动态软阴影效果。《半条命2:第二章》引擎当中的物理子引擎也经过重新设计,提供大场景大范围的物理效果。下面是关于《半条命2:第二章》的画质设定及评测说明。我们将游戏的特效全部开至最高,同时关闭AA/AF。

Half Life2
测试选用的场景

  《半条命2:第二章》的评测我们选择了崖边的场景,测试过程中,我们跑到崖边等待游戏画面的闪光至震荡完毕,并用游戏自带的录像功能进行录像,然后用回放录像功能得出测试成绩。

半条命2:第二章

  作为经典的DX9游戏半条命2,现在的显卡已能非常轻松运行,即使是最高分辨率+最高特效。作为以往A卡的优势游戏,现在已看不到它的光环,GTX 295领先HD 4870 X2不少。

22PhysX游戏对比评测:《雪域危机》回顶部

22 PhysX游戏对比评测:《雪域危机》

雪域危机

雪域危机测试场景
采用自带BenchMark进行测试

  《Cryostasis》雪域危机是一款支持NVIDIA PhysX物理加速的游戏,现在已经正式发布,能带给玩家更真实的表现,我们采用1920x1200全特效进行测试,测试过程开启与关闭PhysX物理加速进行对比。

雪域危机

  支持PhysX物理加速技术的NVIDIA显卡表现非常出色,大幅领先对手,而不支持PhysX的AMD显卡或关闭PhysX的NVIDIA显卡,在有物理特效的场景会变得非常缓慢,因此成绩较低。2009年有不少游戏将支持NVIDIA PhysX物理加速技术,如即将推出的《镜之边缘》,还原更真实的游戏世界。

23CUDA的应用!GTX 295进行视频压缩回顶部

23 CUDA的应用!GTX 295进行视频压缩

Badaboom
视频压缩软件Badaboom

  我们采用了一段1080P视频,片源大小为180M,分辨率为1920x1080。我们将采用Badaboom对这个片源进行压缩,压缩目标为iPhone的适用模式,分辨率为420x320,选取最高品质,压缩后大小为18M,格式为MP4。

  GeForce GTX 295拥有240*2个流处理器,但由于Badaboom不支持双核心压缩,因此压缩过程我们只采用单个核心。对片源压缩使用的时间为0:12,FPS为152.1。而压缩后的视频品质还是可以的。凭借着显卡出色的并行计算技术,将来支持CUDA架构的软件也将逐渐增多。

24显卡温度与功耗测试回顶部

24 显卡温度与功耗测试

温度测试:

  Geforce GTX 295作为顶级显卡,采用双PCB、双核心设计,更先进的55nm工艺使功耗和温度均有一定下降。温度方面,我们采用严厉的FurMark进行烤机,10分钟后记录显卡最高温度为满载温度,然后待机5分钟,记录温度为待机温度。测试环境保持在26摄氏度。

温度对比测试

  从评测中我们可以看到,虽然是GTX 295是双核显卡,但温度控制还是相当出色的,甚至比GTX 280更低温。当然,更先进的55nm制作工艺功不可抹。而再看看噪音控制方面,GTX 295采用静音散热设计,测试过程风扇保持在较低转速。由于BIOS已设定了风扇转速随温度升高而提速,因此在温度控制方面相比之前的版本有明显改善,但显卡满载时却带来更大的噪音。

功耗测试:

极品飞车11测试功耗
极品飞车11测试功耗

  Geforce GTX 295的采用了55nm制作工艺,使双核心显卡的成为了可能,但由于之前65nm的GTX 280功耗较为惊人,虽然采用了55nm制作工艺,但两颗GT200的功耗仍非常大,下面我们将进行功耗评测。经过我们的测试,在极品飞车11的主界面能使显卡满载,因此我们选它来进行功耗测试,待读数稳定时记录数据,通过平台功耗差可以反映出显卡的功耗差。(测试过程开启CPU节能技术,下面的读数为整机功耗) 

功耗对比评测

  从测试结果可以看出,采用55nm制作工艺的GTX 295功耗虽然很大,但相比对手HD 4870 X2功耗控制更有优势,无论是待机还是满载。再反观它们的性能差异,GTX 295的能耗比更为出色,可见这段时间里,NVIDIA在功耗控制方面下了很大功夫。测试中的HD 4870 X2待机很高,经过多次测试均是此结果,估计是节能技术失效所导致。

25PConline评测室总结回顶部

25 PConline评测室总结

GTX 295
重夺性能王座!GTX 295成为最强的3D显卡

评测结果分析:

  从评测结果可以看到,NVIDIA新旗舰Geforce GTX 295以压倒性优势领先对手Radeon HD 4870 X2,成为新一代3D性能之王。在大部分测试项目中,GTX 295均处于领先水平,而随着分辨率的提高,GTX 295领先的幅度更为明显,其中在英雄连、鬼泣4和孤岛惊魂2更是大幅超越了HD 4870 X2。当然,GTX 295也不是没有缺点,从孤岛危机2560x1600 4AA的测试环境中可以看到,GTX 295只有个位数水平,这是因为显存不足所导致的。总的来说,在性能上GTX 295领先HD 4870 X2约20-30%,领先上代旗舰GTX 280 50-60%,性能相当强大。

  在功耗与温度控制方面,GTX 295表现有不错的表现,尤其是功耗方面,满载时比HD 4870低20瓦,GTX 295的能耗比无疑更为出色。GTX 295的噪音控制也比较理想,在测试过程的风扇的噪音不明显。

市场定位分析:

  NVIDIA发布Geforce GTX 295的意图相当明显,就是要打败对手Radeon HD 4870 X2,重新夺回3D性能的皇座,而从评测数据上看出,GTX 295的性能在绝大多数的3D游戏中超越了HD 4870 X2,成为目前最强的游戏显卡。目前HD 4870 X2在国内的定价为3999元,从NVIDIA的官方建议GTX 295的售价是499美元,国内上市价格估计也会是3999元,也就上说与HD 4870 X2正面竞争,由于HD 4870 X2性能上不及GTX 295,相信其价格很快便会下调。

  另一方面,针对Radeon HD 4850 X2显卡2499元的价格定位,NVIDIA也准备好GTX 285进行应对,再配合55nm的GTX 260对付HD 4870 1G,将形成非常完善的反击战线。激烈的竞争意味着显卡价格有下降的可能,相信不久便有厂商进行杀价行动,打算购买高端显卡的用户不妨等等。

未来发展预测:

  2009年初,NVIDIA即以55nm的GT200系列显卡向AMD高端市场进行全面的反击,Geforce GTX 295的发布,轻松打败了HD 4870 X2,再次帮助NVIDIA夺得3D性能宝座;配合Geforce GTX 285对付HD 4850 X2,Geforce GTX 260对付HD 4870 1G的策略,形成了非常完善的反击战线。随着CUDA并行计算应用增多,以及09年更多支持PhysX的游戏出现,在价格相近的情况下,N卡优势将更为明显。在这样的情况下,AMD只能以性价比策略或推出新产品应对NVIDIA这一波的反击,保住市场占有率。虽然之前网上流传AMD将推出增强版的RV770应对,但被AMD方面否定了,当然,不排除是AMD放出的烟雾弹。但无论如何,NVIDIA在高端市场将领先一段时间。

  08年AMD RV770的推出,使显卡市场再次进入激烈的阶段,NVIDIA/AMD均加紧对新产品的研发。从它们最新的计划可以看到,NVIDIA方面今年还有GT212、GT214和GT216等显卡推出,甚至传闻中的GT300也将在今年发布;而AMD方面则有RV870、R800等新一代产品。2009年显卡市场的竞争无疑将更为激烈,究竟NVIDIA或AMD今年是否再有使人激动的产品出现,我们拭目以待。

为您推荐

热门排行

DIY论坛帖子排行

最高点击 最高回复 最新
最新资讯离线随时看 聊天吐槽赢奖品
手机访问回到顶部