千元价位重磅炸弹 GTX460显卡全球首测

2010-07-15 07:37  出处:PConline原创  作者:佚名   责任编辑:zhanli 

  世界杯已于今日凌晨结束了,本以为又要看点球大战,不过在第116分钟,西班牙先进一球取得了最后的胜利。4年一次的世界杯结束了。而2010年下半年的显卡战争才刚刚开始。NVIDIA选择在世界杯总决赛这天发布新一代千元级显卡产品GTX460,其寓意很明显,冠军只有NVIDIA一个。而在邀请函中,NVIDIA也以“迄今准备的最好的游戏GPU”赚足了媒体关注度以及好奇度。

  在经历了GTX480犹抱琵琶半遮面,经历了GTX480/470上市之后就被各种口水淹没的时代,我们终于迎来了基于全新Fermi架构,千元级最新产品GTX460的降临。在这个时候,兴许有很多朋友跟我当初一样有这样的疑惑:

1、这块显卡在继承了GTX480的性能之后,是否也继承了其强大的功耗以及散热量;

2、这块显卡是否价格定位很高,在价格上与根据竞争对手的情况采用的什么策略;

3、GTX260太经典了,GTX460是取代GTX260的产品,是否能胜任。

  在经过四天的反复测试之后,我想天极评测室已经很负责地告诉大家这些答案。下面,就请跟着我们的脚步掀开GF104神秘的面纱。

  首先我们必须得来看一下这次首发的GTX460的大概情况,这次与以往发布新产品不同,基于GF104核心架构的GTX460显卡共有两个版本:GTX460 768MB-192bit与GTX460 1GB-256bit。从命名上也可大致能看出来,显存容量以及位宽是区分两个版本的主要因素。在高分辨率开启抗锯齿的情况下比较消耗显存资源,但显存位宽和容量在以往同型号只有容量大小的区别,而位宽的不同大多存在于不同型号之间的差异,并且同比增减核心规格。

  另一方面,从价格上来说,NVIDIA这次也压得足够低。768M版本官方指导价格1299元,1GB版本官方指导价格1499元,无疑给千元级市场扔了一颗重磅炸弹。填补了1200-1600元市场空白,真正替代为NVIDIA撑了太久千元级市场的GTX260。据悉,AMD赶在GTX460发布之前已经将部分千元级产品做了降价处理。那到底是GTX460定价太低还是AMD的HD5000系列定价太高呢?不管怎样,在NVIDIA缺席的这段时间,AMD真的很“嚣张”,竞争的出现对消费者来说无疑是福音。

GTX460规格对比表
 
 规格参数  GTX460(768M) GTX460(1G) GTX465 HD5830
 核心  核心代号  GF104 GF104 GF100 RV870
 工艺制程(nm)  40 40 40 40
 晶体管数(亿)  19.5 19.5 30 21.5
 流处理器(个)  336 336 352 1120
 显存  显存容量(MB)  768 1024 1024 1024
 显存类型  GDDR5 GDDR5 GDDR5 GDDR5
 显存位宽(bit)  192 256 256 256
 频率  核心频率(MHz)  675 675 607 800
 SP频率(MHz)  900 900 802 800
  显存频率(MHz)   3600 3600 3206 4000
 理论值  纹理填充(GT/s)   37.8 37.8 未知 未知
 显存带宽(GB/s)  86.4 115.2 102.6 128
 功耗  外接电源接口 6+6 6+6 6+6 6+6
待机功耗(W) 95 97 112 105
满载功耗(W) 245 258 338 252
 输出  接口 DVIx2
Mini HDMI
 DVIx2
Mini HDMI DVIx2
Mini HDMI DVIx2
DP+HDMI
分辨率(像素) 2*2560 2*2560 2*2560 3*2560
   价格(RMB) 1299 1499  1899 1500(部分调价)


  那我们来看一下,目前千元级别都存在哪些产品,当然关于依然绝唱的上代显卡在这里我们就不列出来了,因为就市场端来看经常缺货抑或根本找不到了。A卡方面,HD5770,HD5830;N卡方面,GTX460GTX465。除了最新上市的GTX460显卡,其余几款很多品牌都做了降价处理。HD5770目前售价899元,HD5830售价1499元,对于A饭来说,这次真的要感谢一下NVIDIA GTX460。而N卡方面,除了今天要发布的GTX460,GTX465不少商家也降至了1899元。为什么刚上市不久就会掉价如此猛烈,相信看完评测部分大家心里都应该有个底了。

  关于架构方面,我想很多朋友和我一样好奇,NVIDIA这次是不是又在GF100的基础上屏蔽几组SM,称为新产品。下面这张图也许能帮助大家直观得了解。GeForce GTX460采用的是GF104显示核心。

  从上面这张图来看,SM的数量少了一半,不过SM的内容数量有所改变。而且有一点我得跟大家交代一下,GF104的核心架构图应该是扁的才对,从后面的PCB上大家也可以看出,GPU的形状呈长方形,且比较小巧。

  下面,我们就来对两者的核心架构进行一下简单的分析。

GF100与GF104核心规格对比:

-CUDA核心方面:GF100具备512个,而GF104具备384个

-GPC(图形处理器集群):GF100具备4个,GF104具备2个,砍半

-Raster Engine(光栅化引擎):GF100具备4个,GF104具备2个,砍半

-SM(流处理器簇):GF100具备16个,GF104具备8个,砍半

-PolyMorph Engine(多形体引擎):GF100具备16个,GF104具备8个,砍半

-纹理单元:GF100具备64个,GF104同样具备64个

-光栅单元:GF100具备48个,GF104具备32个


GF104显示核心

  从上图以及与GF100和GF104核心的对比可以看出,纹理单元保持原有数量不变之外,除了CUDA核心与光栅单元没有对半砍外,其他的均减少了一半。

  GF104与GF100一样,同样舍弃了TPC(Texture Processing Cluster)概念,引入全新的GPC(Graphic Processing Cluster)图形处理器集群概念。GeForce GTX 460中GPC是由4个SM单元和1个Raster Engine引擎所组成,将顶点、几何、光栅、纹理以及像素处理资源进行有机整合。而GTX460与GTX480相同,都没有采用完整的规格,其中一组SM阵列被屏蔽,减少了48个流处理器和八个纹理单元。

  说到这里,我想一些读者应该会与我有相同的想法,难道NVIDIA留了一手?还有传说中的GTX460+出现?如果有,又将是填补哪个价位,哪个产品的空缺呢?不过,这个估计得等一段时间才能揭晓,我们还是来看一下与其有竞争力的几块显卡的规格对比。

  在GTX480评测的时候我们对新架构中做了一个比较详细的介绍。既然都是基于fermi架构而来,自然百变不离其宗。下面,我们就GF104的架构再做一遍温习。

   关键词之Raster Engine和Polymorph Engine

  NVIDIA认为成熟的GT200架构已经无法适应大规模的tessellation计算,决定为DX11产品设计全新的图形架构。而并行化的Raster Engine和Polymorph Engine就是并行处理架构上的关键模块。


  Polymorph Engine运算过程

  顶点拾取、曲面细分、观察口转换、属性设置和流式输出是Polymorph Engine工作的五个阶段。任意阶段的运算都会被发送至一组SM。该SM将执行游戏的着色程序并将计算结果返回至Polymorph Engine的下一个阶段。所有阶段性计算完成之后,结果再传输给Raster Engine。


  Raster Engine运算过程

  每个Polymorph Engine都拥有专属的顶点获取单元以及tessellator,很大得提高了几何性能。另外,四个并行的Raster Engine与之遥相呼应,他们在每个时钟周期内设置最多四个三角形。

关键词之SM阵列

   在GTX460中,一个GPC由两组SM阵列组成,每一组SM阵列具备48个流处理器、一个PolyMorph Engine多形体引擎、16个Store单元、八个SFU单元和8个纹理单元、两个Warp调度器和指令发送器、能配置为48KB Shared Memory+16KB L1缓存或者16KB Shared Memory+48KB L1缓存的共享内存/L1缓存。在AMD统一渲染架构的GPU中,类似SM等级的部件是SIMD Core,例如RV870拥有20个SIMD Core。

关键词之纹理单元

  在GF104中,每个SM配备了8个纹理单元,共计64个。和上一代GT200以及竞争对手Cypress的80个纹理单元相比,与GF100一样,GF104的纹理单元数量不但没有提升,反而下降了,而GeForce GTX4650由于屏蔽了1组SM,实际上只有48个纹理单元,比GTX465多4个。NVIDIA通过将纹理单元移植到SM中的设计来提升纹理单元的使用效率和时钟频率。一个纹理单元在一个时钟周期内能够计算一格纹理地址并获取四个纹理采样,可以支持包括双线性、三线性在内的各项异性过滤模式。

关键词之Shared Memory和L1/L2 cache

 GF100的L1/L2缓存

  在G80和GT200中,每个SM都有16KB的shared memory。而fermi中,每个SM拥有16KB的shared memory,能配置为48KB shared memory+16KB L1 cache或者16KB shared memory+48KB L1 cache的模式。程序员可以自己编写一段小程序,把shared memory 当成cache来使用,由软件负责实现数据的读写和一致性管理。而在fermi架构中,其提供了768KB的一体化L2 cache,L2 cache为左右的Load/Store以及纹理请求提供高速缓存。L2 chche上读取的数据都是连贯的,它实现了GPU高效横跨数据共享,对于那些无法预知数据地址的算法,例如物理结算期、光线追踪以及稀疏矩阵乘法都可以从Fermi的内存设计中获益。

关键词之ROP单元

  GF104包含四个ROP分区,一个ROP分区包括了8个ROP单元,共计32个ROP单元。一格ROP单元能在一个时钟周期内输出一格32位整数像素,理论上,由于ROP的压缩效率和ROP单元数量的提升,GF104在8x抗锯齿下的性能会得到明显改善。我们从GTX480的评测文章中就已经可以看出这一点了,这次GTX4650的评测我们也将在这一点有具体呈现。

为DX11而生的完美GF104

  GF100迟到了近大半年,在这大半年中ATI顶着DX11的皇冠红了。但是从以上的架构的简单分析来看,我更偏向于NVIDIA的全新架构,虽然ATI HD5000系列从高端到低端支持DX11的显卡都已配齐,但是谁都知道,在架构上做削减的HD5000系列低端卡玩起DX11游戏是相当费劲,但还是吸引了不少消费者的眼球。下面我们来看一下DX11显卡所具有的特性:

1. Tessellation:镶嵌式细分曲面技术

2. Multi-Threading:多线程处理

3. DirectCompute 11:计算着色器

4. ShaderModel 5.0:着色器模型5.0版

5. Texture Compression:纹理压缩

不过,由于之前对这些概念都已经嚼过了,今天我们就只拎其中一个比较重要的出来为大家做一下解析。

DX11特性解读之Tessellation

  最初Tessellation这个词眼出现在AMD显卡中,到了DX11时代,为什么大肆宣扬的却是NVIDIA呢?当然,并不是AMD放弃了Tessellation技术,我想NVIDIA抓住了时机这样说会比较公平。NVIDIA在合适的时间,合适的产品对Tessellation做了目前为止最完美的诠释。为什么小编会说在合适的时间?这与AMD显卡芯片一直有此模块却无法施展的原因是相关的。DX11时代,虽然AMD抢占市场半年之久。但是NVIDIA却给我们一个巨大无比的惊喜。DX8/9/10时代,大部分的重点都是侧重在画面渲染这一块,没有侧重在三角形几何图形的处理上面。在过去的这些年中,画面渲染进步了100倍,但是三角形几何图形的处理却仅仅进步了3倍。到了DX11,微软推出这样一个API,所以尽管AMD早先发布半年,但NVIDIA才是真正抢占了DX11市场先机。

   在以前,我们通过一个前端电路控制模块来汇集,获取和对三角形光栅化。在那个几何运算并不复杂的时代,像这种固定的流水线操作可以达到几何运算性能,并不会因为并行核心的增删而改变。随着几何运算的复杂性逐步增加,DX11引入了Tessellation,NVIDIA认为成熟的GT200架构已经无法适应大规模的Tessellation计算,所以GF100全新架构的诞生也就势在必行。而并行化的Raster Engine和PolyMorph Engine就是并行处理架构上的关键模块。可扩展的PolyMorph Engine能实现较高的三角形速率,每个PolyMorph Engine均拥有专属的顶点获取单元以及Tessellator,很好的提升了几何性能。与之呼应的是四个并行的Raster Engine,它们能在每个时钟周期内设置最多四个三角形,并且在三角形获取,曲面细分以及光栅操作方面具备很强的性能。

Tessellation实现原理(整合于网络)

  Tessellation技术是一种能够在图形芯片内部自动创造顶点,使模型细化,从而获得更好画面效果的技术。Tessellation能自动创造出数百倍与原始模型的顶点,这些不是虚拟的顶点,而是实实在在的顶点,效果是等同于建模的时候直接设计出来的。  

 Tessellation技术是完全可编程的,它提供了多种插值顶点位置的方法来创造各种曲面:

1. N-Patch曲面,就是和当年TruForm技术一样,根据基础三角形顶点的法线决定曲面;

2. 贝塞尔曲面,根据贝塞尔曲线的公式计算顶点的位置;

3. B-Spline、NURBs、NUBs曲线(这三种曲线均为CAD领域常用曲线,在Maya中均有相应工具可以生成)

4. 通过递归算法接近Catmull-Clark极限曲面。

 特色技术之3D Vision Surround

  3D的发展是一个必然的趋势,着各种3D产品的出炉,我们的下一台相机,下一台电脑,下一台电视机是否真会选择3D?答案是肯定的,因为近两年内我暂且不会更换这些装备。两年后的3D市场相信已经普及了不少,价格方面也略有竞争优势了。

 说到3D vision surround,我不得不提到NVIDIA提供的最新258.80驱动,已经可以完美支持3D立体幻境,可以享受一些3D游戏带来的视觉享受。

 3D装备

  3D vision surround对硬件的要求:三台具备120Hz刷新率的显示器+NVIDIA 3D立体环境+SLI系统+Dual Link标准的DVI线缆。

 特色技术之光线追踪

  光线追踪其实并不是什么新技术,只是由于门槛过高,民用级显卡还无法驾驭它。光线追踪是一项可以大幅增加场面真实感的渲染技术,能够利用计算机构建出以假乱真的视觉画面。我们可以简单得这样认为:光线追踪直接操控屏幕的背光,让每个像素都对应真实场景的光反射。如果从人眼的角度来看,光线追踪与真实视觉的远离相同,区别仅在于真实视觉系统中,光线的数量可以分解为无穷大,但是在计算机的视觉系统中,光线的数量是有限的,只不过当光线的数量达到一定临界点时,人眼就无法再加以区分。

 GF100图形架构为光线追踪作了特别的优化,由于其在硬件上支持循环操作,即与光线追踪的工作轨迹同步,L1/L2缓存也提供了效率和带宽。

  当然,除了这些最新的专属于Fermi架构的特色技术外,GF104在老特色技术上的表现也是非常优秀的。比如PhysX以及SLI。下面我们就来看一睹真卡面容。

   这次参加我们测试的是索泰GTX460-1GD5极速版显卡,下面我们就来看一下GeForce GTX460显卡整体外观介绍。

  输出部分,GeForce GTX460显卡与GTX465/470/480相同,依然仅支持双头输出,虽然设计了三路数字输出,但最高仅支持两个2560x1600的分辨率。由于挡板空间原因,将HDMI设置为mini型,它需要占据DVI的一个通道。HDMI虽然可以通过DVI转接而来,但无法支持立体显示,因此原生Mini HDMI是一个必备接口。

  散热部分,GTX460没有延续GTX480/470/465三位大哥的涡轮式散热,而是采用了简单的抽气式(封闭式)散热。小风扇吸入“冷空气”,冷却两根散导热铜管与散热片,盖上盖子,热风从挡板处散出。

  公版卡并没有在散热器上加入过多元素,而且设计与前三位大哥相比真的是小巫见大巫,但是根据我们的测试,核心温度却得到了很好的控制,待机时核心温度仅仅只有31摄氏度。更详尽的数据请大家参照文章后面的评测。

  GeForce GTX460显卡细节介绍

暴力拆解之后,PCB版完全裸露在我们面前,下面我们就来细细看一下具体的布局


GeForce GTX460显卡PCB部分

  从PCB可以看出,GTX460与前三位师兄一样,并没有像GT200一样将专门将2D输出模块单独分离出来设计成一颗NVIO芯片。


GeForce GTX460显卡 核心部分

  GeForce GTX46显卡0的核心代号是GF104-325,A1版本。我想经常关注显示核心的朋友可以发现,GF104的形状与以往不太一样,略偏长方形,而之前的一些GPU大部分都是正方形。其内置336个流处理器(即CUDA物理核心),同时拥有56个纹理单元,技术特性方面,其完全支持GTX480/470/465所拥有的NVIDIA CUDA、PhysX物理加速、3D显示与3D眼镜支持以及PureVideo高清硬件加速技术。

  显存方面,是GeForce GTX460显卡区分两个版本的重要元素,前面开场的时候也已经给大家介绍了这块显卡有两个版本,但是本次我们只收到了1GB版本,所以对于768M版本的相关信息只能给一个大概的数据。

  768M版本的GTX460显卡同样采用三星0.5ns的GDDR5显存颗粒,6颗显存颗粒构成768MB/192Bit的显存规格,显存带宽为86.4GB/s,核心显存频率为公版的675/3600MHz。1GB版本规格为1024MB/256Bit,显存带宽为115.2GB/s,核心显存频率为675/3600MHz,其性能表现超过了GTX460 768MB 30%。

  另外有一点还得在这里给大家透露一下,一些厂商在出厂时已经将频率调到了800/4000MHz的高频。^_^

  供电部分,由于GTX460显卡的功耗大大降低,所以两个版本均采用3+1的核心+显存的供电方式。功耗测试数据也请大家关注后面的评测。

  GeForce GTX460显卡的外接供电部分

  此外,这块显卡还配备了双6pin的外接供电接口。虽然PCI-E 2.0接口最大可以提供200W以上的功率,但是其兼容性并不是很好,有些显卡功耗不高但没有插上外接供电可能会出现机器点不亮的情况,所以双pin输出的方案还是比较周到的。

  我们拿到的这块索泰GTX465显卡在输出部分安装了DVI屏蔽罩,有效阻挡外界杂乱信号的干扰。相信其他品牌也采用了这个解决方案。

测试平台及测试流程简介:

测试平台
CPU类型 Intel Core i7920
主板 Foxconn X58 BloodRage(网购最低价 2659元)
 
内存 Kingtiger DDR3 1333 FlameEdition 1GB×3
显卡 Geforce GTX460 1GB
Geforce GTX460 768MB
AMD Radeon HD5830
ADM Radeon HD585
Geforce GTX465
Geforce GTX470
 
硬盘 Seagate Barracuda 7200 .10 .320GB.SATA
散热器 超频三南海三
 
电源 长城巨龙1250


性能实测环节,为了避免系统性能造成瓶颈,我们搭建了非常强悍的测试平台,选用Intel新一代的 Core i7 920处理器,采用原生4核设计,默认频率高达2.66GHz,集成 8MB L3缓存,支持超线程技术,集成内存控制器,支持先进的3通道内存技术。


处理器截图

主板选用富士康顶级X58 BloodRage与金泰克速虎 DDR3-1333内存搭配,不过不超频的话,I7 920该处理器最高只支持到DDR3 1066规格。


主板信息截图

电源方面我们选择了长城最新推出的巨龙1250电源,其额定功率高达1250W,即使应付多款顶级显卡互联也不成问题。


Intel Core i7 920                         Foxconn X58 Blood Rage


长城巨龙1250                               超频三南海3


理论性能测试:3DMarkVantage 

  Futuremark司最新发布的Benchmark工具,全新的引擎在DX10特效方面和《孤岛危机》不相上下,大量使用128Bit浮点精度HDR光照 、视差映射贴图、高精度纹理贴图和次表面散射等 异常消耗显卡资源的特效导致Vantage对显卡的要求空前高涨。

  3DMark Vantage中直接内置了四种模式,分别为Extreme(旗舰级)、High(高端级) 、Performance(性能级)和Entry(入门级),测试中默认打开Physx物理引擎。

DX11性能测试:Unigine Heaven Benchmark 2.1

   《Heaven Benchmark 2.0》是由俄罗斯Unigine游戏公司开发设计的一款Benchmark程序,该程序是由Unigine公司自主研发的游戏引擎设计,其支持DirectX 9、DirectX 10、DirectX 11与OpenGL 3.2 API,通过26个场景的测试最终得出显卡的实际效能。

  测试设置:开启DX11特效,开启4XAA抗锯齿/16XAF异向过滤,测试1920X1200分辨率下的游戏性能。

DX11性能测试:StoneGiant(石巨人)

游戏引擎开发商BitSquid和游戏开发商Fatshark为PC游戏爱好者准备了一款用于检验GPU之DX11能力的技术演示程序,名为“StoneGiant”,该demo内建对DX11及曲面细分特性的支持。

   测试设置:开启DX11特效,开启4XAA抗锯齿/16XAF异向过滤,测试1920X1200分辨率下的游戏性能。

DX11游戏测试:Dirt2(科林麦克雷拉力2)

   《科林麦克雷:尘埃2》使用Codemasters自行开发的EGO游戏引擎,随着引擎效能的大幅提升,游戏画面品质也有显著的进步,在呈现画面效果的同时,还能即时模拟空气的运动,使得急驰车辆即时产生的气流将影响树木、旗帜、甚至车辆本身等所有物件。

  光线效果、车辆模组品质等也因为引擎而有优异的表现,不仅车辆的精确度与精细度超乎想像,光线与粒子效果、环境与伤害模组让游戏场面更壮观,出色的夜间景象充份展现光线系统的优异;此外,所有物体都有超高解析度的即时柔和阴影,对光线明暗变化模拟得非常细腻,即使连车后激起的尘土效果也很真实,提供玩家更丰富的游戏体验。

  测试设置:DX11模式下将各项画质的设置都为最高,开启4XAA抗锯齿/16XAF异向过滤,测试1920X1200分辨率下的游戏性能。

  测试方法:使用Benchmark Demo测试多次并取平均值。

DX11游戏测试:Metro 2033《地铁2033》

   《地铁2033》是一部以俄罗斯著名作家Dmitriy Glukhovskiy同名小说改编,游戏类型类似于《潜行者》、《辐射3》及《上古卷轴4》。不在于激烈战斗而在于生存的FPS+RPG独特游戏方式。

  该游戏的核心引擎是号称自主全新研发的4A Engine,支持当今几乎所有画质技术,比如高分辨率纹理、GPU PhysX物理加速、硬件曲面细分、形态学抗锯齿(MLAA)、并行计算景深、屏幕环境光遮蔽(SSAO)、次表面散射、视差贴图、物体动态模糊等等。

  测试设置:DX11游戏模式下将各项画质的设置都为high,开启4XAA抗锯齿/16XAF异向过滤,测试1920X1200分辨率下的游戏性能。

  测试方法:使用Benchmark Demo测试多次并取平均值。

 

 DX11游戏测试:Aliens.vs.Predator

   异形大战铁血战士是一款全新的PC和次世代游戏机上的作品,由备受好评,并获得1999年原创PC游戏大奖的英国开发组Rebellion开发。AVP为FPS游戏迷们带来了3个了不起的单人剧情,2个最受欢迎科幻角色之间的1场史诗之战,以及无法估量的“3方对战”的多人游戏内容。在Freya’s Prospect的可怕殖民地,以及充满杀机的丛林和沼泽中,你必须努力求存,并尽力猎杀敌人,这会给你决然不同、毛骨悚然的第一人称游戏体验。

   测试设置:DX11游戏模式下将各项画质的设置都为high,开启4XAA抗锯齿/16XAF异向过滤,测试1920X1200分辨率下的游戏性能。

  测试方法:使用Benchmark Demo测试多次并取平均值。

 DX11游戏测试:S.T.A.L.K.E.R: Call of Pripyat

   故事展开在潜行者:切尔诺贝利的阴影结束后的不久,俄国政府决定举行大规模号称“航道”的军事行动,探索通往变异区中心的大路,旨在将CNPP控制于股掌之中。 根据行动计划,第一个小队将被派遣对整个变异区进行空中侦察,标绘出各变异点位置的详细布局。

  《S.T.A.L.K.E.R: Call of Pripyat》采用GSC的X-Ray图形引擎开发,并且支持DirectX 11,应用了Tessellation渲染NPC的细节并一定程度运用了Direct Compute。

  测试设置:DX11游戏模式下将各项画质的设置都为high,开启4XAA抗锯齿/16XAF异向过滤,测试1920X1200分辨率下的游戏性能。

  测试方法:使用Benchmark Demo测试多次并取平均值。

DX11游戏测试:Battlefield:Bad Company 2

  《战地:叛逆连队2》(Battlefield: Bad Company 2),是EA DICE开发的一款第一人称射击游戏。游戏使用加强版的寒霜引擎,细节画质有一些提高,优化工作更加完善,程序漏洞有所减少。PC版游戏会引入Direct3D 10和DirectX 11的部分技术。由于游戏并非真正基于DirectX 11后端开发,PC版游戏的画面效果与普通DirectX 9游戏并没有明显差别,但得益于DirectX 11,游戏的运作效率则有所提高,系统资源得以节约。

   可彻底破坏掉的房屋破坏效果方面,游戏引入了Havok物理引擎的Destruction 2.0系统,可破坏的物件也由前作的92%上升到99%。而在《战地:叛逆连队2》中,破坏可进行得更为彻底,能做到真正的“夷为平地”。

  测试设置:DX11游戏模式下将各项画质的设置都为high,开启4XAA抗锯齿/16XAF异向过滤,测试1920X1200分辨率下的游戏性能。

  测试方法:使用fraps测试固定场景,反复测试三次后去平均值。

DX10.1游戏性能测试:Tom Clancy's HAWX (汤姆克兰西之鹰击长空)

  作为育碧旗下首款飞行模拟大作,Hawx吸收了NAMCO的空战游戏《皇牌空战6:解放的战火》(Ace Combat 6: Fires of Liberation)的不少优点。本作将更重视爽快度,而不是真实度。

   游戏特色之一是ERS系统(Enhanced Reality System,高真实系统),ERS的全部功能包括显示雷达,开启导弹报警系统、自动修正系统、伤害控制系统、战术地图、信息中继系统、武器轨道修正系统,并且可以控制一队AI僚机。ERS系统可以给菜鸟提供帮助,随着游戏难度的提高,ERS系统会逐步关闭。

  H.A.W.X.中有超过50种飞机。和彩虹六号一样,支持最多4人的coop模式一起打战役,同时支持最多16人同时联机的对抗模式,玩家可以在达到一定经验值后获得解锁武器。

  测试设置:DX10.1游戏模式下将各项画质的设置都为high,开启4XAA抗锯齿/16XAF异向过滤 SSOA设置为High 测试1920X1200分辨率下的游戏性能

 测试方法:游戏自带了Benchmark工具,借助其我们可以很方便地测试多次并取平均值。

DX10游戏测试:《Crysis-Warhead》

  如果单从技术的角度上来说,Crysis-Warhead游戏画面达到了当前PC系统所能承受的极限,超越了次世代平台和之前所有的PC游戏。从不少玩家为了体验这款游戏不惜血本而升级显卡的行为就可以看出这款作品的魅力。

   《Crysis-Warhead》由德国Creytek采用CryENGINE2引擎开发,支持DirectX 10、HDR、物理处理等技术,可展现动态日夜光影循环、全交互可破坏式环境、阳光透射与漫射、实时软阴影、软粒子、高级着色等效果。该游戏大大改良了场景逼真性,以高分辨率进行游戏可以完全让人身临其境。

  测试设置:DX10游戏模式下将各项画质的设置都为high,开启4XAA抗锯齿,测试1920X1200分辨率下的游戏性能。

  测试方法:借助Benchmark工具我们可以很方便地测试多次并取平均值。

DX10游戏性能测试:FarCry2

   Crytek与EA合作后连续推出两款CRYSIS系列作品,而得到《Far Cry》版权的育碧从2004年至现在却一直无续作推出。育碧自然不甘心将手中的王牌白白搁置,于是决定将二代的制作任务交给了《Far Cry》主机版本的制作方育碧蒙特利尔工作室。尽管这款游戏仍然叫作《孤岛惊魂》,育碧蒙特利尔工作室决定将前作科幻的色彩彻底抛弃,打造一款风格迥异,更加真实的游戏。

   《Far Cry 2》采用顶级的Dunia引擎,呈现出爆破与燃烧等的惊人特效、实时的日夜时间运转、动态的音乐系统,以及真人反应般的敌人人工智能,尤其是游戏角色可以和周围环境发生互动,游戏中大部分的游戏环境都会被改变,或者说被破坏。草地可以被火焰喷射器夷为荒地,树木可以被手榴弹炸得连根拔起,甚至炸飞。这种损坏将会在游戏世界中持续下去,除非新的植被长出,进而取代它们。玩家可以在其中体验到枯木逢春和野火烧不尽,春风吹又生等等四季变化。

  测试设置:DX10游戏模式下将各项画质的设置都为high,开启4XAA抗锯齿,测试1920X1200分辨率下的游戏性能。

  测试方法:游戏安装文件夹中自带了Benchmark工具,借助其我们可以很方便地测试多次并取平均值。

 DX9.0C游戏测试:Call Of Duty 6

   时隔两年后,《使命召唤6:现代战争2》 再次降临到玩家的面前,这次,它被无数人称作“神作”!的确,以本作的素质,定必再次稳稳地巩固它在战争射击游戏领域的霸主地位!

   现代战争2除了无比优秀的游戏性之外,画面也非常出色,从冰天雪地的高山到连地面都充满热浪的赤道国家每个细节都能让人惊叹。你将在一连串的可怕阴谋中,揪出出乎意料的幕后黑手。一进入游戏,你就能够完全置身于好莱坞般大制作的战争电影里……

  测试设置:DX10游戏模式下将各项画质的设置都为high,开启4XAA,测试1920X1200分辨率下的游戏性能。

  测试方法:借助Frps软件其我们可以很方便地测试多次并取平均值。

DX9.0C游戏测试:Super Street Fighter IV

   《超级街头霸王4》是以《街头霸王4》为基础,加强内容并调整了平衡性的强化版。游戏角色方面加入了《街头霸王2》中大家熟悉的墨西哥飞鹰等经典角色之外,也有使用踢技为主的新女性角色Juri。游戏的系统并没有进行大幅的修改,不过本次为每个角色都至少新增了一个新的UC必杀技,使得战斗更加充满变数。

   Capcom将街霸4代精美的游戏画面、优秀的操作手感、出色的打击感全盘移植到PC平台,在游戏引擎方面也进行了大幅优化,除了提供更高规格解析度画面输出,新增加的“水彩”、“海报”和“烟灰墨”三种渲染风格也为追求个性的玩家提供了更多选择。游戏还对应Game for Windows Live功能,支持在线对战、游戏内短信互动和即时语音聊天功能,这无疑进一步增加了游戏的互动性。

  测试设置:DX10游戏模式下将各项画质的设置都为high,开启4XAA抗锯齿及16XAF异向过滤,测试1920X1200分辨率下的游戏性能。

  测试方法:借助Benchmark工具我们可以很方便地测试多次并取平均值。

 Physx游戏测试:Batman: Arkham Asylum

   由Rocksteady Sudios开发,Eidos发行的《蝙蝠侠:阿卡姆疯人院(Batman: Arkham Asylum )》是根据Grant Morrison同名漫画改编,堪称蝙蝠侠历代最黑暗的一作。

   游戏于2009年在PC、PS3和Xbox360平台发售。阿卡姆疯人院(Arkham Asylum)里关的都是蝙蝠侠亲手逮捕的罪犯。某天,以小丑(Joker)为首的病人们声称觉得“无聊”,所以劫持了医护人员,要求蝙蝠侠前去陪他们“ 游戏”。这场疯狂的迷藏中,占尽优势的是反派们,蝙蝠侠不仅要提防杀气腾腾的各个患者,同时他自己的精神状态也处于失常的边缘。

  测试设置:游戏细节全部设置为高,开启Physx物理加速,禁用垂直同步,测试1920X1200分辨率下的游戏性能。

  测试方法:使用经典的FRPS测试软件,选择游戏开场的固定场景,测试多次并取平均值。

 Physx游戏测试:MKZ军魂

  FPS网游《MKZ》中文名称为MKZ军魂,是目标软件研发、175平台运营的一款第一人称在线射击游戏。游戏以2010~2020年全球范围内的恐慌及军事冲突为主要背景,以现实世界观为基础,现代高科技战争题材为切入点,配合写实的美术风格、真实的物理系统、专业化的武器装备、特色的载具系统以及独特的领土争夺系统和大量的网络化元素。

  游戏场景光照采用了光照图与实时光照结合的方式来表达,提供更真实的光照效果。游戏高端支持HDR光照效果,在低端系统支持Glow效果,以提供细腻的光照范围表现。游戏支持实时阴影效果,并提供高级与低级两种,以便客户端在品质与性能有更多的选择。灵活高效的骨骼动画系统,能够实现同一角色的多动作融合,支持软硬件加速顶点变换以及静态模型的geometry instancing。

  游戏内嵌美国Ageia公司的PhysX物理引擎,拥有强大的物理表现能力,游戏场景中会出现大量的可破坏物体,甚至包括整栋楼房的倒塌特效。另外还有高级的布料效果、互动植物、以及Rag doll死亡特效等。玩家可以利用其物理特性对敌方造成伤害(类如:高空坠落物体砸伤、物体物理破片飞溅伤害等)。并且可以提供真实的车辆模拟系统。在插有物理卡系统中可自动充分利用硬件来加速物理运算,以便达到更复杂的物理表现效果。

GPU通用机算-Media Coder NT for CUDA

   MediaCoder是一个免费的通用影音转码工具,它将众多来自开源社区的优秀音频视频编解码器和工具进行整合,让用户可以自由地转换音频和视频文件,可满足各种场合下的转码需求。

  我们选取一段1.6GB大小的1080P H.264格式高清短片进行转码测试,N卡默认打开了CUDA加速。

   CUDA加速的作用非常明显,转码时间减少将近一半,对于经常进行视频转换的玩家来说,GTX460是不错的选择之一。

   在温度测试中,首先会在系统运行Fumark + GPU-Z程序烤机模式,连续运行20分钟以上待峰值温度恒定后,通过温度监控软件记录恒定后温度,同理在待机状态下记录待机平均温度。

温度测试平台采用整机密闭环境测试,室温在20度恒温。

   显卡满载测试过程,我们用Vista Aero桌面待机和运行Furmark v1.6.5软件开启极端折磨模式测试GPU的运行温度,测试环境为裸机状态,室内环境温度为25度。

待机温度36度

满载温度72度

  GTX460显卡的发热显然已经降到了正常范围,满载核心温度不超过80度,摆脱了高发热的帽子,玩家可以放心地使用GTX460渡过这个炎热夏天,小幅超频也不用担心散热问题。

   测试仪器为变电家 Power Monitor,测试仪记录了实际功耗值,请注意这个成绩指的是整机功耗,包括CPU、主板、内存、硬盘、显卡、电源以及线路损耗在内的主机总功率,而不是独立的显卡功耗。由于平台一致,所以数据是具有参考价值的。

   成绩分两种模式获得,一个是在操作系统待机15分钟,另外一个是同时运行Furmark拷机软件,让显卡在高负荷下运行,记录稳定时的功率。

   Fermi系列显卡高功耗、高发热的问题一直为人诟病,这也是近期困扰NVIDIA的最大难题,全新的GF104核心显然已经解决了这个问题,从我们的测试结果来看,其功耗与对手HD5830保持在同一水平,待机功耗甚至还要低于对手NVIDIA官方宣称的150W TDP基本符实。

  如此一来GTX465的定位就相当尴尬,性能与GTX460接近,功耗又凭空高出100多W,如果NVIDIA不采取大幅降价促销的手段,相信GTX465在今后的一段时间内都会乏人问津。

   如此低的功耗和发热,GF104核心GTX460显卡的超频性能一直为玩家所期待,下面就让我们一起来进行简单的超频测试。

   超频部分选用经典的微星AfterBurner软件,由于未及时更新的缘故,目前最新的1.60版并不支持核心电压调节,另外NVIDIA也暂时未开放 GeForce GTX 400系列的核心、Shader频率非1:2比例,所以超频过程中为1:2等比超频,这在一定程度上限制了我们的手脚。

   此次超频过程相当顺利,核心频率直接拉升至845MHz,Shader频率随之提升至1690MHz,令人惊喜的是:显存频率也可以轻易从3600MHz超频至4452MHz,并未出现之前GTX470/GTX465那样显存超频能力极差的尴尬。

默认成绩:P15040(GPU:12420)

超频成绩:P18590(GPU:12420)

  通过我们的超频前后的性能对比,诸位网友一定对GTX460强悍的超频能力留下了深刻印象,显卡频率轻松突破845/1690/4452MHz,超频幅度超过20%,此时游戏性能已经超越GTX470。如果进行加压超频的话,相信还有很大的潜力可以发掘。

  总结:N卡史上最超值的千元显卡

  世界杯结束了,斗牛士如愿拿到了大力神杯,橙色军团依然保持了“无冕之王”的头衔,而各方面都比较出色的德国战车蝉联季军。对于GTX460的评测也差不多结束了,给这篇文章起一个什么样的名字才能将GTX460所有的特点全部阐述出来呢?貌似很难!因为GTX460显卡集成了太多我们想要的东西:功耗降下来了,GPU温度得到了控制,价格能接受了,性能秒杀竞争对手,超强的超频性能还具备NVIDIA的最新的创新技术……

  够了!真的够了!AMD已经慌了,所以才有HD5770和HD5830调价的措施。不过,是AMD原先你的价格就定得太高还是……做过多讨论也并无意义。GTX460的出现就像一枚重磅炸弹,逼得千元级显卡市场必须得重新洗牌。这必定是经典且充满口水的一幕,GTX460的发布策略以及对手的调价现象一定会在今后的日子被大家津津乐道。这也是消费者想看到的,NVIDIA这次从任何方面都没有令我们失望。也不能再让我们失望了……

 性能总结:

  GTX460作为2010年最具有看点的产品,其强悍的性能表现显然已经出于大多数人的预料,秒杀HD5830并不算意外,令大家大跌眼镜的是GTX460 1GB版居然超越了“同门师兄”GTX465,这显然让功耗、价格都高出不少的GTX465颜面扫地。

  是为了弥补GTX260+停产后带来的市场空白,也为了区分不同的产品定位,NVIDIA将GTX460分为1GB与768MB两种版本,相应的显存位宽也有所调整,事实证明该策略是相当成成功的,两者无论从价格还是性能方面都对HD5830造成了夹击态势,也对HD5850、HD5770造成了一定冲击,AMD看似完整的DX11显卡产品布局显然已被打乱。

  当然值得一提的是NVIDIA为GTX460预留了十分可观的超频空间,核心突破850MHz已经不算稀奇,而在此频率下,GTX460已经拥有了叫板GTX470以及HD5850的实力,仅用不到一千伍佰元就能享受到如此强悍性能,相信诸位玩家就算做梦也会笑吧,已有厂商同步推出了非公版超频版,对于不善于超频的普通玩家来说,这无疑拥有更大的吸引力。

  GTX460的确最近半年最适合选择的游戏显卡,轻松应付主流3D游戏,就算开启全部特效以及AA抗锯齿也不在话下,当然较低的功耗、发热也让我们可以安心,舒心地使用这款产品。

  继承了Fermi所有优点,抛弃了高功耗、高发热之后的GF104核心如此强大,我们不得不感叹NVIDIA强大的研发实力,也证明了NVIDIA新一代Fermi架构有多么优秀,并且GTX460所使用的GF104核心并非是完整规格,最后我们期待384个CUDA核心版GF104显卡的上市,这必将是NVIIDA搅乱中高端显卡市场的终极武器。