一、前言 2007年5月15日,被AMD并购后的AMD-ATI,终于向世人发布其首款支持DirectX 10的显卡——Radeon HD 2900XT, 也就是我们通常所说的R600。较其竞争对手NVIDIA的首款DirectX 10显卡——GeForce 8800GTX,刚好晚了半年。 AMD-ATI Radeon HD 2900XT显卡终于摆脱传统“管线”概念的束缚,采用更为高效的统一超标量着色架构(Unified Superscalar Shader Architecture),内置高达320个流处理器单元(stream processing units),全面支持Microsoft DirectX 10.0和Shader Model 4.0,能同时兼容DirectX 10、DirectX 9以及OpenGL等引擎开发的3D游戏。 AMD-ATI Radeon HD 2900XT,研发代号为R600,采用目前最先进的80nm GPU制造工艺打造,GPU核心内置了高达7亿个电子晶体管,核心频率高达740MHz,搭配了高速的GDDR3显存颗粒,显存频率运行在1650MHz。
更值得大家关注的是,Radeon HD 2900XT是目前业界首款拥有512Bit海量显存位宽的DirectX 10显卡,显存带宽达到史无前例的106GB/sec,大幅超越NVIDIA上代旗舰GeForce 8800GTX的86.4GB/sec,稍稍领先NVIDIA不久前发布的GeForce 8800Ultra的103.68GB/sec。
随着高清晰视频的不断普及,人们除了关心新一代DirectX 10显卡的3D游戏性能外,它们更趋向于关注图形加速卡在视频回放、视频输出的表现能力。而Radeon HD 2900XT虽说是一款专为3D游戏而打造的高性能显卡,但它其板载的5.1声道Full HD Audio,令用户能更轻松的组建起自己的HTPC(Home Theater Personal Computer)。 如今,统一超标量着色架构(Unified Superscalar Shader Architecture)的R600已经来到我们PConline评测室面前,其领先业界、怪兽级的架构规格,到底能给我们带来多大的惊喜呢?本文将为大家一一揭晓,首先,让我们带大家去深入地了解了解Radeon HD 2900XT(R600)的核心架构。 ATI Radeon HD 2900XT 图 库 评 测 论 坛 购买地点 二、80nm核心工艺制程打造,内建7亿个晶体管,率先采用512Bit显存带宽
AMD-ATI Radeon HD 2900XT,研发代号为R600,采用目前最先进的80nm GPU制造工艺打造,GPU核心内置了高达7亿个电子晶体管,核心频率高达740MHz,搭配了高速的GDDR3显存颗粒,显存频率运行在1650MHz,更惊人的是,Radeon HD 2900XT 核心搭载了512Bit的海量显存位宽,显存带宽达到史无前例的106GB/sec,大幅超强NVIDIA的上代旗舰GeForce 8800GTX的86.4GB/sec,稍稍领先于目前NVIDIA不久前发布的GeForce 8800Ultra的103.68GB/sec。
Radeon HD 2900XT作为目前业界的首款配备512Bit显存位宽的顶级显卡,更高的显存位宽,就能更好的适应日后日益变态的DirectX 10 3D游戏发展,同时为能应付更高精度的HDR渲染特效作出更好的铺垫。
Radeon HD 2900XT显卡同时还内置了在Radeon X1950Pro(RV570)时代加入Native CrossFire Composing Engine(原生交火合成引擎),彻底抛弃了臃肿的数据链接电缆,它通用了在显卡顶部的两条桥接其来进行显卡数据的双向传输,简化了设备的安装,同时,也实现无需主卡的交叉火力束缚,用户组建交叉火力系统也无不再有主附卡的困扰。而且,Radeon HD 2900XT支持非对称式的交叉火力互联,用户无需放弃旧有的Radeon X1900系列显卡,在日后驱动加入该功能的支持后,旧有的Radeon X1900系列将可继续服役,充当物理加速卡的功能,其3D物理加速功能将使3D游戏效果得到更真实的提升。 三、迈入DirectX10时代,统一超标量着色架构的Radeon HD 2900XT架构详解 得益于80nm核心工艺制程的帮助,Radeon HD 2900XT显卡终于摆脱传统“管线”概念的束缚,采用更为高效的统一超标量着色架构(Unified Superscalar Shader Architecture),内置了高达320个流处理器单元(stream processing units),全面支持Microsoft DirectX 10.0和Shader Model 4.0,能同时兼容DirectX 10和DirectX 9 与OpenGL等引擎开发的3D游戏。下面是有关Radeon HD 2900XT显卡的核心架构体系图。 DirectX 10最大的革新就是统一渲染架构(Unified Shader Architecture)。目前的GPU架构还是沿用的分离式渲染架构,此前NVIDIA的G71和ATI的R580都是采用这样的架构,顶点渲染和像素渲染各自独立进行,而且一旦当架构确定下来,顶点和像素shader单元的比例就会固定下来。不过分离式渲染架构设计更为简便而且经验丰富,例如NVIDIA的NV40发成到后来的G70/G71,又或者是R420到R580,性能都得到显而易见的提升。 微软认为这种分离渲染架构不够灵活,不同的GPU,其像素渲染单元和顶点渲染单元的比例不一样,大大限制了开发人员自由发挥的空间。不同的应用程序和游戏对像素渲染和顶点渲染的需求不一样,导致GPU的运算资源得不到充分利用。微软在DirectX 10中提出了统一渲染架构,在通用和独立的shader单元中可以执行不同的shader程序,包括vertex、pixel和在DirectX 10中首次提出的geomery shader。而且随着这些通用独立的shader单元功能的不断完善,日后有望执行更多的shader程序,例如物理效果。 Shader Modle 4.0无论是vertex还是pixel指令,最大指令长度相当于Shader Modle 3.0的128倍(64K),越长越复杂的指令可以产生越真实的画面,Shader Modle 4.0的寄存器也激增到4096个,Constant寄存器采用16×4096阵列。input寄存器采用16/32规格等,上述指标都比以前的DirectX有明显的改进。Shader Modle 4.0允许程序员在渲染物体时使用128个纹理,而DirectX 9只提供4/16规格,更多的纹理意味着物体表面精度更真实,游戏开发者拥有更广泛的选择。 Radeon HD 2900XT显卡,具备320个流处理单元,可实现对顶点、几何和像素着色操作的动态负载平衡和资源分配,同时其通用的指令集和纹理单元访问,可支持目前所有类型的着色器;其核心每时钟周期可完成高达80次的纹理拾取;每像素高达128个纹理,同时Radeon HD 2900XT采用了全面结合的多层纹理缓存设计,支持DXTC 和 3Dc+ 纹理压缩;支持高分辨率纹理,最高可支持8192 x 8192分辨率的纹理显示;支持无失真的Z和模块压缩,比率高达 128:1,无失真的颜色压缩可达 8:1,8 个渲染目标 (MRT),并支持抗锯齿,支持物理加速处理。 除了加入更高效的超标量统一着色架构外,Radeon HD 2900XT还继续提升显卡的AA(全屏抗锯齿)的效能与效果。下述是Radeon HD 2900XT显卡所具备的三种不同的全屏抗锯齿模式,它们分别是:Box Filter,Narrow Tent Filter和Wide Tent Filter模式。另外,但两张Radeon HD 2900XT显卡组建成交叉火力系统后,能实现最高24x的滤镜抗锯齿 (CFAA)和128位浮点精度的HDR纹理过滤,让玩家在游戏中获得最完美的画质体验。 四、Radeon HD 2900XT内建音频芯片,用HDMI组建家庭影院变得更简单 HDCP的全称是High-bandwidth Digital Content Protection,也就是“高带宽数字内容保护”。简单的说,HDCP就是要将通过DVI接口传递的数字信号进行加密,多媒体内容的发出端(电脑、DVD、机顶盒等)与接受端(显示器、电视机、投影机等)之间加上一道保护。这样一层保护主要并不是用来防止通过数字信号进行不合法的复制,而是将数字信号内容进行加密,使得不合法的复制无法无法得到准确的内容、满意的效果。 其实早在Radeon X1000系列,AMD-ATI的中端产品就已经加入了HDCP的支持,但基于生产成本的考虑,基本上也只有千元级别的中端产品才提供HDCP的支持,而随着高清晰视频影碟的发展趋势,如今全系列Radeon HD 2000显卡均在GPU的芯片中整合了HDCP数字保护的支持。 另外,由于HDMI接口的在家电影院中的不断普及,也就是我们在购买液晶电视中经常会被提到的“一线通”功能,HDMI接口的好处除了带宽上比DVI接口稍大外,更重要的是该接口能同时传输视频信号和音频信号,进一步简化与显示、音频输出设备的连接。 目前市面上绝大部分的HDMI显卡显卡均不具备音效芯片,需通过光纤等连接线将主板的音频信号输送至HDMI显卡,而此时主板I/O的光纤输出口将被屏蔽。 如果要保证主板I/O的光纤接口的正常输出,那么你就不得不考虑购买一张独立的声卡来辅助HDMI显卡音频输出。 根据相关的官方资料可知,全系列Radeon HD 2000显卡均具备一个5.1声道Full HD声卡,无需调用主板上的音效芯片,仅需一个小小的DVI TO HDMI转接器,完美实现真正的HDMI“一线通”功能。
不过Radeon HD 2900XT 并没有加入UVD功能的支持,无法实现H.264/AVC、VC-1、DivX 和 MPEG-2 等高清晰视频的硬件解码功能,只能实现硬件级的辅助加速功能,这一点与NVIDIA G80类似。然而,即将在6月中旬发布的Radeon HD 2600和HD 2400系列显卡,将正式加入UVD的硬件高清视频的解码功能,据相关资料显示,其效能要比NVIDIA的PureVideo HD更胜一筹,有关UVD技术的详细介绍,我们将在一篇独立的文章为大家详细介绍,敬请留意。 五、关于Radeon HD 2900XT显卡的系统电源的需求 我们都知道,nVIDIA方面建议一张GeForce 8800GTX显卡应采用450W或以上的电源予以供电,两组GeForce 8800GTX所组成的GeForce 8800GTX SLI系统,应采用750W或以上的电源予以供电。而AMD-ATI方面,单卡的供电要求为500W以上,而对于两块Radeon HD 2900XT显卡所组成的交叉火力系统,官方建议最好采用800W或以上的电源予以供电,以确保系统的稳定运行。
另外一点值得大家注意的是,虽然Radeon HD 2900XT的供电模式为8 Pin + 6 Pin模式,但其中的8 Pin电源输入口与我们平时在主板上用到的8 Pin电源接口的定义是不一致的,如上图,大家应该就可以看到,电源上的8 Pin接口是无法插入Radeon HD 2900XT上的8 Pin电源输入口。当然,大家可以采用双6 Pin的供电模式予以供电,不过控制中心的“ATi OverDrive”就被驱动自动屏蔽了。 六、AMD Radeon HD 2900XT显卡高清晰大图赏析 七、蓝宝石 Radeon HD 2900XT 512MB GDDR3 显卡高清晰大图赏析 蓝宝(SAPPHIRE)作为AMD-ATI全球最大的AIB品牌,不但拥有业界首屈一指的强大研发能力,同时在ATI产品资源优势上也无人能及,其新一代的旗舰显卡——蓝宝石 Radeon HD 2900XT 512MB GDDR3,也在第一时间送抵了我们PConline评测室。其实,细心的朋友应该会发现,目前上市零售的Radeon HD 2900XT 512MB显卡很有可能均出自蓝宝手笔(经典的电容画线手法)。目前蓝宝石 Radeon HD 2900XT 512MB GDDR3 显卡的零售报价为3299元。
产品附件方面,有DVI TO VGA 接头 2个、DVI TO HDMI 接头1个、9PIN VIVO 8.5MM 转接线1条、9PIN S-VIDEO TO HDTV转接线1条、CrossFire 桥接器1个、3D MARK 2006 英文版正版光盘带CD-KEY、VALVE《半条命II:第二章》游戏CD-KEY、蓝宝石驱动光盘,蓝宝石产品说明书各一。 八、盈通 R2900XT-512M-GD3 豪华版 高清晰大图赏析 盈通,作为目前国内的五大通路板卡商之一,也在Radeon HD 2900XT正式发布的前一个星期内,将显卡送抵我们PConline评测室,由于显卡均来自ATI的首批公版产品,因而显卡细节介绍部分我们不在重复,下面是盈通 R2900XT-512M-GD3 豪华版显卡的大图赏析。 Radeon HD 2900XT显卡的PCB上已经烙上“ADVANCED MICRO DEVICES INC.”——AMD的印记。 九、迪兰恒进 镭姬杀手 HD 2900XT 512MB 显卡高清晰大图赏析 十、评测平台及评测说明
本次关于AMD Radeon HD 2900XT 显卡的性能评测,主要分为以下两个部分,包括有:游戏理论性能评测、实际游戏性能评测,当中我们会采用一款公版的GeForce 8800GTS作为评测的性能参考对象。 同时,为了尽量避免由CPU本身带来的瓶颈,我们采用了英特尔目前最顶级的四核心处理器——Core 2 Quad QX6800。 十一、对比评测-3DMark06性能评测 3DMark06 附本次评测软件的简介: 3Dmark06的几个场景令人印象深刻,原深居峡谷的白龙变得幻彩夺目,特别是在阳光的照射下更显状观,鳞片细节和颜色变化莫测,水波纹更加细腻真实。此外“极地深寒”场景是全新开发的Game Test,我们可在寒冷的极地中看到一天日出日落情景,随着太阳在空中慢慢滑过,物体阴影的会随太阳移动而变化。“极地深寒”场影同样使用了FutureMark非常自豪的CSM技术。 十二、对比评测-历代经典3DMark理论性能评测 3DMARK 2001SE 3DMARK03 3DMark05 附本次评测软件的简介: 通过结合DirectX8支持与全新的显卡,3DMark2001 SE继续提供良好的全面系统基准评测。3DMark2001 SE是在与主要的3D加速器和处理器厂商的合作中创作的,提供了一套可靠的诊断工具。该套件通过使用现实的游戏技术评测系统的真实能力来表现3D游戏性能。评测包括:DirectX8 Vertex Shader,Pixel Shader和Point Sprite,DOT3及Environment Mapped Bump Mapping,对全屏反锯齿和纹理压缩的支持,还有两个使用Ipion实时模型的游戏评测。在目前显卡发展日益迅猛的时候,相比后续的3DMARK03与3DMARK05,3DMark 2001SE的评测结果可以更有效的反映CPU对整体性能之间的影响。 3DMark03是Futuremark在03年推出的3D评测软件,其包括了四个游戏评测(飞行模拟、FPS、RPG和自然评测)。评测的对象函括了CPU、特性、画质和声音评测。相比于3DMARK 2001SE,3DMARK03的评测更偏重于显卡整体性能的评估,对CPU性能的依赖性非常的小。此外3DMark03还支持3DNow!、MMX、SSE与SSE2指令。 3DMark05是流行的3DMark系列中的最新版本,引入了世界上第一个需要Pixel Shader 2.0以上支持的基准评测!这个精确的性能和图像品质诊断新工具是为DirectX 9.0c设计的,其中包括了常用的3个全新的游戏评测与2个CPU评测,为用户提供了进行可靠硬件评估所需的所有信息。以一个完全利用最新DX9.0渲染的私有图形着色引擎为基础,它对来年的游戏有多复杂提供了一个良好的参考。 在3DMark05中,FutureMark使用了LiSPSM (Light Space Perspective Shadow Maps)来处理动态阴影,新一代3DMark06中加入了眩目的HDR特效、CSM动态阴影等等,画面更逼真细腻,光影效果更为炫目。 3DMark06的标准评测包括两个HDR评测两个SM3.0图形评测。很明显FutureMark想表达的意思是,未来PC系统的游戏性能最关健的是显卡的HDR/SM3.0效能。3Dmark06还首次使用了AGEIA公司的PhysX物理引擎,用CPU模拟物理引擎计算,这是3Dmark06的一个闪亮的特色。CPU评测的成绩被强制加入到总分里面去,Futuremark揭示了未来游戏发展的方向,CPU/GPU应该获得更好的平衡。 十三、HDR游戏测试-Serious Sam 2、上古卷轴4:湮没、细胞分裂3 Serious Sam 2 (英雄萨姆2) 附本次评测软件的简介: Serious Sam 2性能很大部分取决于CPU,但同时它更加依赖显示卡的效能,新版本针对SLI/CF多卡并行输出作了优化,可以通过该软件来窥探系统使用双卡并联输出的效能提升。 这是一款经典的多人对战FPS类游戏的最新版本,它对系统的要求非常苛刻,对双核处理器作了相关优化,在使用了最新图形、物理引擎后在硬件性能的依赖性提高很多,通过该游戏可以验证出本系统的实际图形表表现。 The Elder Scrolls IV:Oblivion(上古卷轴4:湮没) 附本次评测软件的简介: 《上古卷轴4:淹没》开发时间起始于2002年,可以说,在发售前,这款游戏一直是已公布的角色扮演游戏中最值得期待之作,因为这款游戏是为PC平台以及次时代主机PS3和XBOX 360平台开发,《上古卷轴4:地狱》将成为角色扮演游戏的一个新的里程碑,这一代作品将会是角色扮演类游戏的飞跃,因为它拥有完全自由的游戏性和更加强化的画面品质。 Tom Clancys Splinter Cell Chaos Theory(细胞分裂3:混沌法则) 附本次评测软件的简介: 作为2005年第一季度讨论最多的精品游戏之一,《细胞分裂:混沌法则》将为玩家展现三种类型的游戏体验:第一,单人模式,玩家将控制我们的英雄——萨姆·费舍尔进行维护世界和平的任务;第二,两人合作模式,这个模式是《混沌法则》的新增模式;第三是多人对抗模式,这个虽然在《明日潘多拉》中就已经存在,但是这次全新升级的版本仍会使玩家眼前一亮。 《细胞分裂:混沌法则》运用了ShaderModel 3.0/HDR/Soft shadows/Parallax Mapping等特效,还运用了热扭变、光折射、水纹扭曲以及独创的geo texturing技术。 十六、新近游戏测试:极品飞车10:卡本峡谷 极品飞车10:卡本峡谷 附本次评测软件的简介: 该游戏是《极品飞车》系列的第十部作品,游戏以次世代平台为开发基准,所以比起以往的作品会有亮丽一新的感觉,本作收录了25条全新跑道和更为新款的跑车,在前作的基础上加强了车辆改装要素。该游戏大量的使用了Shader Model 3.0特效,对大部分显卡来说是一个严峻的考验。不久前,我们栏目就专门针对《极品飞车10:卡本峡谷》进行了详细的游戏显卡评测报告,有兴趣的朋友可以点击以下的文章链接。《峡谷漂移!16块显卡深度体验极品飞车10》 十七、OpenGL游戏测试-Quake 4和Doom 3 Quake 4 (雷神之锤4) 附本次评测软件的简介: 这是一款经典的多人对战FPS类游戏的最新版本,它对系统的要求非常苛刻,对双核处理器作了相关优化,在使用了最新图形、物理引擎后在硬件性能的依赖性提高很多,通过该游戏可以验证出本系统的实际图形表现。 DOOM3 附本次评测软件的简介: OpenGL的巨作DOOM III,Doom III引擎惊人的逼真度基本上依靠两个特性:一个现实的物理引擎和一个统一的照明方案,后者整合了详细的凹凸映射和测定体积的阴影。 十八、其他游戏测试-FarCry和Half Life 2 FarCry 附本次评测软件的简介: 大量采用DirectX9渲染的游戏FarCry,为2004年年度最佳FPS游戏之一。Farcry游戏画面相当逼真,粒子效果、特殊效果、环境渲染质量、阴影效果、光照效果均达到相当高的水准;但与此同时,也对显卡和整机的性能提出了比较大的考验。关键是Farcry为首批支持Shader Modle3.0的游戏。 Half life 2 附本次评测软件的简介: Half life2测试采用Prison场景,关闭AA和AF选项,同时将游戏的所有选项设置到最高。Prison的场景最为复杂,长度为201秒,主要的是在prison地图中和CombineSoldier的对抗。主角利用虫球引诱Antlion从而突破机枪的封锁线,在大厅遭遇一群士兵的鏖战以及在餐厅外引爆氧气筒,最后和两个士兵近身缠斗。Demo充分运用了Source引擎的粒子效果以及物理特性,大厅中和一群士兵的战斗对系统的资源要求极高。餐厅的设计就采用了Radiosity Normal Mapping的技术,在其中引爆的油桶更是起到了增加光照复杂度的功效。 十九、PConline评测室总结 好吧,综合上面众多的游戏测试,现在我们来为Radeon HD 2900XT的性能及功能作一个总结。 首先,在新一代HDR游戏测试当中,Radeon HD 2900XT凭借着740MHz的核心频率,320个的流处理器单元,未开启AA(全屏抗锯齿)、AF特效情况下,Radeon HD 2900XT均能较好的领先售价处在同一级别的GeForce 8800GTS 640MB显卡。尤其是极品飞车10的实际效能测试当中,1024 x 768的游戏分辨率下游戏的平均帧数竟高达100帧!以24帧的绝对性能优势抛离对手。 接着,在OpenGL游戏Quake 4 和Doom3的性能测试当中,Radeon HD 2900XT的OpenGL效能表现也较为令人满意,看来被NVIDIA在OpenGL领域打压多时的AMD-ATI,在Radeon HD 2000时代看到了崭露头角的机遇。 不过在开启4倍AA以及16倍的AF特效以后,Radeon HD 2900XT表现出与其512Bit显存位宽、106GB/sec的显存带宽不相应的3D能力,游戏帧数的大幅下降实在令人费解(OpenGL游戏除外),虽然评测期间我们详细的对比了8.37.4.0和8.37.4.2这两个驱动的测试数据,但评测成绩依然没有太大改善,因而我们最终只能将驱动锁定在8.37.4.0这一版本。
根据以往的评测经验,显卡全屏抗锯齿能力的高低,很大程度是取决与显卡ROP(光栅化引擎)数量以及GPU核心频率,Radeon HD 2900XT和GeForce 8800GTS 640MB的ROP数量分别为16个和20个,虽然在ROP数量上,Radeon HD 2900XT比GeForce 8800GTS 640MB少了20%,但Radeon HD 2900XT凭借着较高的740MHz的GPU核心频率,按照常理来说其AA、AF能力应该与GeForce 8800GTS 640MB相若,而不应出现No AA AF时大幅领先,4xAA 16xAF时大幅落后的情况,更何况Radeon HD 2900XT引入了业界首款的512Bit显存位宽,在GPU与显存数据交换的显存带宽方面,应该不会形成瓶颈。因而,我们认为应该是驱动方面依然有部分问题尚待工程师的进一步优化,我们也期待AMD-ATI新驱动的析出,令Radeon HD X2900XT(R600)的实力得以更完美的释放。 由于Radeon HD 2900XT 并没有加入UVD功能的支持,因而无法实现H.264/AVC、VC-1、DivX 和 MPEG-2 等高清晰视频的硬件解码功能,只能实现硬件级的辅助加速功能,这一点与NVIDIA G80类似,毕竟狂热级游戏玩家更为关注显卡在3D游戏中的实际效能,而且,该类玩家的PC配置,凭借CPU本身的加速就已经足够应付上述各种高清晰视频的播放。 然而,即将在6月中旬发布的Radeon HD 2600和HD 2400系列显卡,将正式加入UVD的硬件高清视频的解码功能,据相关资料显示,其效能要比NVIDIA的PureVideo HD稍胜一筹,因为NVIDIA PureVideo HD无法实现VC-1高清视频的硬件解码(只具备硬件加速解码能力),而AMD-ATI的UVD则具备所有上述提到的高清格式视频的硬解码能力。而有关UVD技术的详细介绍,我们将在一篇独立的文章为大家详细介绍,敬请留意。 目前,Radeon HD 2900XT的公开零售报价是399美元,而国内的零售报价则在2899~3299元人民币之间,而GeForce 8800GTS 640MB的零售报价则始终维持在3299元人民币以上,值得一提的是,现时GeForce 8800GTS 640MB已呈缺货状态,因而在3000元的消费领域中,Radeon HD 2900XT可以说是没有直接的对手,因为在其上能提供选择的就只剩GeForce 8800GTX或8800Ultra,而其下则是性能稍低GeForce 8800GTS 640MB的8800GTS 320MB。 好了,本次Radeon HD 2900XT显卡的评测已经全部结束,而有关Radeon HD 2900XT显卡交叉火力及DirectX10性能的对比测试,我们将分别以独立的文章予以对比评测,敬请随时关注我们PConline的DIY硬件频道。 |
正在阅读:Radeon HD 2900XT显卡性能评测:3D效能的新战役Radeon HD 2900XT显卡性能评测:3D效能的新战役
2007-05-15 17:18
出处:PConline
责任编辑:liyan