引言:在距离第一代DX11显卡HD5000发布一年时间后,AMD在上周五如期带来了第二代DX11显卡HD6870和HD6850,随着HD6870和HD6850的发布,预示着高端DX11显卡的竞争局面将变得更为激烈,而此前由HD5800和GTX400构成的竞争局面将在HD5800未完全退市之前变成HD6800、HD5800和GTX400的三足鼎立。 在三足鼎立格局下的高端DX11显卡其性能排位会有什么样的变化?HD6800相对HD5800又有哪些优化和提升相信这些都是你我非常想了解的,今天我们就针对这个问题带来两代八张DX11显卡的终极混战,全面了解它们的功能优化和性能定位。 目前我们基本上可以按照价格因素将显卡分为高中低三个档次,其中价格在一千元以上的显卡很显然是为众多游戏发烧友和对显卡性能要求颇高的用户所准备的,目前处在一千元以上这个价位的显卡分别有AMD的HD5830、HD5850、HD5870和刚刚发布上市的HD6870、HD6850,以及NVIDIA的GTX460、GTX470、GTX480等八款显卡,下面我们罗列了这些显卡的具体参数,而这次我们的横评就包含以下显卡。
性能和功能是目前显卡必不可少的两部分,前面我们提到过HD6800是继HD5000之后的AMD第二代DX11显卡,它与HD5000相比在哪些方面进行了优化和改进呢?而GTX400显卡又有哪些改进和优化呢?下面我们不妨先来了解一下HD6800显卡和GTX400显卡在一些优化方面的介绍。 AMD HD6800显卡优化及功能改进介绍 增强显卡的画质: AMD显卡在画质上一直都比较优势的,相信大家还记得在HD5000系列显卡时AMD就对抗锯齿算法进行了改进,而这次AMD再次对抗锯齿进行改进以达到更佳的画质效果。 经过优化和改进后的抗锯齿功能采用Directcompute进行加速以实现后处理过滤功能,另外提供全场景的抗锯齿功能和任何Direct9、Direct10和Direct11的应用程序和游戏兼容。 Barts核心改进了各向异性过滤的算法,使得HD6800/6900系列显卡在过滤级别上更加平滑,各向异性过滤的效果更出色。 另外,针对HD6000系列显卡AMD在催化剂控制中心方面也做了想对应的改进,改进后的控制中心将为用户提供更多地可选择项目。 全新升级的Eyefinity多屏输出 从HD5000系列显卡开始AMD的所有HD5000显卡都能通过DP输出接口实现3-6屏的多屏输出,而AMD的这一功能在HD6000显卡上面又得到了非常全面的升级。 从上面的输出示意图我们看到,优化升级后的HD6870显卡具备两个DP1.2输出接口,而通过这两个DP输出接口,可以显示非常灵活多样的多屏组合。 另外,凭借着HD6870的高带宽与DP 1.2接口的结合,可以实现更多显示器和分辨率的应用,另外它还可以显示AMD的3D立体输出,而HD6870的HDMI 1.4a输出接口则可以连接到我们的3D电视上,显示3D电视的支持。 AMD HD3D 技术 发布的HD6800系列基于开放式标准的HD3D技术解决方案有着特别的标志性意义。全新的AMD HD3D支持Bit Cauldron、XpanD、RealD等多种3D眼镜解决方案,提供对蓝光3D电影完全解码和DirectX 9、DirectX 10、DirectX 11游戏支持。同时,借助立体3D转换软件合作伙伴DDD和iZ3D,将支持游戏超过400部。 3D显示是通过特殊的眼镜,在超高速状态下,通过LCD通电后将镜片调成不透光的黑色,来分别遮蔽人的左右眼,让两只眼睛看到两张角度不同的画面,即当屏幕播放左眼画面的时候右侧镜片变黑,切换一次后,屏幕播放右眼画面的时候左侧镜片变黑,这样,快速的切换就保证了到达左右眼是有细微差别的图像。 简单的理解就是通过驱动程序的控制,让显卡在计算游戏(影片效果是通过双摄像头实现的)时将每一帧计算出两个不同的画面,显示在显示器上,然后通过3D眼镜让左右眼分别看到不同的画面,从而给人眼以错觉,让我们的眼睛误认为看到了一个“三维”的物体,从而实现立体成像技术的。 AMD的3D显示技术在实现方式上与NVIDIA的3D技术实现方向一样,只需要将3D眼镜的红外线发射器通过USB接口与电脑连接,并且确定已将刷新频率为120Hz的显示器与主机连接好。 AMD的3D显示技术致力于实现更低成本的解决方案,AMD通过与第三方的合作之后可以为消费者带来更多更灵活的选择,从上面的图片中我们看到AMD的3D技术通过与第三方软件的合作可以实现3D转换,并且AMD显卡还可以实现蓝光3D电影的完全硬件解码。 目前来看AMD的3D立体技术能很好的兼容当前朱瑞的显示设备,而在2011年来自以后AMD还可以与更多的显示3D显示设备显示兼容。 与第三方合作实现各种3D应用 AMD通过与第三方软件厂商DDD和iZ3D的合作显示3D游戏技术和2D游戏、视频、照片到3D的转换。 通过对2D电影和图片的转换,我们可以更轻松地实现3D视觉享受。 AMD Eyespeed技术 AMD Eyespeed视频加速技术在视频方面可以支持最新的3D蓝光和UVD 3.0 带来跟来更快更高效地视频解码速度,另外运用OpenCL和DirectCompute 11驱动AMD显卡进行并行计算也可以显示实现视频转换的加速。 GF100核心架构以及功能优化介绍 完整的GF100核心总共有16组SM,每一组SM包含32个CUDA核心,ROP单元总共48个,分为六组,分别搭配一个64-bit显存通道。所有ROP单元和整个芯片共享768KB二级缓存(GT200里是独享)。 在每一组SM阵列里,纹理单元、一二级缓存、ROP单元和各个单元的频率也都完全不同于以往。每组SM里四个纹理单元,合伙使用12KB一级纹理缓存,并和整个芯片共享768KB二级缓存。每个纹理单元每周期可计算一个纹理寻址、拾取四个纹理采样,并支持DX11新的压缩纹理格式。 另外,我们都知道DX11一个很重要的特点就是细分曲面,细分曲面把游戏画面切割成更小的三角形,这样使得整个画面更加逼真细腻,而细分曲面的实现则需要用到多形体引擎,多形体引擎的数量也直接关系到显卡在DX11游戏中的表现。AMD在实现细分曲面时是整个核心共用一个多形体引擎,例如上图NVIDIA也可以在GT200的基础上加上一个多形体引擎来达到变身DX11显卡。 NVIDIA这次并没有直接在GT200核心的基础上直接加入一个多形体引擎以达到DX11显卡要求,而是为了不使单一的多形体引擎成为显卡性能瓶颈在每一组SM中都加入了一个多形体引擎,这也是NVIDIA一直推迟GTX400系列显卡发布的重要原因。 GF100采用三级分层游戏架构 我们已经知道,GF100采用台积电40nm工艺制造,集成大约30亿个晶体管,包含512个流处理器(CUDA核心)。32个这种核心组成一个流式多处理器阵列(SM),然后再四个组成一个图形处理集群(GPC)。GF100就是这样的三层分级架构:4个GPC、16个SM、512个SP。 NVIDIA声称Fermi GF100是一个全新架构并非没有道理。不但是通用计算方面,游戏方面它也发生了翻天覆地的变化,几乎每一个原有模块都进行了重组:有的砍掉了,有的转移了,有的增强了,还有新增的光栅引擎(Raster Engine)和多形体引擎(PolyMorph Engine)。 光栅引擎严格来说光栅引擎并非全新硬件,只是此前所有光栅化处理硬件单元的组合,以流水线的方式执行边缘/三角形设定(Edge/Triangle Setup)、光栅化(Rasterization)、Z轴压缩(Z-Culling)等操作,每个时钟循环周期处理8个像素。GF100有四个光栅引擎,每组GPC分配一个,整个核心每周期可处理32个像素。 多形体引擎则要负责顶点拾取(Vertex Fetch)、细分曲面(Tessellation)、视口转换(Viewport Transform)、属性设定(Attribute Setup)、流输出(Stream Output)等五个方面的处理工作,DX11中最大的变化之一细分曲面单元(Tessellator)就在这里。GF100中有16个多形体引擎,每组SM一个,亦即每组GPC四个。需要说明的一点是AMD显卡在多形体引擎方面的设计采用的是所有SM共用一个多形体引擎,而NVIDIA采用的是每组SM一个,这样也就避免了多形体引擎称谓显卡性能瓶颈。 多形体引擎绝非几何单元改头换面、增强15倍而已,它融合了之前的固定功能硬件单元,使之成为一个有机整体。虽然每一个多形体引擎都是简单的顺序设计,但16个作为一体就能像CPU那样进行乱序执行(OoO)了,也就是趋向于并行处理。NVIDIA还特地为这些多形体引擎设置了一个专用通信通道,让它们在任务处理中维持整体性。 在每一组SM阵列里,纹理单元、一二级缓存、ROP单元和各个单元的频率也都完全不同于以往。每组SM里四个纹理单元,合伙使用12KB一级纹理缓存,并和整个芯片共享768KB二级缓存。每个纹理单元每周期可计算一个纹理寻址、拾取四个纹理采样,并支持DX11新的压缩纹理格式。 ROP单元总共48个,分为六组,分别搭配一个64-bit显存通道。所有ROP单元和整个芯片共享768KB二级缓存(GT200里是独享)。 除了ROP单元和二级缓存,几乎其他所有单元的频率都和Shader频率(NVIDIA暂称之为GPC频率)关联在一起:一级缓存和Sahder单元本身是全速,纹理单元、光栅引擎、多形体引擎则都是一半。对于GF100来说,想超频的话很多地方都要重新来过了。 从NV30 GeForce FX 5800到GT200 GeForce GTX 280,NVIDIA显卡的几何性能只提高了不到3倍,而Shader性能提升了150多倍,但仅仅是从GT200到GF100,几何性能的增长倍数就达到了8x。 有了如此强大的几何性能,NVIDIA就可以使用细分曲面和置换贴图创建更复杂的人物、物体和场景,并保持和对手同样水平的性能,所以才有了16个多形体引擎和4个光栅引擎。 细分曲面是AMD DX11产品的宣传重点,但NVIDIA要做得复杂得多,而且理论上说效果更出色。接下来NVIDIA要做的就是让游戏开发商充分挖掘GF100架构的潜力,在保证性能的基础上做出更精致的游戏画面。 抖动采样(Jittered Sampling)实现更逼真画面 DX11详细定义了显卡需要提供的特性,但对渲染后端的工作涉及甚少,所以NVIDIA做了多形体引擎,还有抖动采样。抖动采样不是新技术,长期用于阴影贴图和各种后期处理,通过对临近纹素(Texel/纹理上的像素点)进行采样来创建更柔和的阴影边缘。它的缺点也是非常消耗资源。 DX9/10上抖动采样是分别拾取每一个纹素,DX10.1开始改用Gather4指令,NVIDIA则在硬件上使用单独一条矢量指令。NVIDIA自己的测试显示,这么做的性能大约是非矢量执行的两倍。 改进抗锯齿最高可实现32AA CSAA是在G80 GeForce 8800 GTX上引入的,当时最高支持16x,如今不但提高到了32x,而且将色彩取样和覆盖取样分离开来,在32x CSAA中分别有8个和24个,无论性能还是画质都有明显提升。NVIDIA宣称,GF100 CSAA从8x到32x的平均性能损失只有区区7%。 在GF100上,Alpha to Coverage可以使用全部采样点(最多32个),而且有33个透明级别,透明多重采样抗锯齿(TMAA)的质量也因此得到了改进。 游戏计算(Compute for Gaming) 首先,CUDA架构的实现途径就多种多样,CUDA C、CUDA C++、OpenCL、DirectCompute、PhysX、OptiX Ray-Tracing等等不一而足。这其中既有NVIDIA自己似有的开发方式,也有开放的业界标准规范,开发商可以自由选择。 在游戏中,NVIDIA CUDA计算架构可以执行画质处理、模拟、混合渲染等等,实现景深、模糊、物理、动画、人工智能、顺序无关透明(OIT)、柔和阴影贴图、光线追踪、立体像素渲染等大量画面效果。值得注意的是NVIDIA这次新加入了队C++的原生支持。 《Metro 2033》里的景深效果 光线追踪演示DEMO NVIDIA还宣称,GF100的游戏计算性能相比GT200有了大幅提高,比如PhysX流体DEMO演示程序3.0倍、《Dark Void》游戏物理2.1倍、光线追踪3.5倍、人工智能3.4倍。 立体多屏环绕技术3D Vision Surround ATI Eyefinity可以支持六屏输出,而3D Vision Surround最多只能达到三屏,但它支持3D立体效果,是3D Vision技术的扩展增强版。遗憾的是,AMD Radeon HD 5000系列能单卡支持六屏输出,NVIDIA GF100却仍然只能同时驱动两台显示器,三台或者更多的话就需要两块GF100组建SLI系统。这样一来,双卡系统的性能当然会好很多,但成本也急剧增加。 但也正因为不是GF100架构的全新技术,GT200 GeForce GTX 200系列同样可以支持3D Vision Surround。事实上,NVIDIA在CES上展示的系统使用的就是两块GeForce GTX 285。 显示设备支持方面,3D立体系统需要三台同样支持3D Vision技术的液晶显示器、投影仪或者DLP,单个分辨率最高1920×1080;如果是非立体系统(此时叫作NVIDIA Surround),任何普通显示设备均可,单个分辨率最高2560×1600。 显卡测试平台和方法说明 在正式测试之前,先让我们一起来看看与这次评测有关的相关评测平台和评测方法。
为了不使CPU成为显卡性能瓶颈,我们选择了目前强大的AMD Phenom II X6 1090T处理器搭配技嘉890FX主板作为测试平台。另外,考虑到Windows7系统将逐渐成为今后的主流系统,同时它还支持Direct 11因此在测试中我们所用了Windows7 64位操作系统作为测试平台,另外考虑到显卡定位等综合因素,在测试分辨率上我们选择了1920x1080 4AA、2560x1600 4AA作为测试标准。在3DMark Vantage理论性能测试中,为了能更体现出显卡的行呢个我们选择Entry档作为测试标准。 Heaven benchmark 2.1对比测试 游戏引擎开发商Unigine推出的DirectX 11 GPU测试程序Heaven Benchmark自去年10月推出以来,就凭借对曲面细分等新特性应用的深度和广度成为媒体和玩家测试DX11显卡的重要工具。 在2.0版本的基础上,Heaven Benchmark 2.1测试工具加入了对OpenGL 4.0标准规范的支持,包括OpenGL模式下的硬件曲面细分技术。并且加入了对多种立体3D模式的支持,包括Anaglyph、Separate Images、NVIDIA 3D Vision、iZ3D等等。此外,2.1版本还进行了一些细节方面的优化和完善。 测试成绩: DX11游戏《地铁2033》测试 作为一款恐怖FPS游戏,《地铁2033》拥有次世代顶级的画面表现,精确的实时光照,高精度的体积阴影,PhysX加速效果,尤其是整体大范围烟雾尘埃刻画更是出众,营造出了一个极具渲染力的恐怖末日游戏场景;游戏中,主角与其他角色的互动性较高,任务也具有一定的自由度;武器种类虽然较少,但细节表现还是较为优秀的。总体上,《地铁2033》凭借DirectX 11/10/9下的优异画面表现和超精细场景刻画,绝对是一款对游戏画面有追求的FPS玩家必玩的大作。 进入《地铁2033》游戏初始界面相信玩家可以感觉到本作的独到设计风格,落在相关选项上对象会有高互动的感应。 DIRECTX 11 OPTIONS(DIRECTX 11选项),RESOLUTION(分辨率),DIRECTX,ANTIALIASING(抗锯齿),TEXTURE FILTERING(纹理过滤),GAMMA(伽玛值)。测试中我们将所有的特效都开到最高,同时打开游戏物理加速。 测试成绩: DX11游戏《异形大战铁血战士》测试 《异形大战铁血战士》是这款FPS游戏是由Rebellion公司开发的,本次的游戏的剧情没有照搬电影的剧情,而是将舞台设定为名叫BG-386的行星,相同的是人类在该星球发现了古代金字塔,而围绕该金字塔隐藏的巨大秘密异形、铁血战士以及人类3种族再次展开激烈的战斗。 游戏中除了提供单人故事模式以外,还提供多人对战模式,可以说多人对战模式才是这个游戏最能吸引玩家一直玩下去的地方。 纹理质量、分辨率、阴影复杂性、各向异性过滤、环境光散射,垂直同步的调整菜单。所谓的(环境光散射)Ambient Occlusion是指通过不特定的光源表现周边所有环境阴影的功能。比如在在墙和墙草和草之间相关物体们产生的光线的反射。在测试中我们将所有的特效开至最高。 测试成绩: DX11游戏《失落的星球2》评测 游戏采用CAPCOM独自研发并进一步强化的“MT-Framework 2.0”游戏引擎,呈现比前作更为细致美丽的画面,使用该引擎的还有《鬼泣4》和《生化危机5》,并且PC版本加入了DX11特效,成为一款具备DX11性能参考价值的游戏。本次测试,我们使用了官方的Benchmark Version进行测试,结果具备很大的权威性。 测试成绩: DX11游戏《战地:叛逆连2》对比测试 《战地:叛逆连2》(Battlefield: Bad Company 2),是EA DICE开发的一款第一人称射击游戏。游戏开发商美国艺电确定 2010年3月2日为游戏Xbox 360、PS3、PC版的首发日期。该作是EA DICE开发的第9款“战地”系列作品,也是《战地:叛逆连》的直接续作,在继承前作特性的基础上,加强了多人联机载具对战和团队合作元素的设定。游戏使用加强版的寒霜引擎,加入了建筑物框架破坏和物体分块破坏的支持。 游戏的选项主要分为一般设置和行动设置两部分。一般选项包括了游戏控制器的选择,玩家控制的习惯,以及声音和视频的设置,多种选项堆在一个窗口虽然稍稍令人有些眼花缭乱,但是却省略了不停翻页找选项的痛苦。至于行动设置部分,则就是图中的“步行”、“载具”和“飞行”的选项。《战地:叛逆连2》提供了多达15种。 测试成绩: DX10《正当防卫2》游戏对比测试 《正当防卫2》依然采用了Rico Rodriquez作为本作的男主角,事情发生在前作发生的几年之后,Rico被要求在东南亚的一个小岛Panau上找到Tom Sheldon,并将其杀死。而具体的做法就是不停地破坏,制造混乱,然后团结某些力量获取情报,最后找到Tom,最终将其杀死。 在《正当防卫2》的高级显示设置里面,可以根据实际平台配置选择不同级别的特效,在这款游戏中我们将所有的特效都开至高,不过由于AMD显卡在这款游戏中没有GPU水面模拟和散景过滤两个特效选项,为了保持测试的公平我们在运用NVIDIA显卡进行测试时将这两个选项选择为“关”。在测试场景上面我们选择的是基准测试中的“黑暗之塔”。 测试成绩: DX10 3D理论性能测试:3DMark Vantage 3DMark Vantage是一款完全针对DirectX 10开发的测试软件,只提供DX10的API,因此DX9的显卡就无缘测试了,而3DMark Vantage较权威地得出显卡的DX10性能,对于消费者了解显卡的理论性能有一定的指导意义。而3DMARK Vantage提供了4个等级的标准设置,分别是Entry(入门级别),Performance(性能级别),High(高端级别)和Extreme(极致级别)。根据本次测试显卡的定位,我们选择Performance(性能级别)对显卡进行测试。
3DMark Vantage认为不同级别的测试模式,显卡和CPU之间的权重比例是不一样的,因此四个测评模式下的评分标准也不一致,下面我们来看看四个模式中,显卡和CPU的权重比为多少:
3DMark Vantage 总得分标准: 测试成绩: DX10游戏《孤岛危机 弹头》对比评测 基于CryengineII的《孤岛危机》至今仍是公认最变态的3D游戏,玩家们还戏称为“显卡危机”,可见其对显卡性能要求之高。我们采用的是Crysis游戏自带的Benchmark进行测试。 测试成绩: DX10游戏《孤岛惊魂2》对比评测
FarCry2《孤岛惊魂2》是一款DX10游戏,我们采用自带BenchMark进行测试,模式为DirectX 10,品质为High。
测试成绩:
《使命召唤》系列游戏时以战争为题材的FPS游戏,以二战或现代战争为背景,玩家扮演其中一名士兵,参与各样大小规模的战役。最新作《使命召唤6:现代战争2》则是再次以现代战争为背景,让玩家们再度投入到紧张刺激的现代战争舞台中。本作仍是基于《使命召唤4》的游戏引擎,只支持DX9C特效,因此对显卡不会有十分苛刻的要求。
测试成绩: DX10.1游戏《鹰击长空》对比评测 在这次测试中我们选择手动测试方法,用Fraps记下平均帧数。在游戏测试中我们选择巴西里约热内卢作为测试场景,从游戏开始即飞机出现时用Fraps记录帧数,直到飞机直线撞击城市爆炸结束止。 测试成绩: 显卡功耗温度测试 在测试之前需要说明的一点是,由于我们无法测试单张显卡的独立功耗,因此在测试中所有的功耗成绩均为整机功耗。 我们采用严厉的FurMark进行烤机,5分钟后记录核心满载时的温度;然后待机5分钟,在GPU-Z的Sensor功能记录此时为待机核心温度。在两个测试环境下我们都使用功耗测试仪来检测功耗,测试环境保持在26摄氏度。
测试成绩: PConline评测室总结 通过上面的功能介绍和游戏测试,我们看到作为HD5800系列显卡的升级版,HD6800系列显卡虽然没有在架构上有实质性的变化,但是通过对部分功能的升级和优化HD6800显卡最终还是弥补了之前HD5800显卡的很多不足,特别是HD6850显卡其凭借着更高的性价比将GTX460 768甩在了身后;而GTX480/GTX470依然在高端DX11显卡领域占据着性能宝座,HD5000除了停产之外似乎也别无选择了。 从性能测试部分的成绩来看,HD6870显卡在性能上并没有延续或者超过上一代的HD5870显卡,而只是比上一代HD5850和对手的GTX460 1GB显卡略好,另外其价格定位在1899-1999元中间,总体来看虽然HD6870在性能和价格上要好过自身的HD5850,但是只需1499元的GTX460 1GB在性能上并不输HD6870而且价格更低,其性价比也就不言而喻了,另外值得注意的是NVIDIA即将发布超频版GTX460显卡,而这款显卡几乎就是冲着HD6870去的,因此可以预见HD6870只能以降价应付。 虽然说HD6870在综合分析上其竞争力不敌GTX460 1GB,但无可否认的是HD6850堪称是一款比GTX460 768MB更超值的显卡,从上面的测试成绩我们看到HD6850可以说在我们所测试的游戏中是全面领先TX460 768MB的,而同样作为1299-1399元这一价位显卡,拥有更高性能和更低功耗温度的HD6850无疑是更加值得选购的产品。 另外,作为单卡旗舰的GTX480显卡在我们所测试的游戏项目中一如既往的领先其它显卡,并且这种优势也还是十分明显,而作为仅次于GTX480的GTX470来说其降价也就是情理之中的事情了,但是降价之后的GTX470显卡和超频版GTX460显卡给HD6870带来的冲击显然是非常巨大的。 最后,HD5850和HD5830等显卡在性能上落后HD6870和HD6850已是不争的事实,而对于定价在1299-1899元的HD6870和HD6850来说其降价的空间和可能性都已经不大,而停产清货看来是它们的唯一出路了。 |
正在阅读:两代显卡终极混战!八大高端DX11显卡横评两代显卡终极混战!八大高端DX11显卡横评
2010-10-28 02:42
出处:PConline原创
责任编辑:heminggui
为您推荐
IT热词