开始的地方 CES上老黄发布了最新的RTX 50系显卡,随着RTX 5090、RTX 5080老大哥们的陆续登场后,备受瞩目的中高端主流玩家显卡RTX 5070也揭开了它神秘面纱,正式与玩家见面。如同其兄弟型号,在硬件规格上,RTX 5070搭载了先进的Blackwell架构,集成了英伟达RTX 50系列的所有尖端功能,例如玩家最关注的DLSS 4等。 那这款显卡的性能表现究竟如何?我们今天就上手技嘉GeForce RTX 5070 GAMING OC 12G魔鹰显卡,带大家一探究竟!这款显卡主打极致的性能释放以及丰富的RGB灯效,同时还有业界领先的4年质保,为的就是给玩家提供稳定而又极致的使用体验。 规格介绍 开始前,照例讲讲新显卡的规格。GeForce RTX 50系显卡采用了此前NVIDIA在AI领域推出的Blackwell架构,以大卫·布莱克威尔命名,其是一名受人尊敬的数学家和统计学家,在博弈论和统计学领域留下了不可磨灭的贡献,NVIDIA用其名字命名这一架构反映了新平台的开创性和先进的计算能力。Blackwell可以说是NVIDIA近年来更新幅度最大的GPU架构了,相比起之前的架构来说,划时代的引入了神经网络着色器,力图为游戏开创先进、高效更有逼真的渲染方式,带给玩家全新的游戏体验。 相比前代Ada架构,Blackwell的升级聚焦于四大方向:分别是AI算力的爆发、光线追踪技术的革新、显存能效的提升以及划时代的神经网络渲染。 第五代Tensor核心 其中AI算力的爆发就不得不提到Blackwell架构上的第五代Tensor核心,新一代Tensor Core添加了对FP4浮点运算精度的支持。FP4是一种较低的量化方法,类似于文件压缩,可以减小模型推理过程中数据存储和计算量大小,提高计算效率,降低该过程对显存的要求。与大多数模型默认使用的FP16相比,FP4使用的显存不到其一半,并使GeForce RTX 50系列GPU的性能相比上一代提升高达2倍。 第四代RT核心 而光线追踪技术的革新则仰赖于第四代RT核心的加持,相较于第三代RT核心来说,Blackwell架构的第四代RT核心主要提升了检测光线、路径与三角形相交的效能,过往在检测时往往只能检测单个三角形,一旦场景复杂,检测能力不足就容易导致渲染出错等问题,而现在检测能够以簇集方式进行,检测效率更高。同时还有三角形簇集解压缩引擎加持,其新增了Linear-swept Spheres(LSS)功能,可以减少渲染毛发所需的几何图形数量,并使用球体代替三角形以获得更准确的毛发形状拟合,能够让显卡发挥更好的性能但只消耗较小的显存占用。 ![]() 综合来看,Blackwell架构的光线追踪多边形相交效率是上一代Ada架构的2倍,是Turing架构的8倍,同时还可以节省25%的显存使用率。 第四代RT核心的改进主要是为实现更好的光追效果。其中有两项新技术能够受益,第一项是RTX Mega Geometry技术。随着光线追踪游戏场景的几何复杂性不断增加,游戏画面中几何图形的计算量也呈现出快速增长的趋势。而RTX Mega Geometry技术能够加速构建边界体积层次结构(BVH),使得在实时渲染中可以处理多达100倍的三角形数量。 该技术的出现,也使得开发者能够在游戏场景中使用更复杂的几何图形,而不会影响游戏帧率。过去需要一个个算BVH,现在RTX Mega Geometry能够智能地在GPU上批量更新三角形簇,减少了CPU的负担,既保证了性能,也兼顾了图像质量。相信随着这些技术的不断发展和应用,未来的游戏将能够呈现出更加逼真和细腻的视觉效果,同时保持高效的性能表现。 另外一个能够受益的技术则是Curve Primitive,方便光追在曲面中的应用,例如一位男士的头发可能需要多达400万个三角形,再加上光线追踪技术,画面所需要的运算负载极大。NVIDIA则通过第四代RT核心中的Linear- Swept Spheres(线性扫描球体)技术有效减少了渲染头发所需的几何体数量,以球形代替多边形,更贴合头发的形状,从而将内存占用量大幅缩减至三分之一,并进一步提升了实际帧数,让头发的渲染效果更加自然流畅。 GDDR7显存 第三点改变则是显存效率的提升,Blackwell架构中还首次加入了对GDDR7显存的支持,此前GDDR6显存的信号编码为NRZ/PAM2,而RTX 40系上的GDDR6X则是PAM4编码。最新的GDDR7显存,信号编码改成了PAM3,NRZ/PAM2每周期提供1位的数据传输,PAM4每周期提供2位的数据传输,而PAM3每两个周期的数据传输为3位。说人话就是,新的编码机制可以使杂讯失真比减小,信号品质更清晰,同时还能带來更高的显存运行频率以及更低的电压,根据NVIDIA的介绍,使用GDDR7显存后,数据传输速率可达GDDR6时的2倍,并且功耗接近GDDR6的一半,经典加量还减价。 神经网络着色器 接着我们再细说一下这一代架构最大变化,NVIDIA这次将Blackwell架构的SM单元直接称为神经网络着色器。相比较于之前的可编程着色、CUDA统一着色、通用计算着色来说,其最大的变化就是引入了AI,AI将会彻底改变GPU的着色方式。 在Blackwell架构中,NVIDIA 进一步拓展了神经网络渲染的范畴,引入了诸多创新元素,包括神经网络纹理压缩(Neural Textures)、神经网络材质(Neural Materials)、神经网络体积(Neural Volumes)、神经网络辐射场(Neural Radiance Fields)以及神经网络辐射缓存(Neural Radiance Cache)等,这些元素共同构成了神经网络渲染中神经网络着色的重要呈现方式。 这里举个例子让大家能够更简单的理解神经网络渲染,过去复杂的物品或大量异材质的贴图往往会占用相当大的内存空间,如果叠加光追的话,计算量将会更大。然而,得益于神经网络渲染技术中的神经网络材质功能,这一问题得到了显著改善。开发者可以先在离线渲染出物品的光照数据,然后再用这些数据训练一个小的AI模型,游戏运行时只要实时调用这个AI模型当场推理就好了,这样就能还原出想要的光照效果了,再配合神经网络纹理压缩技术,就能显著降低实际生成的材质数据量,从而在占用更少显示内存的同时,实现了细节更丰富的材质表现,达到了实时生成如电影般细腻素材的效果。 目前神经网络渲染技术已经得到了微软的大力支持,未来也将会加入到DirectX中,玩家能够体验到更真实的游戏世界。 而在硬件层面,由于神经网络渲染的加入,Blackwell架构的SM单元相较于RTX 40系的Ada架构还是有不小变化的,Ada架构内的SM内,SM单元会拆分成一半的CUDA专门用于处理FP 32(单精度浮点数),另一半则依需求动态调整去处理FP32和INT32(32位整数)。而在Blackwell架构上,SM单元则改成了CUDA核心可以完全依需求动态处理FP32和INT32的形式。 另外一个改进是,过往的着色工作往往只有SM单元的Shader在处理,而Blackwell架构上引入了神经网络渲染以后,使得Blackwell架构上的第五代Tensor核心也能共同分担着色工作,大大提高了着色效率。 这样改进的好处是,Blackwell架构能够进一步针对神经网络渲染工作进行排序,即把传统的着色工作分配给Shader,而需要动用神经网络渲染的工作负载则可以给到Tensor核心上,两种核心同时运用,效率最高可以提升2倍之多。并且得益于Tensor核心也加入了可编程渲染管线,现在开发者或API也能更好的调用Tensor核心,未来游戏内我们能见到的AI技术势必越来越多。 先进的AI管理处理器 此外,AI的应用也越来越多,不仅游戏中应用AI技术,现在连可编程渲染的过程里也引入了AI,因此如何去分配显卡内部多样化工作就成了一个问题。如过往显卡在开启DLSS玩游戏时,其中应用到的语言模型和游戏引擎需要同时与GPU的不同核心交互,生成游戏帧,但是往往很难做到每一帧都有一致的生成时间,亦或者是游戏AI对话的响应不够及时,这些情况都会造成游戏体验不友好。 而Blackwell架构为了解决这一问题,引入了AI管理处理器(AMP)。它能够实时调度资源,确保在神经网络渲染、帧生成和 AI 驱动的游戏交互中实现智能化的任务分配。这种设计不仅带来了更高效的性能输出,还让显卡在游戏渲染和 AI 运算之间实现了绝佳的平衡,确保帧的间隔均匀,对话类型的AI能够及时响应,玩家的游戏体验一致性能够比较好的保障。 GeForce RTX 5070规格 说了这么多,接下来给大家介绍一下GeForce RTX 5070的硬件规格。这款显卡的核心采用的是一颗新的核心——GB205,规格上,拥有5个GPC,每个GPC包含的TPC并不相同。GeForce RTX 5070上总共集成了24个TPC,相比上代RTX 4070多了一个。整卡共有48个SM单元,192个TMUs纹理单元,80个ROPs光栅化处理单元,6144个CUDA核心。CUDA核心数量对比上代的5888个,小幅上涨,增加了约4%。 在工艺制程方面,新的GB205核心沿用了TSMC 4nm 4N NVIDIA Custom Process工艺。核心面积为263mm2,相比RTX 4070的AD104核心小了10%,内部晶体管数量也少了一些,不过规格倒是高了5%,可以说是制程工艺的进步所带来的。另一个对比RTX 4070升级的点在于显存的配置,上代RTX 4070的显存为192-bit的12GB GDDR6X,而全新的GeForce RTX 5070则升级为GDDR7显存,显存等效频率由原来的21 Gbps提升至28 Gbps,这已经是上代旗舰才有的水准了。同时视频输出接口也进行了升级,其中DP接口终于升级2.1b,能够兼顾高分辨率与高刷新率,后续开箱显卡时我们会详细介绍。 而我们上手的技嘉GeForce RTX 5070 GAMING OC 12G魔鹰对比MSRP版本的GeForce RTX 5070更进一步,从它后缀的“OC”也能看出这是超频卡。它提升了基础频率、Boost频率以及TDP设定,为的是能够释放更多的性能,带来更极致的体验。事不宜迟,我们下面正式进入测评环节,带大家感受一下主流显卡的魅力。 显卡外观赏析 先看外包装,有一说一,技嘉显卡的外包装一直很有辨识度。这一代的技嘉GeForce RTX 5070 GAMING OC 12G魔鹰也不例外。黑色作为基底,正面是大大的机械风“G”字样,既彰显了这款显卡为电竞而生,同时也表明了它隶属于GAMING系列。 外包装的右下角还标注了这款显卡支持4年质保,这也是不少玩家选择技嘉的原因之一,相比其他品牌更长的质保时间,也多一分安心。 背面包装就比较传统了,主要是显卡外观展示以及部分设计亮点介绍,让玩家对这款显卡有一个基本的了解。 拆开包装,内部除了有显卡本体外,还配备了12V-2×6转接线、显卡支架、灯光同步连接线以及说明书等,应有尽有。 技嘉GeForce RTX 5070 GAMING OC 12G魔鹰在外观设计上采用了纯黑配色,融入了机甲战士的设计理念,将各式各样的赛博机甲与机械美学相结合,视觉效果极佳,颇有种绝地黑武士的凌厉感。 除此之外,如果你细看的话,还可以看到显卡的外部导风罩其实是多层结构设计,并且融合了不同材质,有时摸起来细腻顺滑,有时又能感受到磨砂的那种质感,感觉非常奇妙。 正面的三把散热风扇更是抢眼,根据官方介绍,这三款风扇都是仿生设计,每把风扇配有7片扇叶,而扇叶的设计则结合了鹰的翅膀空气动力学,一侧带有锯齿状的凸起,内圈则有三圈凸起的纹路,能有效降低了风阻和噪音。 风扇的方向也有讲究,一般的显卡三把风扇的转向都是一致的,而技嘉GeForce RTX 5070 GAMING OC 12G魔鹰采用了逆时针旋转,能够减少了互相之间的气流干扰。并且风扇还加入了RGB幻彩光轮,可玩性拉满。 显卡背板设计也颇具特色,与正面一样,融入了机甲风的设计,错落有致的切割线条装饰加上部分凹凸的做工,给颜值增色不少。 并且整个背板为金属材质,能够起到保护PCB兼具散热的作用。背板上还有GIGABYTE以及GAMING系列的LOGO,非常有辨识度。 金属背板的一侧则是大面积的镂空散热窗口,内部的散热鳍片清晰可见,结合正面的散热风扇能够将气流吹透整张显卡,带来更高效的散热能力。 显卡顶部同样融入了机甲设计风格,最显眼的就是这个滑动侧板设计,使用起来还是相当酷炫的。 另外,大大的“GEFORCE RTX”字样已经是NVIDIA显卡的标配了。 旁边则是这款显卡的电源接口,为12V-2×6接口,单口可提供600W供电能力。同时显卡还提供双BIOS模式(性能/静音),两者的区别在于针对风扇的转速调度,功耗和频率上限设置不会受到影响。 底部则是显卡的金手指,这一代显卡的PCIe接口升级成为了5.0速率,这也是首次在RTX 50系显卡上应用,能够带来更高的传输速率,另外仔细看金手指的形状,它和上一代的显卡也有些微的变化。 技嘉还为这款显卡留下了不少小设计,例如无处不在的GAMING标识,极大的提升了显卡辨识度。 最后是视频输出接口部分,还是经典的3个DP加1个HDMI的配置,不过规格上有了升级,技嘉GeForce RTX 5070 GAMING OC 12G魔鹰采用的是DP 2.1b与HDMI 2.1b规格。 理论上,这一代显卡的视频输出接口可以轻松实现4K 480Hz和8K 240Hz超高分辨率与超高刷新率的需求。 重量及厚度方面,这款显卡的裸卡重量为1306g,在三风扇散热的产品里并不算特别显重。显卡整体尺寸为327 x 132 x 56 mm,厚度大概在2.5槽,属于三风扇中高端显卡里的正常尺寸。 下面是一些上机展示,有一说一,效果还是非常惊艳的,非常适合纯黑电竞主题装机。 显卡拆解赏析 下面是显卡拆解环节,PCB为越肩设计,从堆料跟品控都能看出大厂的味道。各种电子元器件布局紧凑且焊点饱满,用料扎实可靠。 PCB背面,密密麻麻的控制芯片被镶嵌其中,除此之外,也可以看出这款显卡是光滑PCB设计,能够避免玩家在自行组装时手指被划伤和握持不当造成的损坏。 PCB中央的就是GB205-300-A1芯片,基于Blackwell架构打造,采用TSMC 4N工艺。共有48个SM单元,192个TMUs纹理单元,80个ROPs光栅化处理单元,6144个CUDA核心,相比RTX 4070小幅上涨。 核心的四周则是显存芯片,为6颗三星2GB GDDR7显存颗粒,提供192bit显存位宽与高达672GB/s的显存带宽,性能表现超越RTX 4070搭载的显存。 供电设计上,技嘉GeForce RTX 5070 GAMING OC 12G魔鹰为9+3相供电配置,能够充分满足显卡内部各组件的电力需求。 每相供电都配备了独立的DrMOS芯片,根据丝印可以看出,其为AOS的AOZ5310NQI-A。 电源管理芯片则为丝印编码ENC0的芯片,属于AOS的AOZ73004CQI,同时还有一颗uPI uS5650Q用于电源监控。 细节之处还可以看到视频输出接口部分,技嘉使用了镀金工艺,能够大幅提升接口的抗氧化能力。 接下来拆解散热器部分,技嘉GeForce RTX 5070 GAMING OC 12G魔鹰搭载的是名为“风之力”的散热系统。 首先引入眼帘的就是超大尺寸的铜板与服务器级导热凝胶,相比一般的RTX 5070显卡,可谓豪华。 散热器分为两段式结构,铜板直接接触底部的散热鳍片,再加上复合式热管,可快速将GPU芯片和显存的热量传递出去。 鳍片内部包裹的是7根复合式热管,配合回流焊接工艺和金属外壳的高导热特性,散热性能可谓备受期待。 主动散热相信大家在外观赏析中已经见识过了,为正面的散热风扇,它们不仅支持常规的3D启停、正逆转等基础功能,散热性能不容小觑。 测试平台介绍 开始性能测试前介绍一下本次的测试平台, CPU使用的是目前毫无争议的游戏神U——AMD Ryzen R7-9800X3D,主板则是来自技嘉的X870 AORUS ELITE WIFI 7主板,,刷新到最新版本BIOS的同时,在BIOS中开启X3D模式,以便获得更好的性能表现。 内存为G.Skill的幻锋戟Z5 RGB DDR5,在这块主板上能轻松达成DDR5-8000 C38的成绩,并且我们这次选用的是24G×2的套条,确保这张显卡能够释放全部性能。 完整测试平台配置如下: 理论性能测试 开始测试前,先查看这款显卡的GPU-Z信息。可以看到技嘉GeForce RTX 5070 GAMING OC 12G魔鹰的基准频率为2325MHz,Boost频率为2625MHz,这在一众OC超频版显卡中也是T0级别的存在。其他方面,这张显卡的BIOS设定TDP最高为300W,并且还配备了战未来的PCIe 5.0接口。 理论测试部分,我们使用3DMark进行。在以DX11为基础的Fire Strike项目中,实测技嘉GeForce RTX 5070 GAMING OC 12G魔鹰在1080P分辨率下,相较于RTX 4070有着约37%的性能优势;在2K分辨率下,其领先幅度进一步扩大至42%;而在4K分辨率下,其性能优势最为显著,能够达到46%的领先幅度。此外,在以DX12为基础的Time Spy测试中,技嘉GeForce RTX 5070 GAMING OC 12G魔鹰同样表现出色,虽然领先幅度不及Fire Strike项目,但依然有着约30%的性能提升。 另一个提升比较大的点则是Port Royal光追,技嘉GeForce RTX 5070 GAMING OC 12G魔鹰的得分是14400分,作为对比RTX 4070为11150分,提升了约29%。另外我们还测试了Solar Bay项目,这个项目可以综合性的测试你的PC的整体性能,在配置相同的情况下,技嘉GeForce RTX 5070 GAMING OC 12G魔鹰的得分更高,比RTX 4070高出29%,表现非常可观。 DLSS 4性能测试 看完了理论性能部分的测试,接着我们再来看看本次RTX 50系显卡最“顶”的升级,DLSS 3在RTX 40系显卡上引入了帧生成技术,能够依靠AI在两帧之间生成一帧AI帧,从而实现帧数的翻倍,用过的玩家都说好!不过由于每生成一个新的帧都需要光流加速器和 AI 模型参与,因此生成多帧的开销相当高昂,而过高的性能开销会带来瓶颈,导致帧率提升受限。 而这次DLSS 4全新升级,引入了多帧生成技术,它可以利用 AI 为每个渲染帧额外生成多达3帧!相比传统渲染的方式,能够最多实现8倍的性能提升。并且每次渲染额外帧只需要AI模型执行一次,就能输出三帧画面,因此无论是对性能、显存的开销还是延迟都比之前要好了许多。 另外,由于多帧生成技术,输出的帧多了,要给每一帧都安排一个合理的间隔刷新才能让观感更好。因此NVIDIA还引入了专属的Flip Metering来代替CPU Pacing,它将帧节奏逻辑转移到显示引擎,让GPU能够更精确地管理显示时间,尽可能的将每一帧画面的生成时间保持一致,从而提高整体游戏视觉的流畅感。不过由于Flip Metering是硬件级的控制器,因此DLSS 4的多帧生成目前只有RTX 50系显卡支持。 同时DLSS 4 还引入了图形行业首个 Transformer 模型实时应用。熟悉AI的应该对它很熟系了,它在AI生成领域已经应用多年了。基于Transformer架构的 DLSS 超分辨率和光线重建模型,相比之前DLSS使用的卷积神经网络(CNN)模型来说,具备2倍的参数量和4倍的计算量。在游戏场景中,能够提供更高的稳定性、更少的拖影、更高的细节和更强的抗锯齿能力,使画面更加清晰、流畅和逼真。 不过虽然DLSS 4的多帧生成功能是RTX 50系显卡的独占功能,但新的Transformer模型将会逐步下放至DLSS 3、DLSS 2等,将适用于所有GeForce RTX显卡。并且根据NVIDIA的说法,超过75款游戏和应用将在GeForce RTX 50系列开售时支持DLSS 4的全新DLSS多帧生成功能,包括《赛博朋克2077》《战神:诸神黄昏》《心灵杀手2》《霍格沃兹之遗》等,《黑神话:悟空》也将于今年晚些时候升级支持 DLSS4的多帧生成。随着时间的推移,支持DLSS 4的游戏和应用数量将不断增加。 在DLSS 4的理论性能测试中,技嘉GeForce RTX 5070 GAMING OC 12G魔鹰的表现更令人惊叹。通过3DMark测试可以看出,开启DLSS 4后,帧数有了质的飞跃,开关前后的性能差距巨大。特别是在2K分辨率下,性能差距接近5倍;而在4K分辨率下,差距更是达到了6倍之多。与DLSS 3相比,帧数也能够提升70%以上,几乎接近翻倍。更令人震撼的是,在8K分辨率下,搭载DLSS 4的技嘉GeForce RTX 5070 GAMING OC 12G魔鹰能够达到105 FPS,这在过去是只有旗舰显卡才能企及的高度。 接着我们看看DLSS 4在实际游戏中的表现,率先登场的就是有着“显卡杀手”之称的《赛博朋克2077》,它的设置页面是目前支持DLSS 4游戏中最为丰富一款,除了能够设置DLSS 4的多帧生成外,还可以切换DLSS 4的另一个特性——Transfomer Mode,据说能够让画质更清晰,同时还能改善此前的拖影问题,对玩家可以说是一大利好。 我们直接来一波对比,左侧为Transformer模型,右侧则是原本的CNN模型。从第一个场景来看,Transformer模型能够带来更多的细节。例如左侧图片中的栏杆倒影,这部分表现是比较清晰的,而CNN模型中则几乎不可见。 第二个场景也是能够一眼看出区别的,例如金属门的纹理细节以及砖墙的接缝处,明显是Transformer模型的优化要更好一些。 这个场景的区别主要在于地板细节刻画以及右侧铁栏杆部分,采用Transformer模型的情况下,地板细节更接近真实世界,并且铁栏杆的细节也能更好的还原。而CNN模型则会丢失比较多的细节,虽然不影响观感,但总有种“失真感”。 不过Transformer模型目前也并非万能,毕竟是由AI生成而来,因此在部分细节上还是有些错误的。例如下方的窗口部分,阳光照射下应该是斑驳的光影,比较正确显示的应该是CNN模型中的样式。整体来看,现在Transformer模型瑕不掩瑜,大幅改善的画面细节能够给玩家带来更精致的游戏展现。 下面是DLSS 4的性能实测,在最高画质+路径追踪的情况下,技嘉GeForce RTX 5070 GAMING OC 12G魔鹰只能跑23.58 FPS,几乎不可玩。然而,开启DLSS 3后,帧数便有了显著的提升,达到了83.93 FPS,游戏体验变得相当流畅。开启DLSS 4以后,技嘉GeForce RTX 5070 GAMING OC 12G魔鹰能够做到2K分辨率在2K分辨率下的帧数更是飙升至151.76 FPS,足以满足高刷显示器的需求。相较于原生分辨率,性能也提升了整整6.4倍。1%Low的表现也很亮眼,64 FPS的表现意味着游戏过程中很少出现掉帧的情况,整体运行极为稳定。 DLSS 4带来的性能提升是有目共睹的,不过也有玩家担心DLSS 4的画质表现如何,这里我们也在游戏中截取了部分画面,第一个场景其实差距不大,肉眼很难分辨出区别。 第二与第三个场景还是能够看出部分细节的,例如第二幅图中的霓虹灯牌,DLSS开至性能档以后,能够看到灯牌与前面三张图有些许差异,不过你得靠细致的对比才能看出。实际游戏过程中很难发现,基本不影响观感。 总的来说,DLSS对画质的影响没有玩家想象中那么大,甚至于在纹理细节上能够不输或超越原生分辨率。如果你是敏感型玩家,那建议可以开至平衡档,在画面质量和帧率之间能够做到很好的平衡。如果你是追求超高帧率,那性能档也绝对可用,细节保留也不错,不对比基本看不出,同时帧率还能进一步提高。 我们测试的第二款DLSS 4游戏是《霍格沃兹之遗》,支持DLSS 4技术以后可以在设置看到帧生成部分多了一些选择,其中×2则是原本DLSS 3的帧生成,而×4则是RTX 50系独有的多帧生成功能,另外你也可以选择插2帧的方式,也就是所谓的×3选项。 在体验《霍格沃兹之遗》的过程中,可以感受到这款游戏的优化确实做得不错。在2K分辨率下,将画质和光追均设置为最高时,技嘉GeForce RTX 5070 GAMING OC 12G魔鹰在不开启任何超分的情况下,平均帧数能够达到67 FPS,完全可以流畅地进行游戏。若开启DLSS 3的质量档,帧数则会显著提升至141 FPS,此时的游戏体验极为流畅,基本达到了2K@144Hz的标准。而当开启DLSS 4后,帧数更是飙升至209 FPS,这种程度的帧数提升已经远远超出了高刷新率的需求,可以说是极致的流畅。与原生2K分辨率相比,性能提升了约3倍以上。 第二款游戏我们测试的是《星球大战》,一样你能在设置中看到其帧生成功能已经支持4x的选项,也就是DLSS 4多帧生成功能。不过这项功能是RTX 50系独占,如果你是RTX 40系显卡,则只有2x的选项,即传统的帧生成。 在实测中,《霍格沃兹之遗》这款游戏对显卡的压力相当大,不开启任何超分技术的话,游戏体验几乎难以忍受。在2K原生分辨率下,技嘉GeForce RTX 5070 GAMING OC 12G魔鹰的平均帧数仅有27 FPS,游戏画面卡顿严重,延迟也高得惊人。然而,当开启DLSS 4质量档后,情况发生了巨大转变,游戏平均帧数直接飙升至150 FPS,为玩家带来了流畅的2K高刷3A游戏体验。这一表现相较于原生2K分辨率,性能提升了约5.5倍之多。即使与DLSS 3的82 FPS相比,性能提升也接近翻倍,效果十分显著。与此同时,延迟表现也得到了极大改善,几乎下降了一半,游戏过程更加顺畅自然。 最后一款游戏是我们的老熟人《漫威争锋》,这款游戏在我们测试RTX 5090 D、RTX 5080以及RTX 5070 Ti之时,它还没有完全适配DLSS 4,玩家想要体验多帧生成功能还需要依靠NVIDIA App的DLSS 4优设功能。不过现在《漫威争锋》也正式支持DLSS 4了,与上面的游戏一样,玩家在游戏设置中就能直接开启,并且提供了2x、3x以及4x选项,玩家可以随意选择是插一帧、插两帧还是插三帧。 我们直接选择4x的档位,即插三帧的DLSS 4。实测技嘉GeForce RTX 5070 GAMING OC 12G魔鹰在2K全高设置下,不开超分,帧数为98 FPS,畅玩已经没有问题了。不过FPS游戏追求的就是极致的帧数!开启DLSS 3后,帧数可以达到198 FPS,相比原生分辨率已经提升了一倍以上,如果再开启DLSS 4多帧生成,那性能对比原生分辨率的话,更是提升3-4倍,327 FPS直接晋级电竞3A。同时延迟表现也非常出色,原生分辨率下,其延迟为42 ms,而开启DLSS 4以后,延迟甚至能够降低至25 ms,游戏会更加跟手,体感更佳。 当然,如果你想玩的游戏还不支持DLSS 4,那也不用担心,NVIDIA App还提供DLSS 4优设功能,说人话就是能够让游戏强开DLSS 4,像此前的《漫威争锋》,在未更新前,玩家可以直接在NVIDIA App中简单设置,就能将帧生成调至“4×”,一键实现多帧生成。目前也有不少游戏支持DLSS 4优设功能,感兴趣的玩家可以前往体验。 总的来说,DLSS 4的多帧生成技术的诞生,让主流级显卡也能媲美过往旗舰级显卡的游戏性能,确实让玩家的游戏体验提升到了新的高度。就拿我们正在测试的技嘉GeForce RTX 5070 GAMING OC 12G魔鹰来说,与上一代RTX 40系显卡的DLSS 3帧生成功能相比,简直是帧数的飞跃。在相同的画质设置下,RTX 5070的表现远远超过了RTX 4070,其帧数更是几乎RTX 4070的两倍! 另外,值得一提的是,与DLSS 4一起到来的还有全新的NVIDIA Reflex 2技术。延迟一直是电竞中绕不开的话题,玩家的每个动作都会经过复杂的计算,再在屏幕上渲染,这其中的每一步都会增加延迟。虽然延迟往往只有几十毫秒,但是你却能明显的感觉到游戏的不流畅、卡顿。 为了尽可能的降低延迟所带来的不良游戏体验,NVIDIA发布了NVIDIA Reflex技术,它可以使GPU和CPU同步,确保最佳响应速度和低系统延迟。目前NVIDIA Reflex已集成到超过100款游戏中,可以将PC延迟降低50%。 而GeForce RTX 50系显卡再度升级,带来了NVIDIA Reflex 2技术。它结合了Reflex低延迟模式与Frame Warp技术。它可以把最新的鼠标输入指令同步给渲染帧,及时更新渲染的游戏帧并在渲染帧被发送到显示器之前获取最新的鼠标信息,通过刷新渲染的游戏帧以进一步减少延迟,将PC延迟进一步降低多达75%。 另外,Frame Warp的加入,能够进一步将延迟降低。当一个帧被GPU渲染时,CPU会根据最新鼠标或手柄输入计算工作流中下一帧的视角位置。Frame Warp从CPU采样新的视角位置,然后将GPU刚才渲染的帧扭转到最新的视角位置。在渲染帧被发送到显示器之前,在尽可能最新的时间进行扭转操作,确保屏幕上反映最新鼠标输入。 而当Frame Warp转移游戏像素时,图像中可能会产生缝隙撕裂、镜头位置的变化会让游戏场景中显示新的部分。NVIDIA则开发了一种优化了延迟的预测渲染算法,该算法使用来自先前帧的视角、颜色和深度数据,对这些撕裂空白的像素进行准确的图像修复。玩家可以通过更新的视角看到没有撕裂的渲染帧,并降低了改变游戏内视角位置而产生的延迟。说人话就是现在NVIDIA Reflex 2还可以根据上一帧的信息去脑补一些空白的像素,有种无中生有但你又看不出来的感觉。 首发支持NVIDIA Reflex 2技术的游戏是《THE FINALS》以及《无畏契约》,后续我们也会第一时间带给大家该技术的详细评测。 游戏性能测试 看完了RTX 50系专属的DLSS 4以后,下面我们要测试的是常规的游戏性能,毕竟还有些游戏目前不支持DLSS 4。老样子,先跑3DMark的DLSS 3性能测试。技嘉GeForce RTX 5070 GAMING OC 12G魔鹰在2K分辨率下,对比RTX 4070性能提升幅度非常大,大概在32%左右,4K分辨率下,开启DLSS 3以后性能领先也在31%以上,至于8K,在上面的DLSS 4大家也看到了,它绝对是有一战之力的。 具体游戏测试方面,我们选取了12款游戏进行测试,包含光追及光栅性能方面的测试,而游戏画质方面均全部选择最高画质,光追设定部分,如有则采用最高。我们也会加入RTX 4070的成绩,方便大家了解技嘉GeForce RTX 5070 GAMING OC 12G魔鹰的提升有多少。 技嘉GeForce RTX 5070 GAMING OC 12G魔鹰在多款主流游戏里性能表现出众。像在《极限竞速:地平线5》中,它能跑到225帧的超高帧率,比前代显卡高出约39%,玩家可以畅享极致流畅的驾驶体验;即便是在对硬件要求极高的《赛博朋克2077》里,当开启超级光追和DLSS 3质量模式时,它也能达到127.08帧,比前代快了24%,游戏中夜之城的霓虹光影、复杂的人物建模和逼真的天气效果都能完美展现。总之,2K光栅和光追对于RTX 5070来说完全不在话下。 图像视频创作性能测试 接下来我们重点关注一下这款显卡的创作能力。技嘉GeForce RTX 5070 GAMING OC 12G魔鹰在综合场景下的性能表现十分亮眼。根据PCMark10 Extended测试结果来看,这款显卡在游戏和数位内容创作方面相较于RTX 4070有了约20%的提升,与更高端的RTX 5070 Ti相比,二者差距也仅在10%左右。不过在生产力测试中,其成绩相对较低,这种情况与我们之前测试的其他RTX 50系显卡类似,推测可能是当前驱动还不够完善所导致的。 细分场景,办公软件的测试我们用的则是UL Procyon的Office Productivity测试,总分方面技嘉GeForce RTX 5070 GAMING OC 12G魔鹰为8487分,是三款显卡中最高的,领先上代显卡约3%,对比RTX 5070 Ti也丝毫不逊色。 在UL Proccyon的图像编辑测试中,三款显卡表现相当,难分伯仲。然而在视频剪辑测试方面,差距则明显拉开,毕竟RTX 50系显卡配备了新一代编解码器,并支持更多格式的编解码。实测显示,技嘉GeForce RTX 5070 GAMING OC 12G魔鹰对比RTX 4070,性能提升了整整20%,与RTX 5070 Ti的差距也缩小至5%左右。 Adobe和达芬奇的Pugetbench测试结果进一步验证了这一点,视频编辑部分的提升尤为显著,这主要得益于RTX 5070对编码器的升级。例如,在达芬奇和PR的测试中,技嘉GeForce RTX 5070 GAMING OC 12G魔鹰领先RTX 4070约18-32%。 3D渲染创作性能测试 接下来我们把目光投向3D渲染以及工业领域,技嘉GeForce RTX 5070 GAMING OC 12G魔鹰在Blender和V-Ray中的表现十分出色。在Blender中,其性能比RTX 4070高出18%-35%;而在V-Ray中,更是领先RTX 4070达49%之多。不过,与RTX 5070 Ti相比,仍存在28%的差距。但考虑到两者的价格差异,这样的性能差距也在合理范围之内。 再看看另外一款渲染器,D5 Render作为一款基于DXR和光线追踪技术的GPU渲染器,凭借其先进的光线追踪技术,能够呈现出令人惊艳的渲染画面。在对RTX 40系显卡进行测试时,D5 Render已经支持了DLSS 3帧生成技术。而随着RTX 50系显卡的推出,通过NVIDIA App,D5 Render现在也支持最新的DLSS 4多帧生成功能。 在实际测试中,开启DLSS 4后,渲染预览界面的流畅度得到了极大的提升,帧数稳定在200 FPS左右。与未开启DLSS时的57 FPS相比,性能提升达到了4倍以上,这种提升是革命性的。即使与RTX 40系显卡的DLSS 3相比,DLSS 4也展现出了其强大的优势,帧数翻倍,为用户带来了全新的渲染体验。 在工业领域,我们选择了极具代表性的SPEC2020进行测试。在多项测试中,技嘉GeForce RTX 5070 GAMING OC 12G魔鹰展现出了卓越的性能。与RTX 4070相比,平均有30%的性能提升,这一提升幅度令人瞩目,甚至超出了我们的预期。在不少测试项目中,RTX 5070与更高端的RTX 5070 Ti之间的差距也并不大,通常在10%左右。这表明RTX 5070在性能上已经非常接近更高端的RTX 5070 Ti,能够为预算有限的用户提供极高性价比的选择。 NVIDIA编解码测试 在接下来的测试中,我们将深入了解RTX 50系显卡的编解码器性能。GeForce RTX 50系列显卡配备了第9代NVENC编码器和第6代NVDEC解码器,支持AV1 UHQ(超高画质AV1)和MV-HEVC(多视角HEVC)编解码。此外,该系列显卡还升级支持DisplayPort 2.1 UHBR20输出,单一通道带宽达20Gbps,为用户带来令人惊叹的HDR视觉效果、超高分辨率和更流畅的游戏体验。 在测试中,我们使用最新版本的达芬奇软件,导入NVIDIA提供的4K60片源和工程文件,分别测试AV1、H.265和H.264格式下的编码导出时间。结果显示,技嘉GeForce RTX 5070 GAMING OC 12G魔鹰在导出这三段视频的时间分别为16秒、15秒和16秒,相比RTX 4070分别快了63%、73%和69%。虽然在短时长的视频中,时间差距看似只有几秒,但如果换成大型视频工程项目,节省的时间将非常可观。 此外,我们还对不同格式的导出视频进行了画质对比。测试结果表明,AV1编码的视频在画质上与H.265和H.264并无明显差异。无论是在文字、人像还是建筑画面中,三者的画质都难分伯仲,普通观众在不特意标注格式的情况下,很难用肉眼区分。随着视频网站、剪辑软件和硬件厂商的不断推动,AV1格式有望成为下一个广受欢迎的视频编码标准。 值得一提的是,GeForce RTX 50系显卡还能够支持4:2:2色度取样的视频编解码,这将节省CPU的负担,加快创作速度。上面的图表里也可以看到我们的测试成绩,实测导出时间会比上代显卡快不少,毕竟RTX 40系显卡不支持该功能,仅支持4:2:0色度采样,如果一定要4:2:2导出只能靠CPU软解。 4:2:2色度采样的视频文件采用的是YUV颜色格式,与存储红色、绿色和蓝色(RGB)值不同,颜色被存储为亮度Y、蓝差色度U和红差色度V。在这类视频中,视频的完整亮度将被保留,而原始色度信息只保留一半,因此相比4:4:4的视频,其视频帧数据量仅有不到三分之二,而相比4:2:0的视频又能提供两倍的颜色分辨率,因此创作者采用这种格式拍摄,能够在保留更多色彩信息的同时还能减少文件大小和带宽需求。 AI性能测试 在这个人人都谈AI的时代,我们的评测也少不了AI方面的测试,RTX 50系显卡也针对AI进行了改进,最重要的一点就是加入了对FP4精度模型加速处理的支持,它相比此前RTX 40系上的FP8精度,能够实现更快的生成速度,同时显存占用也更低。 首先我们用UL Procyon的FLUX.1 AI Image Generation Demo For NVIDIA进行测试。在使用FP4精度模型时,技嘉GeForce RTX 5070 GAMING OC 12G魔鹰能够做到13.176s生成一张图,而RTX 4070则要50秒以上,性能差距有3倍之多,同样的设置,生成4张图片,技嘉GeForce RTX 5070 GAMING OC 12G魔鹰只需要52秒,而前代显卡则要足足3分钟以上。 值得一提的是,FP4精度模型生成的图片也非常能打,从下图就能看出来,其与FP8生成的图片几乎没有区别,玩家完全不用担心图片质量问题,大胆创作即可。 在AI文本生成测试中,技嘉GeForce RTX 5070 GAMING OC 12G魔鹰同样表现出色。使用MLPerf Client v0.5大语言模型进行测试,该模型基于Meta的Llama 2 7B开源LLM,涵盖内容生成、创意写作以及文本总结摘要等四项AI任务。技嘉GeForce RTX 5070 GAMING OC 12G魔鹰几乎是压倒性的优势赢过上代显卡,在每一项任务中都领先RTX 4070约15%左右。 为了进一步验证其性能,我们还使用UL Procyon的AI Text Generation测试了更多的大语言模型,在Llama 3.1 7B和Mistral-7B两项测试中,技嘉GeForce RTX 5070 GAMING OC 12G魔鹰相比RTX 4070提升了20-30%。而在参数扩大至Llama 2 13B的测试中,技嘉GeForce RTX 5070 GAMING OC 12G魔鹰的表现更加亮眼,领先RTX 4070约116%,优势非常明显。 超频潜力测试 上面我们提到,这款显卡的TDP上限能够去到300W,因此我们也测试了这款显卡的超频潜力。实测这款显卡在性能模式、功耗解锁至111%、风扇转速手动拉满的情况下,最大可以将核心超频75MHz,显存超频150MHz。实测Time Spy得分23060,整体表现还是非常可观的。 功耗与温度表现 最后一项测试烤机,这也是许多玩家关注的重点。技嘉GeForce RTX 5070 GAMING OC 12G魔鹰配备了性能以及静音两种BIOS模式,我们分别进行测试。在性能模式下,Furmark烧机10分钟后,得益于技嘉GeForce RTX 5070 GAMING OC 12G魔鹰出色的设计底蕴,核心温度并不高,仅有63度,显存温度更是低至52度,此时显卡的最大功率为359.7W,已经完全顶着TDP的上限了,风扇转速则是1650 RPM,表现相当惊人,甚至接近不少水冷卡的表现了。 在静音模式的设定下,同样是烤机10分钟,核心温度稍有提升,为68.8℃,显存则是58℃,表现也非常不错。静音模式还有一个优势就是风扇转速降低了,烤机时为1380 RMP,与性能模式相差了300RPM,整体噪音表现会更加优秀。 横向对比RTX 4070时可以看到,虽然新显卡的TDP提升了,不过整体的烤机功耗并不算高,特别是技嘉GeForce RTX 5070 GAMING OC 12G魔鹰还配备双BIOS,无论是更激进的性能模式还是更安静的静音模式,核心与显存的温度都还控制得不错,属于是非常惊喜了。 评测总结 实测下来,技嘉GeForce RTX 5070 GAMING OC 12G魔鹰绝对是一张面面俱到的主流级游戏显卡。这款显卡在设计上尽显精工巧思,采用了经典的三风扇布局,不仅有效提升了散热效率,还能在高负载运行时保持冷静,确保性能稳定输出。其硬朗的外观风格简约而不失大气,低调的色调中透露出一丝神秘感,恰到好处的灯效设计更是为其增添了几分科技美感,无论是安装在何种风格的机箱内,都能轻松融入并成为焦点。 在技术层面,这个就不必多说了,服务器级别的Blackwell 架构设计,同时还应用了TSMC 4N工艺,使得显卡在面对复杂计算任务时能够游刃有余,同时还能保持高效的能耗管理。顶级的工艺加上卓越的架构设计,能够带来更高的分辨率和更复杂的图形效果,为游戏玩家提供更逼真、流畅的游戏体验。 性能表现各位玩家就更不用担心了,技嘉 GeForce RTX 5070 GAMING OC 12G 魔鹰在 2K 光追游戏场景中展现出了非凡的实力,无论是画面细节的呈现还是帧率的稳定性都令人满意,配合 DLSS 4 技术后,画质与性能实现了完美平衡,让玩家可以在高画质、高帧率下尽情畅玩各类 3A 大作。在创意软件领域,它凭借强大的图形处理能力,能够快速完成视频渲染、3D 建模等复杂任务,支持更先进的 4:2:2 10bit 视频格式,为创作者提供了更广阔的创作空间和更高效的 workflows。 而在当下热门的 AI 领域,这款显卡更是如鱼得水,其 CUDA 核心为 AI 计算提供了强大的算力支持,使得深度学习、图像识别等 AI 应用的运行速度大幅提升,无论是 AI 研究人员还是普通用户在使用 AI 工具时,都能感受到事半功倍的高效体验。在目前 4000 - 5000 元的中高端显卡市场中,它无疑是一款综合实力强劲、全面发展的优秀产品,能够满足不同用户在游戏、创作以及 AI 应用等多方面的需求。目前,这款显卡已经上架各大电商平台,,感兴趣的玩家不要错过~ |
原创栏目
硬件热点
硬件视频
IT百科
网友评论
聚超值•精选