首页 > DIY外设 > 显卡 > 评测> 正文

NVIDIA GeForce RTX 5070 Ti 16GB首发评测:性能飙升30%,AI大升级,中高端显卡的强势蜕变!

DIY硬件频道 编辑:陈奕翰 发布于:2025-02-19 22:00 PConline原创

写在开头

不知道前段时间屏幕前的你抢到了GeForce RTX 5090D或GeForce RTX 5080没呢?旗舰级的显卡代表极致的性能表现,但更多玩家追求的是性能释放足够优秀的同时,还能够有性价比的定价。因此RTX 50系的70级显卡来了!还是熟悉的味道,全新服务器级别的Blackwell架构,TSMC N4工艺打造,还有DLSS 4、Reflex 2等诸多黑科技集于一身!率先推出的则是GeForce RTX 5070 Ti显卡。

比较可惜,这一级别的显卡NVIDIA并没有打算推出FE公版设计,而是全由AIC厂商来把控。看过我们GeForce RTX 5080 FE评测的玩家都知道,其银黑相间而又小巧轻薄的设计,妥妥的性能黑武士。不过没关系,本次测试将会使用NVIDIA提供的影驰GeForce RTX 5070 Ti魔刃。一样是黑色的设计,一样的SFF READY标准设计,并且电竞风格十足。即使你不喜欢黑色的显卡,影驰也为我们提供了白色版本的影驰GeForce RTX 5070 Ti圣刃。

事不宜迟,就让我们往下看看GeForce RTX 5070 Ti能否引领更极致的性能表现!再现70级显卡荣光!

规格介绍

开始前,照例讲讲新显卡的规格。GeForce RTX 50系显卡采用了此前NVIDIA在AI领域推出的Blackwell架构,以大卫·布莱克威尔命名,其是一名受人尊敬的数学家和统计学家,在博弈论和统计学领域留下了不可磨灭的贡献,NVIDIA用其名字命名这一架构反映了新平台的开创性和先进的计算能力。Blackwell可以说是NVIDIA近年来更新幅度最大的GPU架构了,相比起之前的架构来说,划时代地引入了神经网络着色器,力图为游戏开创先进、高效更有逼真的渲染方式,带给玩家全新的游戏体验。

相比前代Ada架构,Blackwell的升级聚焦于四大方向:分别是AI算力的爆发、光线追踪技术的革新、显存能效的提升以及划时代的神经网络渲染。

第五代Tensor Core

其中AI算力的爆发就不得不提到Blackwell架构上的第五代,新一代Tensor Core添加了对FP4浮点运算精度的支持。FP4是一种较低的量化方法,类似于文件压缩,可以减小模型推理过程中数据存储和计算量大小,提高计算效率,降低该过程对显存的要求。与大多数模型默认使用的FP16相比,FP4使用的显存不到其一半,并使GeForce RTX 50系列GPU的性能相比上一代提升高达2倍。

第四代

而光线追踪技术的革新则仰赖于第四代的加持,相较于第三代来说,Blackwell架构的第四代主要提升了检测光线、路径与三角形相交的效能,过往在检测时往往只能检测单个三角形,一旦场景复杂,检测能力不足就容易导致渲染出错等问题,而现在检测能够以簇集方式进行,检测效率更高。同时还有三角形簇集解压缩引擎加持,其新增了Linear-swept Spheres(LSS)功能,可以减少渲染毛发所需的几何图形数量,并使用球体代替三角形以获得更准确的毛发形状拟合,能够让显卡发挥更好的性能但只消耗较小的显存占用。

综合来看,Blackwell架构的光线追踪多边形相交效率是上一代Ada架构的2倍,是Turing架构的8倍,同时还可以节省25%的显存使用率。

第四代的改进主要是为实现更好的光追效果。其中有两项新技术能够受益,第一项是RTX Mega Geometry技术。随着光线追踪游戏场景的几何复杂性不断增加,游戏画面中几何图形的计算量也呈现出快速增长的趋势。而RTX Mega Geometry技术能够加速构建边界体积层次结构(BVH),使得在实时渲染中可以处理多达100倍的三角形数量。

该技术的出现,也使得开发者能够在游戏场景中使用更复杂的几何图形,而不会影响游戏帧率。过去需要一个个算BVH,现在RTX Mega Geometry能够智能地在GPU上批量更新三角形簇,减少了CPU的负担,既保证了性能,也兼顾了图像质量。相信随着这些技术的不断发展和应用,未来的游戏将能够呈现出更加逼真和细腻的视觉效果,同时保持高效的性能表现。

另外一个能够受益的技术则是Curve Primitive,方便光追在曲面中的应用,例如一位男士的头发可能需要多达400万个三角形,再加上光线追踪技术,画面所需要的运算负载极大。NVIDIA则通过第四代中的Linear- Swept Spheres(线性扫描球体)技术有效减少了渲染头发所需的几何体数量,以球形代替多边形,更贴合头发的形状,从而将内存占用量大幅缩减至三分之一,并进一步提升了实际帧数,让头发的渲染效果更加自然流畅。

GDDR7显存

第三点改变则是显存效率的提升,Blackwell架构中还首次加入了对GDDR7显存的支持,此前GDDR6显存的信号编码为NRZ/PAM2,而RTX 40系上的GDDR6X则是PAM4编码。最新的GDDR7显存,信号编码改成了PAM3,NRZ/PAM2每周期提供1位的数据传输,PAM4每周期提供2位的数据传输,而PAM3每两个周期的数据传输为3位。说人话就是,新的编码机制可以使杂讯失真比减小,信号品质更清晰,同时还能带来更高的显存运行频率以及更低的电压,根据NVIDIA的介绍,使用GDDR7显存后,数据传输速率可达GDDR6时的2倍,并且功耗接近GDDR6的一半,经典加量还减价。

神经网络着色器

接着我们再细说一下这一代架构的最大变化,NVIDIA这次将Blackwell架构的SM单元直接称为神经网络着色器。相比较于之前的可编程着色、CUDA统一着色、通用计算着色来说,其最大的变化就是引入了AI,AI将会彻底改变GPU的着色方式。

在Blackwell架构中,NVIDIA 进一步拓展了神经网络渲染的范畴,引入了诸多创新元素,包括神经网络纹理压缩(Neural Textures)、神经网络材质(Neural Materials)、神经网络体积(Neural Volumes)、神经网络辐射场(Neural Radiance Fields)以及神经网络辐射缓存(Neural Radiance Cache)等,这些元素共同构成了神经网络渲染中神经网络着色的重要呈现方式。

这里举个例子让大家能够更简单地理解神经网络渲染,过去复杂的物品或大量异材质的贴图往往会占用相当大的内存空间,如果叠加光追的话,计算量将会更大。然而,得益于神经网络渲染技术中的神经网络材质功能,这一问题得到了显著改善。开发者可以先在离线渲染出物品的光照数据,然后再用这些数据训练一个小的AI模型,游戏运行时只要实时调用这个AI模型当场推理就好了,这样就能还原出想要的光照效果了,再配合神经网络纹理压缩技术,就能显著降低实际生成的材质数据量,从而在占用更少显示内存的同时,实现了细节更丰富的材质表现,达到了实时生成如电影般细腻素材的效果。

目前神经网络渲染技术已经得到了微软的大力支持,未来也将会加入DirectX中,玩家能够体验到更真实的游戏世界。

而在硬件层面,由于神经网络渲染的加入,Blackwell架构的SM单元相较于RTX 40系的Ada架构还是有不小变化的,Ada架构内的SM内,SM单元会拆分成一半的CUDA专门用于处理FP 32(单精度浮点数),另一半则依需求动态调整去处理FP32和INT32(32位整数)。而在Blackwell架构上,SM单元则改成了CUDA核心可以完全依需求动态处理FP32和INT32的形式。

另外一个改进是,过往的着色工作往往只有SM单元的Shader在处理,而Blackwell架构上引入了神经网络渲染以后,使得Blackwell架构上的第五代也能共同分担着色工作,大大提高了着色效率。

这样改进的好处是,Blackwell架构能够进一步针对神经网络渲染工作进行排序,即把传统的着色工作分配给Shader,而需要动用神经网络渲染的工作负载则可以给到上,两种核心同时运用,效率最高可以提升2倍之多。并且得益于也加入了可编程渲染管线,现在开发者或API也能更好地调用,未来游戏内我们能见到的AI技术势必越来越多。

先进的AI管理处理器

此外,AI的应用也越来越多,不仅游戏中应用AI技术,现在连可编程渲染的过程里也引入了AI,因此如何去分配显卡内部多样化工作就成了一个问题。如过往显卡在开启DLSS玩游戏时,其中应用到的语言模型和游戏引擎需要同时与GPU的不同核心交互,生成游戏帧,但是往往很难做到每一帧都有一致的生成时间,抑或者是游戏AI对话的响应不够及时,这些情况都会造成游戏体验不友好。

而Blackwell架构为了解决这一问题,引入了AI管理处理器(AMP)。它能够实时调度资源,确保在神经网络渲染、帧生成和 AI 驱动的游戏交互中实现智能化的任务分配。这种设计不仅带来了更高效的性能输出,还让显卡在游戏渲染和 AI 运算之间实现了绝佳的平衡,确保帧的间隔均匀,对话类型的AI能够及时响应,玩家的游戏体验一致性能够比较好地保障。

GeForce RTX 5070 Ti规格

说了这么多,接下来给大家介绍一下GeForce RTX 5070 Ti的硬件规格。这款显卡的核心采用的是GeForce RTX 5080同款GB203,不过核心代号上稍有区别,GeForce RTX 5070 Ti为GB203-300-A1。规格上,拥有6个GPC,每个GPC包含的TPC并不相同。GeForce RTX 5070 Ti上总共集成了35个TPC,略少于RTX 5080。整卡共有70个SM单元,280个TMUs纹理单元,96个ROPs光栅化处理单元,8960个CUDA核心。对比上代RTX 4070 Ti的话,可以说是史诗级进步了,单是CUDA核心就增加了17%左右,甚至已经超越了RTX 4070 Ti SUPER!

在工艺制程方面,新的GB203核心沿用了TSMC 4nm 4N NVIDIA Custom Process工艺。核心面积为378mm2,同样比RTX 4070 Ti的AD104核心大了28%,内部晶体管数量则有456亿。另一个对比RTX 4070 Ti升级的点在于显存的配置,上代RTX 4070 Ti的显存为192-bit的12GB GDDR6X,而全新的GeForce RTX 5070 Ti不仅升级了GDDR7显存,还将显存位宽提升至256-bit。正因如此,GeForce RTX 5070 Ti也是众多玩家所期待的RTX 50系列显卡之一。

同时16GB的大容量显存也能为玩家提供高分辨率下的极致帧率,还能兼顾大部分AIGC用户的应用需求,多重黑科技加持下,高分辨率出图也可更加高效。同时视频输出接口也进行了升级,能够兼顾高分辨率与高刷新率,后续开箱显卡时我们会详细介绍。

最后一个变化则是售价了,上代RTX 4070 Ti的售价为6499元,而全新的GeForce RTX 5070 Ti售价!对比上代直接便宜了!这么一看,再结合一下新架构新技术,瞬间就有性价比了,而该显卡的具体上市时间则是2月20日,感兴趣的玩家不妨关注一下,至于同级的GeForce RTX 5070则将在3月5日与大家见面,下面我们就给大家揭晓GeForce RTX 5070 Ti的性能表现。

外观赏析

先看外包装设计,影驰GeForce RTX 5070 Ti 魔刃显卡的包装盒正面就印有“刃BLADE”系列LOGO,其整体形状与虎爪相似,配色为金色。而包装的其他设计相较于RTX 40系则变化不大,同样是正面右下角标注GPU型号,而背面则使用图文来说明显卡产品特性。

拆开外包装,显卡四周有缓冲泡棉填充,同时显卡还有防静电袋加持,保护性拉满。

附件也十分丰富,包含显卡支撑杆套件、RGB同步线以及一根3×8Pin转16Pin的电源转接线。

影驰GeForce RTX 5070 Ti魔刃的外观设计还是非常有辨识度的,整体设计非常简约,四四方方、有棱有角的风格配上黑色主色调,不仅质感满满,更是让人一眼就能感觉到其电竞属性。

显卡外部的导风罩还同时使用了磨砂以及亮面两种材质进行搭配,不同角度望去,显卡呈现出不一样的立体感。并且细节设计方面,导流罩的左侧还有所谓的“咒文”标识,为产品添加了一丝神秘感。

在散热配置方面,影驰GeForce RTX 5070 Ti魔刃配备了三把支持智能启停的9cm 7扇叶环形风扇,并且风扇还进行了大刀阔斧的升级,不仅扇叶强度得到了提升,在同噪声下,对比前代,风压提升了15%,同转速下,噪音则降低了5%。

视角来到显卡的背面,经典的金属背板设计。不过在背板的居中位置印有系列LOGO、“BLADE”标识以及“GEFORCE RTX”英文字样。有一说一,在黑色背板的衬托下,视觉效果拉满,远远望去,一眼就能看出这是影驰的显卡。

除此之外,背板上还有咒文图案,与正面连成一线,交相辉映。设计方面,考虑到散热需要,金属背板的右侧照例使用了大面积的镂空设计,这样能够让正面的风扇吹透内部的热管,从而辅助显卡散热。

侧边则是这张显卡最有意思的地方,这里加入了磁吸LOGO灯设计,在显卡的机身顶部和右侧都可以看到磁吸LOGO灯的安装槽位,用户可以随心选择灯牌的安装位置。

并且灯牌上印有影驰GALAX的英文LOGO标识,进一步提高辨识度。而且这块灯牌在上机通电以后,还能够展示RGB,为主机添彩。

视线延伸到显卡顶部,咒文图案继续在此点缀。显卡顶部还专门设计有镂空位置,用于增强散热效果。

拉近镜头,供电接口方面,影驰GeForce RTX 5070 Ti魔刃采用了12V-2×6接口进行供电,供电接口使用了反扣式设计以便用户进行安插,且供电接口旁则设计有灯光同步接口。

显卡底部则是PCIe金手指,其为PCIe 5.0×16速率,妥妥的战未来设计,这也是首次在RTX 50系显卡上应用,能够带来更高的传输速率,并且金手指的形状和上一代的显卡有些微的变化。

最后是显卡I/O接口部分,视频输出接口还是常规的3个DP加1个HDMI的配置,不过规格上有了升级,影驰GeForce RTX 5070 Ti采用的是DP 2.1b与HDMI 2.1b规格。理论上,这一代显卡的视频输出接口可以轻松实现4K 480Hz和8K 240Hz超高分辨率与超高刷新率的需求。

显卡拆解

下面是显卡拆解环节,首先需要卸下背板上的10颗螺丝,这样可以将金属背板分离。

想要进一步分离PCB则需要取下PCB背部的X型框架以及侧边I/O挡板的固定螺丝。

PCB的中间则是GPU核心,它与GeForce RTX 5080用的是同款GB203核心,不过代号为GB203-300-A1。

在GPU核心周围则是8颗三星显存,编号是K4VAF325ZC-SC28,其后缀的28也代表这个显存速率为28Gbps,单颗容量2GB,一共是16GB的GDDR7显存。

显卡供电配置方面,该显卡采用 相供电设计。

仔细看内部的用料,无论是核心MOSFET还是显存MOSFET,采用的都是MPS的MP87993。

而电源管理芯片以及电源监控芯片则被安排在PCB的背面,其中电源管理芯片为MPS的MP29816-A。

而电源管理芯片则是我们熟悉的安森美的NCP45492。

内部用料看完,我们再关注一下这款显卡的散热模块。首先最显眼的就是中间的均热板设计,可以说是非常舍得下成本了。

而像显存、电感等发热元器件不仅有均热板加持,还有厚厚的导热贴,进一步提高了显卡的散热效能。

另外,影驰也很细心地配置了合金中框,这样设计不仅可以辅助散热,还可以进一步提升PCB的刚性,防止弯曲变形。

整个散热器是经典两段式设计,左侧是密密麻麻的散热鳍片,鳍片之下则是4根使用了回流焊接工艺的6mm镀镍复合热管。

主动散热部分则是我们一开始介绍过的三把9cm风扇,不仅风量更大,噪音控制也非常得当,在我们的测试过程中几乎听不到噪音。

总的来说,影驰GeForce RTX 5070 Ti魔刃堆料还是非常充足的,无论是均热板还是多根复合热管的设计,都让这款显卡有了更好的发挥舞台。反映到性能上,则是比其他RTX 5070 Ti能够带来更多的功耗释放,不妨看下面的性能测试环节。

测试平台介绍

开始性能测试前介绍一下本次的测试平台, CPU使用的是目前毫无争议的游戏神U——AMDRyzen R7-9800X3D,主板则是来自微星的MPG X870E CARBON Wi-Fi 暗黑主板。内存为24G×2套条的T-FORCE XTREEM ARGB 幻镜DDR5内存,在主板上直接开启AMD EXPO功能即能轻松达成DDR5-8000 C38的成绩,确保显卡能够释放全部性能。

显示器部分我们则采用的是HKC出品的G27H4Pro显示器,其配置非常出色,拥有27英寸大屏,除此之外还有320Hz超高刷新率,妥妥的准赛事级电竞显示器,超高的刷新率对于追求瞬间反应和精准操作的 FPS 游戏而言,无疑是一项极为关键且无可替代的优势。

满足电竞还不够,HKC G27H4Pro还有超高色域覆盖,属于是高刷色彩两手抓了。135%sRGB和112%AdobeRGB色域容积以及95%DCI-P3色域覆盖,为用户提供ΔE≤2的精准色彩表现力,营造绚丽色彩让游戏不止好玩,同时10bit(8bit+FRC)色深还能呈现更为细腻的色彩过渡。

完整测试平台配置如下:

开始测试前,照例还是要“认识”一下这张显卡。只可惜目前最新版本的GPU-Z 2.62.0还没能适配最新的影驰GeForce RTX 5070 Ti魔刃显卡;因此部分GPU信息显示并非正确。从目前 的信息来看,影驰GeForce RTX 5070 Ti魔刃显卡的基准频率为2295MHz,Boost频率为2452MHz。另外值得关注的是,此款显卡默认TDP为300W,最大TDP也为300W。

理论性能测试

在性能实测环节,我们首先采用了3DMARK的理论性能测试。在FireStrike系列测试中,影驰GeForce RTX 5070 Ti魔刃的表现令人瞩目,其在FireStrike Ultra小项中领先RTX 4070 Ti约35%,在其他两个小项中也实现了28%~33%的领先优势。接着,我们关注了以DX12为基准的Time Spy测试,影驰GeForce RTX 5070 Ti魔刃的得分达到了27572,相较于RTX 4070 Ti,平均领先幅度达到了24%。

光线追踪是RTX 50系列显卡提升的重点领域之一。在这一领域,影驰GeForce RTX 5070 Ti魔刃以19088得分的成绩大幅领先RTX 4070 Ti,领先幅度高达36%。在最新的Speed Way测试中,性能提升同样达到了37%。实事求是地说,CUDA核心数量的优势确实让GeForce RTX 5070 Ti在理论性能上表现出色。同时得益于BLACKWELL架构的优化,它进一步拉开了与前代RTX 4070 Ti的差距。可以说,这一代RTX 50系显卡确实具备了不容小觑的实力。

DLSS 4专项测试

看完了理论性能部分的测试,接着我们再来看看本次RTX 50系显卡最“顶”的升级,DLSS 3在RTX 40系显卡上引入了帧生成技术,能够依靠AI在两帧之间生成一帧AI帧,从而实现帧数的翻倍,用过的玩家都说好!不过由于每生成一个新的帧都需要光流加速器和 AI 模型参与,因此生成多帧的开销相当高昂,而过高的性能开销会带来瓶颈,导致帧率提升受限。

而这次DLSS 4全新升级,引入了多帧生成技术,它可以利用 AI 为每个渲染帧额外生成多达3帧!相比传统渲染的方式,能够最多实现8倍的性能提升。并且每次渲染额外帧只需要AI模型执行一次,就能输出三帧画面,因此无论是对性能、显存的开销还是延迟都比之前要好了许多。

另外,由于多帧生成技术,输出的帧多了,要给每一帧都安排一个合理的间隔刷新才能让观感更好。因此NVIDIA还引入了专属的Flip Metering来代替CPU Pacing,它将帧节奏逻辑转移到显示引擎,让GPU能够更精确地管理显示时间,尽可能地将每一帧画面的生成时间保持一致,从而提高整体游戏视觉的流畅感。不过由于Flip Metering是硬件级的控制器,因此DLSS 4的多帧生成目前只有RTX 50系显卡支持。

同时DLSS 4 还引入了图形行业首个 Transformer 模型实时应用。熟悉AI的应该对它很熟悉了,它在AI生成领域已经应用多年了。基于Transformer架构的 DLSS 超分辨率和光线重建模型,相比之前DLSS使用的卷积神经网络(CNN)模型来说,具备2倍的参数量和4倍的计算量。在游戏场景中,能够提供更高的稳定性、更少的拖影、更高的细节和更强的抗锯齿能力,使画面更加清晰、流畅和逼真。

不过虽然DLSS 4的多帧生成功能是RTX 50系显卡的独占功能,但新的Transformer模型将会逐步下放至DLSS 3、DLSS 2等,将适用于所有GeForce RTX显卡。并且根据NVIDIA的说法,超过75款游戏和应用将在GeForce RTX 50系列开售时支持DLSS 4的全新DLSS多帧生成功能,包括《赛博朋克2077》《战神:诸神黄昏》《心灵杀手2》《霍格沃兹之遗》等,《黑神话:悟空》也将于今年晚些时候升级支持 DLSS4的多帧生成。随着时间的推移,支持DLSS 4的游戏和应用数量将不断增加。

在简单介绍之后,让我们进一步探讨DLSS 4理论性能表现,仍经典的3DMark测试。即便是定位中高端的影驰GeForce RTX 5070 Ti魔刃显卡,在启用DLSS 4后,其帧数表现也如同开启了作弊模式,实现了巨大的性能飞跃。开启与关闭DLSS 4的性能对比,简直是天壤之别!在2K分辨率下,性能差距达到了惊人的4倍。而到了4K分辨率,性能差距更是夸张,达到了6倍之多。与DLSS 3相比,帧数提升也超过了77%,预示着游戏市场的未来将经历一场变革。最令人震惊的是在8K分辨率下的表现,通常情况下,即使是中高端显卡也难以在8K分辨率下流畅运行游戏。然而,影驰GeForce RTX 5070 Ti魔刃在DLSS 4的加持下,竟然能够达到137.03 FPS,这已经超出了我们之前的想象,也意味着分辨率不再是限制我们畅玩游戏的障碍。

接着我们看看DLSS 4在实际游戏中的表现,第一款游戏是《霍格沃兹之遗》,支持DLSS 4技术以后可以在设置看到帧生成部分多了一些选择,其中×2则是原本DLSS 3的帧生成,而×4则是RTX 50系独有的多帧生成功能,另外你也可以选择插2帧的方式,也就是所谓的×3选项。

经过体验,《霍格沃兹之遗》这款游戏的优化表现相当出色。在2K分辨率和光线追踪效果均调至最高设置的情况下,使用影驰GeForce RTX 5070 Ti魔刃显卡,即便不启用任何超分辨率技术,游戏的平均帧率也能达到77 FPS,确保了流畅的游戏体验。当启用DLSS 3性能模式后,帧率进一步提升至156 FPS,游戏体验变得极为流畅。而开启DLSS 4后,帧率更是飙升至惊人的294 FPS,这一数值已经很接近目前2K@360Hz显示器的刷新率上限。在实际游戏过程中,无论是1%最低帧率还是延迟表现都有显著提升,特别是延迟,甚至比原生分辨率下还要低,带来了更佳的操控感。

第二款游戏我们测试的是《星球大战》,一样你能在设置中看到其帧生成功能已经支持×4的选项,也就是DLSS 4多帧生成功能。不过这项功能是RTX 50系独占,想要体验最强的游戏性能,那就赶紧升级最新的影驰GeForce RTX 5070 Ti魔刃!

经过实际测试,DLSS 4在这款游戏中表现卓越,在2K原生分辨率下,影驰GeForce RTX 5070 Ti魔刃的平均帧率仅为35 FPS,延迟也上升至50 ms。然而,一旦启用DLSS 4的性能模式,游戏的平均帧率激增至198 FPS,延迟进一步降低至42 ms,游戏体验瞬间变得如丝般顺滑,与原生2K分辨率相比,性能提升了多达5.6倍;即便是与DLSS 3的110 FPS相比,性能也几乎翻了一番,确实令人印象深刻。

下一款游戏则是有“显卡杀手”之称的《赛博朋克2077》,有一说一,《赛博朋克2077》的设置页面就更丰富,除了能够设置DLSS 4的多帧生成外,还可以切换DLSS 4的另一个特性——Transfomer Mode,据说能够让画质更清晰,同时还能改善此前的拖影问题,对玩家可以说是一大利好。

接下来,让我们深入了解DLSS 4的性能表现。作为“显卡杀手”,《赛博朋克2077》对显卡的挑战无疑是巨大的。在2K分辨率、最高画质以及开启路径追踪的条件下,影驰GeForce RTX 5070 Ti魔刃的帧率仅为32 FPS,导致游戏体验卡顿且令人不快。然而,当启用DLSS 3后,游戏的帧数跃升至110 FPS,流畅度显著提升。进一步开启DLSS 4,影驰GeForce RTX 5070 Ti魔刃的性能更是达到了200 FPS,相较于原生分辨率,性能提升了惊人的6.2倍。更令人印象深刻的是,1%Low的帧数表现甚至超越了DLSS 3的平均帧数,这意味着整体游戏体验中几乎不存在掉帧现象,稳定性达到了极致。

如果你想玩的游戏还不支持DLSS 4,那也不用担心,NVIDIA App还提供DLSS 4 Override功能,说人话就是能够让游戏强开DLSS 4,这里我们以《漫威争锋》为例,在NVIDIA App中简单设置,就能将帧生成调至“4×”,一键实现多帧生成。

经过实际测试,启用多帧生成功能确实带来了显著的效果。在2K全高设置下,不使用超级采样,《漫威争锋》的帧率可达124 FPS,已经能够提供流畅的游戏体验。当开启DLSS 3技术后,帧率进一步提升至223 FPS,几乎是原生分辨率下的两倍。若进一步启用DLSS 4多帧生成技术,性能提升更是超过三倍,达到375 FPS,这使得游戏体验直接跃升至电竞级别的3A大作。此时,配合2K@360Hz的显示器,游戏体验将更加畅快淋漓。此外,延迟表现同样令人满意,在原生分辨率下延迟为33ms,而启用DLSS 4后,延迟可降至23ms,使得游戏操作更加灵敏,整体体验更佳。

总体而言,DLSS 4的多帧生成功能无疑显著提升了玩家的游戏体验。与前一代RTX 40系列的DLSS 3帧生成功能相比,DLSS 4再次实现了帧数的显著提升。在相同的画质设置下,影驰GeForce RTX 5070 Ti魔刃的性能远超RTX 4070 Ti。在提及的四款游戏中进行实测,开启DLSS 4的影驰GeForce RTX 5070 Ti魔刃的帧数几乎是RTX 4070 Ti的两倍!这一成就并非依赖于硬件的简单堆砌,而是凭借“科技与巧妙的技术”实现的。

另外,值得一提的是,与DLSS 4一起到来的还有全新的NVIDIA Reflex 2技术。延迟一直是电竞中绕不开的话题,玩家的每个动作都会经过复杂的计算,再在屏幕上渲染,其中的每一步都会增加延迟。虽然延迟往往只有几十毫秒,但是你却能明显地感觉到游戏的不流畅、卡顿。

为了尽可能地降低延迟所带来的不良游戏体验,NVIDIA发布了NVIDIA Reflex技术,它可以使GPU和CPU同步,确保最佳响应速度和低系统延迟。目前NVIDIA Reflex已集成到超过100款游戏中,可以将PC延迟降低50%。

而GeForce RTX 50系显卡再度升级,带来了NVIDIA Reflex 2技术。它结合了Reflex低延迟模式与Frame Warp技术。它可以把最新的鼠标输入指令同步给渲染帧,及时更新渲染的游戏帧并在渲染帧被发送到显示器之前获取最新的鼠标信息,通过刷新渲染的游戏帧以进一步减少延迟,将PC延迟进一步降低多达75%。

另外,Frame Warp的加入,能够进一步将延迟降低。当一个帧被GPU渲染时,CPU会根据最新鼠标或手柄输入计算工作流中下一帧的视角位置。Frame Warp从CPU采样新的视角位置,然后将GPU刚才渲染的帧扭转到最新的视角位置。在渲染帧被发送到显示器之前,在尽可能最短的时间进行扭转操作,确保屏幕上反映最新鼠标输入。

而当Frame Warp转移游戏像素时,图像中可能会产生缝隙撕裂、镜头位置的变化会让游戏场景中显示新的部分。NVIDIA则开发了一种优化了延迟的预测渲染算法,该算法使用来自先前帧的视角、颜色和深度数据,对这些撕裂空白的像素进行准确的图像修复。玩家可以通过更新的视角看到没有撕裂的渲染帧,并降低了改变游戏内视角位置而产生的延迟。说人话就是现在NVIDIA Reflex 2还可以根据上一帧的信息去脑补一些空白的像素,有种无中生有但你又看不出来的感觉。

首发支持NVIDIA Reflex 2技术的游戏是《THE FINALS》以及《无畏契约》,后续我们也会第一时间带给大家该技术的详细评测。

游戏性能测试

在见识了DLSS 4的卓越性能之后,让我们将注意力转向常规游戏性能的评估。一如既往,我们首先进行3DMark的DLSS 3性能测试。影驰GeForce RTX 5070 Ti魔刃在2K分辨率下的性能相较于RTX 4070 Ti提升了约38%;而在4K分辨率下,启用DLSS 3后,性能优势大致保持在39%。

当然理论性能终归是纸上谈兵,还得进游戏里实际测试一下才知道影驰GeForce RTX 5070 Ti魔刃的实力。这里我们选取了11款游戏进行测试,包含光追及光栅性能方面的测试,而游戏画质方面均全部选择最高画质,光追设定部分,如有则采用最高。

实测2K分辨率下,影驰GeForce RTX 5070 Ti魔刃应对绝大多数游戏都轻轻松松,特别是在DLSS的加持下,满足2K@200Hz电竞级是完全没有问题,即便是全高设置的《黑神话:悟空》,这款显卡也能有85 FPS的表现。后续《黑神话:悟空》完全能够使用上DLSS 4后,想必帧数提升会更加迅猛。具体到性能上,在这么多款游戏里,影驰GeForce RTX 5070 Ti魔刃整体比RTX 4070 Ti强约31%左右。

图像视频创作性能测试

游戏测完,下面就来看一下创作者们比较关心的生产力性能,在PCMark10 Extended测试, 影驰GeForce RTX 5070 Ti魔刃在游戏、数位内容创作方面的表现更佳,基本上要比RTX 4070 Ti高10%和15%左右。而生产力方面的成绩与之前我们所测试的RTX 50系列一样,得分比较低,推测是目前驱动和软件优化还不完善所致。

在办公软件的测试环节中,影驰GeForce RTX 5070 Ti魔刃同样表现出色,其整体性能大约领先4%。这一优势主要体现在Excel、PowerPoint以及Outlook这三个应用程序上。然而,实事求是地说,使用这两款显卡进行日常办公任务确实显得有些奢侈。毕竟,在打开这些软件时,性能上的差异几乎可以忽略不计。

在Adobe和达芬奇的基准测试中,影驰GeForce RTX 5070 Ti魔刃相较于RTX 4070 Ti展现了显著的性能提升,尤其是在视频编辑方面。这一进步主要得益于新一代GeForce RTX 5070 Ti对编码器的进一步升级,它不仅提高了编解码的效率,还扩展了支持的格式范围。例如,在达芬奇和Premiere Pro的测试中,GeForce RTX 5070 Ti相较于RTX 4070 Ti领先约15%~31%,这一差距相当显著。此外,在After Effects中也有约6%的性能提升,总体而言,这使得内容创作的效率得到了提升。

3D渲染创作性能测试

看完了图像视频方面的创作,我们再把目光投向3D渲染以及工业领域的软件中,看看RTX 50系显卡又有怎样的精彩表现。还是熟悉的朋友Blender以及V-Ray,在这两款软件中,影驰GeForce RTX 5070 Ti魔刃的表现也是大杀四方,基本是大幅度领先RTX 4070 Ti。

再看看另外一款渲染器,D5 Render是一款基于DXR和光线追踪技术构建的GPU渲染器。正因为其有光线追踪技术,其渲染的画面相当出色。这款软件在RTX 40系显卡测试时支持了DLSS 3帧生成,而现在随着RTX 50系显卡的发布,它也可以通过NVIDIA App的方式支持最新的DLSS 4多帧生成功能。

实测在开启DLSS 4以后,整个渲染预览的界面变得丝滑流畅,帧数基本在222 FPS附近,而对比不开DLSS时,仅58 FPS的表现来看,性能几乎是提升了4倍以上。即便是面对RTX 40系的DLSS 3,也一点不虚,性能优势也有50%以上。

再看看工业领域的表现,SPEC2020能够反映显卡的工业能力,在多项测试中影驰GeForce RTX 5070 Ti魔刃依旧傲视群雄,对比RTX 4070 Ti平均有16%的提升,这个性能提升还是很可观的。

NVIDIA编解码测试

接下来的测试则是介绍RTX 50系显卡的编解码器,GeForce RTX 50系列显卡上换装了第9代NVENC编码器与第6代NVDEC解码器,在视频规格上支持AV1 UHQ(超高画质 AV1)与MV-HEVC(多视角HEVC)编解码。同时由于GeForce RTX 50系列显卡还升级支持DisplayPort 2.1 UHBR20输出,单一通道支持20Gbps带宽,因此用户可以体验到令人惊叹的HDR视觉效果、超高分辨率和更流畅的游戏体验。

这里我们直接使用NVIDIA提供的4K60片源与工程文件分别测试AV1、H.265以及H.264下的编码导出时间。实测同一段素材下,影驰GeForce RTX 5070 Ti魔刃导出三段视频的时间分别是9秒、14秒以及10秒,效率提升已经是超级明显了。

同时,我们也对导出的不同格式的视频进行了画质对比,实测AV1编码的视频在画质上与H.265或H.264也没有明显差距,无论是在文字、人像还是建筑等画面里,三者的画质可以说是伯仲之间,如果不特地标注其格式,一般人很难用肉眼分辨出来。随着目前越来越多视频网站、剪辑软件和硬件厂商的推动,未来AV1势必会成为下一个最受欢迎的格式。

值得一提的是,GeForce RTX 50系显卡还能够支持4:2:2色度取样的视频编解码,这将节省CPU的负担,加快创作速度。上面的图表里也可以看到我们的测试成绩,实测导出时间会比上代显卡快不少,毕竟RTX 40系显卡不支持该功能,仅支持4:2:0色度采样,如果一定要4:2:2导出只能靠CPU软解。

4:2:2色度采样的视频文件采用的是YUV颜色格式,与存储红色、绿色和蓝色(RGB)值不同,颜色被存储为亮度Y、蓝差色度U和红差色度V。在这类视频中,视频的完整亮度将被保留,而原始色度信息只保留一半,因此相比4:4:4的视频,其视频帧数据量仅有不到三分之二,而相比4:2:0的视频又能提供两倍的颜色分辨率,因此创作者采用这种格式拍摄,能够在保留更多色彩信息的同时还能减少文件大小和带宽需求。

AI性能测试

AI是老黄在CES上谈及的重点,而RTX 50系显卡上针对AI性能的改进则是加入了对FP4精度模型加速处理的支持,它相比此前RTX 40系上的FP8精度,能够实现更快的生成速度,同时显存占用也更低。

不信你看,我们用UL Procyon的FLUX.1 AI Image Generation Demo For NVIDIA进行测试。在均使用FP8精度模型时,影驰GeForce RTX 5070 Ti魔刃能够做到16.51 s生成一张图,而RTX 4070 Ti明显已经爆显存了,运行时已经需要依赖共享内存才能运行,因此耗时超长;而切换到FP4精度模型后,影驰GeForce RTX 5070 Ti魔刃生成图片的速度能够提升到8.26秒一张,效率同样是翻了几番。影驰GeForce RTX 5070 Ti魔刃所配备的16GB GDDR7显存明显带来了更大容量与更高带宽的传输优势。

并且FP4精度模型生成的图片超级快,从下图就能看出来,其与FP8生成的图片几乎没有区别,无论是对关键词的理解还是图像的质量,都非常有保障,新时代AIGC玩家的最佳选择了。

在AI文本生成测试中,影驰GeForce RTX 5070 Ti魔刃在一众大语言模型里同样表现出众,我们用MLPerf Client v0.5大语言模型进行测试,它是基于meta的Llama 2 7B开源LLM打造,涵盖了四项AI任务,分别是内容生成、创意写作以及对两份不同长度文本进行总结摘要。实测影驰GeForce RTX 5070 Ti魔刃在每一项中都表现出了绝对的统治力,各项领先幅度均在40%以上。

随后,我们利用UL Procyon的AI Text Generation对多个大型语言模型进行了进一步测试。在这些测试中,影驰GeForce RTX 5070 Ti魔刃的领先优势依然显著。在基于Llama 3.1 7B LLM构建的Phi-3.5测试中,这款新一代显卡取得了4286分的成绩,相较于RTX 4070 Ti,性能提升了35%。当测试参数扩展至Llama 2 13B时,影驰GeForce RTX 5070 Ti魔刃的表现更加卓越,得分高达4309分,相较于RTX 4070 Ti,性能领先幅度达到了约42%。

功耗与温度表现

最后一项测试烤机,这也是许多玩家关注的重点,毕竟双槽卡的厚度但是塞下了300W的核心,不免让人担心它的温度表现。不过实测Furmark烧机10分钟后,得益于影驰GeForce RTX 5070 Ti魔刃出色的设计底蕴,核心温度并不高,仅有68.5度,显存温度也是60度,此时显卡的最大功率为300W,已经完全顶着TDP的上限了,风扇转速则是1968RPM,噪声不算大,在可接受的范围之内。

在与RTX 4070 Ti进行横向比较时,尽管影驰GeForce RTX 5070 Ti魔刃的热设计功耗(TDP)有所增加,但其烤机时的整体功耗依然保持在较低水平。此外,这款双槽显卡在减少厚度的同时,依然能够很好地控制核心与显存的温度,这确实令人惊喜。对于ITX平台的玩家而言,这无疑是一个好消息,意味着即使是小型主机也能享受到强大的性能。

评测总结

经过这段时间的实测,GeForce RTX 50系列确实给我带来了不少惊喜。影驰GeForce RTX 5070 Ti魔刃无论是在外观设计、硬件配置、散热性能还是制造工艺方面,都全面展示了NVIDIA的雄厚实力。技术上,全新的Blackwell架构、DLSS 4、RTX神经网络渲染等技术,将GeForce RTX 5070 Ti推向了新的性能巅峰。

具体到实际表现,我们可以分情况讨论。首先在游戏体验方面,GeForce RTX 5070 Ti给我们带来了许多惊喜。实测结果显示,即使仅开启DLSS 3,GeForce RTX 5070 Ti显卡的性能也能领先上一代显卡约40%。更不用说新的RTX 50系列显卡还支持革命性的DLSS 4,实测性能提升显著,与2K原生分辨率相比,性能差距更为明显!

在内容创作方面,GeForce RTX 5070 Ti同样表现出色,特别是新一代编解码器的加持,使得视频和渲染速度成倍增长。配合NVIDIA Studio平台的持续优化,即便是不以游戏为主的创作者,也有充分的理由升级到GeForce RTX 5070 Ti。此外,AI性能是这一代产品提升的重点,支持FP4精度加速,AI图像生成速度甚至可以达到RTX 4070 Ti的数倍!并且它还配备了16GB GDDR7大显存,能够提供惊人的数据传输速度,轻松应对高分辨率渲染和AI创作。

最后,让我们来谈谈选购建议。这次NVIDIA GeForce RTX 5070 Ti无疑是这次的明星产品,它将高性能与高性价比完美结合。无论是热衷于游戏的玩家,还是需要强大图形处理能力的视频制作人,亦或是计划搭建小型本地化AI PC的用户,GeForce RTX 5070 Ti都是一个极佳的选择。随着越来越多游戏开始支持DLSS 4技术,这款显卡的性能将得到进一步提升,畅玩4K分辨率游戏并享受高帧率将成为现实。

如果你正在寻找一款能够满足你多样化需求的显卡,那么GeForce RTX 5070 Ti绝对值得你的考虑。以6299元的建议零售价来看,它在同档次显卡中显得格外突出,似乎只有通过抢购才能得到。”抢到RTX 50显卡就是赚到“这句话的含金量仍在提升中!

NVIDIA   GeForce   RTX 5070 Ti   16GB   显卡   评测
DIY硬件频道

网友评论

聚超值•精选

推荐 手机 笔记本 影像 硬件 家居 商用 企业 出行 未来
二维码 回到顶部