在 NVIDIA GeForce RTX 4090 系列 GPU 首发之际,技嘉也推出了旗下高端产品:技嘉 RTX 4090 GAMING OC 魔鹰 24G。它主打独特的 RGB 光轮和强化的散热模组。
(相关资料图)
我们也是提前收到了技嘉 RTX 4090 GAMING OC 魔鹰 24G,在本次测试中,我们将使用一套顶级无瓶颈的配置,看看这款非公 RTX 4090 能把核心压榨到什么水平。具体配置如下:
外观设计
技嘉 RTX 4090 GAMING OC 魔鹰 24G 24G 显卡的包装盒很大,正面印有 RTX 4090 的产品型号,4 年保修支持等信息。
包装内除了显卡本体,还有一根 4 个 8Pin 转 1 个 16Pin 的线缆,一袋替补螺丝螺母配件包以及一根定制显卡支架。
由于 RTX 4090 普遍偏重,因此包装内都附赠了显卡支架,横装显卡时一定要使用避免侧板弯曲。
技嘉 RTX 4090 GAMING OC 魔鹰 24G 24G 显卡正面为 3 风扇设计,扇叶四周被磨砂哑光材质的铝合金外框包裹,外框四周有做 CNC 倒角处理,表面还有一些点缀纹理。风扇本体为黑色磨砂材质,每个风扇有 9 片扇叶组成,风扇直径为 110mm,中央印有技嘉英文字母 Logo。
这组风扇最大的特色在于,内置了三套 RGB 灯带,在风扇旋转时会随之产生 RGB 光轮,观感非常炫酷。此外这个 RGB 等待也可以通过技嘉的软件进行自定义。
技嘉 RTX 4090 GAMING OC 魔鹰 24G 24G 显卡背板为深灰色金属,左侧印有装饰图案和技嘉 Logo,右侧是镂空散热开孔。
透过散热开口,是一组布满鳍片的散热模组,内含 10 根复合式热管。
显卡背板下部靠右位置有一个双 BIOS 开关,用户可以在静音模式和 OC 性能模式间切换。为了展现更好的性能,笔者下文都会在 OC 模式下进行测试。
正侧面为开放式设计,底部包裹着显卡的金属外框和技嘉 logo 灯,上半部露出巨大的散热格栅和导热铜管。
I / O 金属挡板为深灰色,配有 3*DP1.4 接口和 1*HDMI2.1 接口,支持最高 8K 输出。
技术解析
技嘉 RTX 4090 GAMING OC 魔鹰 24G 是基于目前最高端的 AD102 核心打造的,但核心还没有完全解锁,后续应该还有真旗舰 RTX 4090Ti,解锁剩下的 2 个 GPC 单元。目前的 RTX 4090 内有 16384 个 CUDA 核心、512 个 Tensor 核心、128 个光追核心、512 个纹理单元、176 个 ROP 单元,比上一代 RTX 3090 核心规模大了一半还多。
技嘉 RTX 4090 GAMING OC 魔鹰 24G 的核心频率是 2230-2520MHz,而在启用一键超频后,频率还会进一步提高,相比上代提升了一半还多。显存方面依旧是 384-bit 24GB GDDR6X,但带宽达到了 1TB / s。TDP 默认为 450W,和非公版 RTX 3090 Ti 差不多。
技嘉 RTX 4090 GAMING OC 魔鹰 24G 的架构也发生了不小的变化,它升级到了最新的 NVIDIA Ada Lovelace 架构。基于 TSMC NVIDIA 定制 4N 工艺打造,因此实现了高达 2 倍的性能功耗比飞跃。
反映到具体的功能上,新架构带来了不少的新功能。由于双 NVENC 编码器的引入,让它新增了对 AV1 编码的支持,可以将视频导出时间至多缩短一半。正是由于 Ada 光流加速器的引入,使得 DLSS 3 能够预测场景中帧和帧之间的运动变化,实现 AI 插帧,在保持图像质量的同时提高帧率。总之就是游戏生产两相宜。
DLSS 3 详解
发布会上最重磅的一个技术升级,便是 DLSS 3 技术了。DLSS 3 是一款由 AI 驱动的性能倍增器,由全新第四代 Tensor Core 和 GeForce RTX 40 系列 GPU 的全新光流加速器驱动,是 NVIDIA 广受好评的深度学习超级采样技术的最新版本,并拥有开创性的光学多帧生成功能,将开启 NVIDIA RTX 神经网络渲染游戏和应用的新时代。
基于 NVIDIA Ada Lovelace 架构的新光流加速器可分析两帧连续的游戏图像,并计算帧到帧中物体和元素的运动矢量数据,而不使用传统游戏引擎的运动矢量进行建模。这极大地减少了 AI 在渲染诸如粒子、反射、阴影和光照等元素时的视觉异常。
简单地说,过去的 DLSS 2 是通过渲染出一个低分辨率图像,然后 AI 放大至高分辨率,实现画质与帧数的兼顾。而全新的 DLSS 3 在兼容 DLSS 2 的基础上,还新增了插帧功能,可以在两个真实帧之间插入 AI 推算出来的虚拟帧,实现帧数的倍增。再结合 DLSS 2 的超分辨率功能,AI 能重建至多八分之七的显示像素,与没有 DLSS 相比,游戏性能最高提升了 4 倍!
口说无凭,我们直接进入测试环节。最新版的 3DMark 已经适配了 DLSS 3 的 BenchMark,我们把技嘉 RTX 4090 GAMING OC 魔鹰 24G 的测试结果和 DLSS 2 进行控制变量的对比,可以直观地看出差异。实测在 DLSS 2 模式下,平均帧数为 136 帧,相比于不开 DLSS 2 的 58.62 帧已经提升了两倍多。
但如果我们开启最新的 DLSS 3 技术,技嘉 RTX 4090 GAMING OC 魔鹰 24G 显卡帧数直接来到了平均 168 帧,比不开 DLSS 提升了 3 倍多。至于具体的游戏帧数提升,我们稍后统一进行测试。
压力测试 & 理论跑分
这样一款非公旗舰,会在公版显卡的基础上有多大的进步呢?接下来我们进行理论测试,首先是单烤甜甜圈,烤机 10 分钟后,核心温度稳定在 63.9℃左右,功耗稳定在 446W 左右,与公版的表现基本一致。如果配 i7 / i9 这样等级的处理器的话,还是老老实实上 1000W 以上的电源吧,最少也要 850W 不虚标的电源。
接下来进行 3DMark 压力测试,这个测试可以检测连续跑分下显卡性能有没有发生下降,一般 97% 以上才算合格的显卡。实测技嘉 RTX 4090 GAMING OC 魔鹰 24G 的得分为 99.5%,几乎没有降频,完美通过测试。
在 3DMark TimeSpy DX12 测试中,技嘉 RTX 4090 GAMING OC 魔鹰 24G 显卡分数达到了 35111 分,作为对比,GeForce RTX 4090 公版的分数为 34725 分,RTX 3090 为 18981 分。
在 3DMark Fire Strike DX11 测试中,技嘉 RTX 4090 GAMING OC 魔鹰 24G 显卡分数达到了 76434 分,作为对比,GeForce RTX 4090 公版的分数为 75013 分,GeForce RTX 3090 为 46045 分。这个分数意味着可以 4K 分辨率流畅运行所有的游戏了,哪怕是光追游戏和 VR 游戏也能满足高刷新率的需求。
在 3DMark Portal Royal 光追测试中,技嘉 RTX 4090 GAMING OC 魔鹰 24G 获得了 25518 分,比公版 RTX 4090 的 25080 分更高。过去 GeForce RTX 3090 可以在 2K 分辨率下流畅体验的光追游戏,RTX 4090 已经可以再在 4K 分辨率下畅玩了。
游戏实测
反映到实际游戏中,DLSS 3 能带来多大的提升呢?目前,DLSS 3 已经得到了许多全球领先游戏开发者的支持,有超过 35 款游戏和应用宣布即将支持该技术,由于只要适配 DLSS 3 就可以向下兼容 DLSS 2,开发难度非常低,所有后续肯定会有越来越多开发商加入 DLSS 阵营。例如:
● 《超级人类》(SUPER PEOPLE):抢先体验版将于 10 月 12 日 13:00 发布,支持 DLSS 3
● 《生死轮回》(Loopmancer)将于 10 月 12 日发布更新版,支持 DLSS 3
● 《逆水寒》拂云庭(Justice ‘Fuyun Court’): 全新图形展示将于 10 月 13 日发布,支持 DLSS 3
● 《微软模拟飞行》(Microsoft Flight Simulator):将于 10 月 17 日为 Xbox Insider 计划成员推出测试版,支持 DLSS 3
● 《瘟疫传说:安魂曲》(A Plague Tale: Requiem):将于 10 月 18 日发布,支持 DLSS 3
我们选取了《赛博朋克 2077》、《逆水寒》和《虚幻引擎 5:天琴座》这几款已经适配了 DLSS 3 的游戏和 Demo 来对技嘉 RTX 4090 GAMING OC 魔鹰 24G 进行测试。此外我们还会测试一款 Unity 引擎的 Demo《Enemies》。
首先我们测试一下国产武侠网游《逆水寒》中,同样提供了 RTX 光线追踪和 DLSS 3 的选项。我们开启 4K 最高画质来试试它的帧数表现吧。从下面的数据可以看出,不开启 DLSS 几乎是不可玩的状态,而在开启 DLSS 3 后,帧率提高了近 5 倍。相比于同档位的 DLSS 2 也提升了近 65%。而且大部分项目中都比公版 RTX 4090 略高 2 帧左右。
在画质方面,我们选择了一处 BenchMark 中的细节,可以看出 DLSS 关闭和 DLSS 平衡的画面差距微乎其微,由于抗锯齿的存在,开启 DLSS 后甚至更养眼了一些,这就是 AI 技术的魅力所在。
↑ 左 DLSS 关闭 ,右 DLSS 3 平衡
在《赛博朋克 2077》这款显卡杀手中,我们可以在 4K 最高画质超级光追的模式下运行它自带的 BenchMark,得到了以下数据。技嘉 RTX 4090 GAMING OC 魔鹰 24G 可以在原生 4K 分辨率下运行超级光追的《赛博朋克 2077》。而在开到 DLSS 超级性能档位的前提下,能实现 4K144Hz 畅玩,对于超级发烧友,甚至能满足 8K60 帧的畅玩。
接下来是一款使用虚幻 5 引擎制作的游戏 Demo《Lyra》。虚幻 5 引擎提供了对 RTX 光线追踪、DLSS 3 和 NVIDIA Reflex 完整的支持,因此后续会有大量基于虚幻 5 引擎打造的 3A 大作上线(比如《黑神话:悟空》)。
DLSS 3 在《天琴座》中的表现同样符合预期。在开启 DLSS 3 后,帧率提高了近 1.7 倍。相比于同档位的 DLSS 2 也提升了近 20%。
除了虚幻引擎外,Unity 引擎也提供了对 RTX 光线追踪、DLSS 3 和 NVIDIA Reflex 的完整支持。最后我们测试一款画质爆炸的 Demo《Unity:Enemies》。这款 Demo 就没有那么多档位可以选了,只能调整开关。在开启 DLSS 3 后,帧数暴涨了近 3 倍,4K 渲染丝般顺滑。
那么 DLSS 3 技术就是十全十美的吗?当然不是。DLSS 3 的本质是插帧,插帧必定有一个副作用就是延迟的提高。毕竟我们鼠标是对我们看到的那一帧做出的反馈,而 AI 却会加上额外的帧,这个延迟的提高对于竞技游戏的影响是很大的。所以在打开 DLSS 3 的插帧功能时,NVIDIA Reflex 会强制打开,尽量弥补插帧带来的渲染延迟。从测试数据中我们可以看出,开启 DLSS 3 后的延迟甚至比啥都不开还要略低,如果想要追求绝对的低延迟的话,可以关闭 DLSS,单独打开 NVIDIA Reflex,享受极限的电竞体验。
此外我们还测试了一些传统的光栅游戏和 DLSS2 游戏。在《古墓丽影:暗影》中,实测在 4K 分辨率最高画质最高光追下运行 BenchMark 能跑到 133 帧,没开 DLSS 就已经很流畅了。
在开启质量档 DLSS 后,帧数更是暴涨到了 174 帧,几乎可以满足几乎所有场景的 4K144Hz 需求了。
最后我们测试一款光追 3A 大作《控制》,4K 最高画质最高光追下不开 DLSS 只能勉强 76 帧流畅游玩,而技嘉 RTX 4090 GAMING OC 魔鹰 24G 开启 DLSS 后帧数几乎翻倍,这个 4K 游戏体验相当出色了。
而在优化出色的《极限竞速:地平线 5》中,我们开启 4K 极端画质,依旧能达到平均 131 帧。看来在 RTX 4090 的狂暴性能下,这款赛车游戏即便是 8K60 帧也能搞定了。
创意生产
到了 RTX 4090 这个级别的,肯定不仅仅是打游戏,创意生产和深度学习才是主要受众。技嘉 RTX 4090 GAMING OC 魔鹰 24G 也是一款通过 NVIDIA Studio 支持的 GPU。目前有超过 75 款创意应用可以调用 AI 算力,来大大提高工作效率。
在建模渲染类软件中,技嘉 RTX 4090 GAMING OC 魔鹰 24G 都可以利用 CUDA 为工作提供硬件加速,目前几乎所有的建模软件都会对 NVIDIA 的 GPU 有优化,所以能做到效率、稳定和兼容性的共存。比如在常用的渲染工具 V-Ray 中,可以借助 RTX 加速的光线追踪,实现高性能最终帧渲染。借助搭载 AI 的降噪功能,GPU 可进一步加速交互式渲染。
V-Ray Benchmark 开启 CUDA 加速的话,分数达到了 4445 分,比公版的 4200 多分更高,是笔者测下来这么多非公版显卡中最高的。
得益于光追性能的提升,技嘉 RTX 4090 GAMING OC 魔鹰 24G 在 V-Ray GPU RTX 中的分数也提高到了 6062 分,也比公版卡略高,创下了我们数据库的历史记录。
在视频后期这一块,RTX 40 系 GPU 新增了对 AV1 编码的支持。AV1 是下一代的视频编码技术,能够在占用相同空间情况下,提供更加快速的视频编码和更高质量的流媒体传输性能。NVIDIA 与多家行业合作伙伴密切合作,当今主流多媒体应用均可以支持 AV1。目前国内的剪映专业版已经支持 AV1 的视频加速。OBS 直播软件也支持了 AV1 编码的录制,希望能尽快适配 AV1 编码的直播,大大节约直播带宽。
常用的视频调色剪辑软件 Davinci 也提供了 AV1 编码的支持,作为一个免费开源的编码,后面会有越来越多的主流软件加入进来。
最后我们为大家测试了 PugetBench For Davinci。基于 NVIDIA CUDA 技术的 GPU 加速特效可实现更快速度的实时视频编辑和帧渲染,使用 NVIDIA 编码的输出速度提升最高可达 5 倍。技嘉 RTX 4090 GAMING OC 魔鹰 24G 最终分数可以达到 2513 分,可以流畅剪辑 8K 视频不卡顿。
总结
技嘉 RTX 4090 GAMING OC 魔鹰 24G 作为一款高端非公显卡,的确超额完成了任务。不仅在性能释放稳定性上再创新高,而且独特的 RGB 光轮和一键 OC 切换按钮也颇有新意。如果你是想体验 4K144Hz 的游戏发烧友,那么这款性能优于公版 RTX 4090 的显卡会是入手非公卡的好选择。
技嘉的 RTX 4090 系列将于 10 月 12 日首发,建议零售价为:
GV-N4090AORUSX W-24GD:16998 元
GV-N4090AORUS M-24GD:15998 元
GV-N4090GAMING OC-24GD:13998 元
GV-N4090WF3-24GD:12999 元
此外,在技嘉的京东旗舰店里还在举行 RTX 40 系列显卡的上市活动,与电源显示器搭购可以享受额外折扣。还能参与晒单返 E 卡等活动,感兴趣的话可以点下方的链接前去参与。
点此前往