带 60 后缀的显卡一直是消费级市场中玩家的最爱,它拥有恰到好处的功耗和性能平衡点,性价比也一直非常出色。今年,基于 AI 的 DLSS 3 技术和全新 NVIDIA Ada 架构的发布,让 40 系显卡在性能表现上突飞猛进,那么 RTX4060Ti 系列,能否再次夺得甜品卡的美誉?借着这块技嘉 AORUS GeForce RTX 4060 Ti GAMING OC 8GB 显卡,我们一起来看看吧。
【资料图】
IT之家本次拿到的这张 8G 版显卡,按照官方的说法非常适合在 1080P 分辨率下体验高帧游戏,为此我们组了一套高配英特尔测试平台,具体配置如下:
外观设计
技嘉 AORUS GeForce RTX 4060 Ti GAMING OC 8GB 这次的设计非常“阳刚”,合金装甲部分采用近乎笔直的线条体现,四个角中有一个做了斜切设计处理,另外三个做了弧形过渡。钛灰色的金属装甲表面除了简单的斜切线条处理之外,没有其它装饰元素,整体风格简约干练。
卡身尺寸方面,技嘉 AORUS GeForce RTX 4060 Ti GAMING OC 8GB 的三围分别是 281*117*53mm,属于是 3 槽显卡的范围了,三风扇的外部规格也表明,它的体积还是不小的。
细看风扇部分,3 把 8cm 的导流风扇表面进行了黑化涂装处理和切割纹理设计,确保外观一体性的同时让风阻更小,同时这 3 把风扇也支持 3D 启停和正逆转设计等功能。
显卡背面是覆盖了全包裹设计的银灰色金属盖板,能够给 PCB 更全面的保护,风格同样偏硬核,左侧印有技嘉字母 Logo 和 GEFORCE RTX 标志,右侧空出了一块进气镂空开口,可以看到内部的导热鳍片。
技嘉 AORUS GeForce RTX 4060 Ti GAMING OC 8GB 的显卡一侧可以看到单 8Pin 接口,左侧还提供了一个双 BIOS 模式切换开关,出厂默认会以 OC 模式运行,而切换到静音模式下,风扇转速将会降低,噪音也随之下降,给用户提供更安静的使用环境。
下方右侧部分技嘉做了一个镂空 Logo 字符的技嘉英文 Logo,支持 1670 万色的 RGB 灯效,可在官方或第三方灯光控制程序中选择灯光效果。
接口方面,技嘉 AORUS GeForce RTX 4060 Ti GAMING OC 8GB 提供了 2*DP1.4a 接口和 2*HDMI2.1a 接口,这在主流的显卡中还是比较少见的,对视频输出的兼容性和实用性更进一步,最高支持 8K60Hz 视频输出。
核心解析
RTX 4060 Ti 基于 AD106 核心打造,整体架构接近于 RTX 4070,最明显的区别是 GPC 从 4 组变成了 3 组,内部共有 4352 个 CUDA 核心、136 个 Tensor 核心、34 个第三代 RT 核心和 51 个 ROP 单元,大概保留了 75% 的 RTX 4070 核心规模。当然,其主打的 NVENC 视频编码单元和 NVDNC 视频解码单元依旧得到保留,这意味着它很适合用来进行内容创作。
RTX 4060 Ti 的 BOOST 频率为 2535MHz,默认频率为 2250MHz。显存方面采用 128-bit 位宽的 8GB GDDR6 海力士显存,理论上来说功耗和发热应该都有一定降低。英伟达称,从历史上看,显存位宽一直被用作确定 GPU 速度和性能等级的重要指标。然而,显存位宽本身并不能完全反映存储子系统的性能。这次虽然采用了 128-bit 闪存,但 NVIDIA Ada Lovelace 全新架构的存储子系统将 L2 缓存的大小增加了 16 倍,极大提高了缓存命中率。
如图所示,Ada GPU 中的 L2 缓存带宽已显著增加。这使得在处理核心和 L2 缓存之间传输更多数据成为可能。在各种游戏和综合基准测试中,与 2MB 二级缓存的性能相比,32MB 二级缓存将显存总线流量平均降低了 50% 以上,这种 50% 的流量减少使 GPU 能够更有效地使用其显存带宽,效率提升可达近 2 倍。在一系列游戏和综合测试中,缓存命中率的增强将会使游戏帧率的提升幅度高达 34%。
说回根本,以上这些提升都得益于最新的 NVIDIA Ada 架构,它基于 TSMC 4N NVIDIA 定制工艺打造,实现了高达 2 倍的性能功耗比飞跃。它的流式多处理器吞吐量超过上一代产品的 2 倍,第三代 RT Cores 的光线追踪计算能力更是提升了 2.8 倍。此外,第四代 Tensor Cores 新增了 FP8 引擎,具备高达 1.32 Petaflops 的 Tensor 处理性能,超过上一代的 5 倍。而 SER 技术为光线追踪带来了最高可达 3 倍的性能提升,整体游戏性能也可高达 25% 的提升。
新的 NVIDIA Ada 架构不仅为各种专业图形、视频、AI 和计算工作负载提供了惊人的性能和能效,同时也带来了许多创新特性,例如:
1.新增了光流加速器,能够利用 AI 预测场景中的运动变化,实现了 DLSS 3 的帧生成技术,大幅提升了帧率和图像质量。
2.支持了 AV1 编码器,能够有效压缩视频文件的大小,同时保证更高的画质。这对于视频转码、流媒体、视频会议、增强现实和虚拟现实等应用场景非常有用。
3.引入了 RTX VSR 功能,能够实现实时视频超分辨率,让低分辨率的视频在高分辨率的屏幕上也能呈现出清晰的细节。
理论性能
通过前面的分析,我们大体知道这次的 RTX 4060Ti 的功耗是很低的,那通过 FurMark 的 15 分钟烤机测试来看,最终稳定运行的烤机温度仅有 66.1℃,显存温度约 79.9℃,整机功耗才 160W,比上代 RTX3060 还要低,如果搭配个酷睿 i5 之类的百瓦 CPU,电源就只需 450W 即可,能耗比是真的强,再加上 RTX4060Ti 将推出不少单风扇和双风扇小卡,ITX 玩家们这下有福了。
接下来进行 3DMark 压力测试,这个测试可以检测连续跑分下显卡性能有没有发生下降,一般 97% 以上才算合格。实测技嘉 AORUS GeForce RTX 4060 Ti GAMING OC 8GB 得分为 99.6%,性能释放极其稳定。
在 3DMark Time Spy DX12 测试中,技嘉 AORUS GeForce RTX 4060 Ti GAMING OC 8GB 的显卡分数达到了 14135 分,作为对比 RTX 3060Ti 的成绩为 12277 分,提升大约在 15% 左右,但功耗却更低了。
在 3DMark Fire Strike Extreme DX11 测试中,技嘉 AORUS GeForce RTX 4060 Ti GAMING OC 8GB 显卡分数达到了 16668 分,作为对比 RTX 3060 Ti 的分数为 14553,提升幅度也有 14% 左右。
而在 3DMark Portal Royal 光追测试中,技嘉 AORUS GeForce RTX 4060 Ti GAMING OC 8GB 获得了 8254 分,RTX 3060 Ti 的分数为 7158 分。
游戏实测
看完了理论分数,我们就来实际测试下游戏表现好了。测试之前,我们将分辨率调整为 1920*1080,游戏画质一律设置为最高,并默认开启最高档位的光追选项,DLSS 默认开到质量档。第一款是竞技游戏《CS:GO》,这款游戏可以体现 RTX 4060 Ti 的高帧表现,实测平均帧数来到了 545 帧,足以喂饱各种电竞显示器了。
值得一提的是,目前已有 70 款游戏已支持 NVIDIA Reflex 低延迟技术,其中有 8 款主流竞技射击游戏支持 NVIDIA Reflex,包括:《Apex 英雄》《使命召唤:战区 2》《命运 2》《逃离塔科夫》《堡垒之夜》《守望先锋:归来》《彩虹六号:围攻》和《无畏契约》。大家可以期待下 CS2 在更新起源 2 版本后,也能加入 NVIDIA Reflex 的支持。
接下来是两款经典 3A 游戏,在《荒野大镖客 2: 救赎》中开启 DLSS 质量档后,运行自带的基准测试,平均帧数来到了 116 帧,技嘉 AORUS GeForce RTX 4060 Ti GAMING OC 8GB 在 1080P 下玩这个游戏还是很爽的。
在《古墓丽影:暗影》中,1080P 最高画质运行自带的游戏基准测试,平均帧数高达 221 帧,虽然这是款老 3A 游戏了,但这样的表现足以说明即使开到 2K,RTX4060 Ti 也是完全可以驾驭的。
在非常有代表性的光追 3A 游戏《控制》中,最高档位光追下运行游戏,平均帧数也可以到 146 帧,完全能够跑满 144Hz 电竞显示器,畅享 3A 效果。
当然,真正能够让 RTX 4060 Ti 和 RTX 3060Ti 拉开差距的,还是 DLSS 3 技术,它能够利用 AI 和 GeForce RTX 40 系列 GPU 上的第四代 Tensor Core 和光流加速器,生成更多的高质量帧,从而大幅提升帧数。DLSS 3 是 NVIDIA 深度学习超采样技术的最新版本,也是神经图形技术的革命性突破,能够在保持画质和反应速度的同时,将性能提升高达 4 倍。
简单来说,过去的 DLSS 2 技术是通过渲染一个低分辨率图像,然后通过 AI 放大至高分辨率,从而提升画质和帧率。而全新的 DLSS 3 技术在兼容 DLSS 2 的基础上,新增了帧生成功能,可以在两个真实帧之间插入 AI 推算出的全新帧,从而实现帧率的倍增。同时,结合 DLSS 2 的超分辨率功能,AI 能够重建多达八分之七的显示像素,与没有 DLSS 相比,游戏性能最高可提升 4 倍!
目前已经有超过 300 款 DLSS 游戏和应用发布。其中已有超 30 款已发布的 DLSS 3 游戏。从发布进度来看,在 DLSS 2 和 DLSS 3 各自发布的前六个月中,DLSS 3 的采用速度比 DLSS 2 快 7 倍。看来适配难度是相当低的,相信将来有越来越多的游戏适配 DLSS 技术。
我们先来看看压力最大的《赛博朋克:2077》,在 1080P 分辨率下开启光追的帧数情况,在默认状态下,技嘉 AORUS GeForce RTX 4060 Ti GAMING OC 8GB 的平均帧数约 45 帧,并没有达到 60 帧及格线,但如果开启 DLSS 2 质量,帧数就可以达到平均 82 帧,而开启 RTX 40 系列专享的黑科技 DLSS 3,瞬间暴涨到了平均 124 帧,畅玩光追最高画质毫无压力。
《巫师 3:狂猎》在更新了次世代版本后,对图形配置的要求也大大提高,画质水平也足以媲美同类型的次世代 3A 第一梯队。那么有了 DLSS3 技术的加持,技嘉 AORUS GeForce RTX 4060 Ti GAMING OC 8GB 的表现又会如何呢?
《巫师 3:狂猎》次世代版在 1080P 分辨率不开启 DLSS 的情况下,技嘉 AORUS GeForce RTX 4060 Ti GAMING OC 8GB 的平均帧数也只有 44 帧,开启质量档 DLSS 2 之后,刚好可以达到平均 60 帧的水平流畅游玩。如果再打开 DLSS 3 质量,帧数瞬间就能涨到平均 103 帧,大部分场景下都能跑到百帧了。
相比之下,同为次世代 3A 大作的《瘟疫传说:安魂曲》不仅画质很棒,优化也做得更好。即使不开启 DLSS,也能基本达到 60 帧左右的帧数。
经过我们的实测,技嘉 AORUS GeForce RTX 4060 Ti GAMING OC 8GB 在不开启 DLSS 技术的情况下,平均帧数为 59 帧,刚好卡在及格线上。当开启 DLSS 2 质量档后,平均帧数会提升到 77 帧,如果进一步开启 DLSS 3,那么最终的平均帧数可达到 118 帧,符合电竞帧玩 3A 的高水平。
前面我们提到,RTX 4060 Ti 8G 的功耗是相当低的,一根 8Pin 供电就能带动。因此我们还使用英伟达官方的 FrameView 工具统计了一下各个 3A 大作中的平均功耗。测出来的数据还是挺不错的,大部分 3A 大作中实际功耗都在 130-140W 左右,基本和游戏本一个水平了,如果你手上的电源瓦数不是很高,不妨等等 RTX4060Ti。
创意生产
NVIDIA GeForce RTX 4060 Ti 系列也被赋予了一定的创意生产能力,该显卡支持安装 NVIDIA Studio 驱动,以加速 110 多款最受欢迎的创意应用。专有的 SDK 能使这些应用的运行速度更快,并提供独家功能,如 Optix、DLSS 和 Maxine。NVIDIA Studio 全套创意应用,包括 NVIDIA Omniverse、Broadcast、Canvas 和 RTX Remix。如果选购 16G 大显存版本的话,也让它具备了一定的生成式人工智能的运算能力,拿来进行简单的 AI 绘画训练也是没有问题的。不过 16G 大显存版尚未发售,我们接下来还是用 8G 版做一下简单的测试。
NVIDIA GeForce RTX 4060 Ti 8G 的 CUDA 核心可以提供硬件加速,使得工作效率得以提高。几乎所有的建模软件都会对 NVIDIA 的 GPU 进行优化,因此在效率、稳定性和兼容性方面都能够兼顾。例如,在常用的渲染工具 V-Ray 中,可以利用 RTX 加速的光线追踪功能,实现高性能的最终帧渲染。此外,搭载了 AI 降噪功能的 GPU 还可以进一步加速交互式渲染,提供更加流畅的工作体验。
进入实测环节,在 V-Ray Benchmark 中,技嘉 AORUS GeForce RTX 4060 Ti GAMING OC 8GB 获得了 1405 分的成绩,应付入门和中等规模的建模渲染需求问题不大。
而光追对性能的提升,具体则表现在 V-Ray GPU RTX 的测试项目中,技嘉 AORUS GeForce RTX 4060 Ti GAMING OC 8GB 拿到了 1919 分的成绩,对于有光追参与的建模渲染需求同样支持到位。
我们也测试了一下技嘉 AORUS GeForce RTX 4060 Ti GAMING OC 8GB 在 Blender 中的性能发挥,实测结果如下,可以看到它对于这种建模类生产力场景有着非常好的加速效果。
视频后期制作方面,技嘉 AORUS GeForce RTX 4060 Ti GAMING OC 8GB 上的 NVENC 编码器就派上用场了,其本身也支持下一代视频编码技术 AV1,AV1 能够在占用相同空间情况下,提供更加快速的视频编码和更高质量的流媒体传输性能。随着各大视频平台希望节约服务器流量费用,AV1 编码必将成为未来的主流编码方式。
我们做了一个小测试,在剪映专业版中,导出一个相同分辨率相同码率的视频,一个编码协议选择传统的 H264, 一个选择下一代的 AV1 编码,结果 H264 编码的体积为 140M,AV1 编码的体积仅 106M,在保证画质的前提下体积小了非常多。
另外,支持 AV1 编解码的技嘉 AORUS GeForce RTX 4060 Ti GAMING OC 8GB 导出这个视频可以通过显卡加速,仅需 8 秒即可完成压制。
我们还测试了 Puget Bench For Adobe,其中在视频剪辑软件 Adobe Premiere 中,我们开启 GPU CUDA 加速,然后使用 Puget Benchmark 进行测试,最终得分 1445 分,剪辑 4K 视频素材时视频线拖动、回放都丝滑不卡顿。
另外一款压力更大的视频特效软件 Adobe Effects 中,我们同样使用 Puget Benchmark 进行测试,最终得分 1590 分,能用来制作一些比较复杂的视效。
除了视频内容生产以外,在视频内容消费领域 RTX 4060 Ti 8G 也提供了 RTX VSR 技术。全称为 RTX Video Super Resolution(RTX 视频超分辨率技术)。它可以通过 GPU 的 AI 计算,至多将在线 1080P 视频提升到 4K 分辨率,实现提高清晰度的效果,目前这一技术已经适配了 Chrome 浏览器和 Edge 浏览器,以及本地播放器 VLC。
RTX 视频超分辨率的使用非常简单,只要将 RTX 30 系列 / 40 系列的驱动程序更新到最新版本,并将 Chrome / Edge 浏览器也更新到最新版本便可以启用。启用路径为:NVIDIA 控制面板 —— 视频 —— 调整视频图像设置。此选项框下有四个档位可选。档位越高超分辨率效果更明显,但也会消耗更多的 GPU 资源。
目前它已支持国内的主流视频平台(哔哩哔哩、斗鱼和虎牙),以及一些国外的视频平台(Youtube、Twitch、Netflix、Hulu 和 Disney+)。同时它也支持本地视频超分辨率。在下面的测试中,从最左边的原生 480P 分辨率超分后,后面的 1-4 档能看出更加清晰了,实际观感媲美 4K。
↑ 从左至右依次为 480P、VSR1、VSR2、VSR3、VSR4
总结
技嘉 AORUS GeForce RTX 4060 Ti GAMING OC 8GB 在我们的实测中还是一张比较有诚意的卡,无论是外观设计,接口配置还是实际性能表现和功耗情况,它的性能上限和潜力都非常突出。RTX 4060 Ti 8G 的硬件规格前提下,完全能够满足 1080P 下的电竞级 3A 游戏体验,这点毋庸置疑,但最令人惊喜的还是它的低功耗表现,真正做到了甜品卡的体验,对玩家来说非常实用。如果你最近想买一块显卡用来打游戏,可以毫不犹豫地入手它。
标签: