iGame RTX 4060 Ti Ultra W DUO 8GB评测:光追火力全开,波普激战1080p

每次提到七彩虹iGame显卡,第一反应便是十足的用料,物理按钮一键超频和带劲的iGame个性化散热设计,玩家们往往也要为其多付一些成本。而就在上个月GeForceRTX4070发布时,iGame首次以MSRP3199元(制造商建议零售价)的价格抢占了首发先机,从此开启了iGame入门级产品线看齐公版FoundersEdition的局面。

此次参与MSRP首发的iGameGeForceRTX4060TiUltraWDUOOC8GB亦是如此,在公版GeForceRTX4060Ti8GBFoundersEdition性能解禁的同时,这款显卡就展现到了我们面前。


重点是,iGameRTX4060TiUltraWDUOOC8GB不仅延续了全新设计的波普风格设计,还自带一定性能提升的一键超频,定价与公版FE相当,俨然要把性价比拉满。那么这款GPU是否真的能符合大伙对性价比的期待,现在就让我们奉上首发评测。


AD106初登场

NVIDIA此次给GeForceRTX4060系列设计的GPU型号均为AD106,共计GeForceRTX4060Ti8GB、GeForceRTX4060Ti16GB和GeForceRTX4060三个版本。通过对完整的AD106进行部分硬件上的屏蔽,实现不同的定位划分。


iGameRTX4060TiUltraWDUOOC8GB向上虽然还会有计划7月份发布的16GB版本,但在GPU核心上没有变化,仅在显存做出区分,对于1080p或是2K游戏而言,8GBGDDR6显存无疑能确保游戏性能的同时兼顾性价比。


让我们先把焦点放在AD106。完整的AD106拥有3个GPC,有点类似于CPU中的3个独立核心,每个GPC同样包含了6组TPC,每组TPC包含2个流式多处理器(StreamingMultiprocessors,SM)。其中SM是可以看成诸多核心的集合体,从Maxwell架构开始引入了处理块(Sub-Core)概念。每个SM包含4个处理块,每个处理块包含1个64KB寄存器堆,1个L0指令缓存,1个Warp调度器,1个调度单元,4个加载/存储单元,1个特殊功能单元(SpecialFunctionUnit,SFU)用于执行超越函数指令(比如正弦、余弦、倒数、平方根等)和图形差值算法指令。

此外,每个SM下的128个CUDACore随处理块分成4组,每组CUDA由16个专门用于FP32的CUDACore,16个可以在FP32和INT32之间切换的CUDACore组成。


多样的组合让AD106完整形态下拥有4608个CoreCore、144个纹理单元,48个ROPs和36个SM,对应的,也拥有144个第四代TensorCore和36个第三代RTCore。每个SM包含128KBL1缓存,总共拥有32MBL2缓存。


AD106

需要注意的是,AD106的32MBL2缓存是此次性能提升的重点之一,相比之下是RTX3060Ti4MBL2缓存的8倍之多。更大的L2缓存有助于提高随机存取的命中率,而更快的L2缓存能提升运算单元的效率。内核在计算的过程中会不断的调用存储子系统的数据,顺序是L1缓存、L2缓存、显存、内存,越往后响应速度越慢。为了赶上快速刷新的游戏画面,GPU所有的数据会经过预加载放置在缓存中,因此缓存容量越大,下一帧所需要素材的命中率就越高,GPU跑腿寻找数据所需要的时间就更短,效率就更高。


但由于紧贴着核心的L1缓存设计决定了存储空间不可能做得太大,提升L2缓存容量就称为了理想选择。因此我们就会看到GeForceRTX4060Ti8GBFE在L2缓存空间相对RTX3060Ti增大8倍之后,命中率得到了大幅提升,需要从显存、内存中寻找素材的概率大幅缩减,从提升了整体性能。

由于AD106中所有GPC都需要通过L2缓存完成所有访存操作,庞大的L2缓存搭配每个SM下包含的4个第四代TensorCore,1个第三代RTCore,都将成为后续游戏实时光线追踪和DLSS3性能提升的重要前提。这也是为什么,即使iGameRTX4060TiUltraWDUOOC8GB即使只是用了了128-bit8GBDDR6显存,实际性能也仍然会明显提升。


iGameRTX4060TiUltraWDUOOC8GB使用的GPU版本为AD106-350-A1。仅删除了一组TPC,因此从整体上看GPC结构没有做删减,只是减少了2个SM。在理论上iGameRTX4060TiUltraWDUOOC8GB拥有17个TPC,34个SM,4352个CUDACore,从而着色器Shaders性能达到22TFLOPs。并拥有136个第四代TensorCore,TensorFP8/INT8的稀疏度性能(Sparsity)达到353TFLOPs,以及34个第三代RTCore,光追性能为51TFLOPs。并拥有136个纹理单元,48个ROPs。L2缓存没有做删减,同样是足量的32MB。


AD106-350-A1

值得说明的是GeForceRTX4060TiFE公版基础频率2310MHz,最高频率为2535MHz,通过iGameRTX4060TiUltraWDUOOC8GB一键超频后可以来到2580MHz,同时GDDR6显存也进行了一定的优化,显存频率达到9000MHz,显存数据传输率为18Gbps,也明显优于RTX3060Ti的14Gbps的GDDR6,为后续不错的性能表现奠定了基础。这里不妨让我们放出对比表格。


重返DUO双风扇

GeForceRTX40系列经常被诟病体积太过离谱,而iGameRTX4060TiUltraWDUOOC8GB做了一个不错的表率。它将显卡外观设计控制在255mm的范围,使用DUO双风扇设计,且不占据太多机箱空间,帮助RTX4060Ti恢复到大伙所认知的显卡主流形态。


与此同时,iGameRTX4060TiUltraWDUOOC8GB的电源接口也回到了传统的8pin形态,而非目前所推崇的16pin(12VHPWR)接口,从而帮助iGame节省了一根转换线,并且对市面在售的新旧ATX版本电源都可以提供良好的兼容性。


显卡给人留下深刻印象还要属于这一代iGameUltra带来的波普(POP)艺术风格。这种风格起源于上个世纪50年代,通过大胆的色彩运用及随性的线条勾勒,打造出拥有极强物质主义及乐观精神的独特艺术风格并延续至今。


这是一项能够常驻流行文化的设计,天马行空但合理的色彩碰撞搭配,能够帮助玩家跳出公式化,展现不一样的DIY性格。同时iGame还为其融入了圆形波点元素,以及随着光线与观察角度变化而不断呈现出的多样的色彩效果,都暗示着iGameRTX4060TiUltraWDUOOC8GB不俗的视觉展示能力。


事实上iGameRTX4060TiUltraWDUOOC8GB的散热硬件不错。2个90mm双环形扇叶可以做到叶片环环相连,提升风扇强度。同时风扇内部使用了双滚珠轴承设计,帮助风扇可以柔滑流畅运行,并延长风扇的使用寿命。


双环形风扇下方则使用了一套大面积的散热鳍片以加速导热效率。其中包括2x6mm热管来提升散热效率。与高端显卡相同的回流焊也出现在iGameRTX4060TiUltraWDUOOC8GB中,确保热管和鳍片紧密接触,以获得更好的散热效能。


另外波普风格也延续到了iGameRTX4060TiUltraWDUOOC8GB的金属背板中,粉色的Ultra字体有不错的时尚感,也与顶端侧灯相互呼应。同时也可以看到背板使用了开孔设计,更便于风道流通。


顺带一提,侧灯的RGB控制同样由iGameCenter来完成,这套控制软件目前已经发展到全能的系统监控、超频、RGB调整,甚至还带有游戏帧数预判和社交属性,进一步帮助iGameRTX4060TiUltraWDUOOC8GB获得了更多体验。




在挡板设计上,iGameRTX4060TiUltraWDUOOC8GB的双槽设计也留足散热空间,并提供了3个和1个接口,以及iGame独有的一键超频按钮。其中按钮旁配有提示标识,方便玩家不通过说明书或者开机,也能了解显卡目前切换的状态。


得益于不错的散热模组,在实际压力测试下,iGameRTX4060TiUltraWDUOOC8GB表现可圈可点。在压力测试下,GPU的核心温度在68℃,低于公版。同时通过红外线测试可以看到,在室温24℃环境中,显卡外观也保持着清凉。


另外值得注意的是,由于略带超频的关系,iGameRTX4060TiUltraWDUOOC8GB的TGP为182W,比公版高出2W,在实际使用过程中基本可以忽略。在NVIDIA给出的功耗参考中可以看到RTX4060Ti的待机功耗为7W,AV1解码播放功耗13W。而实际的游戏功耗也用不着180W,像赛博朋克这种光追特效全开,性能释放拉满的状态,功耗也刚刚超过150W。


玩爽光线追踪

对于大多数玩家而言,1080p高刷屏才是性价比的最优选,特别是不断增加的光线追踪特效为GPU计算带来了不少压力,在合理价位下围绕iGameRTX4060TiUltraWDUOOC8GB搭配合适的显示输出环境才是合理的选择。因此在测试中,我们将主要围绕1080p光线追踪最高画质进行。


同时按照惯例放出测试平台,硬件阵营包括英特尔Corei9-13900K,七彩虹ColorfulCNVDDR5-600016GBx2,CVNZ790D5GAMINGFROZENV20,以及1250W电源作为支持,同时也引入上一代GPU作为对比。



需要注意的是,iGameRTX4060TiUltraWDUOOC8GB使用了通道,而非x16,在实际测试中不会影响GPU的性能发挥,反倒可以节省主板PCIe通道留给进行扩展。但x8通道毕竟是在物理上的缩减,我们从显卡针脚设计上可以看到后半部分是没有电路的。因此iGameRTX4060TiUltraWDUOOC8GB能够在和插槽中充分发挥性能,而如果用在上,性能肯定是有折扣的。因此现在还在用主板的同学,可以考虑连电脑一起升级了。


测试部分,这里先奉上3DMark传统项目,这里主要使用3DMarkTimeSpy,3DMarkTimeSpyExtreme,3DMarkFireStrikeExtreme,3DMarkFireStrikeUltra,PortRoyal进行对比。iGameRTX4060TiUltraWDUOOC8GB表现不错,相对GeForceRTX3060Ti的提升幅度在8%到20%之间,相对GeForceRTX2060SUPER则可以提升到50%至70%。


在常规的游戏测试中,iGameRTX4060TiUltraWDUOOC8GB也提供了类似的表现,相对GeForceRTX3060Ti的平均提升近20%,相对GeForceRTX2060SUPER则提升60%。同时也可以看到iGameRTX4060TiUltraWDUOOC8GB的高频率在部分游戏中起到了比公版更好的效果。


但不要忘了,DLSS3才是RTX40系列的重头戏。在DLSS推出的近5年中,已经有超过300款应用和游戏提供支持,而DLSS3发布数个月内,支持的游戏和应用已经超过30款,增长速度更快,提升效果也更明显。但前提是必须要有一块GeForceRTX40系列GPU中的第四代TensorCore提供硬件支持,此前的TensorCore最高只能支持到。

这是一项包含了提升游戏帧率、降低系统延迟的完整解决方案。它通过引入光流加速器(OpticalFlowAcceleration,OFA)与DLSS相结合的办法,构建出了一个更为立体的分析方式,将卷积自编码器的输入源扩展到几个部分,分别是:之前帧与当下帧,由光流加速器生成的光流场、游戏运动矢量和深度等数据。这时候DLSS3甚至承担起渲染过程中7/8的工作,让CPU和GPU进完成其中1/8的渲染即可,从而节省出大量的计算资源专注到更有用的地方。


在3DMarkDLSS功能测试中可以很好的证明这一点,在2K分辨率下GeForceRTX4060Ti相对GeForceRTX3060Ti的提升幅度近70%,相对GeForceRTX2060SUPER则提升130%。而在4K分辨率下,提升幅度更夸张,分别达到91%和170%。


然后是DLSS3游戏测试部分,这里主要在1080p分辨率下进行,所有游戏均开启光线追踪最高画质。其中《微软飞行模拟》提升幅度非常明显,iGameRTX4060TiUltraWDUOOC8GB相对GeForceRTX3060Ti和GeForceRTX2060SUPER分别提升了99%和165%,DLSS3帮助加速了复杂的地面建筑优化,从而拉开了差距。


赛博朋克2077》夜之城复杂的光影对显卡的性能要求很高,这里iGameRTX4060TiUltraWDUOOC8GB相对GeForceRTX3060Ti和GeForceRTX2060SUPER分别提升了84%和164%。


为了获得真实的驾驶环境,《F12022》对帧率的要求也更为苛刻,这里iGameRTX4060TiUltraWDUOOC8GB相对GeForceRTX3060Ti和GeForceRTX2060SUPER分别提升了40%和104%。


另外由于DLSS3本身自带NVIDIAReflex技术,不仅解决了AI插帧的时候避免关键操作和关键帧排在渲染序列尾端,同时也默认开启了游戏高速响应的节奏,在时代,这个选项需要游戏单独支持,并需要开启独立的选项才能实现,而现在则可以直接运用在DLSS3游戏中。同时目前主流的10款射击类游戏中,也已经有8款游戏提供了对NVIDIAreflex的支持,比如《Apex英雄》,《使命召唤:战区2》,《命运2》,《逃离塔科夫》,《堡垒之夜》,《彩虹六号:围攻》和《无畏契约》等。


尝鲜AI

AI已经是我们当下绕不过去的话题,iGameRTX4060TiUltraWDUOOC8GB的353TFLOPs的TensorFP8/INT8稀疏度性能已经可以用来处理很多AI加速,比如2022年推出的StableDiffusionAICG工具就是很好的例子。


这里我们利用一段固定的文字描述来引导为我们创建20张符合描述的建筑风景图片。在UI界面中设置GeForceRTX4060Ti同时运算2张图片,总共运行10次,即20张。每张图片分辨率为768x768分辨率,采样步数设置为50。

文字描述参考如下:

通过比较,并记录下每个GPU花费的时间,并进一步推算出每分钟生成的图像效率(ImagesPerMinute)。可以看到iGameRTX4060TiUltraWDUOOC8GB相对GeForceRTX3060Ti和GeForceRTX2060SUPER在的AI效率分别提升了10%和42%,表现大致与GeForceRTX3070Ti持平。


同样,在利用ON1ResizeAI2022提升图片的原生分辨率测试中,iGameRTX4060TiUltraWDUOOC8GB相对GeForceRTX3060Ti节省了18%左右的时间,相对GeForceRTX2060SUPER节省了将近46%的时间。






当然开启RTXVSR也是有代价的,在运行状态下会明显发现GPU占用率达到83%,这时候就不能指望iGameRTX4060TiUltraWDUOOC8GB还可以分心做其他事情了。


激发创作热情

最后是iGameRTX4060TiUltraWDUOOC8GB的创作性能测试。这里先围绕iGameRTX4060TiUltraWDUOOC8GB的渲染输出进行测试,例如V-Ray5Benchmark中,会分别对CUDACore和RTX进行检测。

在CUDACore性能上,GeForceRTX4060Ti8GB相对GeForceRTX3060Ti提升11%,相对GeForceRTX2060SUPER提升165%。而在RTX性能中,GeForceRTX4060Ti8GB相对GeForceRTX3060Ti提升15%,相对GeForceRTX2060SUPER提升130%。


OctaneRerRTX是同样是测试GPU的光线追踪性能表现,在一个复杂场景下考验GPU每秒产生的样本率,GeForceRTX4060Ti8GB相对GeForceRTX3060Ti平均提升11%,相对GeForceRTX2060SUPER平均提升73%。


BlerBenchmark主要检测了Moster、Junkshop、Classroom三个输出场景,GeForceRTX4060Ti8GB相对GeForceRTX3060Ti平均提升30%,相对GeForceRTX2060SUPER平均提升76%。


工程专业常见的SPECviewperf2020。这是一款包含能源勘探、医学、建筑设计、机械设计、汽车设计、飞机设计领域的专业软件图形测试,包括包括3dsmax、Catia、Creo、Energy、Maya、Medical、SNX、Solidworks等主流软件。能够看到GeForceRTX4060Ti8GB相对GeForceRTX3060Ti平均提升9%,相对GeForceRTX2060SUPER平均提升27%。



写在最后

充满波普风格的iGameGeForceRTX4060TiUltraWDUOOC8GB表现确实不错,见坚守MSRP价格的同时,同样保留了本应该高端iGame才有的诸多特色技能,比如不错的散热模组,更高的频率,一键超频,以及功能不断丰富的iGameCenter。在同样的价格下,iGameRTX4060TiUltraWDUOOC8GB无疑更具有吸引力,毕竟它给的实在有点多。


而在面对新一代主流显卡需求,iGameRTX4060TiUltraWDUOOC8GB性能确实也交出了不错的答卷,1080p光线追踪最高画质可以超过100FPS运行,充分发挥1080p电竞屏幕的优势,保证的流畅的酸爽,并降低了系统响应,从而帮助玩家在游戏中获得更高的胜率。


因此在游戏、创作、AI性能面前,iGameRTX4060TiUltraWDUOOC8GB达到了预期的素质,并且还能相对FE公版略进一小步,如果你不是坚定的FoundersEdition拥护者,iGameUltra的信仰完全可以考虑一波,毕竟浅色调外观,战力还挺猛的主流级显卡,放在同类竞品中也是不多见的。

版权声明:本站所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流,不声明或保证其内容的正确性,如发现本站有涉嫌抄袭侵权/违法违规的内容。请举报,一经查实,本站将立刻删除。

相关推荐