英伟达RTX新纹理压缩技术首测,能省96%显存,性能影响大吗?

5 0

英伟达RTX新纹理压缩技术首测,能省96%显存,性能影响大吗?

英伟达RTX神经纹理压缩技术深度解析:大幅降低纹理内存,性能影响有限 测试结果:纹理内存降低96%,性能损失可控 近日,YouTube频道Compusemble对英伟达的RTX神经纹理压缩(NTC)技术进行了详尽的基准测试。结果显示,与传统纹理压缩技术相比,RTX NTC技术能够将纹理内存大小大幅降低约96%。这一突破性的技术为3D工作负载带来了显著的性能提升。 测试模式:NTC转码与样本推理 Compusemble在RTX 4090显卡上分别以1440p和4K分辨率对NTC技术进行了测试。测试分为两种模式:“NTC转码为BCn”和“样本推理”。其中,“NTC转码为BCn”模式会在加载时将纹理转码为BCn格式;而“样本推理”模式则仅对渲染特定视图所需的单个texel进行解压缩,从而进一步减少纹理内存大小。 性能对比:DLSS超分与TAA抗锯齿 在1440p分辨率下,当启用DLSS超分功能时,“NTC转码为BCn”模式将测试应用的纹理内存占用从272MB降低至98MB,减少了64%。而“样本推理”模式则将纹理大小降至仅11.37MB,与非神经压缩技术相比,内存占用减少了95.8%,与之前的神经压缩模式相比减少了88%。 值得注意的是,启用RTX神经纹理压缩技术后,性能会受到一定影响。由于测试使用的是上一代RTX 4090显卡,而非最新的RTX 5090显卡,因此随着新一代架构的推出,性能损失可能会有所减少。 分辨率提升:4K分辨率下的性能表现 将分辨率提升至4K后,性能显著下降。启用DLSS超分功能时,“NTC转码为BCn”模式的平均FPS在1100帧左右,“样本推理”模式的平均FPS则略低于1000帧,两种模式的1%低值都在500帧左右。 而关闭DLSS,改用原生分辨率搭配TAA抗锯齿时,“NTC转码为BCn”模式的平均FPS提升至1700帧左右,“样本推理”模式的平均FPS在1500帧左右。前者的1%低值略低于1100帧,后者的1%低值略低于800帧。 协同向量功能:提升帧率表现 Compusemble还在4K分辨率下,针对“样本推理”模式测试了协同向量功能。启用协同向量时,平均帧率在1500帧左右;关闭协同向量时,平均FPS急剧下降至略低于650帧。1%的低值在启用协同向量时略低于750帧,关闭时略高于400帧。 RTX神经纹理压缩技术前景广阔 Compusemble的基准测试表明,英伟达的神经压缩技术能够在大幅减少3D应用纹理内存占用的以牺牲一定性能为代价,尤其是在“样本推理”模式下。RTX NTC技术已经开发了至少几年时间,这项新技术利用现代英伟达GPU中的张量核心来压缩3D应用和游戏纹理,而非传统的块截断编码。RTX NTC是自1990年代以来纹理压缩技术的首次重大升级,能够支持比当前GPU运行的纹理分辨率高出四倍的纹理。 目前,RTX NTC技术仍处于测试阶段,尚未确定发布日期。有趣的是,其最低硬件要求似乎并不高。英伟达在GitHub上的RTX NTC页面确认,最低GPU要求是RTX 20系列显卡。该技术还已在GTX 10系列显卡、AMD Radeon RX 6000系列显卡以及Arc A系列显卡上得到验证,这意味着未来该技术有望在非RTX显卡甚至游戏主机上得到广泛应用。