英伟达RTX新纹理压缩技术首测，能省96％显存，性能影响大吗？

5 0 2025-02-10

英伟达RTX神经纹理压缩技术深度解析：大幅降低纹理内存，性能影响有限测试结果：纹理内存降低96%，性能损失可控近日，YouTube频道Compusemble对英伟达的RTX神经纹理压缩（NTC）技术进行了详尽的基准测试。结果显示，与传统纹理压缩技术相比，RTX NTC技术能够将纹理内存大小大幅降低约96%。这一突破性的技术为3D工作负载带来了显著的性能提升。测试模式：NTC转码与样本推理 Compusemble在RTX 4090显卡上分别以1440p和4K分辨率对NTC技术进行了测试。测试分为两种模式：“NTC转码为BCn”和“样本推理”。其中，“NTC转码为BCn”模式会在加载时将纹理转码为BCn格式；而“样本推理”模式则仅对渲染特定视图所需的单个texel进行解压缩，从而进一步减少纹理内存大小。性能对比：DLSS超分与TAA抗锯齿在1440p分辨率下，当启用DLSS超分功能时，“NTC转码为BCn”模式将测试应用的纹理内存占用从272MB降低至98MB，减少了64%。而“样本推理”模式则将纹理大小降至仅11.37MB，与非神经压缩技术相比，内存占用减少了95.8%，与之前的神经压缩模式相比减少了88%。值得注意的是，启用RTX神经纹理压缩技术后，性能会受到一定影响。由于测试使用的是上一代RTX 4090显卡，而非最新的RTX 5090显卡，因此随着新一代架构的推出，性能损失可能会有所减少。分辨率提升：4K分辨率下的性能表现将分辨率提升至4K后，性能显著下降。启用DLSS超分功能时，“NTC转码为BCn”模式的平均FPS在1100帧左右，“样本推理”模式的平均FPS则略低于1000帧，两种模式的1%低值都在500帧左右。而关闭DLSS，改用原生分辨率搭配TAA抗锯齿时，“NTC转码为BCn”模式的平均FPS提升至1700帧左右，“样本推理”模式的平均FPS在1500帧左右。前者的1%低值略低于1100帧，后者的1%低值略低于800帧。协同向量功能：提升帧率表现 Compusemble还在4K分辨率下，针对“样本推理”模式测试了协同向量功能。启用协同向量时，平均帧率在1500帧左右；关闭协同向量时，平均FPS急剧下降至略低于650帧。1%的低值在启用协同向量时略低于750帧，关闭时略高于400帧。 RTX神经纹理压缩技术前景广阔 Compusemble的基准测试表明，英伟达的神经压缩技术能够在大幅减少3D应用纹理内存占用的以牺牲一定性能为代价，尤其是在“样本推理”模式下。RTX NTC技术已经开发了至少几年时间，这项新技术利用现代英伟达GPU中的张量核心来压缩3D应用和游戏纹理，而非传统的块截断编码。RTX NTC是自1990年代以来纹理压缩技术的首次重大升级，能够支持比当前GPU运行的纹理分辨率高出四倍的纹理。目前，RTX NTC技术仍处于测试阶段，尚未确定发布日期。有趣的是，其最低硬件要求似乎并不高。英伟达在GitHub上的RTX NTC页面确认，最低GPU要求是RTX 20系列显卡。该技术还已在GTX 10系列显卡、AMD Radeon RX 6000系列显卡以及Arc A系列显卡上得到验证，这意味着未来该技术有望在非RTX显卡甚至游戏主机上得到广泛应用。