在7月初Super系列解禁的同时,由英伟达开发的独立应用FrameView也在官网开放下载。这套源自英伟达的应用能够更直接读取显卡在各个阶段的帧数,同时界面也延续了GeForce Experience的风格,不仅绿,还很简单。
基本上你只需要设置好存放数据目录,在游戏中按下快捷键。FrameView就能详尽的记录游戏平均帧数、丢帧数、GPU功耗,显卡整体功耗等等。同时FrameView还会自动生成一份报告文件,对上一段游戏监控汇总给出结论。在本篇测试中,除了游戏自带的Benchmark测试工具外,其余游戏和DEMO内容均通过FrameView采样参考。
由于GeForce RTX 2080 Super本身拥有8GB GDDR4显存,足以用来更高分辨率的游戏。在游戏测试环节中,我们将绝大部分游戏开启至4K分辨率最高画质模式,即使对显卡性能较为苛刻,GeForce RTX 2080 Super也同样能达到30FPS以上,这意味着如果适当调低画质或者降低游戏设置中的分辨率选项,高帧率游戏完全不成问题。
与测试软件不同,游戏开发中经常有许多讨巧的技术确保游戏体验的流畅性。例如早年著名的Fast Inverse Square Root(平方根倒数速算法)可以一次性解决了求平方根倒数时浮点运算操作带来的巨大的运算耗费,被运用到《Quake III:Teamarena》中,传言是由大神约翰·卡马克在做梦的时候想出的十六进制常数0x5f3759df,不过卡马克本人否认了这一点,此为后话。
因此图灵架构中,英伟达给游戏开发团队准备了数量众多的高级渲染技术,包括Mesh Shading(网格着色)、Varable Rate Shading(比率可变着色)、Texture Space Shading(纹理空间着色)、Multi-View Rendering(多视图渲染)、Resource Management and Binding Model(资源管理及模型分仓)。
例如,Mesh Shading(网格着色)通过引入一套新模型,让开发人员按可以消除CPU渲染调用瓶颈,以类似Compute Shader计算着色器协作式多线程运作,加快复杂场景的渲染效率。
Varable Rate Shading(比率可变着色,VRS)则是微软在DirectX 12中允许游戏开发者引入的提升画面效率功能。它可以动态调整屏幕上256个区域的着色比率,方便开发人员部署新算法实现以前难以实现的分区精确优化。现在这项技术也被引入到3DMark下个月的评测子项中,足以见得VRS正在变成新游戏中被更多开发者追捧的技术。
而近期被最近常提及的,则是图灵架构下SM的整数运算单元拥有了自己的指令发射端口,使得浮点运算单元和整数运算单元可以并行执行任务。以《古墓丽影:暗影》的范例来看,平均每100条浮点指令,就会伴随38条整数流水指令和62条浮点流水指令。当两者并行,指令吞吐率就会升高,游戏速度同样得以提升。
还是那句话,随着英伟达Game Ready不断深入到游戏开发的不同阶段,发布时间越近的游戏,越有机会发挥出显卡性能。
因此即使关闭深度学习超采样DLSS的前提下,GeForce RTX 2080 Super平均比GeForce RTX 2080 提升7%左右,当然,相对GeForce RTX 2080 Ti仍然有平均18%的差距。