自去年英特尔发布锐炫显卡以来,尤其是在进入到今年之后,英特尔加快了锐炫显卡驱动的更新频次,进而使得锐炫显卡在DX9、DX11游戏方面取得了显著进步。同时在DX12游戏方面,得益于架构优势,锐炫显卡本身就有着良好的性能支持。
DX11、DX9游戏体验大幅提升
【资料图】
根据英特尔最新披露的数据来看,锐炫A750 8GB限量版显卡在最新驱动加持,以及搭配英特尔13代酷睿i5-13400F处理器的情况下,相对于首发时的驱动版本,1080P分辨率下DX11游戏性能已经足足提升了19%,99%低帧流畅度提升了20%。
了解硬件的朋友都知道,仅凭驱动优化就取得如此大幅度的提升并不容易,但是英特尔锐炫做到了。
截至目前为止,英特尔在今年已经推出了多达十数个个大大小小的锐炫显卡驱动,总计已经推出了近30个驱动版本的更新。
今年一季度,英特尔发布的针对DX9游戏大幅提升的驱动,促使平均性能提升约为43%,与此同时,锐炫A750显卡降价至249美元,整体性价比大幅提升。
以《CS:GO》、《英雄联盟》等游戏为例,在首版驱动3490和一季度发布的4086驱动之间,DX9游戏体验的提升是极大的,最高达到了77%,最低也有10%的平均帧率提升,这使得英特尔锐炫显卡在DX9游戏上的不足得到弥补。
今年二季度,英特尔进一步深入研究了CPU与GPU的平衡问题,通过大量数据统计,表明锐炫A750合适搭配的选择是酷睿i5,随后提供了大量优惠,加速了锐炫的推广进程。
在新发售游戏优化方面,目前英特尔为57款新游戏提供了Day 0Gameon的首日优化支持,这意味着当一款新的大型游戏发布时,英特尔需要完成所有的优化工作,并准备好所有的驱动,进而为玩家带来更好体验。
此外,Intel XeSS技术也在加快拓展游戏支持,目前原生支持XeSS技术的游戏已经超过70款。可能也只有英特尔这样拥有强大生态能力的公司,才能在短短一年不到的时间里达成如此多里程碑的吧。
CPU与GPU的平衡关系
在一系列优化验证过程中可以看到,英特尔提供的数据都是在锐炫A750与英特尔酷睿i5处理器基础上进行的测试,因为数据显示酷睿i5处理器是锐炫A750的最佳平衡选择,那么此时就会有一个问题产生:如果使用酷睿i9处理器去做相同测试会发生什么呢?
从下图可以看到,对于酷睿i9处理器,最新驱动与初版驱动之间的性能提升在9%到30%之间,虽然也是相当大的提升,但比起酷睿i5最高77%的提升显然是要稍微逊色一些。
总体来说,酷睿i5平均性能提升在19%~20%,而酷睿i9约为12%,当看到这组数据时,是不是有悖于我们惯有的认知呢?性能越强的处理器不是应该提升更明显吗?
其实并非如此。当你使用集成显卡的时候,CPU因为负载更大,所以CPU性能提升往往有着更高的收益比;而当GPU性能足够强时,很多时候性能受限就转移到了CPU上,因此驱动程序需要重新架构,以减少每帧所需的CPU工作量,此时CPU的提升收益就完全不如GPU提升收益来的大了。
我们都知道,游戏每一个画面帧都需要一定的渲染时间,也就是Frametime,帧生成时间。下图是英特尔官方给出的渲染流程示意图,简单来说就是游戏每一帧开始时会执行一系列逻辑,随后进行物理计算,进行命中检测,将目标移动到新的位置,可能会绘制新的几何图形等,之后会进入渲染过程。
在计算完游戏状态之后,它会将所有的游戏状态传递给一个渲染器,然后渲染器将从游戏状态转换为DirectX调用并进行传递,之后会执行名为Present”的操作,它是一个DX命令,当被调用时,就意味着已经将所有图形信息都发送给了DirectX,它现在可以渲染一帧,CPU随之进入等待状态,等待“Present”返回之后,进入下一个循环,也就是开始等待渲染新的一帧。
什么是GPU Busy?
为了搞清楚从一帧的“Present”到下一个帧的“Present”之间的时间间隔,也为了搞清楚CPU与GPU之间在这些阶段的平衡关系,英特尔引入了一个新的衡量指标:GPU Busy。
通过GPU Busy指标,用户可以了解到GPU使用多少时间进行实际渲染,多少时间是空闲等待状态。同时可以了解游戏运行时,CPU与GPU工作是否处于平衡状态,是彼此之间高效协同工作,还是互相闲置互扯后腿。
因此,GPU Busy可以帮助玩家更加清晰直观地了解到自己的CPU与GPU是否匹配,二者时间是否存在一些瓶颈,同时还能够分析出游戏分辨率、画质设定是否合适,以便做出更有对策性地调整。
英特尔院士Tom Petersen表示,“GPUBusy会因游戏而异。在设置中,一般来说,在运行更多的GPU密集型活动时,GPU Busy的程度会更高,当较少时,它会更低,并且大多数情况下可以很容易通过更改分辨率体现出来。”
比如以1080P分辨率、Ultra画质下的《守望先锋2》测试为例,锐炫A750显卡在搭配酷睿i5处理器时,在首发3490驱动版本下以及在后续4571版本下,GPU Busy(黄色)与帧生成时间(蓝色)之间的状态有着非常显著的差异。
在使用4571驱动时,GPU Busy与帧生成时间几乎处于完全同步的状态,这意味着CPU与GPU在绝大部分时间都能够高效协同工作,不会出现明显的空闲等待期,因此在效率上获得显著提升。
GPU Busy这项指标也能够衡量出游戏在不同画质时的GPU Busy与帧生成时间之间的状态。如下面两张图所示,在《反恐精英2》这款游戏中,同样配置、同为4571驱动的情况下,1080P分辨率低画质和Ultra画质时的曲线状态差异非常明显。
如果作为玩家看到这样的GPU Busy指标状态,那么就会明白,这款游戏在当前配置下最合适的画质设定就是“Ultra”,而非“Low”。
可见,在引入GPU Busy指标之后,如果玩家特别在于CPU与GPU的工作效率,亦或者说想要获得最佳游戏体验,就能够更加针对性地去选择硬件搭配和游戏设定了。
通过PresentMon Beta更好地了解GPU Busy
那么我们如何才能够测量出自己电脑的GPU Busy指标呢?为此,英特尔推出了PresentMon Beta测试工具。它是为终端用户和媒体提供的工具,可以使GPU Busy与帧生成时间之间的平衡关系变得可视化。它同时兼容N卡和A卡,支持DirectX11、12、OpenGL、Vulkan等API。
如下图所示,PresentMon提供了全新的叠加视图功能,在游戏时可以实时监测各项性能数据,如GPU Busy指标、游戏实时帧率、GPU占用率、温度等信息,还能够监测99%低帧状态等。
PresentMon可由用户进行界面显示参数的自定义,调整显示效果等等,它包含了大约30种不同的参数可以监控,用户可以将其设置为数字文本或图形图表模式,同时它也支持直方图,通过不同的UI形式让用户更加了解自己电脑游戏时的状态。
其实在笔者看来,如果英特尔能够把PresentMon集成到Arc Control控制面板里会更加方便。但根据Tom Petersen的介绍来看,PresentMon其实本身也是一个软件的集合,因此它涵盖了一些底层SDK,以便为高级别的软件提供服务。
随着后续版本更新,Arc Control可能会逐步开始利用PresentMon服务,但目前还无法实现。因此现阶段英特尔首先是将可PresentMon的各项功能加以完善,让它能更加独立地运行。此外考虑到PresentMon可以兼容N卡、A卡,因此现阶段作为独立软件去使用会更符合自身定位。
结语
自去年10月发布锐炫GPU以来,英特尔在短时间内大幅优化了DX9游戏体验,并且重新设计了DX11驱动,带来了高达19%左右的游戏性能提升以及大约20%的99百分位提升。
此外,英特尔全新引入GPU Busy指标去衡量游戏过程中CPU与GPU之间的平衡关系,并且可以帮助用户通过更改游戏画质设定、分辨率设定等来提升硬件效率。同时,英特尔推出全新的Intel PresentMon Beta测试工具,终端用户可以自由下载,并通过它来监测电脑状态,了解自己电脑的GPU Busy指标。
责任编辑:振亭
标签: