游戏开发论坛

 找回密码
 立即注册
搜索
查看: 34583|回复: 0

《地平线:西部禁域》的Deferred Texture技术

[复制链接]

5万

主题

5万

帖子

8万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
86215
发表于 2022-5-20 09:26:20 | 显示全部楼层 |阅读模式
导语:《地平线:西部禁域》是Guerrilla Games在2022年推出的一款备受关注的续作游戏,在游戏当中主角埃洛伊踏上了前往西方未知土地的冒险,为了实现广阔世界的种种表现效果,研发团队对其渲染管线进行了升级优化,其中就包括了Deferred Texture技术。本文内容源于在GDC 2022上Guerrilla Games团队所做的分享,原题为Adventures with Deferred Texturing in 'Horizon Forbidden West' 。

微信图片_20220520092207.JPG

overview

微信图片_20220520092216.JPG

一、关于visibility buffer

visibility buffer其实出来很长时间了,近期通过nanite被大家熟知。它有很多变种,如文章中所列,Intel(原版)、Dawn Engine(Eidos)、UE5、Activision都有不同的做法。

总的说来就是开始渲染是一个比传统gbuffer小的多的visibility buffer,仅保存primitive id等少量信息,贴图等一概不读。然后再来一个pass,把各种复杂信息补上,输出gbuffer或者直接shading都可以。这个shading过程常常是在compute shader里做的。

传统渲染管线的问题

我们以最标准的vs-rasterize-ps流程来看,这里有若干问题:

  • ps总是以2x2 quad来渲染,对于tiny triangle的case,overhead非常高。
  • 渲染管线非常的“死”,导致很多时候出现大量gap,比如做shadow depth pass的时候,gpu中大量单元非常空闲;老的流程在面临现在更加复杂的case,真的是越来越不给力了。
  • async compute等需要进一步挖掘来提升gpu利用率。

visibility buffer的优势

  • 实际shading更少的pixel。
  • 可以各种batch,大幅度提升cache效率。
  • 可以使用compute shader,async compute,进一步提升gpu的利用率。

二、Guerrilla Games的做法

overview亮点

  • 用于植被,相比很多visibility buffer做法用于static mesh,这里是多了一个进步。
  • 使用IndirectDispatch来进一步做了batch,大幅度提升了wave的利用率。
  • 融合了自己实现的VRS(不是使用硬件的)。
  • 完整的管线介绍,和足够有说服力的性能提升。

植被

首先guerrilla在horizon里是把visibility buffer用于植被的。

微信图片_20220520092219.JPG

因为植被是一直动的,而且风动动画也一直比较消耗,所以在整个过程中带来挑战:降低vertex transform就格外的重要。

技术细节

visibility buffer的格式:

微信图片_20220520092220.JPG

存的是一个32bit的信息,相比ue和activision的都更小。

pipeline & batch

batch

微信图片_20220520092222.JPG

如果我们建好visibility buffer,然后一个compute shader上去算,那么就会出现大量的divergence,导致性能很差。

这里使用一个DispatchIndirect,先对visibility buffer的内容进行排序,pack到16x16的tile中,然后在发起wave cmd。

这样的话,shader、texture、const的切换就大大降低,效率提升了不少。

vertex transform

这里visibility一种做法就是在shading pixel的时候,直接做vertex的transform。

这个如果triangle特别小的话,也可以是一个选项。

但是horizon的case是,triangle往往还比较大的,那么就还是batc起来比较好。

就是把要transform的vertex输出到一个ring buffer里,batch&去重,然后计算好了之后再使用。

pipeline

微信图片_20220520092223.JPG

整个过程拆得比较细,用到的时候再查就好,道理就是如此。

微信图片_20220520092224.JPG

在pipeline中间可以看到,基本都用async compute把计算给hide起来了。

性能

微信图片_20220520092225.JPG

微信图片_20220520092227.JPG

可以看到在这个管线里,性能提升还是很可观的。

文/安柏霖
来源:腾讯游戏学堂

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

作品发布|文章投稿|广告合作|关于本站|游戏开发论坛 ( 闽ICP备17032699号-3 )

GMT+8, 2024-12-22 15:11

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表