光線追蹤是指在模擬場景中對若干條模擬光線進行單獨追蹤,模擬光線其與場景中物體、物體表面材質的交互,從而達到全局照明場景中更真實的渲染效果。相比傳統的光柵化渲染的方式,光線追蹤雖然效果更好但同時對于計算資源的需求更高,傳統軟件實現方式并不能大規模普及開來。英偉達在2018年推出了通過硬件加速來實現實時光線追蹤的桌面級GPU,這可以看作是GPU領域的一次重大突破。而今時隔3年之后,Imagination推出了全新的移動GPU平臺——C系列,通過全新的“光子”架構讓光線追蹤進入到了移動端,成為GPU史上又一次的重大邁進。
圖:Imagination提供的是否開啟實時光線追蹤的效果對比*
克服光線追蹤進入移動端的難點
由于光線追蹤對于計算資源有著很高的要求,而移動端又非常注重功耗的表現,所以光線追蹤功耗表現是其進入移動端的第一難題。據Imagination技術前瞻副總裁Kristof Beets分享,移動端面臨的限制很多,一方面核心的數量沒有辦法無限疊加,發熱和功耗都會成為很大的問題。Imagination新推出的具有光線追蹤功能的C系列GPU IP,它有專門的硬件部分把光線追蹤相關的計算分流到光線追蹤的硬件上,來實現光線追蹤的效果。其中包括光線的反射、陰影、全局照明和環境光的遮蔽。總體上可以達到整個顯示效果的極大提升,同時保留原來非常低的功耗和效率。
Imagination將新的光線追蹤架構命名為“光子”。據Imagination中國區戰略市場與生態副總時昕博士分享,“去創造一個新的宇宙,大家第一個想到的概念是什么?我想到上帝說的一句話”要有光“。我們要創造一個全新的虛擬世界,我們第一個需要的東西也是光,所以我們把新的光線追蹤的架構命名為光子。”新的“光子”GPU架構這個專門用來進行光線追蹤處理的硬件單元叫做RAC(光線加速集群),通過該硬件的加速可以實現傳統 方式數倍的提升,各項性能幾乎都能提高50%。以32位的CXTRT3舉例:每秒鐘可以計算13億條光線的折射、反射,每秒算力達到1.5T,48G像素/s、紋理運算1.3G/s、48GBoxTest;如果做AI定點運算每秒可以達到6TOPS。
在場景的渲染上,越真實的體驗需要調度越多的硬件資源。根據不同的渲染等級,RAC中的不同硬件加速模塊會相應的被調用,把光線遍歷、追蹤和監控算法通過專用的硬件來實現。當全局光照打開,數億條光線打到物體上,將會產生非常大的計算量。Imagination會將數億條光線通過分組的形式來進行計算,從而提高計算的效率。分組計算后的結果通過一致性檢測硬件來進行簇化,將畫面提升到最佳。
將全新的RAC與之前B系列中的USC、TPU等放在一起,就可以組成一個具備光線追蹤能力的移動GPU。據悉,CXT支持多核架構來實現更高的性能表現,例如4核架構最多可以達到7.8G Ray/s,同時還可以選擇用專門神經網絡加速器單元去做降噪的處理,將更多的資源去做圖形相關的渲染計算。此外Imagination也開發了相應的軟件工具,開發者可以查看每秒的光線數,測試的負載等;另外還有一個為內容開發者提供的軟件開發套件,功能類似于跑在PowerVR上模擬出的效果。
光線追蹤的大規模應用之路
光線追蹤的思路很早就已經出現,但受制于計算資源的需求較大,一直沒能得到很大規模應用。而且在前期碎片化問題嚴重,一些方案均來自自有API或軟件方案,這意味著內容開發者并不難在后臺大量應用這些技術。專用的硬件加速的出現使其成為了可能,英偉達的硬件加速光線追蹤桌面級GPU的發布是一個節點,讓硬件方案進入市場并得到認可。而今Imagination的光線追蹤移動GPU的發布,是一個更為重要的節點,帶來了光追的大規模應用爆發的可能。
為了進一步推進光追的普及,Imagination率先提出了一個光追的分級體系,如下圖所示:0級為傳統方案,可能是在圖形工作站上進行幾個小時的畫面渲染,可能也會有一些專業的非標準化的硬件來加速。1級是后來業界在將光追算法向GPU上逐漸遷移,將CPU版本軟件轉換成GPU的版本,借助GPU的并行計算能力來獲得數量級加速。2級中出現了更多細致的光線處理的新的方式,3級中出現了硬件BVH處理能力。據時昕博士分享,目前行業中即使是PC上的光追,大概就在2、3級的水平。第4級別是當前Imagination所發布的新產品可以達到的,這是全球第一次達到該級別的硬件處理能力。第5級上會進一步將會更多計算工作負荷從原來的GPU的渲染器或著色器中分離出來,轉移到專門的硬件上去加速,從而省下更多的GPU資源來做其他動態渲染,這樣可以在性能提升的同時降低功耗。
其實Imagination已經具備直接推出L5級別光追方案的能力,但由于現在市場并不成熟所以并沒有推出。Kristof表示,沒有選擇現階段推出L5級產品主要為了市場平衡考慮,Imagination跟市面上的光線追蹤開發者有過溝通,如果現在推出市場上唯一的L5等級光線追蹤硬件設備,因為市場沒有準備所以不會有太多開發者來開發相應的應用。所以Imagaination決定先推出L4級別的CXT產品來培育市場,讓游戲3D引擎、游戲開發者進入到生態中,再慢慢把光線追蹤市場做大。在標準方面,現在市場上已經出現了一些光線追蹤技術趨向于標準化、統一化的趨勢。時昕表示,處理器的成功離不開整個生態,包括接口,包括編程的模式、工具等等。整個光追生態其中一個重要因素——API標準已經成型,包括Vulkan都有相關的標準出來,Imagination的硬件提供了可能性,上層內容開發者和工具開發者,也會遵循同樣的光線追蹤標準,相信很快會有很多豐富的內容出現。Imagination也積極與微軟等合作伙伴進行密切的溝通,在此基礎上繼續提升GPU架構追求更好的PPA表現。
###
據悉諸多客戶已經獲得了最新CXT的IP授權,按照正常的產品研發周期推算,消費者有望在2023年在移動設備上體驗到硬件光線追蹤方案。