GPU領域再迎重大創新——全新Imagination DXTP GPU將功效提升20%
2025-03-14
作者:北京華興萬邦管理咨詢有限公司 翔煜 商瑞
來源:華興萬邦
Imagination于不久前正式發布了DXTP GPU IP,這款新產品的亮點在于,在標準圖形工作負載下,其能效比(FPS/W)相比前代產品實現了高達20%的提升。作為GPU IP行業的領導者,截至2023年的公開數據顯示,搭載Imagination IP授權的芯片累計出貨量高達110億顆。這些芯片廣泛應用于移動設備(包括智能手機)、汽車、消費電子產品和電腦等多個領域。
此次功效得到大幅提升的DXTP GPU的發布,正值在DeepSeek等大模型技術的推動下,邊緣AI設備廣泛興起的產業轉型期,功效更高的GPU IP將為邊緣端側AI SoC的開發提供巨大的支持。同時,DXTP GPU也是Imagination繼不久前發布比鎖步和雙備份成本低很多的、已獲得ASIL-B認證的GPU分布式功能安全機制后又一個重大技術持續進步。
而回顧GPU的技術升級浪潮,可以發現Imagination始終以創新為核心動力,在近幾年不斷推出具有突破性的IP產品,從根本上重塑了圖形計算和人工智能領域的發展藍圖。因此,本文以Imagination在GPU領域的持續創新為例,通過盤點該公司近年來在GPU技術領域內的創新,分析其長期堅持的技術創新戰略,以及這一戰略與國內芯片設計公司在各個領域內協同創新的機會,共同探索如何成為行業引領者實現雙贏,支持國內芯片企業去實現更多的創新與突破。
Imagination:持續的技術創新助其成為GPU行業的引領者
2021年,Imagination推出了業界首款在移動平臺上支持硬件光線追蹤的GPU IP——Imagination CXT GPU,這一創舉在移動圖形處理領域具有里程碑意義。在CXT誕生之前,移動設備受限于硬件性能和功耗等因素,圖形渲染的真實感和沉浸感遠不及桌面設備。
CXT通過引入Imagination開發的PowerVR Photon架構的光線加速集群(RAC),成功解決了這一難題。RAC采用了先進的光線處理算法,能夠高效處理光線的傳播、反射、折射和陰影計算等復雜操作。
CXT的光線追蹤技術能夠實時計算光線的傳播路徑,生成逼真的光影效果,使得游戲中的物體與場景之間的光影交互更加自然。此外,CXT在功耗控制方面也進行了優化。它采用了動態功耗管理技術,根據光線追蹤任務的復雜度自動調整硬件資源的分配,在保證圖形質量的同時,盡可能降低能耗。這使得移動設備在運行支持光線追蹤的游戲時,不會因為功耗過高而導致發熱嚴重或續航時間大幅縮短,為移動光線追蹤技術的普及奠定了堅實的基礎。
2023年,Imagination推出新一代的IMG DXT GPU,在CXT GPU取得成功的基礎上,進一步發展了光線追蹤技術。DXT GPU具備可擴展的光線追蹤功能,這一創新特性使廠商能夠根據不同的應用場景和設備性能需求,靈活調整光線追蹤的精度和復雜度。對于高端游戲和專業圖形設計領域,DXT能夠提供更高質量的光線追蹤。在有復雜渲染需求的大型游戲中,DXT不僅可以實現全域光照效果,并且模擬真實世界中光線在場景中的多次反射和折射,使整個游戲場景更加明亮和自然。同時,DXT上的擴展光線追蹤技術在專業圖形設計、建筑設計和影視特效制作等許多領域,可以幫助設計師實現更加真實的渲染效果和更加逼真的虛擬場景,提高成品質量和視覺沖擊力。
Imagination在其DXT GPU中還加入了多項創新,例如“2D雙速率紋理映射”技術,該技術能在同一時間處理兩種不同分辨率的紋理,通過智能切換紋理分辨率,在保證圖形質量的同時,顯著提升紋理處理速度,減少內存帶寬占用。在復雜2D場景渲染中,例如手機游戲中的角色和場景繪制,它能根據畫面元素的遠近和重要程度,動態調整紋理分辨率,近景和關鍵元素采用高分辨率紋理以呈現精細細節,遠景元素則使用低分辨率紋理,從而在不影響視覺效果的情況下,大幅提升渲染效率,優化圖形處理性能。
2023 年末,為了幫助桌面和數據中心客戶實現高性能的云端GPU創新解決方案,Imagination推出了DXD GPU IP。該款GPU的創新之處在于首次將Imagination的API覆蓋擴展至DirectX,這一舉措顯著提升了DXD與Windows平臺上的應用程序和游戲的兼容性。同時,Imagination 的硬件虛擬化技術 HyperLane 在DXD中發揮了關鍵作用,該技術支持在單個GPU上安全且獨立地運行多達八個操作系統,這意味著當 DXD部署在服務器中時,能夠支持多達八個用戶同時進行游戲,極大地提升了服務器的使用效率,降低了云游戲的運營成本,并為云游戲行業的發展帶來了創新的運營模式。
時間來到2024年9月,針對全球汽車智能化的需求,Imagination推出了其算力最高可擴展至24 TOPS INT8的DXS系列GPU,該系列IP不僅為智能駕駛艙和先進駕駛輔助(ADAS)等應用所需SoC帶來澎湃的算力,而且轉為諸如汽車處理器等對安全性要求極為嚴苛的應用,開發了結合GPU的計算模式特點并大幅降低成本分布式功能安全機制(DSM),這為汽車和工業等越來越多需要GPU的圖形處理能力和計算能力的電子系統帶來了巨大的創新。
通過引入DSM機制,Imagination DXS GPU能以比鎖步或者功能備份等功能安全機制小得多的資源開銷實現ASIL-B級別的功能安全,這在降低了高昂的成本的同時還提升了效率。采用DSM分布式安全機制的DXS GPU已經通過嚴格的ASIL-B認證,汽車SoC開發商僅需增加大約10%的芯片面積就實現了功能安全,如果結合該公司的HyperLane硬件虛擬化技術,還能大幅度提升這些汽車SoC的計算性能和效率。以自動駕駛系統為例,DXS能夠實時、安全地處理海量的傳感器數據,而HyperLane則通過虛擬化技術隔離數據和處理過程,在確保系統的安全性和可靠性的同時,為自動駕駛芯片的創新提供了堅實的支持。
集大成的D系列收官之作:DXTP 融合創新服務端側AI
新推出的Imagination DXTP GPU是其D系列的巔峰之作,匯聚了前代產品的眾多優點。它不僅繼承了DXT系列GPU的圖形處理能力和能效優勢,例如“2D雙速率紋理映射”技術,還融合了DXS系列的計算能力和能效優勢,包括用于AI加速的大容量本地內存。在能效方面,DXTP GPU表現出色,在常規圖形工作負載下,其功耗效率(FPS/W)比前一代產品DXT提升了高達20%。
在端側AI應用場景中,這一特性對主控SoC尤為關鍵。以智能家居為例,搭載DXTP的芯片可以利用大容量本地內存快速存儲和處理AI模型數據,用智能攝像頭去實時識別畫面中的人物、物體,還能借助DXTP的高性能計算能力對識別結果進行快速分析,例如判斷是否有異常行為等,然后及時向用戶推送警報信息,極大提升了智能家居主控SoC的智能特性和響應速度。
DXTP GPU卓越的能源效率使其能夠在相同的功耗預算下實現更高的幀率(FPS),這使得下游相關方能夠在不影響電池續航的前提下,為終端用戶帶來更先進的圖形處理體驗和計算功能。DXTP GPU為SoC芯片設計公司帶來兩個方面的創新:首先是“利用率”顯著提升,它能將理論上的TFLOPS高效轉化為實際的FPS,實現了極高的效率,同時將功耗浪費降至最低。
其次是DXTP GPU提供了芯片資源使用靈活性,它能夠處理圖形或AI工作負載,或者同時處理這兩種計算需求,因此在AI功能已成為智能手機等設備差異化競爭的焦點的今天,DXTP能夠支持在GPU上無需額外的芯片面積來專門用于AI處理,也不會犧牲用戶界面或游戲體驗,這體現了對芯片資源的高效靈活利用。
搭載DXTP GPU的新一代SoC已在設計之中
DXTP GPU提供DXTP-48-1536和DXTP-64-2048兩種配置,兩款產品均已經向芯片設計公司出售了授權,因此預計搭載該GPU的SoC將很快可以提供給系統廠商使用。其中,DXTP-64-2048在1GHz的運行頻率下,具備64 GPixel/s的處理速度,能夠實現2 TFLOPS的FP32、4 TFLOPS的FP16以及8 TOPS的INT8峰值計算性能;DXTP-48-1536同樣具備48 GPixel/s的處理速度、1.5 TFLOPS的FP32、3.0 TFLOPS的FP16和6 TOPS的INT8性能。
在功能特性上,DXTP引入全新的靈活任務調度機制。該機制可實時監測各個任務的狀態和資源需求,依據任務優先級和實時需求動態分配計算資源。當同時運行圖形渲染和AI計算任務時,能合理分配資源,確保系統高效運行,提升整體性能和響應速度,進一步提高能源利用效率,有力推動邊緣AI應用發展。
DXTP 的均衡架構設計同樣是一項創新。這種架構通過優化渲染計算的吞吐量,相較于前代產品實現了高達50%的性能提升。通過擴展緩存容量和系統級帶寬,DXTP 構建了更高效的通道,能夠更有效地替代 GPGPU 完成各類復雜計算工作,完成數據存儲和傳輸。在處理大規模數據集時,緩存能夠暫存頻繁訪問的數據,從而減少讀取時間;而更高的系統級帶寬則確保了數據在不同組件間快速傳輸,有效避免了傳輸瓶頸。無論是實時渲染大型3D游戲,還是處理AI計算任務中的海量數據,DXTP 都能憑借其架構優勢高效且穩定地執行。
此外,借助Imagination的低開銷HyperLane技術,DXTP支持完全安全的GPU多任務處理,可同時運行圖形和計算任務,極大地提升了系統靈活性。例如,在智能汽車場景中,車輛行駛時,DXTP 一方面要負責渲染高精度的 3D 地圖,為駕駛員提供清晰直觀的導航界面,實時呈現路況和周邊環境信息;另一方面,還要同步處理來自多個傳感器的 AI 計算任務,如對攝像頭捕捉到的圖像進行實時分析,識別行人和其他車輛,以輔助自動駕駛決策。這兩項任務對計算資源的需求都很高,且對處理的及時性和準確性要求嚴格,DXTP 憑借 HyperLane 技術,能將圖形渲染和 AI 計算任務高效分配到不同的虛擬環境中,讓它們互不干擾地穩定運行,保障了駕駛過程中的安全性和用戶體驗。
生態合作創新支持開發者更方便完成設計并復用成果
Imagination不僅在硬件技術上不斷創新,還積極構建豐富的軟件生態系統,推動 GPU 技術的廣泛應用,展現了其全方位支持芯片設計企業及其用戶去實現創新的能力。
Imagination與Android和Linux生態系統緊密協作,致力于挖掘GPU的計算潛力。通過與這些主流操作系統的深度整合,Imagination為開發者打造了一個更加便捷、高效的開發環境。同時,Imagination為開發者們提供了豐富的創新資源和強大的工具,包括定期更新的驅動程序、詳盡的指南和示例代碼,支持OpenGL/ES、OpenCL、Vulkan等多種標準。開發者可以根據項目需求選擇最合適的開發框架,從而提升開發的靈活性和效率,為創新應用的開發提供了有力支持。
在圖形處理、GPU計算和人工智能領域,Imagination與UXL基金會開展合作,利用其oneAPI等開放標準支持開發者去降低創新門檻并充分復用創新成果。例如通過結合使用Imagination的OpenCL工具包,相較于開源人工智能方案,能夠實現高達4倍的人工智能應用性能提升。這一合作成果為人工智能開發者提供了更加強大、高效的開發工具,加速了人工智能應用在GPU上的開發和部署,推動了人工智能領域的創新發展。
Imagination還擁有一系列功能豐富的開發者工具,可用于性能分析與調試,同時還提供帶有示例和指南的軟件開發工具包(SDK)。這些工具和SDK可從開發者門戶網站下載,并且已經被眾多游戲工作室長期使用。Imagination的開發者社區充滿活力,便于分享經驗、解決問題。社區活動和競賽激發創新,技術交流讓開發者掌握最新動態,而競賽則促進了思想交流和應用創新,營造了一個充滿創新活力的生態環境。
通過前面介紹的這些創新產品、技術和生態舉措,可以發現Imagination一方面致力于從算力指標、整體功耗、芯片面積、功能安全和架構均衡性等基礎性能上挖掘性能極限正在重新定義GPU,另一方面還在架構靈活性、用戶體驗、特色功能和AI支持能力等產品特色功能上支持SoC設計企業及其用戶去引領或者適應新的商業模式,第三還聯合產業內外各類創新主體攜手推動這些技術更快轉化為智能化轉型的強大動力,共同去引領邊緣AI時代的創新發展。在邊緣AI快速發展的今天,Imagination在GPU領域的持續創新,不斷為SoC設計企業帶來可以引領市場的全新功能,還為整個圖形計算和人工智能計算在端側智能領域帶來了新的發展機遇。
更多精彩內容歡迎點擊==>>電子技術應用-AET<<