DPU被視為僅次于CPU、GPU的第三顆大芯片,負責處理“CPU做不好,GPU做不了”的數據任務,預計全球DPU市場將在2023-2024年迎來爆發式增長。
全球芯片巨頭英偉達、英特爾先后下場,國內涌現了中科馭數、云豹智能、大禹智芯、云脈芯聯、星云智聯、邊緣智芯等一系列創業公司,下游云計算龍頭AWS、阿里云等廠商也早已布局······DPU行業迎來百家爭鳴時期。
12月21日,中科馭數宣布完成數億元規模A+輪融資,由麥星投資和昆侖資本聯合領投。這是繼7月底完成A輪融資之后,該公司今年獲得的第二筆數億元融資;5月成立的云脈芯聯10月獲得IDG、壁仞科技等企業的投資。
DPU也在攪動著二級市場。21日,在左江科技回復投資者稱,公司自研可編程網絡安全處理芯片在功能定義和架構設計上已具備DPU相關特性要求后,股價連漲三天。
在這一全新賽場上,國產DPU廠商有多大機會?誰能脫穎而出?
下一個黃金賽道?
在數據中心時代,CPU一家獨大的局面將一去不復返。
DPU被視為僅次于CPU、GPU的第三顆大芯片,負責處理“CPU做不好,GPU做不了”的數據任務。在英偉達等廠商的環伺下,英特爾在數據中心的市場將不斷被蠶食。
DPU的概念最早由硅谷創業公司Fungible提出,在英偉達收購網絡解決方案廠商Mellanox并重新包裝定義DPU后,這一概念一炮而紅。目前,該市場仍處于發展初期,各廠商定義有所不同。主流的DPU定義由NVIDIA提出,即DPU是集數據中心基礎架構于芯片的通用處理器。
賽迪顧問發布的《2021中國DPU行業發展白皮書》將DPU方案分為三種:一是以通用眾核處理器為基礎,以多核ARM為核心,以眾取勝,可編程靈活性較好,但是應用針對性不夠,對于特殊算法和應用的支持與通用CPU相比并無太顯著優勢;二是以專用核為基礎的異構核陣列,針對性較強、性能較好,但是犧牲了部分靈活性;第三種路線結合了前二者優勢,即將通用處理器的可編程靈活性與專用的加速引擎相結合,正在成為最新的產品趨勢。
由于目前DPU的概念和技術標準并未統一,各家從自身優勢出發輸出相應的解決方案,形成百家爭鳴的競爭格局。
一方面,英偉達、英特爾、Marvell、博通等全球芯片龍頭積極布局,設立自己的標準;另一方面,眾多創業公司加入這一藍海。與此同時,包括AWS、阿里云等各大云服務廠商都在布局自己的數據處理器。
據第一財經了解,全球最大云服務廠商AWS采用的是以Arm核為主的方案。2015年,AWS收購了Annapurna Labs,后者是為超大規模數據中心和邊緣計算設計基于Arm架構芯片的廠商;2017年,AWS正式推出Nitro,將網絡、存儲和安全任務卸載到基于Arm架構的專用設備上。
而阿里云提出的X-Dragon系統架構核心MOC卡采用的則是FPGA+CPU的形式。有業內人士表示,微軟早期采用的是純FPGA的方案,目前也在往FPGA+CPU方向轉。
除了自研,云廠商也通過投資等方式尋找合適的解決方案。例如,騰訊投資云豹智能,字節投資云脈芯聯。
大禹智芯CEO李爽告訴第一財經,目前DPU主流的市場方案包括以Arm核為主的架構、FPGA+CPU架構,以及SoC架構,前兩者已經在云計算廠商得到批量部署,整體SoC方案則是今后的趨勢,“我們自己的產品路線也按照這個來。FPGA+CPU的方案與第一代Arm核為主相比,接口的豐富度和處理性能要好很多,但是FPGA的功耗較大、價格較高。與此同時,我們的SoC項目已經啟動。”
頭豹研究院預測,2025年全球DPU市場規模將達到135.7億美元,中國DPU市場規模將達到37.4億美元。
賽迪顧問的數據更樂觀。該機構預計,全球DPU市場將在2023-2024年迎來爆發式增長,中國早于全球市場,于2022-2023年就將迎來爆發式增長。預計到2025年,全球DPU產業市場規模將超過245.3億美元,中國DPU產業市場規模將超過565.9億元。
有業內人士認為,DPU數量會和服務器數量一個級別,每臺服務器都需要1個甚至多個DPU產品。
DPU的產生源自應用驅動。摩爾定律放緩使得通用CPU性能增長的邊際成本迅速上升。中科馭數CEO鄢貴海表示,2010年前,網絡的帶寬年化增長大約30%,近年達到45%;而CPU的性能增長從10年前的23%,到近年降低至3%。當網絡帶寬增速和CPU性能增速的比例達到10倍的情形下,CPU幾乎已經無法直接應對網絡帶寬的增速。
“這個時代的核心變化是CPU性能增加趕不上數據產生的速度。2018年前,我如果買一個24核的CPU,有2個核處理流量,還有22個核可以處理上層應用;2018年后流量快速增加,需要16核處理流量,處理其他任務的只有8個核,幾乎2/3就廢掉了。”邊緣智芯首席架構師李甫告訴第一財經。
在大型數據中心,流量處理占了計算30%的資源,AWS將這些還未運行業務程序,先接入網絡數據就要占去的計算資源稱為“數據中心稅(Datacenter Tax)”。
DPU最直接的作用是作為CPU的卸載引擎,接管網絡虛擬化、硬件資源池化等基礎設施層服務,從而釋放寶貴的CPU資源來運行上層應用,實現了以數據為中心的業務和基礎設施操作的分離。
芯片巨頭爭霸
2020年10月,在收購Mellanox后,英偉達發布了首款DPU產品——BlueField2系列。英偉達創始人兼CEO黃仁勛表示:“現代超大規模云正在推動數據中心的新架構。需要一種旨在處理數據中心基礎設施軟件的新型處理器來卸載和加速虛擬化、網絡、存儲、安全和其它云原生AI服務的巨大計算負載。BlueField DPU的時代已經到來。”
英偉達規劃了多代產品,計劃在2022年推出性能更強的BlueField3,2024年推出集成其GPU模塊的BlueField4。
從戰略上,英偉達收購Mellanox推出DPU,并試圖收購Arm,加上其傳統強項GPU,將侵蝕英特爾的市場份額,直接威脅后者在數據中心的霸主地位。
股市上的表現更加直接。2020年7月,英偉達市值超過英特爾,成為全球第三大半導體企業;一年多后的今天,英偉達成為全球市值最高的半導體企業。截至北京時間12月28日,英偉達市值7736億美元,幾乎是英特爾(市值2112億美元)的4倍。
不過,英偉達是否能成功復制GPU的成功仍有待觀察。多位業內人士告訴第一財經,此前Mellanox產品在云服務廠商的認可度并不高,“它的劣勢是它確實不太懂(云),包括客戶對它產品的測試和設計都有吐槽。在Mellanox尚未被收購前,我們有測過很多功能,一些功能的改變也是我們提的。”
不少人認為,英偉達對DPU市場的教育和推動概念的作用要大于其產品的實際應用。
在英偉達的步步緊逼下,英特爾自然也不甘落后。2021年6月,英特爾發布了IPU(Infrastructure Processing Unit,基礎設施處理器),對標英偉達的DPU,并推出了基于FPGA和ASIC的兩種方案。
Guido Appenzeller介紹稱,在美國和中國,六大云服務廠商目前使用基于FPGA的IPU。“隨著帶寬變高,我們看到他們緩慢地轉向專用ASIC IPU。因為存在很多專利協議,所以不會發生快速轉變。”
通過使用IPU,可以從服務器卸載與運行基礎設施任務相關的開銷。云服務廠商的軟件在IPU本身上運行,而租戶的應用程序在服務器CPU上運行。這不僅釋放了服務器上的資源,同時優化了整體性能,而且為云廠商提供了一個單獨且安全的控制點。
值得一提的是,ASIC版本IPU采用的CPU核是ARM架構,而非英特爾自身的X86架構,這意味著英特爾的話語權正在減弱,為了迎合客戶需求選用了競爭對手的架構。
第一財經了解到,英特爾ASIC版本IPU主要與谷歌合作,谷歌提出相應需求,英特爾為其“定制”。
李甫認為,IPU側重多個CPU的管理,努力融合IaaS模塊,降低集群管理成本,更多像是一個協處理器。“類似在CPU中的大小核,變成了雙路服務器中的雙路大小CPU架構。為了應對不同客戶需求,英特爾可能會采用FPGA +小CPU +大CPU的超異構計算模型,復雜化DPU/IPU市場。我們推出基于PCIe Switch總線交換技術的XPU芯片,正是為了這種超異構計算架構準備的通用數據分發芯片。”
除此之外,賽靈思、Marvell、博通等老牌芯片廠商也都在推出針對數據中心的解決方案。
國內創業公司遍地開花
國內初創企業也陸續推出相應的解決方案。中科馭數自主研發KPU芯片架構,落地于金融計算、數據中心、云原生、5G邊緣計算等場景。該公司正在研發的第二代DPU芯片K2已經完成設計和驗證工作,預計將于2022年第一季度投產流片。
12月4日,大禹智芯第一代DPU產品Paratus V1.0正式亮相。根據該公司規劃,2021年,大禹智芯完成第一代產品的研發、客戶測試和商業化交付;2021年年底,第二代產品即將成功研發,并實現對應商業合同的簽署;2021年年底,大禹智芯啟動自有芯片(SoC方案)的研發。
12月15日,云豹智能發布全功能云霄DPU網卡,全面支持裸金屬、虛擬機和容器服務資源一體化和性能加速,主要基于FPGA方案。據悉,下一代軟件定義DPU芯片也正在按計劃研發中。
專注PCIe技術棧的邊緣智芯則提供了另一種視角,數據從網卡進入其設計的XPU后,分發給CPU、GPU、SSD。按其架構,在XPU為中心的架構中,網卡無需智能,只需要提供基本的網絡協議功能即可,適用于低成本、低延遲的應用場景。
與CPU和GPU不同,DPU目前在技術標準和生態方面都處于早期階段,并未出現絕對的領先者。接受采訪的多位業內人士認為,中國具備豐富的數據資產,有強大的互聯網產業,在這一賽道中,中國芯片廠商或許有望脫穎而出。