《電子技術應用》
您所在的位置:首頁 > 電子元件 > 業界動態 > DPU芯片數據中心奇襲Intel,不止英偉達一個

DPU芯片數據中心奇襲Intel,不止英偉達一個

2021-04-13
來源:與非網
關鍵詞: 英偉達 DPU

  去年秋天,英偉達宣布推出一款新型處理器DPU,黃仁勛的帶貨原話是:“數據中心已成為新型計算單元。在現代化、安全的加速數據中心中,DPU 已成為其重要的組成部分。CPU、GPU 和 DPU 的結合,可構成完全可編程的單一AI計算單元,提供前所未有的安全性和算力。”

  DPU作為面向數據中心的專用處理器,是否真的有望成為繼CPU和GPU之后的第三顆算力芯片?

 

  為什么需要DPU?

  微信圖片_20210413103612.jpg

  圖源 | PC Magazine

  CPU負責通用計算、GPU負責加速計算已經成為絕大部分數據中心的常態。用于加速計算的GPU,將計算密集型任務從CPU中分離出來,CPU繼續發揮通用計算和邏輯運算的能力,將并行計算、機器學習和AI計算等任務交給GPU處理。

  隨著數據中心向軟件定義的趨勢發展,它在變得更加靈活的同時也將承受更大的負擔,基礎架構的運行將消耗20%-30%的CPU核心。這也意味著,新的分工體系需要更加細分的“工種”,為CPU“減負”。

  正如GPU受圖形圖像需求的驅動發展,DPU(Data Processing Unit,數據處理器)的產生背景是端邊云一體化趨勢下,對計算延遲、數據安全、資源虛擬化的需求,而這些功能對于實現對于下一代云上大規模計算至關重要。

  

  國內外玩家都有誰?

  事實上,想在基礎網絡架構變革中分一杯羹的不止DPU,還有智能網卡(SmartNIC)。我們都知道數據中心服務器之間的網絡互聯有一套底層軟件系統,這套軟件需要能完成網絡互聯協議,除此之外,還需要能跑一套數據中心必備的網絡安全系統。傳統上,這些處理也跑在CPU上,而隨著SmartNIC的逐漸普及,它正在網絡安全和網絡協議處理方面緩慢地取代CPU。

  Xilinx去年推出的Alveo U25 就是一款一體化內置可編程FPGA的 SmartNIC ,在單顆器件上實現了網絡、存儲和計算加速功能的融合。

  DPU可以看做是SmartNIC的增強版本,一方面加強了SmartNIC對于網絡協議和網絡安全的處理能力,另一方面整合并加強了分布式存儲的處理能力,從而讓DPU能在這兩個領域更多地替代CPU。

  這將是一個即將掀起大風浪的領域,擠滿了摩拳擦掌的選手們。據不完全統計,國內外布局這一市場的玩家,既有Intel、英偉達、Broadcom、Marvell這樣的大廠,也包括Fungible、Pensando等初創企業,其中幾家大廠近些年的幾宗收購,也在圍繞這一領域展開。

  從技術路線來看,各家方案有所不同。Intel、Broadcom都是面向交換機、路由器芯片,Intel基于FPGA,Broadcom基于Arm架構;英偉達側重于數據安全、網絡、存儲卸載,主要基于所收購的Mellanox網絡方案及Arm架構實現;Marvell主要面向5G帶寬,通過收購Cavium獲得的可編程芯片技術和Arm架構形成方案;Pensando和Fungible兩家創企,前者面向支持P4的SDN,方案主要通過軟件定義網絡處理器實現,后者面向網絡、存儲、虛擬化,方案基于MIPS架構。

  國內廠商在這一領域目前有披露的并不多,華為的智能網卡屬于DPU的細分,不過智能網卡芯片還未正式宣布;阿里方面,據了解有DPU較為原始形態的產品;還有中科馭數,最近剛剛宣布了下一代DPU芯片計劃。

 

  沖擊千億量級DPU市場

  國產芯片加速成長

  根據Fungible和Nvidia的預測,用于數據中心的DPU量級將達到和數據中心服務器等量的級別。服務器每年新增大約千萬量級,一臺服務器可能沒有GPU,但一定會有一顆或者多顆DPU,好比每臺服務器都必須配網卡一樣。服務器每年新增大約1500萬臺,每顆DPU如果以1萬元計算,將是千億量級的市場規模。

  追溯起來的話,中科馭數的創始團隊算是在國內較早進行DPU芯片研發的。該公司創始人兼CEO鄢貴海博士、聯合創始人兼CTO盧文巖博士、首席科學家李曉維博士,均來自中科院計算所計算機體系結構國家重點實驗室。他們提出了軟件定義加速器技術(Software Defined Accelerator),自主研發了KPU(Kernel Processing Unit)芯片架構,并于2019年設計出業界首顆數據庫與時序數據處理融合加速芯片,已經成功流片。中科馭數的DPU芯片,正是基于自研的KPU芯片架構,具有網絡協議處理、數據庫和大數據處理加速、存儲運算、安全加密運算等核心功能。

  從KPU架構到DPU芯片,中科馭數的關鍵優勢是什么?

  鄢貴海博士介紹,相較于傳統的ASIC或SoC DPU芯片架構,KPU有較高的靈活性,可以通過即時的軟件配置來定義芯片內部數據運算邏輯,在保障充沛算力的同時,以最低功耗支撐更多運算負載類型。其KPU定位為“敏捷異構”的專用計算架構,與CPU、GPU、FPGA、ASIC相比,KPU-Drive方案在算力、能效比(TCO)、算法靈活性、邊際成本、開發周期等方面優勢明顯。

  目前,中科馭數已經積累了8個大類的KPU內核資源, 涵蓋了時間序列分析、數據查詢、加密解密、數據壓縮、協議解析等,并在過去兩年完成了兩代KPU的迭代。KPU也從最初的單個應用算法加速,進化到了集網絡、數據庫與應用算法的全方位立體化加速體系。

  再與同類方案做橫向對比,中科馭數是否有獨特優勢?

  據了解,同類DPU方案類型大致可以概括為三種:一是以通用眾核為基礎的同構眾核DPU,例如Broadcom的Stingray架構,以多核Arm為核心,以眾取勝,可編程靈活性較好,但是應用針對性不夠,對于特殊算法和應用的支持,與通用CPU相比并無太顯著優勢;二是以專用核為基礎的異構核陣列,這種架構的特點是針對性較強、性能較好,但是犧牲了部分靈活性;第三種路線是以上二者的折中,且專用核的比重越來越大,正在成為最新的產品趨勢,以英偉達的BlueField2系列DPU來看,就包括4個Arm核及多個專用加速核區域,Fungible的DPU則包含6大類的專用核,和52個MIPS小型通用核。

  “不同于Broadcom、Fungible等國外芯片廠商,中科馭數的DPU沒有采用原來眾核為主的架構,而是將重點放在異構核上,以針對性算法加速為核心,通過KPU架構來組織異構核。在KPU架構下,中科馭數研發了芯片級完善的L2/L3/L4層全網絡協議處理核,推出了直接面向OLAP、OLTP及類SQL處理的數據查詢處理核”,鄢貴海介紹。

  這樣帶來的好處是,更高效的數據處理效率、獲得更直接的使用接口,以及更佳的虛擬化支持,這些特性對于金融科技、數據中心、混合云及邊緣計算等高帶寬、低延遲、數據密集型的計算場景都尤為重要。

  以KPU架構為核心,在2019年流片第一顆芯片K1的基礎上,中科馭數下一顆芯片K2預計今年年底流片。從目前曝光的芯片架構來看,功能層面包括L2/L3/L4層的網絡協議處理,可處理200G網絡帶寬數據;融合了數據庫、大數據處理能力,直接面向OLAP、OLTP及大數據處理平臺,如Spark等;此外,還囊括機器學習計算核以及安全加密運算核。

  微信圖片_20210413103714.jpg

中科馭數K2芯片架構

 


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 六月婷婷激情 | 久久久久久国产精品免费免 | 国产高清在线免费 | 成人精品在线观看 | 国产欧美va欧美va香蕉在线观 | 奇米第四色888 | 97国产影院| 精品视频 久久久 | 国产真实强j视频在线观看 国产真实伦在线视频免费观看 | 激情五月亚洲色图 | 国产区久久 | 国产永久免费高清在线观看视频 | 国产一区2区 | run away无删减韩国动漫在线看 | 免费久 | 青草视频网 | 老女人网址 | 中文字幕日本一区久久 | 国产小视频网站 | 国产99久久 | 色噜噜狠狠在爱丁香 | 国产精品欧美亚洲韩国日本不卡 | 五月天情网 | 丁香婷婷在线观看 | 国产99免费视频 | 国产欧美一级片 | 国产成人免费在线 | 99国产精品| 久久国产精彩视频 | 广东东莞一级毛片免费 | 青青草国产免费久久久91 | 日日网| 国产成人亚洲综合无 | 你懂的免费在线视频 | 亚洲免费国产 | 啊v天堂网 | 五月丁开婷婷 | 精品福利视频网 | 国产精品视频网址 | 久久久久久久一精品 | 久久精品国产精品亚洲 |