在全球處理器領域,以X86架構和ARM架構為主流的指令集架構占據了絕對優勢。架構授權成為我國處理器廠商發展無法越過的屏障以及發展保持持續性的潛在不利因素。以RISC-V(第五代精簡指令處理器)為代表的開源指令集架構的出現,被業內視為最有可能打破目前處理器生態格局的途徑。近年來,RISC-V在世界范圍內逐漸步入發展熱潮。2018年以來,RISC-V在我國也受到越來越多的重視,中國RISC-V產業聯盟和中國開放指令生態系統(RISC-V)聯盟相繼成立。如何利用RISC-V的開源特性與新興技術實現國產SoC的國產化發展,成為我國集成電路產業共同關注的話題。
2019年7月11日下午,由《電子技術應用》雜志社、中電會展與信息傳播有限公司、EETOP(易特創芯)聯合承辦的“基于RISC-V的SoC國產化發展路徑”研討會在成都世紀城新國際會展中心召開。電子科技大學電子科學與工程學院副教授黃樂天、芯來科技創始人& CEO胡振波、知存科技創始人王紹迪從基于RISC-V指令集擴展的專用SoC設計、國產化RISC-V處理器核及配套工具鏈、RISC-V在AI-SoC芯片中的應用等多方位多角度,闡述了我國利用開源開放的RISC-V構建中國自主可控芯的不斷探索。
《電子技術應用》楊暉(左一)、知存科技王紹迪(左二)、電子科大黃樂天(右二)、芯來科技胡振波(右一)合影
基于RISC-V的SoC國產化發展路徑直播視頻
黃樂天:基于RISC-V擴展指令集的專用SoC設計
電子科技大學副教授黃樂天博士就職于電子科學與工程學院,長期以來從事計算機系統架構與系統級芯片設計交叉方向的研究,包括片上多核處理器與片上網絡、異構計算系統與芯片、領域專用處理器與可重構計算等。
電子科技大學副教授黃樂天博士
傳統SoC的設計方向是以軟制硬,而目前的SoC必須靠硬件對軟件進行加速,這種加速方式主要有下圖所示三種。
專用SoC中加速器的三種耦合方式
RISC-V除常規指令之外,還有定制指令,并為其預留了編碼格式,利用預留編碼格式,設計人員可以為他們想要加速的應用程序添加所需的任何指令。 這是一個強大的功能,因為它不會破壞任何軟件兼容性,同時為發明和差異化留出空間。
黃博士的團隊基于RISC-V架構設計了基于自定義擴展指令的神經網絡加速器。
神經網絡加速器的實現方式
加速器中,5個加速模塊共用RoCC接口,需要對輸入向信號做一到多仲裁,輸出向信號做多到一仲裁。
神經網絡加速器總體硬件設計
經驗證,該加速器的每個模塊都能有效地加速相應的計算,且向量長度越長,加速效果越明顯。
上述設計案例證明,RISC-V的指令集格式非常適宜于通過指令擴展設計專用加速器,Rocket Chip定義的RoCC給定了較為完備的指令擴展接口設計方法。但問題也很明顯,即目前國產化的RISC-V處理器大多把其當成ARM的替代品,對于指令擴展和專用SoC設計的支持不足。未來,在人工智能/神經網絡領域,需要繼續探索指令擴展加速器與專用SoC設計方法;同時通過對各種形式加速器的研究逐步形成設計方法學,從而更加廣泛的指導專用SoC設計;在前兩者研究的基礎上提出領域專用(Domain Specific)SoC架構、設計自動化工具和流程,形成可以支持“敏捷開發”的設計自動化工具集。
芯來科技:本土RISC-V的先行者和布道者 賦能國內AIoT產業變革
芯來科技成立于2018年,是中國大陸知名的專業RISC-V處理器內核IP和解決方案公司,同時還是中國RISC-V產業聯盟(CRVIC)副理事長單位,以及中國開放指令集生態(RISC-V)聯盟(CRVA)會員單位,致力于與上下游合作伙伴共同構建RISC-V的產業生態系統。芯來科技創始人& CEO胡振波出版了國內第一本和第二本RISC-V中文書籍,堪稱中國本土RISC-V的先行者和布道者。
芯來科技創始人& CEO胡振波
芯來科技推出的N200系列RISC-V處理器內核IP,專為超低功耗與嵌入式場景而設計,達到業界一流的指標,非常適合替代傳統的8051與ARM Cortex-M系列內核。該內核IP系列已經過量產驗證,目前已經全面推向市場。
芯來產品路線圖
其中,N201內核是一款入門級商用RISC-V處理器內核,可廣泛應用于對面積、成本和功耗敏感的IoT領域芯片的微控制部分。N201內核支持RISC-V RV32IC/EC指令集架構、支持機器模式(Machine Mode),可完美替代ARM Cortex-M0或傳統8051八位內核。
N201內核
同時,芯來科技還推出一項RISC-V處理器內核IP普惠計劃——“一分錢計劃”,用戶只需三步便可以加入到芯來“一分錢計劃”,就可幾乎免費地獲取與使用N201內核。
芯來科技“一分錢計劃”
除了標準的處理器內核IP,芯來科技還提供RISC-V專用處理器、軟件工具鏈、SoC子系統的定制服務和解決方案,從而賦能客戶實現產品的差異化與高效的性價比。
知存科技:RISC-V在AI SoC芯片中的應用
知存科技CEO王紹迪
隨著深度學習的進一步發展和AI芯片算力的提升,邊緣人工智能芯片將迎來更大的爆發點。安防、自動駕駛、智慧城市、智慧家庭等應用場景都將逐步走向落地。據有關預測,未來2-5年,邊緣人工智能芯片市場需求將增長至3000億人民幣。而AI芯片作為AI的載體,被大家寄予厚望,尤其是高算力、低成本、低功耗的AI芯片。
邊緣市場增長迅速 ($20~30B in 2025)
得益于免費、開源、可模組化特色,基于RISC-V打造低功耗AI芯片成為一個新的解決思路。RISC-V在AI中的優勢非常明顯:(1)性價比高,可顯著降低邊緣AI芯片的成本;指令集精簡,邏輯硬件少,芯片面積??;可按需自由組合的模塊化指令集,針對專用芯片降低芯片面積;無向前兼容負擔,芯片面積?。唬?)高效,精簡指令集,硬件簡單、功耗低,工作頻率高;(3)靈活,可自定義指令,適用于專用場景,從而提高效率;(4)良好的生態發展,目前已經有200多家公司和組織成員參與維護和更新指令集,支持Linux、RTOS、RT-Thread等,且工具鏈愈加完善,未來隨著越來越多玩家的加入,還將涌現越來越好的軟件。
目前,RISC-V在AI中的商業化也取得了多項進展,在美國,NVIDIA早早就加入了RISC-V基金會,并做了不少研究,近日還公開了在深度神經網絡(DNN)中應用RISC-V指令集的可能。Mythic也與其他十幾家企業和組織共同成立了OpenHW組織,特斯拉也加入RISC-V基金會,并考慮在新款芯片中使用免費的RISC-V設計。在國內,比特大陸在Sophon Edge人工智能芯片中就采用了RISC-V架構,嘉楠耘智也在去年年底發布了全球第一款基于RISC-V的邊緣計算商用芯片。
在很多AI推理運算中,90%以上的運算資源都消耗在數據搬運的過程。芯片內部到外部的帶寬以及片上緩存空間限制了運算的效率?,F在工業界和學術界很多人認為存算一體化是未來的趨勢。
AI運算的瓶頸
存算一體化分為幾種:DRAM和SSD中植入計算芯片或者邏輯計算單元,可以被叫做存內處理或者近數據計算,這種方式非常適合云端的大數據和神經網絡訓練等應用;另一種就是存儲和計算完全結合在一起,使用存儲的器件單元直接完成計算,比較適合神經網絡推理類應用。
存算一體
知存科技是后者,即將存儲和計算結合到閃存單元中的存算一體。知存科技使用單一浮柵存儲陣列完成深度學習網絡的存儲和計算功能,運算過程中無需緩存、內存和邏輯運算加速器,在存儲單元器件中直接完成計算,從而徹底解決人工智能運算中的存儲墻和算力問題。
知存科技的存算一體
目前知存科技基于自主研發的存算一體架構和存儲陣列的嵌入式智能語音芯片已經完成流片,支持DNN、LSTM等多種常用網絡,支持可變運算和參數精度,預計2019年年末進入量產。
研討會現場討論熱烈,演講嘉賓和與會聽眾就基于RISC-V的國產SoC的發展展開深入探討。大家一致認為,國產SoC想要擺脫X86、ARM架構的限制,實現真正的崛起,RISC-V將是一個最大的機遇,它給了我們和全球一致的起跑線,錯過RISC-V 我們可能又將錯過一個時代!欣慰的是,國內RISC-V生態體系正在逐步建立起來,也涌現了一批代表性企業真正投入到基于RISC-V指令集的處理器內核及相應開發環境等工作中??梢灶A見,未來幾年,RISC-V將助力國產SoC迎來最佳發展期。