2月19日至23日,第70屆ISSCC(國際固態電路會議)在美國舊金山召開,清華大學集成電路學院作為第一署名單位在ISSCC 2023發表了8篇學術論文,所涉及研究內容包括存內計算視覺芯片、量子計算芯片、多模態Transform芯片、異步類腦芯片、可重構存內張量計算芯片、超寬帶收發機、分頻器、振蕩器等。
本刊編輯委員會專家尹首一教授作為通訊作者的3篇文章獲得發表,下面我們對相關論文進行介紹。
ISSCC (International Solid-State Circuits Conference)國際固態電路會議始于1953年,是全球學術界和工業界公認的集成電路設計領域最高級別會議,被認為是“集成電路設計領域的奧林匹克大會”。ISSCC通常是各個時期國際上最尖端固態電路技術最先發表之地。每年吸引超過3000名來自世界各地工業界和學術界的參會者。
存內計算視覺芯片CV-CIM
代價匹配算法需要精確計算圖像間的相似度,已經被廣泛應用于自動駕駛,機器人,AR/VR等領域,但由于其頻繁的數據訪存,導致其難以應用于低功耗場景中。集成電路學院魏少軍、尹首一教授團隊提出了采用存算一體范式的CV-CIM,將計算單元與SRAM存儲單元完成合并,減少數據搬移。利用異或邏輯的自反性,結合律等,可重構為乘法,加法,減法,比較等多種基本算子。進一步經過數模混合存算單元的配合,實現包括L0/L1/L2在內的多種距離計算算法;并利用圖像相似度,動態擴充計算數據稀疏度,擴展計算噪聲容限,提升計算精度;通過增加行方向細粒度地址控制,列方向讀寫并行模式,大幅提升存算系統的利用率??紤]到模擬單元受PVT影響,增加Canary BIST單元保證計算系統魯棒性。CV-CIM作為國際首款針對圖像匹配的存算一體芯片,在28nm工藝上成功實現流片,峰值能效為1158TOPs/W,面積為0.387mm^2。
該工作以 “CV-CIM: A 28nm XOR-derived Similarity-aware Computation-In-Memory For Cost Volume Construction”為題發表在ISSCC2023。集成電路學院博士研究生岳志恒為論文第一作者,尹首一教授為通訊作者。
多模態Transform芯片
多模態Transformer是當下最流行的處理多種模態信號(視覺、文字、語音等)的AI模型之一,已廣泛應用于視頻問答、多語言圖像檢索等任務中。這類模型巨大的計算量、頻繁的數據訪問、獨特的跨模態注意力機制對AI芯片設計造成諸多挑戰。集成電路學院魏少軍、尹首一教授團隊提出國際首款基于可重構數字存算一體架構的多模態Transformer AI芯片MulTCIM。研究團隊充分利用跨模態注意力機制中的計算冗余性,設計出綜合利用attention-token-bit三個層次混合稀疏性的存算一體架構:1)使用注意力局部性調度器優化attention稀疏,提高存算單元利用率;2)采用模態自適應存算一體網絡優化token稀疏,減少跨模態切換時的等待時間;3)利用位寬均衡存算一體單元優化bit稀疏,降低存算一體單元的計算延遲。MulTCIM芯片使用TSMC 28nm工藝成功流片,在典型多模態Transformer模型ViLBERT上僅產生2.24μJ/Token的能耗,相比于ISSCC2022上發表的Transformer芯片可獲得5.91倍的能效提升。
該工作以“MulTCIM: A 28nm 2.24μJ/Token Attention-Token-Bit Hybrid Sparse Digital CIM-based Accelerator for Multimodal Transformers”為題發表在ISSCC2023。集成電路學院畢業生涂鋒斌博士為論文第一作者,尹首一教授為論文通訊作者。
可重構存內張量計算芯片TensorCIM
Beyond-NN計算是面向通用智能場景的新型計算類型。不同于傳統的處理圖像、語音等規則數據結構的神經網絡,Beyond-NN計算需要處理真實世界中的非規則數據結構,例如社交網絡、知識圖譜、推薦系統等。針對Beyond-NN在算力、訪存、功能三方面的技術挑戰,集成電路學院魏少軍、尹首一教授團隊提出國際首款基于可重構數字存算一體架構的多芯粒張量處理器TensorCIM:1)TensorCIM采用多芯粒系統對算力和存儲容量進行擴展,在降低制造成本的同時,為不同規模的Beyond-NN場景提供可擴展的系統解決方案。2)TensorCIM通過數字存算一體架構大幅減少數據搬運,并支持高精度的浮點計算以保證準確度。3)TensorCIM將可重構技術與數字存算一體相結合,實現稀疏張量聚集和稀疏神經網絡計算兩種模式的動態切換,保持極高的計算資源利用率。TensorCIM芯片使用TSMC 28nm工藝成功流片,在圖神經網絡、推薦系統等典型Beyond-NN應用上驗證,取得3.7nJ/Gather的稀疏張量聚集效率和8.3TFLOPS/W的稀疏FP32張量代數能效,相比同期浮點存算一體AI芯片能效提升5.6倍。
該工作以“TensorCIM: A 28nm 3.7nJ/Gather and 8.3TFLOPS/W FP32 Digital-CIM Tensor Processor for MCM-CIM-Based Beyond-NN Acceleration”為題發表在ISSCC2023。集成電路學院畢業生涂鋒斌博士為論文第一作者,尹首一教授為論文通訊作者。