近日,海光信息技術團隊成功完成DeepSeek V3和R1模型與海光DCU(深度計算單元)的適配,并正式上線!
用戶現可通過“光合開發者社區”中的“光源”板塊訪問并下載相關模型,或直接登錄[www.sourcefind.cn]搜索“DeepSeek”,即可基于DCU平臺快速部署和使用相關模型。
DeepSeek V3和R1模型采用了Multi-Head Latent Attention(MLA)、DeepSeekMoE、多令牌預測、FP8混合精度訓練等創新技術,顯著提升了模型的訓練效率和推理性能。
DCU是海光信息推出的高性能GPGPU架構AI加速卡,致力于為行業客戶提供自主可控的全精度通用AI加速計算解決方案。憑借卓越的算力性能和完備的軟件生態,DCU已在科教、金融、醫療、政務、智算中心等多個領域實現規模化應用。
海光DCU技術團隊表示,將持續推動大模型迭代適配與優化更新,攜手更多優秀大模型企業為行業客戶提供更高效、更經濟、更安全的AI解決方案。同時,團隊也將積極探索更多應用場景,推動AI技術在更多行業的落地與普及。
本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。