2月9日消息,飛騰官方宣布,飛騰騰云S5000C、飛騰騰銳D3000處理器已成功實現對DeepSeek全系列大模型的端到端支持,覆蓋數據中心和終端場景,而且性能非常出色。
其實在2024年,DeepSeek-V2.5 236B大模型就已經在飛騰騰云S5000C平臺成功穩定運行。
DeepSeek-V3、R1版本發布后,飛騰第一時間在騰云S5000C、騰銳D3000平臺上本地部署驗證,形成整體解決方案,構建端到端的國產平臺DeepSeek大模型智算環境。
在數據中心側,騰云S5000C服務器可以與多款AI加速卡配合,實現DeepSeek蒸餾版和全量版的部署。
根據官方實測,飛騰騰云S5000C搭配8塊國產的AI加速卡,蒸餾版DeepSeek-R1-Distill-Llama-70B版本的推理速度可達到每秒22個tokens,本地部署的推理效率與國外同類產品架構解決方案相當,整體性能相當于國外平臺性能的80%左右。
同時,完整版DeepSeek R1 671B模型采用分布式推理框架,基于四機、32卡AI服務器集群,也已部署成功。
在用戶終端側,基于騰銳D3000、銀河麒麟V10系統的臺式機,可以本地部署DeepSeek-R1 7B蒸餾版模型,再搭配1張國產推理卡,就實現了AI PC能力,能夠建立安全可靠的本地知識助手。
現階段,飛騰平臺已實現端到端支持DeepSeek全系列、眾多開源和國產頭部大模型的本地化部署,可為企業級和個人應用提供全國產化、軟硬一體、性價比高、安全、開放的全棧解決方案。
本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。