3月9日消息,從超算互聯網官微獲悉,本周,超算互聯網平臺上線阿里巴巴開源推理模型QwQ-32B API接口服務,現在用戶可獲得免費的100萬Tokens。
據了解,基于國產深算智能加速卡以及全國一體化算力網,平臺支持海量用戶便捷調用QwQ-32B、DeepSeek-R1等國產開源大模型的接口服務。
超算互聯網QwQ-32B API接口服務頁面
超算互聯網QwQ-32B模型鏡像創建頁面
超算互聯網AI社區QwQ-32B模型快速開發頁面
用戶無需下載本地,只需一鍵啟動Notebook功能,即可在平臺快速開發QwQ-32B模型,或引入專有數據進一步私有化部署。
QwQ-32B是阿里Qwen團隊最新發布的推理模型,基于Qwen2.5-32B+強化學習構建。
據官方公示的基準評測結果,在測試數學能力的 AIME24 評測集上,以及評估代碼能力的LiveCodeBench中,QwQ-32B表現與DeepSeek-R1相當,遠勝于o1-mini 及相同尺寸的R1蒸餾模型。
QwQ-32B API調用服務具體步驟如下:
1、用戶在超算互聯網商城首頁中搜索QwQ-32B,點擊“QwQ-32B 接口服務”商品,購買完成后,點擊“去使用”。
2、進入API接口信息頁面:點擊“去使用”后會進入API接口信息頁面。
3、按需選擇訪問形式,有三種訪問形式可選:使用Postman、Apifox等http工具訪問;使用python代碼訪問;以及在終端頁面直接訪問。
目前,超算互聯網除提供QwQ-32B模型API接口服務外,近期還上線有DeepSeek-R1全家桶、最高671B滿血版的API部署與AI Web應用服務。
3月6日,阿里巴巴通義千問最新開源模型QwQ-32B正式發布,擁有比DeepSeek更小的尺寸,性能卻可比肩全球最強開源推理模型。
據了解,通過大規模強化學習,千問QwQ-32B在數學、代碼及通用能力上實現質的飛躍,整體性能比肩DeepSeek-R1。
而且在保持強勁性能的同時,千問QwQ-32B還大幅降低了部署使用成本,在消費級顯卡上也能實現本地部署。
目前,阿里已采用寬松的Apache2.0協議,將千問QwQ-32B模型向全球開源,所有人都可免費下載及商用。