近日,全球領先的IT市場研究和咨詢公司IDC發布《中國生成式AI應用開發平臺市場:企業統一AI開發平臺的雛形》報告。該報告不僅對市場上主流的大模型平臺廠商進行了對比分析,還為企業用戶選擇大模型平臺提供了關鍵的技術指標。在此次評估中,百度智能云獲得七項滿分,位于所有大模型平臺廠商第一名。亞馬遜云AWS、阿里云并列第二名。
IDC報告指出,大模型平臺給應用程序開發提供了一個新的路徑,企業在選擇大模型平臺的時候,應該重點關注廠商在模型層和數據層的能力。在模型層能力方面,如何讓模型更好的適配企業的應用場景至關重要。而在數據層能力方面,如何做好RAG(檢索增強生成),保證生成內容的準確性,消除幻覺最為關鍵。
而在這兩個方面,百度智能云都有深厚的技術積累。百度智能云千帆大模型平臺(以下簡稱千帆平臺)是大模型與AI應用開發及服務平臺,可以從模型開發、模型服務、應用開發三大維度,為企業提供全流程服務。目前,文心大模型日均調用量超過15億次,千帆平臺已經幫助客戶精調了3.3萬個模型、開發了77萬個企業應用。
模型精調助力大模型與產業深度融合
大模型具有強大的泛化能力,可以處理很多通識類問題,但在某些特定行業及領域的表現不如人意。這是因為不同行業有著獨特的專業知識、邏輯和數據特點,通識知識無法完全覆蓋這些特殊需求。模型精調是增強大模型在行業應用中表現的關鍵,通過將行業的專業知識和數據特征融入大模型,可以讓其更好地滿足行業特定需求,從而提升應用的準確性和可靠性。
行業內主流大模型服務商也正在通過大模型平臺提供模型精調服務,幫助企業快速打造AI應用。
AWS SageMaker集成了亞馬遜的高性能預訓練模型庫,這些預訓練模型在大規模的通用數據上進行了訓練,已經學習到了豐富的特征表示和知識,為模型精調提供了良好的基礎,同時,SageMaker 還提供了多種先進的機器學習算法,用戶可以根據精調任務的特點和需求,選擇合適的算法來進一步優化模型性能。
百度智能云千帆大模型平臺提供了完整的工具鏈,是業界首個上線DPO、KTO等模型訓練方法的平臺,提供了高質量通用語料數據和開箱即用的模型精調樣板間。無論是想要自己準備數據、做精調,還是想快速上手、復制行業最佳實踐,千帆平臺都可以高效支持。目前,在千帆平臺上,每天有超過一半的調用量是來自精調后的模型。
拿醫療行業舉例,杭州全診醫學基于千帆平臺和文心大模型打造了AI醫療助理應用,能夠在導診、預診、診間、入院、手術、隨訪等全階段服務醫生患者。以輔助醫生撰寫病歷為例,全診醫學通過使用20萬份精標病歷數據對大模型進行了精調,使AI醫療助理的醫學用語更準確、更規范,大幅提升病歷內容質量。病歷生成的準確度提升了45%,醫生的接診量提高了20%,造福更多病患。
RAG已成為企業解決大模型幻覺問題的有效手段
生成式 AI 已成為企業布局和投資的重點,企業希望借助大模型實現降本增效和產品創新。然而,通用大語言模型(LLM)在實際應用中往往存在幻覺問題或回答不準確的情況,尤其是在面向 B 端場景時,難以有效滿足企業的落地需求。為解決這一問題,企業通常采用 RAG(檢索增強生成)技術,將生成式 AI與企業內部數據庫、知識庫相結合,使生成內容更加準確、合理。在此過程中,向量數據庫憑借其在語義理解和高效檢索方面的獨特優勢,成為企業實現 RAG 的關鍵組成部分。
不久前,IDC發布了《RAG與向量數據庫市場前景預測》報告,對使用大模型的企業進行了深入調研。報告顯示,在生成式 AI 的開發過程中,41% 的高管認為構建 RAG 架構至關重要;此外,81% 的 IT 領導者認為,基于業務數據的生成式 AI 模型能夠為企業帶來顯著的競爭優勢。這表明,RAG 技術在提升通用大模型準確性方面效果顯著,且企業對其認可度正持續提高。隨著更多企業意識到 RAG 的重要性,它有望成為生成式 AI 落地的關鍵推動力。
在分析了RAG和向量數據庫市場的發展趨勢后,IDC還評估了市場上的主要廠商。在這一評估中,百度智能云的向量數據庫 VectorDB 在核心性能、功能全面性、大模型支持、戰略與生態合作、工程化落地五個關鍵領域保持領先,綜合排名并列第一。
目前,百度智能云 VectorDB 已經在超過 500 家客戶中實際落地使用,支持 HNSW、Puck、PQ 等常用算法,主流 LLM、RAG 框架,以及百度智能云千帆和開源 Embedding 模型,支持企業一站式部署落地。面向未來,百度智能云 VectorDB 將繼續在產品形態、內核功能、生態支持三個方面重點發力,為企業 AI 應用落地服務,提供最專業的向量數據庫服務。