隨著人工智能聊天機器人ChatGPT引發的熱議持續升溫,科技圈正迎來一輪新熱潮,不少用戶被ChatGPT足以“以假亂真”的擬人回答深深震撼,還有用戶使用過微軟基于ChatGPT支持的最新版本人工智能搜索引擎后驚呼“時代變了”。
在中文人工智能領域,百度、360、科大訊飛等人工智能公司紛紛發力,關于“中國版ChatGPT”最終將花落誰家也不斷引起業內熱議。
事實上,ChatGPT之所以能夠取得令人稱奇的能力,核心在于其基于GPT-3.5架構一路發展而來,具備強大認知智能的預訓練模型,海量學習數據以及背靠微軟的強大算力。從這些維度來看,誰將最先打造出“中國版ChatGPT”呢?
━━━━━
ChatGPT表現出色
考驗國內企業認知智能領域技術積累
ChatGPT屬于認知智能領域的應用,從目前普遍的對話感受來看,ChatGPT的最大亮點就在于其意圖識別與語言理解能力甚至能夠達到“以假亂真”的水準,回答滴水不漏。要做到這一點,強大的NLP(自然語言處理)技術是關鍵。
有觀點認為,ChatGPT的核心技術是人工智能語言大模型,其關鍵是如何讓人工智能模型具備邏輯推理能力,以及如何讓人工智能學習全互聯網的知識。這些ChatGPT基本都做到了,因此在決策和知識環節有了很大的突破。
據了解,目前國內有不少公司正在布局這一領域。2月7日,百度宣布將推出類ChatGPT的技術,并確定項目名為“文心一言”。三六零同日也在投資者互動平臺上表示計劃盡快推出類ChatGPT技術的原型版產品。
具體來看,對于決策和知識環節,常識推理是重要一環。對于常識問答系統來說,首先要能從千萬量級的海量的知識庫中準確檢索到相關的知識,同時模型要能正確地將兩條知識進行結合,建立兩條常識之間的關系,才能與問題相匹配,最終得到正確選項。
2月8日,科大訊飛在投資者互動平臺回應稱,已面向認知智能領域陸續開源了6大類、超過40個通用領域的系列中文預訓練語言模型,在Github平臺的中文預訓練模型的星標數達13346,位列第一,是第二名的2倍,“公司已經在當前核心技術、產業場景、行業數據等深厚積累的基礎上,于2022年12月份進一步啟動生成式預訓練大模型任務攻關,科大訊飛AI學習機將成為該項技術率先落地的產品,將于2023年5月6日進行產品級發布。”截至目前,這是唯一給出確切上市時間,并率先實現商業化的中國企業。
在該領域,科大訊飛主導承建了科技部首批20家標桿全國重點實驗室之一的認知智能全國重點實驗室,多年來始終保持關鍵核心技術處于世界前沿水平。去年科大訊飛曾獲得包括OpenBookQA、常識推理挑戰賽QASC等在內的總共獲得了12項認知智能領域權威評測的第一。
━━━━━
如何“再打造”ChatGPT?
數據與算力是門檻
事實上,早在2022年12月,首個開源的類ChatGPT項目就已經在GitHub上發布,該項目基于谷歌語言大模型PaLM架構,使用了同ChatGPT一模一樣的從人類反饋中強化學習的方法,但卻出現了無人能夠運行的窘境。
這是因為,人工智能模型要想達到ChatGPT的級別,不僅要看算法,還需要足夠大的規模、海量的訓練數據以及支撐運行的算力。
中國電信首席專家、美國貝爾實驗室院士畢奇在接受媒體采訪時表示,ChatGPT所使用的技術研發需要投入大規模資金,它基于一個巨大的語料庫,千億參數的模型,還需要計算快且便宜的芯片等。
IDEA研究院(粵港澳大灣區數字經濟研究院)認知計算與自然語言研究中心講席科學家張家興公開表示,與以往的人工神經網絡相比,預訓練大模型最大的不同在于它規模足夠大,深度學習網絡的層數多、連接多、參數多。
據了解,2012年前后的深度學習網絡只有幾百萬參數;2018年前后主流的預訓練模型達到1億參數;目前被證明非常有效的大規模預訓練模型已有幾千億參數,短短幾年時間提升了幾千倍。在對預訓練模型各種不同的技術評測中,算法性能展示了一個規律:數據規模越大、預訓練模型參數越多,算法輸出精度往往也越高,而在這背后,所要求的算力也更加恐怖。
ChatGPT由OpenAI研發,該公司背靠微軟,可用算力包括28.5萬個CPU核心、1萬個英偉達V100 GPU。公開資料顯示,ChatGPT的前身GPT-3參數量達到了驚人的1750億,訓練一次所要消耗的成本就高達近8400萬元人民幣。由此看來,訓練ChatGPT所需要的數據量、算力只會更多。
目前,國內市場中百度、科大訊飛等常年深耕人工智能的企業各自均有各自的算力積累,如科大訊飛曾于去年12月在投資者互動平臺上表示,其于2009年就開始算力基礎設施建設,目前已建成4城7中心深度學習計算平臺,訊飛的算力不僅完全滿足AI算法模型訓練,及面向開放平臺數百萬開發者和其他行業伙伴提供相關AI服務的需求。
━━━━━
產品發布看什么?
行業應用是關鍵
當“硬件”足夠,ChatGPT能夠運轉起來的重要因素還有一個:讓其能夠不斷迭代、訓練的海量數據。記者在體驗多個國外人工智能語義模型時發現,對方往往提供免費的對話服務,但需要用戶予以反饋,通過此種方式對模型進行再訓練,事實上,這天然符合行業應用的場景。
三六零董秘在近期的電話會議中表示,ChatGPT走出了通用范式(AI)的從0到1,這會對搜索引擎的底層邏輯造成重大影響,所以大家看到現在首先發力或者主要發力于ChatGPT產品的是谷歌等搜索引擎巨頭,“在此之前,大家對于能用通用AI來做專業的事情心里是沒有根的,大家更多做垂直領域或者更專業的AI,用更專業的數據模型去訓練人工智能,去做一些專業領域的事情。”
在行業應用方面,他認為360使用安全AI查找、掃描漏洞效果非常好,科大訊飛從很早開始就做AI訓練模型,在專有領域做到了相當的水平,在醫療領域、教育領域有很好的市場地位。
事實上,深耕某一行業多年的公司具備更多數據積累優勢。公開資料顯示,目前科大訊飛智慧教育產品已在全國32個省級行政單位50000多所學校中應用,服務超1.3億師生;在AI學習機市場,去年營收增長53%,一直是份額最高的學習機產品;智醫助理產品覆蓋了全國380個區縣,5.3億次AI輔助診療。
記者梳理資料發現,近期科大訊飛、云從科技等A股相關人工智能類公司的投資者交流活動吸引了多家投研機構的關注,是否會布局類ChatGPT產品是主要問題之一。早在2月7日,科大訊飛就在深交所互動易上回答關于“搶灘ChatGPT語言模型”的問題時表示,已于2022年12月份進一步啟動生成式預訓練大模型任務攻關,科大訊飛AI學習機將成為該項技術率先落地的產品,于2023年5月6日進行產品級發布。該技術突破將在AI學習機的中英文作文輔導、中英文口語學習等方面帶來顯著提升。科大訊飛在2023年會持續升級該系列技術,并陸續應用于公司在教育、醫療、汽車、消費者等多個行業賽道的既有產品,持續提升核心技術效果和產品體驗。可見,從算力算法積累到搶先布局產品落地,科大訊飛在這場中國版的ChatGPT角逐中已優先一步。
睿億投資研究總監熊林認為,包括ChatGPT在內的人工智能產業,由于具有替代人工的潛能,可以有效地幫助企業降本增效,因而長期想象空間很大,但短期產品迭代及生態建立仍需時間,盈利兌現也需要時間,因此應提防過度炒作帶來的風險。
事實上,在基礎算力、人工智能模型、數據量等維度,國內的人工智能公司均有各自的優勢,在ChatGPT大獲成功的鼓勵下,中國版ChatGPT的到來似乎已并不遙遠。有業界觀點稱,從大數據資源看,中國擁有全世界最大規模的網民數量,有豐富的應用場景,在數據積累方面優勢明顯。雖然目前全球還沒有能跟ChatGPT驚艷表現相抗衡的大模型,但是業界共識是差距在兩年左右,兩年的差距并非鴻溝,有趕超可能。屬于AIGC的時代已然來臨,那些對AIGC探索的企業也將接踵而至。