首頁 > 互聯網 > > 正文

              文心4.0推理成本或暴增10倍,大模型如何走遠

              2023-10-13 09:56:55    來源:和訊

              從競爭打響,再到決出勝負,最快需要多長時間?


              【資料圖】

              在科技圈,大模型如論第二,則很少有行業敢稱第一。2023年,業界刮起一股“百模大戰”風潮,百余個大模型面世,期待贏得下一個人工智能時代的入場券。但時間僅過半年有余,這場萬眾矚目的角逐便走至了“決賽圈”。

              目前,行業中的大模型用戶體驗已逐漸出現“分水嶺”。背后的推手,無疑是科技巨頭們正在投入巨資,強化自家產品的基礎模型能力。

              近期有媒體報道稱,百度正在加緊訓練文心大模型4.0,或將在10月17日百度世界大會上發布。據透露,目前這款基礎模型已在理解、生成、邏輯和記憶四大方面有巨大突破,在邏輯推理、代碼、數學等方面的進步水平明顯。另一組引人注意的信息是,文心大模型4.0的推理成本相比文心大模型3.5增加很多,有傳聞是8-10倍,也有說法是至少翻了10倍。

              如何理解大模型的推理成本?其訓練成本和推理成本的關系是什么?如果百度文心4.0推理成本真的至少翻了10倍,那么大模型的可持續發展之路在何方?這些問題無疑為這場科技競賽增添了更多看點。

              01

              推理成本激增

              什么是推理成本?通常意義上,它指的是大語言模型訓練完成后在線為用戶提供生成內容服務時產生的成本,模型的每一次“思考”和“輸出”都會產生資源消耗。

              推理成本由質量和數量兩部分構成。一方面,在質量側,需要優秀的算法和技術實力儲備作為支撐,其背后往往意味著專業的算法工程師和數據科學家團隊的支持;而在數量側,“暴力計算”所依賴的計算資源也是重要因素。

              GPU“堆料”能不能解決所有問題?

              應該說,在過去的一段時間是可以這樣認為的。不過,目前隨著模型網絡結構的復雜化、參數規模的巨量化,線性的基礎設施投入所取得的邊際收益正在降低。

              對于技術研發能力不足的大模型廠商而言,由于AI芯片價格的持續高企,“堆料”邏輯是死路一條,并必將被市場淘汰。而推理成本本身,也是因不同的開發商而異的。

              02

              “中文天才”已就位

              在市場中,有實力的企業通常愿意雇傭名牌大學的高等生。在大模型領域內,這個規律同樣適用。

              目前,行業里已出現多種為大模型生成內容付費的使用方式,不過根本上,遇到刁鉆或時效性問題時,大模型給出的結果仍然效果不甚理想。一方面,這是由于中文特有的復雜性決定;另一方面,也是用戶激增帶來的短期算力不足所導致。

              實際上,此前行業所提及的“訓練成本”和“推理成本”并不能等同。

              一般而言,訓練GPT-3等級的大模型的成本約為140萬美元,這也是幾個月前人們對大模型成本測算的核心依據,但GPT-3迭代到3.5、GPT-4后,大模型的成本增長是非常驚人的。對于一些私有部署的模型而言,其模式是在已經訓練好的模型進行輸出,成本相對較低。但這種模式只能滿足特定需求,并不適用于開放市場。

              目前,考慮到在線推理場景,則更需要處理大規模數據,成本隨之被推高。

              根據海外最新研究《TheEconomicsofLargeLanguageModels》,可以有如下估計:每個token(1000token約等于750個單詞)的訓練成本通常約為6N(N為參數的計量單位),而推理成本約為2N,也就是說推理成本大約相當于訓練成本的三分之一。但隨著模型上線部署后使用量的增加,推理成本可能遠超訓練成本。

              在國外,大模型的付費是大勢所趨。其中以ChatGPT專業版為例,其版本所提供的用戶體驗與免費版差別很大。當然,這也有助于大模型向著健康正向、持續發展的角度進步。

              有媒體估算過,使用云計算服務(以AWS為例)調用ChatGPT的能力,每處理一個輸入長度為50字、輸出長度為1000字的問題,大約需要消耗0.00014611美元的云計算資源。即用1美元可以向ChatGPT提問約6843個問題。

              據推測,文心4.0的推理成本將比3.5版本上升10倍。不過,其帶來的好處也是顯而易見的,那就是相當于為每個普通人都帶來了“高知高學”的AI助手。

              03

              中文大模型逐漸彎道超車

              應該說,2023年是屬于“遙遙領先”的一年。在眾多網友的觀感中,這個詞匯除弘揚國產技術實力外,也有一些趣味因素在其中。

              中文大模型是否能夠“遙遙領先”?這是十分令人期待的。

              嚴肅些說,中國需要自己的中文大模型。可以看到,中文大模型的崛起已在日程之上。在OpenAI的GPT系列活躍量連續下滑之際,諸如百度文心一言等產品的增長卻與日俱增。應該說,從落后再到領跑,在過去的幾個月間,中文大模型打出了一場漂亮的逆襲戰。

              中文大模型的優勢是,它在語義理解上更加準確,在文化背景差異上也幾乎沒有代溝。如果當我們把視角放在科技創新、產業升級等大背景下,中文大模型所承載的知識量或將再次刷新人們的認知。

              應該看到,中文大模型也是“國貨”的一種,它不僅是高新技術領域的突破,也可被看成一種對外名片和集體記憶。

              一個好消息是,目前據已知的訊息,百度文心大模型4.0已進入小流量測試階段,其參數量大于所有已經公開的LLM(大語言模型)。

              值得注意的是,該款產品是國內首次使用萬卡規模AI集群訓練的大語言模型。借助百度飛槳的深度融合,它將大幅超越前作。作為國內對標“GPT-4"的產品,它的問世將是令人激動的。

              有媒體爆料,百度文心大模型4.0正在加緊訓練,已經接近可發布狀態。

              言而總之,對于國內眾多廠商而言,如今的大模型已至競爭的下半場,“百模大戰”或更快落幕。不過對于普通人而言,產品的品牌廠商并不重要,能享受到體驗上乘的產品才是第一選擇。

              (責任編輯:徐帥 )

              【免責聲明】本文僅代表第三方觀點,不代表和訊網立場。投資者據此操作,風險請自擔。

              關鍵詞:

              上一篇:諾和諾德稱司美格魯肽腎病治療試驗提前終止,GLP-1概念股連連大漲 減肥藥成了“萬能藥”?
              下一篇:最后一頁

              熱點話題

              熱點推薦

              頭條

              ? 亚洲国产成人AV网站| 亚洲AV日韩AV天堂一区二区三区| 亚洲综合伊人久久大杳蕉| 亚洲Av无码乱码在线观看性色| 亚洲欧洲无码AV不卡在线| 国产91在线|亚洲| 亚洲资源最新版在线观看| 亚洲乱码无限2021芒果| 亚洲人成人77777网站不卡| 亚洲区视频在线观看| 亚洲人成人77777网站不卡| 亚洲jjzzjjzz在线观看| 亚洲AV无码久久久久网站蜜桃| 亚洲国产成人在线视频| 亚洲一级毛片免观看| 亚洲国产精品午夜电影| 亚洲91精品麻豆国产系列在线| 亚洲天堂2016| 亚洲日韩av无码中文| 亚洲av永久无码| 国产成人综合久久精品亚洲| 国产亚洲精品美女久久久久久下载| 无码国产亚洲日韩国精品视频一区二区三区 | 亚洲综合无码AV一区二区| 在线亚洲午夜理论AV大片| 亚洲男同帅GAY片在线观看| 亚洲AV无码专区国产乱码电影 | 精品亚洲一区二区| 伊人久久综在合线亚洲2019| 亚洲成a人片在线观看中文app| 亚洲一区中文字幕在线观看| 亚洲日韩精品无码专区加勒比| 麻豆亚洲AV成人无码久久精品| 亚洲一区日韩高清中文字幕亚洲| 中文字幕在亚洲第一在线| 亚洲AV无码不卡在线播放| 亚洲色av性色在线观无码| 国产精品亚洲综合五月天| 国产精品亚洲lv粉色| 国产亚洲精品高清在线| 亚洲国产精品第一区二区|