據文心一言發布已過去50余天,5月9日,百度工程師首次現場演示了“文心千帆”如何可視化微調大模型。
百度智能云方面表示,正在內測的“文心千帆大模型平臺”,是全球首個一站式的企業級大模型生產平臺,不但提供包括文心一言在內的大模型服務及第三方大模型服務,還提供大模型開發和應用的整套工具鏈。
3月16日,文心一言在萬眾矚目中面世,而由于其演示的Demo為錄屏,不少網友大呼“失望”,就連李彥宏也多次提及,這類大語言模型還遠未到發展完善的階段,進步空間很大。
【資料圖】
近兩個月的時間過去了,經過多次迭代升級和首批企業內測后,百度的底氣似乎足了一些。
300余家生態伙伴參與內測,大模型推理成本降為十分之一
3月16日開始,百度智能云大模型平臺便啟動了首批企業內測,面向企業客戶開放了文心一言API接口調用服務。并于3月27日,推出面向客戶的“文心千帆”大模型平臺。
據了解,文心千帆大模型平臺具有生成合同、邀請函、數字人文案、直播文案、訂機票、改行程等多種能力。例如在用戶輸入五一想從北京出發去云南玩五天等關鍵信息后,文心千帆除了提供行程攻略信息外,還會自動關聯相關的門票和機票信息,對行程細節不滿意時,也可以提出更改。
在收費模式上,文心千帆的推理服務調用以0.012元/1000 tokens收費,按調用輸入輸出總字數付費。百度集團副總裁袁佛玉透露:“截止目前,已有超過300家生態伙伴參與文心一言內測,在400多個企業內部場景取得測試成效。”
目前,文心千帆大模型平臺提供公有云服務、私有化部署兩大交付模式。
在公有云服務方面,將提供推理(直接調用大模型的推理能力)、微調(通過高質量精標業務數據,高效訓練出特定行業的大模型)、托管(將模型發布在百度智能云,以實現更加穩定高效的運行)三種服務,大幅降低企業部署大模型的門檻。
在私有化部署方面,文心千帆大模型平臺支持軟件授權(提供在企業環境中運行的大模型服務)、軟硬一體(提供整套大模型服務及對應的硬件基礎設施),租賃服務(提供機器和平臺的租賃滿足客戶低頻需求)三種方式。私有化部屬能夠滿足對數據監管有嚴格要求的企業客戶需求。
4月25日,在文心一言開啟內測一個月之際,百度智能云曾表示,其已完成4次技術版本升級,相較最初版本推理效率提升了10倍,模型算力利用率提升了1倍,大模型推理成本隨之降為原來的十分之一。
互聯網產業時評人張書樂向記者指出,文心一言依托百度的龐大搜索數據和算法優勢,其學習資料極為豐富,關鍵在于其學習方法(算法)上的迭代完善,能否支撐其從一個尋章摘句的“書蟲”變為有獨立思考能力的“優等生”。目前,文心一言的完善程度應該在國產大模型中是比較高的,而且依托“中文”這個護城河,較之國外大模型有更多地緣優勢。
被質疑、被回懟,文心一言需要“螃蟹”的覺悟
雖然過去近兩個月時間,但關于文心一言的討論一直不斷。
3月底,文心一言推出不到兩周,便迎來了質疑聲。有微博博主發文質疑其文生圖功能抄襲“StableDiffusion”,同時在中文語義理解方面存在局限。彼時,百度方面回應稱,文心一言完全是百度自研的大語言模型,文生圖能力來自文心跨模態大模型ERNIE-ViLG。
隨后,在接受36氪采訪中,李彥宏表示,“早在文心一言發布之前,大家用文心一格(指代百度基于文心大模型的文生圖系統)就能體驗文生圖這個能力。”
此外,李彥宏指出,“百度的文心一言和OpenAI差距可能在兩個月左右”。這番言論卻讓王小川不以為然。
他直言,這肯定是平行宇宙里的李彥宏說的,不是我們這個世界里的。并指出,文心一言不可能和OpenAI差距只有兩個月,如果真是如此,那肯定是另一個宇宙。他認為國內目前的大模型和GPT的差距不可能是2個月是三年。但這是很動態的,大家很努力就有可能快一些。
5月4日,李彥宏在內部活動中回應了此番爭議,他表示,“說實話這有點斷章取義,我后面緊接著還說,這不是重點,重點是這兩個月的差距我們要用多長時間才能趕上,也許很快,也許永遠也趕不上。”
同時,他認為,算力不能保證我們能夠在通用人工智能技術上領先,算力是可以買來的,創新的能力是買不來的,是需要自建的。據悉,目前全球算力規模美國占34%,中國占33%,算力差不多。
在今天的演示會上,百度智能云云計算產品解決方案和運營部總經理宋飛表示,“大家可能會覺得堆積算力、寫好代碼、然后進行模型訓練,把它跑起來就行了。實際上在訓練過程中會遇到各種各樣的挑戰,很少有人能夠使得一個大模型訓練過程能夠在連續一兩天內不出問題。百度AI大底座可以為大模型提供高效、穩定的訓練和有效的收斂。千卡加速比達到90%,資源利用率70%,開發效率提升100%。這是AI大底座為大模型的開發和應用帶來的價值。”
從目前的實踐來看,以文心一言為代表的大模型主要應用于B端,在張書樂看來,這主要是因為C端延伸存在難度。
他指出,一是個體用戶需求太過龐雜、無序,難以有效滿足不同層次用戶使用需求;二是個體用戶主流需求過于淺顯。大多數C端體驗僅僅是嘗鮮,缺乏深度應用能力。就如辦公軟件在C端大多停留在文字處理一般,而少有人涉及深層使用,這讓GPT的應用場景既雜且淺,缺乏戰略縱深;三是可實現的多模態對于C端大多數用戶而言較為雞肋,加上目前的生成能力依然是“小升初”階段,無法真正意義上滿足C端用戶所謂“一鍵式傻瓜操作”。
至于能否追上ChatGPT,百度需要培養AI原生應用的思維方式和理念,也需要有做“敢于吃螃蟹的人”的覺悟,爭議和期待會在一段時間內共存。
正如李彥宏所言,“改變思維方式會是痛苦的,會經歷各種挫折和煎熬,需要用毅力去克服這種慣性,用發現和探索的眼光來看待這個新的世界。”
(責任編輯:王治強 HF013)關鍵詞: