近日,由 GAIR 研究院、雷峰網、世界科技出版社、科特勒咨詢集團聯合主辦的第七屆 GAIR 全球人工智能與機器人大會,在新加坡烏節大酒店拉開帷幕。
此次大會是在大模型技術爆炸時代,國內首個出海的 AI 頂級論壇,也是中國人工智能影響力的一次跨境溢出。本屆大會共開設 10 個主題論壇,聚焦大模型時代下的 AIGC、Infra、生命科學、教育、SaaS、web3.0、跨境電商等熱門領域的變革創新。
(資料圖片)
其中,“大模型時代超級基建”的主題引發業內的激烈討論。過去數年間,AI 領域應用落地曾一度乏善可陳。但在剛剛過去的幾個月,ChatGPT 引爆了大模型的浪潮。盡管如此,當前的大語言模型的訓練然面臨諸多挑戰?!按竽P蜁r代的超級基建”旨在與行業頭部公司共同探討 AI 底層基礎設施相關話題。Zilliz 創始人兼 CEO 星爵在“大模型時代超級基建”環節進行了主題演講,并參與圓桌論壇的討論。
星爵指出,過去十年,受限于研發成本和開發難度,全球僅有 1% 的開發者專注于 AI 領域的研發工作。但如今,有了大模型和向量數據庫作為能力基座,一個 AI 應用的開發僅僅需要兩三個工程師一個周末的時間便可完成。正可謂“忽如一夜春風來,千樹萬樹梨花開?!?/p>
此外,星爵還強調了向量數據庫之于大模型的重要性。他認為,向量數據庫承擔著大模型數據片外存儲的重任,不管是圖片、視頻語言還是生物學中蛋白質的三維結構,都可以用向量的方式表征它的語義。
針對數據實時性和私域專有數據的問題,星爵表示,學術界和工業界存在兩種解決方案,一是通過Fine tuning的方式迭代演進,讓大模型學到更多知識;二是通過 Vector search方法,把最新的或私域知識存到向量數據庫中,需要時再在向量數據庫中做基于語義的向量檢索。上述兩種方法都能為大模型提供更加精準的答案。
不過,星爵也坦言,從成本角度出發,向量數據庫的成本是 Fine tuning的1/ 1000。所以大模型廠商都無一例外地推薦開發者使用向量檢索的方式做知識庫管理,以便和模型有一個更好交互,降低落地使用成本的同時,提升在業務中的實際效果。
在演講過后的圓桌論壇環節,星爵與云啟資本合伙人陳昱、潞晨科技創始人尤洋、UCloud 季昕華共同討論了當下備受關注的熱門話題,包括大模型基礎設施建設面臨的挑戰、如何降低大模型訓練成本等。
在被問及大模型基礎設施建設面臨的挑戰時,星爵強調了數據方面的問題。他表示,世界上有 80% 以上的數據都是非結構化的數據。過去十多年,非結構化數據的管理能力主要由谷歌、微軟等大公司掌握。星爵表示,新 AI 時代對數據管理的要求也會變得更大,如何更好地做好數據基建,對各行業各公司而言都是不小的挑戰。
針對業內非常關心的成本問題,星爵表示,就降低成本而言,從向量數據庫角度來看,主要包括三方面:第一,要有更好的算法;第二,要更聰明地利用個體存儲;第三,要比以往有更強的有效利用硬件的能力。
(免責聲明:此文內容為廣告,相關素材由廣告主提供,廣告主對本廣告內容的真實性負責。本網發布目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責,請自行核實相關內容。廣告內容僅供讀者參考。)
(責任編輯:周文凱 )關鍵詞: