亚洲精品国产情侣av在线_91亚洲国产成人久久精品网站_亚洲AV无码专区电影在线观看_亚洲AV无码专区亚洲AV桃

首頁 > 互聯網 > > 正文

不只是統計機器!MIT研究人員重磅論文引圍觀:大型語言模型是“世界模型”,甚至有獨立的“時間和空間神經元”

2023-10-07 07:46:27    來源:每日經濟新聞

近年來,大型語言模型(下稱LLMs)的能力不斷提高,引發了各界關于它們是否只是學習了表面的統計規律,還是形成了包含數據生成過程的內在模型(即世界模型)的爭論。近日,來自麻省理工(下稱MIT)的研究人員公布了他們的研究,就此給出了答案。

MIT研究人員Wes Gurnee和Max Tegmark于10月3日提交在預印本arXiv上的論文稱,他們通過分析三個空間數據集(世界、美國、紐約市的地點)和三個時間數據集(歷史人物、藝術作品、新聞標題)在Llama-2系列模型中的學習表征,發現了世界模型的證據。


(資料圖片)

研究人員發現,LLMs學習了空間和時間的線性表征,并且這些表征在不同的尺度和實體類型(如城市和地標)之間是統一的。此外,作者還識別出了單個的“空間神經元”和“時間神經元”,它們可靠地編碼了空間和時間坐標。論文稱,現代LLMs獲取了關于空間和時間這些基本維度的結構化知識,證明LLMs學習的不僅僅是表面統計規律,而是真正的世界模型。

LLMs中存在“時間和空間神經元”

在空間和時間數據集層面,研究人員在實驗中構建了六個數據集,包含有對應空間或時間坐標的地點或事件的名稱,分別涵蓋了不同的空間或時間尺度,包括全球范圍內的地點、美國國內的地點,以及紐約市范圍內的地點;過去3000年內去世的歷史人物;1950年以來發布的歌曲、電影和書籍;以及2010年至2020年發布的新聞標題。

圖片來源:arXiv網站論文

對于每個數據集,研究人員納入了多種類型的實體,例如城市等人口密集場所和湖泊等自然地標,以研究不同對象類型的統一表征情況。此外,研究人員還維護并豐富了相關的元數據,以便通過更詳細的分類分析數據。

研究人員使用標準的探測技術,即在LLMs的內部激活上擬合一個簡單的模型來預測與輸入數據相關聯的目標標簽。具體來說,給定一個激活數據集A和一個目標Y,包含時間或二維經緯度坐標,作者擬合線性回歸探測器得到一個線性預測器。在未提示過的數據上強大的預測性表明,LLMs中有可被線性解碼出來的空間和時間信息。

作者首先探測了Llama-2-{7B, 13B, 70B}每一層對每個空間和時間數據集的預測性能。結果顯示,在所有數據集上,空間和時間特征都可以被線性探測器恢復,而且這些表達隨著模型規模增大而變得更準確,并且在達到穩定狀態之前,模型前半層的表達質量會平穩提高。例如,他們發現,Llama-2-70B竟然能夠描繪出真實世界的文字地圖。

總結來說,MIT研究人員的研究顯示:LLMs不僅僅是隨機的模型——Llama-2已經是包含世界的詳細模型,甚至包含獨立的“時間神經元”和“空間神經元”!

論文作者之一、MIT研究大模型優化的博士生Wes Gurnee的論文一經arXiv和推特(現X)發布,便引發廣泛關注。其推文概述了論文的內容,截至發稿,已經有近300萬次閱讀。

LLMs學習的空間和時間線性表征在不同實體類型間是統一的

此外,作者還研究了Llama-2的這些空間或時間表征是否對提示詞敏感,即是否可以通過上下文來引發或抑制這些事實回憶。直覺上,對于任何實體詞,自回歸模型都有動機產生一個適合應對任何未來可能的上下文或問題的表達。

為了研究這一點,研究人員創建了新的激活數據集,其中在每個實體詞前加上不同的提示。在所有情況下,作者都包括了一個“空”提示,只包含實體詞(和一個序列開始符號)。然后,作者包括了一個詢問模型回憶相關事實的提示,例如“的經緯度是多少”或“的發布于何時”。對于美國和紐約市數據集,作者還包括了詢問這個地點在美國或紐約市哪里的提示,試圖消除一些地點名稱的歧義(例如City Hall)。

作為基準的模型,作者囊括了10個隨機提示詞作為提示。為了確定是否可以模糊主題,對于一些數據集,作者將所有實體名稱全部大寫。最后,對于標題數據集,作者嘗試在最后一個詞和在標題后面加上句號兩種情況下進行測試。研究人員發現,顯式地提示模型信息,或者給出消除歧義的提示,對Llama-2的輸出結果幾乎沒有影響。然而,作者驚訝地發現隨機干擾詞和將實體大寫會降低其輸出內容的質量。唯一明顯改善性能的修改是在標題后面加上句號進行探測,這表明句號被用來包含句子結束。

圖片來源:arXiv

Wes Gurnee和Max Tegmark在論文的“討論”章節指出,他們提供的證據表明,LLMs學習的空間和時間線性表征在不同實體類型之間是統一的,并且對提示詞具有相當敏感的反應,而且存在對這些特征高度敏感的單個神經元。由此推論,在模型和數據量足夠大的情況下,LLMs僅靠下一個標記的預測就足以學習世界的文字地圖。

“我們的分析為今后的工作提出了許多有趣的問題。雖然我們表明可以線性地重建樣本在空間或時間中的絕對位置,而且一些神經元使用了這些探測方向,但空間和時間表征的真正范圍和結構仍不清楚。特別是,我們推測這種結構的最典型形式是離散化的分層網狀結構,其中任何樣本都被表示為其最近基點的線性組合。此外,LLMs可以也確實在使用這種坐標系,以線性探針(linear probe)的方式使用正確的基點方向線性組合來表示絕對位置。我們預計,隨著LLMs規模的擴大,這一坐標系將通過更多的基點、更多的粒度以及更精確的實體到模型坐標的映射而得到增強。”研究人員寫道。

Wes Gurnee和Max Tegmark的論文標題 圖片來源:arXiv

作者還指出,在他們的分析以及更廣泛的研究中,另一個干擾因素是他們的數據集中存在許多模型本身并不知道的“實體”,從而“污染”了他們的激活數據集。

“我們對這些了解空間和時間維度的世界模型是如何學習或使用的理解也僅僅觸及了其表面。在初步的實驗中,我們發現我們的模型在不依賴多步推理的情況下難以回答基本的時空關系問題,這使得因果干預分析變得復雜,但我們認為這是理解何時以及如何使用這些特征的關鍵步驟。”論文作者補充道。

封面圖片來源:視覺中國(000681)-VCG111421248465

(責任編輯:劉暢 )

關鍵詞:

上一篇:5.5G要來了!已有上市公司布局,VC/PE看好這些投資機會
下一篇:最后一頁

熱點話題

熱點推薦

頭條

? 亚洲精品国产情侣av在线_91亚洲国产成人久久精品网站_亚洲AV无码专区电影在线观看_亚洲AV无码专区亚洲AV桃

              久久免费美女视频| 麻豆精品一区二区三区| 国产一区二区福利视频| 欧美国产国产综合| 在线影院国内精品| 久久精品亚洲国产奇米99| 亚洲国产综合在线| 成人丝袜18视频在线观看| 亚洲精品国产一区二区精华液| 欧美久久高跟鞋激| 亚洲视频在线观看三级| 韩国v欧美v亚洲v日本v| 国产精品每日更新| 欧美男女性生活在线直播观看| 中文字幕不卡三区| 黄色精品一二区| 亚洲少妇屁股交4| 精品日韩一区二区三区免费视频| 亚洲中国最大av网站| 成人高清在线视频| 亚洲观看高清完整版在线观看| 久久综合狠狠综合久久综合88 | 在线影院国内精品| 1024亚洲合集| 粉嫩在线一区二区三区视频| 亚洲资源在线观看| 国产亚洲欧美日韩日本| 久久精品久久久精品美女| 欧美国产精品一区| 欧美日韩高清不卡| 自拍偷拍亚洲激情| 日韩高清一区二区| 久久精品免视看| 91成人网在线| 综合色天天鬼久久鬼色| 狠狠色丁香婷婷综合久久片| 国产欧美一区二区精品久导航 | 午夜精品一区在线观看| youjizz国产精品| 一本久道久久综合中文字幕| 久久精品一区四区| 黑人巨大精品欧美黑白配亚洲| 综合色中文字幕| 欧美成人一区二区三区片免费| 五月激情综合色| 国产午夜精品一区二区| 欧美三级在线看| 亚洲自拍与偷拍| 久久免费视频色| 6080午夜不卡| 一区二区三区精品视频在线| 成人h精品动漫一区二区三区| 午夜av一区二区三区| 国产精品视频在线看| 国产精品中文字幕一区二区三区| 一区二区久久久久久| 国产亚洲精品aa午夜观看| 精品一区二区国语对白| 亚洲精品成人a在线观看| 久久你懂得1024| 国产经典欧美精品| 午夜久久久久久电影| **性色生活片久久毛片| av在线不卡观看免费观看| 欧美亚洲日本国产| 综合色天天鬼久久鬼色| 国产乱码精品一区二区三区忘忧草 | 成人午夜看片网址| 午夜精品福利一区二区三区av| 中文字幕亚洲一区二区va在线| 不卡视频在线观看| 欧美三级电影在线观看| 天天操天天干天天综合网| 国产精品国产自产拍高清av王其| 精品国产百合女同互慰| 亚洲国产精品一区二区www在线| 亚洲bt欧美bt精品777| 日本不卡123| 26uuu亚洲综合色欧美| 欧美日韩精品免费观看视频| 一区二区三国产精华液| 国产欧美精品一区二区色综合| 欧美一级欧美三级在线观看| 免费人成精品欧美精品| 亚洲一区二区三区四区不卡| 国产精品高清亚洲| 26uuu欧美| 日韩女优毛片在线| 国产一区二区久久| 欧美三级一区二区| 日本aⅴ精品一区二区三区| 中文字幕 久热精品 视频在线| 久久久99久久| 国产成人在线观看| 欧美性一级生活| 免费欧美高清视频| 婷婷国产v国产偷v亚洲高清| 亚洲制服丝袜av| 国产精品欧美经典| 中文天堂在线一区| 久久久久亚洲蜜桃| 国产拍欧美日韩视频二区| 91视频你懂的| 国产日韩三级在线| 成年人国产精品| 久久久www成人免费无遮挡大片| 97se亚洲国产综合自在线观| 精品国产污污免费网站入口 | 日韩欧美成人一区二区| 国精品**一区二区三区在线蜜桃| 色88888久久久久久影院按摩 | 久久综合久久99| 91麻豆国产福利在线观看| 精品国产三级电影在线观看| 成人性生交大片免费看中文网站| 欧美一激情一区二区三区| 国产精品乡下勾搭老头1| 欧美精品18+| 奇米一区二区三区av| 午夜视黄欧洲亚洲| 美女一区二区久久| 欧美日韩国产成人在线免费| 国产精品一区2区| 日韩欧美美女一区二区三区| 成人高清免费在线播放| 精品久久人人做人人爽| 91麻豆.com| 国产精品私房写真福利视频| 国产精品久线在线观看| 亚洲乱码中文字幕综合| 一二三区精品福利视频| 免费高清不卡av| 欧美性一二三区| 国产精品亚洲成人| 精品久久一二三区| 国产农村妇女毛片精品久久麻豆| 中文字幕在线观看一区二区| 亚洲欧美日韩久久| 日韩av电影天堂| 欧美理论在线播放| 99久久精品99国产精品 | 欧美日韩国产电影| 不卡视频在线观看| 国产精品乱人伦| 亚洲国产人成综合网站| 久久66热re国产| 欧美大胆人体bbbb| 国产精品免费网站在线观看| 亚洲一区二区三区自拍| 欧美在线视频全部完| 成人av电影在线| 国产精品成人在线观看| 亚洲最新在线观看| 爽好多水快深点欧美视频| 欧美视频中文字幕| 国产东北露脸精品视频| 欧美国产一区视频在线观看| 亚洲嫩草精品久久| 蜜臀av性久久久久av蜜臀妖精| 91精品中文字幕一区二区三区| 91免费视频观看| 夜夜嗨av一区二区三区中文字幕| 在线视频欧美精品| 91香蕉国产在线观看软件| 日韩一区在线看| 午夜av区久久| 91丨porny丨蝌蚪视频| 亚洲美女在线一区| 日本电影亚洲天堂一区| 成人av网站免费观看| 亚洲免费毛片网站| 欧美日韩国产免费一区二区| 久久日韩精品一区二区五区| 亚洲一区二区高清| 91精品国产入口| 91啪亚洲精品| 日韩理论片中文av| 91精品国产91久久久久久一区二区| 国产三级久久久| 日韩综合在线视频| 精品国产乱码久久久久久影片| 亚洲少妇30p| 高清不卡在线观看av| 亚洲男人的天堂网| 6080国产精品一区二区| 国产精品护士白丝一区av| 精品无人码麻豆乱码1区2区| 国产三区在线成人av| 色综合久久久久网| 91在线观看污| 久久精品国产亚洲a| 国产精品沙发午睡系列990531| 在线观看日韩av先锋影音电影院| 久久欧美中文字幕| 美国一区二区三区在线播放| 国产欧美一区在线| 欧美午夜精品电影| 国产精品久久久久一区| 视频一区欧美精品| 国产精品久久久久影院色老大|