Hinton:我的直覺告訴我,,模型規(guī)模擴(kuò)大后,推理能力也能提升。
人們?nèi)绾喂ぷ??大致來說,人類有直覺進(jìn)行推理,,再用推理來糾正我們的直覺,。當(dāng)然,在推理過程中也會(huì)使用直覺,。假設(shè)推理的結(jié)論與直覺沖突,,我們就會(huì)意識(shí)到需要糾正直覺。
這與AlphaGo或AlphaZero的工作方式類似,,它們有一個(gè)評(píng)估函數(shù),,只需看一眼棋盤,然后判斷“這對(duì)我來說有多好,?”但是,,進(jìn)行蒙特卡羅推演時(shí),你會(huì)得到一個(gè)更準(zhǔn)確的想法,,你可以修改你的評(píng)估函數(shù),。因此,通過讓模型接受推理的結(jié)果,,來對(duì)模型進(jìn)行訓(xùn)練,。
大語言模型必須開始這樣做,,必須開始通過推理,來訓(xùn)練模型的直覺,,知道下一步做什么,,并意識(shí)到什么是不對(duì)的。這樣,,他們就可以獲得更多的訓(xùn)練數(shù)據(jù),,而不僅僅是模仿人類。這正是AlphaGo能夠做出第37步妙棋的原因,,它擁有更多的訓(xùn)練數(shù)據(jù),,因?yàn)樗褂猛评韥頇z查下一步應(yīng)該是什么。
多模態(tài)讓模型學(xué)習(xí)更加容易,,同時(shí)利于空間推理
主持人:你對(duì)多模態(tài)有何看法,?我們談到了這些類比,而這些類比往往遠(yuǎn)遠(yuǎn)超出了我們所能看到的范圍,。模型發(fā)現(xiàn)的類比遠(yuǎn)遠(yuǎn)超出了人類的能力,,可能是在我們永遠(yuǎn)無法理解的抽象層面上。現(xiàn)在,,當(dāng)我們將圖像,、視頻和聲音引入其中時(shí),你認(rèn)為這會(huì)如何改變模型,?你認(rèn)為它將如何改變,,它能夠進(jìn)行的類比?
Hinton:這將帶來很大的改變,。例如,,它將使模型更好地理解空間事物。僅從語言角度來看,,很難理解一些空間事物,。盡管值得注意的是,即使在成為多模態(tài)之前,,GPT-4也能做到這一點(diǎn),。但是,當(dāng)你讓模型成為多模態(tài)時(shí),,如果你讓它既能做視覺,,又能伸手抓東西,它能拿起物體并翻轉(zhuǎn)它們等等,,它就會(huì)更好地理解物體,。因此,雖然可以從語言中學(xué)到很多東西,,但如果是多模態(tài),,學(xué)習(xí)起來會(huì)更容易,。事實(shí)上,需要的語言更少,。