包括在他X主頁(yè)中的簡(jiǎn)介,,第一句話上來(lái)也是Language Agents:
而這,,也正是他博士畢業(yè)論文的題目:
Language Agents: From Next-Token Prediction to Digital Automation
。
Language Agents,即
語(yǔ)言智能體
,,是姚順雨提出來(lái)了一種新的智能體類別,。
和傳統(tǒng)智能體不同的是,這種方法是將語(yǔ)言模型用于智能體的推理和行動(dòng),,主打一個(gè)讓它們實(shí)現(xiàn)
數(shù)字自動(dòng)化
(Digital Automation)
,。
至于具體的實(shí)現(xiàn)方法,則有三個(gè)關(guān)鍵技術(shù)
(均有獨(dú)立的論文)
,,它們分別是:
ReAct
:一種將推理和行動(dòng)相結(jié)合的方法,,通過(guò)語(yǔ)言模型生成推理軌跡和行動(dòng),來(lái)解決各種語(yǔ)言推理和決策任務(wù),。
思維樹
:一種基于樹搜索的方法,,通過(guò)生成和評(píng)估多個(gè)思維路徑來(lái)解決復(fù)雜問(wèn)題,提高語(yǔ)言模型的推理能力,。
CoALA
:一個(gè)概念框架,,用于組織和設(shè)計(jì)語(yǔ)言代理,包括內(nèi)存,、行動(dòng)空間和決策制定等方面,。
以ReAct為例,研究是將語(yǔ)言模型的動(dòng)作空間擴(kuò)充為動(dòng)作集和語(yǔ)言空間的并集,。
語(yǔ)言空間中的動(dòng)作
(即思維或推理軌跡)
不影響外部環(huán)境,,但能通過(guò)對(duì)當(dāng)前上下文的推理來(lái)更新上下文,可以支持未來(lái)的推理或行動(dòng),。
例如在下圖展示的對(duì)話中,,采用ReAct的方法,可以引導(dǎo)智能體把“產(chǎn)生想法→采取行動(dòng)→觀察結(jié)果”這個(gè)過(guò)程進(jìn)行循環(huán),。
如此一來(lái),,便可以結(jié)合推理的軌跡和操作,允許模型進(jìn)行動(dòng)態(tài)的推理,,讓智能體的決策和最終結(jié)果變得更優(yōu),。
江蘇省中醫(yī)院消化系腫瘤外科主任姚學(xué)權(quán),,在經(jīng)歷6年與癌癥的斗爭(zhēng)后,,于2024年7月12日下午2時(shí)28分在南京離世,終年59歲
2024-07-16 20:00:5859歲腫瘤專家姚學(xué)權(quán)病逝