若是把ReAct的方法歸結(jié)為讓智能體
“reason to act”
,,那么下一個(gè)方法,,即
思維樹(shù)
,,則重在讓智能體 “reason to plan”
“reason to plan”
思維樹(shù)是把問(wèn)題表示為在樹(shù)結(jié)構(gòu)上的搜索,,每個(gè)節(jié)點(diǎn)是一個(gè)狀態(tài),,代表部分解決方案,,分支對(duì)應(yīng)于修改狀態(tài)的操作,。
它主要涉及四個(gè)問(wèn)題:
思維分解:將復(fù)雜問(wèn)題分解為一系列中間步驟,,每個(gè)步驟都可以看作是樹(shù)的一個(gè)節(jié)點(diǎn),。
思維生成:利用語(yǔ)言模型生成每個(gè)節(jié)點(diǎn)的潛在思維,這些思維是解決問(wèn)題的中間步驟或策略,。
狀態(tài)評(píng)估:通過(guò)語(yǔ)言模型對(duì)每個(gè)節(jié)點(diǎn)的狀態(tài)進(jìn)行評(píng)估,,判斷其在解決問(wèn)題中的進(jìn)展和潛力。
搜索算法:采用不同的搜索算法
(如廣度優(yōu)先搜索BFS或深度優(yōu)先搜索DFS)
來(lái)探索思維樹(shù),,找到最優(yōu)的解決方案,。
將思維樹(shù)應(yīng)用到“24點(diǎn)”游戲中,與此前的思維鏈
(CoT)
相比,,準(zhǔn)確率有了明顯提高,。
至于Language Agents中的最后一個(gè)關(guān)鍵技術(shù),即
CoALA
,,則是一種用于組織和設(shè)計(jì)語(yǔ)言智能體的概念框架,。
從下面的結(jié)構(gòu)圖來(lái)看,它大致分為信息存儲(chǔ),、行動(dòng)空間和決策制定三大模塊,。
信息存儲(chǔ)是指語(yǔ)言智能體將信息存儲(chǔ)在多個(gè)內(nèi)存模塊中,包括短期工作記憶和長(zhǎng)期記憶
(如語(yǔ)義記憶,、情景記憶和程序記憶)
,。
這些內(nèi)存模塊用于存儲(chǔ)不同類(lèi)型的信息,如感知輸入,、知識(shí),、經(jīng)驗(yàn)等,并在智能體的決策過(guò)程中發(fā)揮作用,。
江蘇省中醫(yī)院消化系腫瘤外科主任姚學(xué)權(quán),在經(jīng)歷6年與癌癥的斗爭(zhēng)后,,于2024年7月12日下午2時(shí)28分在南京離世,,終年59歲
2024-07-16 20:00:5859歲腫瘤專(zhuān)家姚學(xué)權(quán)病逝