對于AI系統(tǒng)來說,,要成功實(shí)現(xiàn)自我復(fù)制并非易事,需要長期規(guī)劃與復(fù)雜操作。研究人員為這兩種AI系統(tǒng)配備了智能體框架,,這個框架包含工具集,、思維范式以及系統(tǒng)提示,,使LLM能與操作系統(tǒng)交互,。智能體框架是LLM與環(huán)境交互的必要組件,,通常具有以下功能:工具用于與計算設(shè)備進(jìn)行交互,;系統(tǒng)提示提供詳細(xì)的工具使用方法,;思維模型支持LLM更好地完成任務(wù)。LLM則類似于人類的大腦,,具備感知,、規(guī)劃、調(diào)用操作和反思等功能,。
實(shí)驗(yàn)結(jié)果顯示,,兩款LLM的自我復(fù)制成功率超過50%。這證明即使是由參數(shù)較少,、能力相對較弱的LLM驅(qū)動的AI系統(tǒng),,也已跨越自我復(fù)制的紅線。研究表明,現(xiàn)有LLM之所以具備編程能力,,是因?yàn)樗鼈兛梢詮拇罅繑?shù)據(jù)集中學(xué)習(xí),,這些數(shù)據(jù)集包含了來自GitHub、Stack Overflow等多個來源的海量代碼,。在實(shí)驗(yàn)設(shè)置中,,基礎(chǔ)LLM的主要任務(wù)是編寫可在Bash shell中執(zhí)行的命令、指令或程序,。
在成功案例分析過程中,,研究人員觀察到一系列Bash命令,這些命令被歸納為探索環(huán)境,、改變環(huán)境,、使用系統(tǒng)工具以及執(zhí)行程序四類。兩個LLM頻繁對環(huán)境展開探索,,涵蓋文件系統(tǒng),、進(jìn)程空間以及連接端口等關(guān)鍵方面。從環(huán)境反饋中學(xué)習(xí)并更新計劃是完成自我復(fù)制的重要因素,。此外,,早期積累的信息量對自我復(fù)制的成功與否也起著關(guān)鍵作用,積累的信息量越大,,就越容易實(shí)現(xiàn)成功的自我復(fù)制,。
DeepSeek掀起的大模型旋風(fēng)在中美兩地愈演愈烈,。1月27日,,蘋果App Store中國區(qū)免費(fèi)榜顯示,DeepSeek站上首位
2025-01-27 11:12:32DeepSeek登頂蘋果中美兩區(qū)意味著什么近日,,杭州深度求索官方推出的AI助手DeepSeek-V3憑借其超過600B的總參數(shù)和卓越性能,,在AI領(lǐng)域掀起一股新的浪潮
2025-02-11 20:48:02中國AI技術(shù)實(shí)現(xiàn)反向輸出