OpenAI正式發(fā)布了其智能體Operator,這款A(yù)I能夠獨(dú)立完成用戶指派的任務(wù),。只需給它一個(gè)任務(wù),,比如購物清單,它就能自主完成購買,。演示中可以看到,,所有屏幕上的操作都是由Operator自己完成的,包括預(yù)定餐廳等任務(wù),。
Operator目前僅面向每月200美元的Pro用戶開放,。盡管如此,網(wǎng)友們對(duì)這一發(fā)布感到非常興奮,。有人表示,,如果Operator開源會(huì)更好,希望其他公司如DeepSeek和Meta也能推出類似的產(chǎn)品,。
通過官方演示可以看出,,Operator幾乎可以在任何網(wǎng)站上自主操作,無需人類輔助,。例如,,它可以找到食譜并把所需食材添加到購物車。與基于API或編程接口的Agent不同,,Operator通過文本思維鏈進(jìn)行推理,。當(dāng)需要登錄或支付時(shí),它會(huì)將控制權(quán)交還給用戶,。此外,,用戶可以通過自定義指令獲得個(gè)性化體驗(yàn),并保存提示以便快速訪問重復(fù)任務(wù),。
Operator基于一個(gè)新的模型Computer-Using-Agent(CUA),,結(jié)合了GPT-4o的視覺能力和高級(jí)推理強(qiáng)化學(xué)習(xí)。這個(gè)模型能夠在網(wǎng)頁界面上自動(dòng)執(zhí)行鼠標(biāo)和鍵盤操作,,遇到問題時(shí)還可以自我糾錯(cuò),。在WebArena和WebVoyager基準(zhǔn)測(cè)試中,CUA表現(xiàn)出色,。
目前,,美國地區(qū)的Pro會(huì)員已經(jīng)可以使用Operator,而其他付費(fèi)用戶和地區(qū)則需等待,。OpenAI計(jì)劃在未來將這些功能集成到ChatGPT中,。
隨著Operator的發(fā)布,OpenAI宣布進(jìn)入了從AI到AGI五步過程中的第三階段,即Agents階段,。這意味著AI可以作為系統(tǒng)執(zhí)行一些行動(dòng)任務(wù),。OpenAI還預(yù)告未來幾周和幾個(gè)月內(nèi)將推出更多智能體。
在直播前,,OpenAI還修復(fù)了ChatGPT和API錯(cuò)誤率高的問題,,并預(yù)告免費(fèi)版ChatGPT用戶也將能使用o3-mini。