OpenAI正式發(fā)布了其智能體Operator,這款A(yù)I能夠獨立完成用戶指派的任務(wù),。只需給它一個任務(wù),,比如購物清單,,它就能自主完成購買,。演示中可以看到,,所有屏幕上的操作都是由Operator自己完成的,,包括預(yù)定餐廳等任務(wù),。
Operator目前僅面向每月200美元的Pro用戶開放。盡管如此,,網(wǎng)友們對這一發(fā)布感到非常興奮,。有人表示,,如果Operator開源會更好,希望其他公司如DeepSeek和Meta也能推出類似的產(chǎn)品,。
通過官方演示可以看出,,Operator幾乎可以在任何網(wǎng)站上自主操作,無需人類輔助,。例如,,它可以找到食譜并把所需食材添加到購物車。與基于API或編程接口的Agent不同,,Operator通過文本思維鏈進(jìn)行推理,。當(dāng)需要登錄或支付時,它會將控制權(quán)交還給用戶,。此外,,用戶可以通過自定義指令獲得個性化體驗,并保存提示以便快速訪問重復(fù)任務(wù),。
Operator基于一個新的模型Computer-Using-Agent(CUA),,結(jié)合了GPT-4o的視覺能力和高級推理強(qiáng)化學(xué)習(xí)。這個模型能夠在網(wǎng)頁界面上自動執(zhí)行鼠標(biāo)和鍵盤操作,,遇到問題時還可以自我糾錯,。在WebArena和WebVoyager基準(zhǔn)測試中,CUA表現(xiàn)出色,。
目前,,美國地區(qū)的Pro會員已經(jīng)可以使用Operator,而其他付費用戶和地區(qū)則需等待,。OpenAI計劃在未來將這些功能集成到ChatGPT中。
隨著Operator的發(fā)布,,OpenAI宣布進(jìn)入了從AI到AGI五步過程中的第三階段,,即Agents階段。這意味著AI可以作為系統(tǒng)執(zhí)行一些行動任務(wù),。OpenAI還預(yù)告未來幾周和幾個月內(nèi)將推出更多智能體,。
在直播前,OpenAI還修復(fù)了ChatGPT和API錯誤率高的問題,,并預(yù)告免費版ChatGPT用戶也將能使用o3-mini,。