AI智能體正在加速?lài)L試代替人類(lèi)完成一些任務(wù),。1月23日,,OpenAI發(fā)布了首個(gè)AI智能Operator。這款智能體能像人類(lèi)一樣使用網(wǎng)頁(yè)瀏覽器,,點(diǎn)擊按鈕,、打字輸入內(nèi)容,自動(dòng)完成預(yù)訂旅行住宿,、餐廳預(yù)約,、在線購(gòu)物等復(fù)雜任務(wù)。
系統(tǒng)支持多任務(wù)并行處理,,例如在某購(gòu)物網(wǎng)站上訂購(gòu)搪瓷馬克杯的同時(shí),,也能在另一平臺(tái)預(yù)定露營(yíng)地。用戶(hù)可以為特定網(wǎng)頁(yè)或全站添加自定義指令,,并在主頁(yè)保存,,實(shí)現(xiàn)跨聊天窗口的多任務(wù)處理,如設(shè)置訂機(jī)票時(shí)的首選航司,。
技術(shù)原理主要由Computer-Using Agent模型驅(qū)動(dòng),,結(jié)合了GPT-4o的視覺(jué)識(shí)別能力和基于強(qiáng)化學(xué)習(xí)的高級(jí)推理功能,使Operator能夠“看見(jiàn)”網(wǎng)頁(yè)并與之互動(dòng),。目前,,研究預(yù)覽版率先向訂閱200美元Pro計(jì)劃的美國(guó)用戶(hù)開(kāi)放,后續(xù)將逐步擴(kuò)展至Plus,、Team和Enterprise級(jí)別用戶(hù),。OpenAI希望很快將Operator集成到其所有ChatGPT應(yīng)用中,。
從現(xiàn)有體驗(yàn)來(lái)看,Operator在基礎(chǔ)網(wǎng)頁(yè)操作和重復(fù)性任務(wù)方面表現(xiàn)出色,,如搜索篩選,、創(chuàng)建購(gòu)物清單和音樂(lè)播放列表等任務(wù)成功率較高。但在處理復(fù)雜的房產(chǎn)搜索等任務(wù)時(shí),,成功率相對(duì)較低,;在處理不熟悉的UI界面和文本編輯時(shí)表現(xiàn)欠佳。發(fā)布演示和用戶(hù)測(cè)試中,,Operator出現(xiàn)了網(wǎng)頁(yè)無(wú)法成功加載等情況,,表明其在運(yùn)行穩(wěn)定性上存在不足。部分網(wǎng)站可能會(huì)屏蔽AI訪問(wèn),,導(dǎo)致智能體無(wú)法在這些網(wǎng)站上執(zhí)行任務(wù),,限制了其應(yīng)用范圍。
據(jù)OpenAI介紹,,這款智能體在WebArena測(cè)試中得分58.1%,,在WebVoyager測(cè)試中實(shí)際網(wǎng)站導(dǎo)航成功率達(dá)87%,而在OSWorld測(cè)試中的得分為38.1%,。WebArena測(cè)試用于評(píng)估智能代理在網(wǎng)絡(luò)環(huán)境中執(zhí)行任務(wù)的能力,,WebVoyager測(cè)試則在真實(shí)網(wǎng)站上測(cè)試模型性能,OSWorld測(cè)試評(píng)估模型控制完整操作系統(tǒng)的能力,。
盡管還談不上完美,,但這款產(chǎn)品標(biāo)志著OpenAI進(jìn)軍智能體領(lǐng)域的開(kāi)始??梢哉f(shuō),,Operator是OpenAI向通用人工智能目標(biāo)邁進(jìn)的重要一步,也將進(jìn)一步增強(qiáng)該公司在AI領(lǐng)域的競(jìng)爭(zhēng)力,??紤]到Operator在代替用戶(hù)執(zhí)行任務(wù)時(shí)可能需要輸入敏感信息,如何避免潛在安全風(fēng)險(xiǎn)成為一個(gè)重要問(wèn)題,。