OpenAI智能體可自主幫人訂餐購物邁向通用人工智能的重要一步

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-01-25 09:09:39 網(wǎng)易

AI智能體正在加速嘗試代替人類完成一些任務(wù),。1月23日，OpenAI發(fā)布了首個AI智能Operator,。這款智能體能像人類一樣使用網(wǎng)頁瀏覽器,，點擊按鈕、打字輸入內(nèi)容,，自動完成預(yù)訂旅行住宿,、餐廳預(yù)約,、在線購物等復(fù)雜任務(wù)。

系統(tǒng)支持多任務(wù)并行處理,，例如在某購物網(wǎng)站上訂購搪瓷馬克杯的同時,，也能在另一平臺預(yù)定露營地。用戶可以為特定網(wǎng)頁或全站添加自定義指令,，并在主頁保存,，實現(xiàn)跨聊天窗口的多任務(wù)處理，如設(shè)置訂機(jī)票時的首選航司,。

技術(shù)原理主要由Computer-Using Agent模型驅(qū)動,，結(jié)合了GPT-4o的視覺識別能力和基于強(qiáng)化學(xué)習(xí)的高級推理功能，使Operator能夠“看見”網(wǎng)頁并與之互動,。目前,，研究預(yù)覽版率先向訂閱200美元Pro計劃的美國用戶開放，后續(xù)將逐步擴(kuò)展至Plus,、Team和Enterprise級別用戶,。OpenAI希望很快將Operator集成到其所有ChatGPT應(yīng)用中。

從現(xiàn)有體驗來看,，Operator在基礎(chǔ)網(wǎng)頁操作和重復(fù)性任務(wù)方面表現(xiàn)出色,，如搜索篩選、創(chuàng)建購物清單和音樂播放列表等任務(wù)成功率較高,。但在處理復(fù)雜的房產(chǎn)搜索等任務(wù)時,，成功率相對較低；在處理不熟悉的UI界面和文本編輯時表現(xiàn)欠佳,。發(fā)布演示和用戶測試中,，Operator出現(xiàn)了網(wǎng)頁無法成功加載等情況，表明其在運行穩(wěn)定性上存在不足,。部分網(wǎng)站可能會屏蔽AI訪問,，導(dǎo)致智能體無法在這些網(wǎng)站上執(zhí)行任務(wù)，限制了其應(yīng)用范圍,。

據(jù)OpenAI介紹,，這款智能體在WebArena測試中得分58.1%，在WebVoyager測試中實際網(wǎng)站導(dǎo)航成功率達(dá)87%,，而在OSWorld測試中的得分為38.1%,。WebArena測試用于評估智能代理在網(wǎng)絡(luò)環(huán)境中執(zhí)行任務(wù)的能力，WebVoyager測試則在真實網(wǎng)站上測試模型性能,，OSWorld測試評估模型控制完整操作系統(tǒng)的能力,。

盡管還談不上完美，但這款產(chǎn)品標(biāo)志著OpenAI進(jìn)軍智能體領(lǐng)域的開始,?？梢哉f,，Operator是OpenAI向通用人工智能目標(biāo)邁進(jìn)的重要一步，也將進(jìn)一步增強(qiáng)該公司在AI領(lǐng)域的競爭力,?？紤]到Operator在代替用戶執(zhí)行任務(wù)時可能需要輸入敏感信息，如何避免潛在安全風(fēng)險成為一個重要問題,。

(責(zé)任編輯：張蕾)

關(guān)閉

OpenAI智能體可自主幫人訂餐購物 邁向通用人工智能的重要一步

相關(guān)新聞

今日熱點

頻道熱點

OpenAI智能體可自主幫人訂餐購物邁向通用人工智能的重要一步