OpenAI新模型：圖文音頻全搞定,，GPT-4o引領(lǐng)交互新時(shí)代

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2024-05-14 09:07:05 姣忔棩緇忔祹鏂伴椈

OpenAI新模型：圖文音頻全搞定

在周二凌晨1點(diǎn)的春季發(fā)布會(huì)上，OpenAI繼“文生視頻模型”Sora后再次為市場(chǎng)帶來(lái)新驚喜,。公司CTO米拉·穆拉蒂揭曉了與ChatGPT相關(guān)的多項(xiàng)更新,，核心內(nèi)容包括兩大方面：一是推出了升級(jí)版的GPT-4o多模態(tài)大模型，該模型在速度與成本上優(yōu)于GPT-4 Turbo；二是宣布ChatGPT免費(fèi)用戶也能享用GPT-4o模型,，進(jìn)行復(fù)雜數(shù)據(jù)分析,、圖像解析、在線搜索及應(yīng)用商店訪問(wèn)等,，預(yù)示著GPT應(yīng)用商店即將迎來(lái)用戶量的激增。

針對(duì)不同用戶群體,，OpenAI調(diào)整了消息限制策略,，付費(fèi)用戶將享有更高額度的消息發(fā)送權(quán)限,，而免費(fèi)用戶在配額耗盡后,，系統(tǒng)會(huì)自動(dòng)切換至GPT-3.5,。未來(lái)一個(gè)月左右，Plus用戶還將迎來(lái)基于GPT-4o優(yōu)化的語(yǔ)音體驗(yàn)，盡管當(dāng)前API尚未集成語(yǔ)音功能,。此外，專(zhuān)為macOS設(shè)計(jì)的ChatGPT桌面應(yīng)用即將面世，Windows版本預(yù)計(jì)年內(nèi)推出，便于用戶通過(guò)快捷鍵互動(dòng)提問(wèn),。

米拉·穆拉蒂?gòu)?qiáng)調(diào),，此次發(fā)布標(biāo)志著公司在易用性上取得重要進(jìn)展。在演示環(huán)節(jié),，GPT-4o展現(xiàn)了實(shí)時(shí)語(yǔ)音交互,、情緒感知及多語(yǔ)言翻譯等能力,，如通過(guò)語(yǔ)音識(shí)別用戶的緊張情緒并給予放松建議，以及實(shí)時(shí)提供數(shù)學(xué)問(wèn)題解答等。GPT-4o還能檢測(cè)面部表情以判斷情緒,，并有望與代碼庫(kù)互動(dòng),，進(jìn)行數(shù)據(jù)分析與圖像解讀,。OpenAI新模型：圖文音頻全搞定,。

OpenAI透露，GPT-4o的文本,、圖像輸入功能即日上線，而語(yǔ)音和視頻功能預(yù)計(jì)在未來(lái)幾周內(nèi)加入,。盡管市場(chǎng)上關(guān)于生成式AI的投入與日俱增,，2023年已達(dá)291億美元,，且預(yù)計(jì)市場(chǎng)規(guī)模將持續(xù)膨脹，但也引發(fā)了對(duì)技術(shù)偏見(jiàn)及未經(jīng)充分測(cè)試服務(wù)快速普及的擔(dān)憂,。

自2022年11月亮相以來(lái),，ChatGPT用戶量飛速增長(zhǎng)，現(xiàn)接近1億周活躍用戶,，深受《財(cái)富》500強(qiáng)企業(yè)青睞,。穆拉蒂承諾，未來(lái)數(shù)周內(nèi),，這些創(chuàng)新功能將面向大眾開(kāi)放,。她還特別感謝了英偉達(dá)提供的先進(jìn)GPU技術(shù)支持。

OpenAI介紹,，GPT-4o在音頻響應(yīng)速度上實(shí)現(xiàn)了顯著提升,，最快可在232毫秒內(nèi)作出反饋，更接近人類(lèi)對(duì)話節(jié)奏,。此模型整合了文本,、音頻、圖像處理能力,，為自然人機(jī)交互帶來(lái)了質(zhì)的飛躍,。雖然目前仍處于探索階段，GPT-4o展現(xiàn)的潛力預(yù)示著AI技術(shù)在多模態(tài)交互上邁出了重要一步,。

(責(zé)任編輯：盧其龍 CN070)

關(guān)閉

OpenAI新模型：圖文音頻全搞定,，GPT-4o引領(lǐng)交互新時(shí)代

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)