OpenAI新模型:圖文音頻全搞定
在周二凌晨1點(diǎn)的春季發(fā)布會(huì)上,,OpenAI繼“文生視頻模型”Sora后再次為市場(chǎng)帶來新驚喜,。公司CTO米拉·穆拉蒂揭曉了與ChatGPT相關(guān)的多項(xiàng)更新,核心內(nèi)容包括兩大方面:一是推出了升級(jí)版的GPT-4o多模態(tài)大模型,,該模型在速度與成本上優(yōu)于GPT-4 Turbo;二是宣布ChatGPT免費(fèi)用戶也能享用GPT-4o模型,,進(jìn)行復(fù)雜數(shù)據(jù)分析,、圖像解析、在線搜索及應(yīng)用商店訪問等,,預(yù)示著GPT應(yīng)用商店即將迎來用戶量的激增,。
針對(duì)不同用戶群體,OpenAI調(diào)整了消息限制策略,,付費(fèi)用戶將享有更高額度的消息發(fā)送權(quán)限,,而免費(fèi)用戶在配額耗盡后,系統(tǒng)會(huì)自動(dòng)切換至GPT-3.5,。未來一個(gè)月左右,,Plus用戶還將迎來基于GPT-4o優(yōu)化的語音體驗(yàn),盡管當(dāng)前API尚未集成語音功能,。此外,,專為macOS設(shè)計(jì)的ChatGPT桌面應(yīng)用即將面世,Windows版本預(yù)計(jì)年內(nèi)推出,,便于用戶通過快捷鍵互動(dòng)提問,。
米拉·穆拉蒂強(qiáng)調(diào),此次發(fā)布標(biāo)志著公司在易用性上取得重要進(jìn)展,。在演示環(huán)節(jié),,GPT-4o展現(xiàn)了實(shí)時(shí)語音交互、情緒感知及多語言翻譯等能力,,如通過語音識(shí)別用戶的緊張情緒并給予放松建議,,以及實(shí)時(shí)提供數(shù)學(xué)問題解答等,。GPT-4o還能檢測(cè)面部表情以判斷情緒,并有望與代碼庫互動(dòng),,進(jìn)行數(shù)據(jù)分析與圖像解讀,。OpenAI新模型:圖文音頻全搞定。
OpenAI透露,,GPT-4o的文本,、圖像輸入功能即日上線,而語音和視頻功能預(yù)計(jì)在未來幾周內(nèi)加入,。盡管市場(chǎng)上關(guān)于生成式AI的投入與日俱增,,2023年已達(dá)291億美元,且預(yù)計(jì)市場(chǎng)規(guī)模將持續(xù)膨脹,,但也引發(fā)了對(duì)技術(shù)偏見及未經(jīng)充分測(cè)試服務(wù)快速普及的擔(dān)憂,。
自2022年11月亮相以來,ChatGPT用戶量飛速增長,,現(xiàn)接近1億周活躍用戶,,深受《財(cái)富》500強(qiáng)企業(yè)青睞。穆拉蒂承諾,,未來數(shù)周內(nèi),,這些創(chuàng)新功能將面向大眾開放。她還特別感謝了英偉達(dá)提供的先進(jìn)GPU技術(shù)支持,。
OpenAI介紹,,GPT-4o在音頻響應(yīng)速度上實(shí)現(xiàn)了顯著提升,最快可在232毫秒內(nèi)作出反饋,,更接近人類對(duì)話節(jié)奏,。此模型整合了文本、音頻,、圖像處理能力,,為自然人機(jī)交互帶來了質(zhì)的飛躍。雖然目前仍處于探索階段,,GPT-4o展現(xiàn)的潛力預(yù)示著AI技術(shù)在多模態(tài)交互上邁出了重要一步,。
5月13日,,OpenAI在春季更新活動(dòng)中揭曉了ChatGPT的新版本,,該版本搭載了升級(jí)的人工智能模型GPT-4o
2024-05-14 08:45:16OpenAI新模型可讀取用戶情緒OpenAI于13日在加州的發(fā)布會(huì)推出了GPT-4o,這是一款強(qiáng)調(diào)多模態(tài)能力的人工智能模型,,面向公眾免費(fèi)開放
2024-05-15 15:50:04OpenAI新模型更“通人性”OpenAI最近發(fā)布了萬眾矚目的新成果,其中核心亮點(diǎn)是多模態(tài)模型GPT-4o,,伴隨著ChatGPT的新用戶界面和桌面版GPT的亮相
2024-05-14 07:51:45有情緒的AI出現(xiàn)了