OpenAI新模型:圖文音頻全搞定
在周二凌晨1點(diǎn)的春季發(fā)布會(huì)上,OpenAI繼“文生視頻模型”Sora后再次為市場(chǎng)帶來(lái)新驚喜,。公司CTO米拉·穆拉蒂揭曉了與ChatGPT相關(guān)的多項(xiàng)更新,,核心內(nèi)容包括兩大方面:一是推出了升級(jí)版的GPT-4o多模態(tài)大模型,該模型在速度與成本上優(yōu)于GPT-4 Turbo;二是宣布ChatGPT免費(fèi)用戶也能享用GPT-4o模型,,進(jìn)行復(fù)雜數(shù)據(jù)分析,、圖像解析、在線搜索及應(yīng)用商店訪問(wèn)等,,預(yù)示著GPT應(yīng)用商店即將迎來(lái)用戶量的激增。
針對(duì)不同用戶群體,,OpenAI調(diào)整了消息限制策略,,付費(fèi)用戶將享有更高額度的消息發(fā)送權(quán)限,,而免費(fèi)用戶在配額耗盡后,,系統(tǒng)會(huì)自動(dòng)切換至GPT-3.5,。未來(lái)一個(gè)月左右,Plus用戶還將迎來(lái)基于GPT-4o優(yōu)化的語(yǔ)音體驗(yàn),盡管當(dāng)前API尚未集成語(yǔ)音功能,。此外,專(zhuān)為macOS設(shè)計(jì)的ChatGPT桌面應(yīng)用即將面世,Windows版本預(yù)計(jì)年內(nèi)推出,便于用戶通過(guò)快捷鍵互動(dòng)提問(wèn),。
米拉·穆拉蒂?gòu)?qiáng)調(diào),,此次發(fā)布標(biāo)志著公司在易用性上取得重要進(jìn)展。在演示環(huán)節(jié),,GPT-4o展現(xiàn)了實(shí)時(shí)語(yǔ)音交互,、情緒感知及多語(yǔ)言翻譯等能力,,如通過(guò)語(yǔ)音識(shí)別用戶的緊張情緒并給予放松建議,以及實(shí)時(shí)提供數(shù)學(xué)問(wèn)題解答等。GPT-4o還能檢測(cè)面部表情以判斷情緒,,并有望與代碼庫(kù)互動(dòng),,進(jìn)行數(shù)據(jù)分析與圖像解讀,。OpenAI新模型:圖文音頻全搞定,。
OpenAI透露,GPT-4o的文本,、圖像輸入功能即日上線,而語(yǔ)音和視頻功能預(yù)計(jì)在未來(lái)幾周內(nèi)加入,。盡管市場(chǎng)上關(guān)于生成式AI的投入與日俱增,,2023年已達(dá)291億美元,,且預(yù)計(jì)市場(chǎng)規(guī)模將持續(xù)膨脹,但也引發(fā)了對(duì)技術(shù)偏見(jiàn)及未經(jīng)充分測(cè)試服務(wù)快速普及的擔(dān)憂,。
自2022年11月亮相以來(lái),,ChatGPT用戶量飛速增長(zhǎng),現(xiàn)接近1億周活躍用戶,,深受《財(cái)富》500強(qiáng)企業(yè)青睞,。穆拉蒂承諾,未來(lái)數(shù)周內(nèi),,這些創(chuàng)新功能將面向大眾開(kāi)放,。她還特別感謝了英偉達(dá)提供的先進(jìn)GPU技術(shù)支持。
OpenAI介紹,,GPT-4o在音頻響應(yīng)速度上實(shí)現(xiàn)了顯著提升,,最快可在232毫秒內(nèi)作出反饋,更接近人類(lèi)對(duì)話節(jié)奏,。此模型整合了文本,、音頻、圖像處理能力,,為自然人機(jī)交互帶來(lái)了質(zhì)的飛躍,。雖然目前仍處于探索階段,GPT-4o展現(xiàn)的潛力預(yù)示著AI技術(shù)在多模態(tài)交互上邁出了重要一步,。
5月13日,OpenAI在春季更新活動(dòng)中揭曉了ChatGPT的新版本,,該版本搭載了升級(jí)的人工智能模型GPT-4o
2024-05-14 08:45:16OpenAI新模型可讀取用戶情緒OpenAI于13日在加州的發(fā)布會(huì)推出了GPT-4o,,這是一款強(qiáng)調(diào)多模態(tài)能力的人工智能模型,面向公眾免費(fèi)開(kāi)放
2024-05-15 15:50:04OpenAI新模型更“通人性”OpenAI最近發(fā)布了萬(wàn)眾矚目的新成果,,其中核心亮點(diǎn)是多模態(tài)模型GPT-4o,伴隨著ChatGPT的新用戶界面和桌面版GPT的亮相
2024-05-14 07:51:45有情緒的AI出現(xiàn)了