OpenAI新模型:圖文音頻全搞定
在周二凌晨1點的春季發(fā)布會上,,OpenAI繼“文生視頻模型”Sora后再次為市場帶來新驚喜,。公司CTO米拉·穆拉蒂揭曉了與ChatGPT相關的多項更新,,核心內(nèi)容包括兩大方面:一是推出了升級版的GPT-4o多模態(tài)大模型,該模型在速度與成本上優(yōu)于GPT-4 Turbo,;二是宣布ChatGPT免費用戶也能享用GPT-4o模型,,進行復雜數(shù)據(jù)分析、圖像解析、在線搜索及應用商店訪問等,,預示著GPT應用商店即將迎來用戶量的激增,。
針對不同用戶群體,OpenAI調(diào)整了消息限制策略,,付費用戶將享有更高額度的消息發(fā)送權限,,而免費用戶在配額耗盡后,系統(tǒng)會自動切換至GPT-3.5,。未來一個月左右,,Plus用戶還將迎來基于GPT-4o優(yōu)化的語音體驗,盡管當前API尚未集成語音功能,。此外,,專為macOS設計的ChatGPT桌面應用即將面世,Windows版本預計年內(nèi)推出,,便于用戶通過快捷鍵互動提問,。
米拉·穆拉蒂強調(diào),此次發(fā)布標志著公司在易用性上取得重要進展,。在演示環(huán)節(jié),,GPT-4o展現(xiàn)了實時語音交互、情緒感知及多語言翻譯等能力,,如通過語音識別用戶的緊張情緒并給予放松建議,,以及實時提供數(shù)學問題解答等。GPT-4o還能檢測面部表情以判斷情緒,,并有望與代碼庫互動,,進行數(shù)據(jù)分析與圖像解讀。OpenAI新模型:圖文音頻全搞定,。
OpenAI透露,,GPT-4o的文本、圖像輸入功能即日上線,,而語音和視頻功能預計在未來幾周內(nèi)加入。盡管市場上關于生成式AI的投入與日俱增,,2023年已達291億美元,,且預計市場規(guī)模將持續(xù)膨脹,但也引發(fā)了對技術偏見及未經(jīng)充分測試服務快速普及的擔憂,。
自2022年11月亮相以來,,ChatGPT用戶量飛速增長,現(xiàn)接近1億周活躍用戶,,深受《財富》500強企業(yè)青睞,。穆拉蒂承諾,未來數(shù)周內(nèi),這些創(chuàng)新功能將面向大眾開放,。她還特別感謝了英偉達提供的先進GPU技術支持,。
OpenAI介紹,GPT-4o在音頻響應速度上實現(xiàn)了顯著提升,,最快可在232毫秒內(nèi)作出反饋,,更接近人類對話節(jié)奏。此模型整合了文本,、音頻,、圖像處理能力,為自然人機交互帶來了質(zhì)的飛躍,。雖然目前仍處于探索階段,,GPT-4o展現(xiàn)的潛力預示著AI技術在多模態(tài)交互上邁出了重要一步。
5月14日深夜,美國OpenAI公司舉辦線上“春季更新”活動,,揭曉兩大核心內(nèi)容:發(fā)布最新旗艦模型GPT-4o及在ChatGPT服務中增添多項免費功能
2024-05-14 07:49:16OpenAI新模型:絲滑如真人5月13日,,OpenAI在春季更新活動中揭曉了ChatGPT的新版本,該版本搭載了升級的人工智能模型GPT-4o
2024-05-14 08:45:16OpenAI新模型可讀取用戶情緒OpenAI于13日在加州的發(fā)布會推出了GPT-4o,,這是一款強調(diào)多模態(tài)能力的人工智能模型,,面向公眾免費開放
2024-05-15 15:50:04OpenAI新模型更“通人性”OpenAI最近發(fā)布了萬眾矚目的新成果,,其中核心亮點是多模態(tài)模型GPT-4o,伴隨著ChatGPT的新用戶界面和桌面版GPT的亮相
2024-05-14 07:51:45有情緒的AI出現(xiàn)了