OpenAI推出新旗艦?zāi)P虶PT-4o
北京時(shí)間周二凌晨1點(diǎn),,OpenAI舉辦了一場春季發(fā)布會(huì),,向公眾展示了一系列與ChatGPT相關(guān)的創(chuàng)新。發(fā)布會(huì)核心內(nèi)容包括發(fā)布新旗艦?zāi)P汀癎PT-4o”以及在ChatGPT中增加更多免費(fèi)功能,。
GPT-4o作為本次發(fā)布會(huì)的重頭戲,,標(biāo)志著OpenAI在人機(jī)交互領(lǐng)域邁出了重要一步。這款模型能夠?qū)崟r(shí)處理音頻,、視覺和文本信息,,顯著提升了ChatGPT的語言處理能力,支持50種不同語言,,并在處理速度和質(zhì)量上有所突破,。與舊模型相比,,GPT-4o在理解圖像和音頻方面更為出色,能在極短時(shí)間內(nèi)對(duì)音頻輸入做出響應(yīng),,接近人類對(duì)話的自然節(jié)奏,。演示中,它能識(shí)別用戶的緊張情緒并給予指導(dǎo),,還能根據(jù)需求調(diào)整語調(diào),,展現(xiàn)出高度的情境適應(yīng)性。
性能方面,,GPT-4o不僅在文本,、推理和編碼等基礎(chǔ)能力上保持高水平,其多語言,、音頻和視覺處理能力更是達(dá)到了前所未有的標(biāo)準(zhǔn),。這種跨模態(tài)的進(jìn)步被視作AI領(lǐng)域的一大變革,使得AI能夠更全面地理解和響應(yīng)用戶的個(gè)人情境和需求,。OpenAI推出新旗艦?zāi)P虶PT-4o,。
更令人興奮的是,GPT-4o的手機(jī)版通過語音和視覺識(shí)別技術(shù),,不僅能理解用戶的言語和身體狀態(tài),,還能根據(jù)所處環(huán)境作出互動(dòng),比如解答數(shù)學(xué)問題后參與生活話題的討論,,實(shí)現(xiàn)了真正的個(gè)性化交流體驗(yàn),。
OpenAI透露,GPT-4o是首個(gè)集成了文本,、視覺和音頻處理的模型,,目前團(tuán)隊(duì)正初步探索其潛能和局限。技術(shù)文檔中還提及了模型的其他能力,,如3D建模,、圖像詩創(chuàng)作及照片卡通化等,預(yù)示著GPT-4o的應(yīng)用前景廣闊,。
至于ChatGPT的更新,,免費(fèi)用戶現(xiàn)在也能體驗(yàn)到GPT-4o帶來的數(shù)據(jù)分析、圖像分析等高級(jí)功能,,付費(fèi)用戶則享受更高的消息限制,。未來,OpenAI計(jì)劃為Plus用戶提供增強(qiáng)的語音體驗(yàn),,并推出適用于macOS的ChatGPT桌面應(yīng)用,,Windows版預(yù)計(jì)后續(xù)跟進(jìn)。OpenAI推出新旗艦?zāi)P虶PT-4o。
OpenAI首席執(zhí)行官Sam Altman在社交媒體上高度評(píng)價(jià)GPT-4o,,稱其為公司迄今為止最先進(jìn),、最快捷且原生支持多模態(tài)的模型,暗示著AI技術(shù)正朝著更加智能,、全面的方向快速發(fā)展,。
在周二凌晨1點(diǎn)的春季發(fā)布會(huì)上,,OpenAI繼“文生視頻模型”Sora后再次為市場帶來新驚喜
2024-05-14 09:07:05OpenAI新模型:圖文音頻全搞定