隨著OpenAI的圖像生成功能完成重大升級(jí),新的問題也隨之而來。OpenAI首席執(zhí)行官薩姆·奧爾特曼表示,ChatGPT的文生圖應(yīng)用需求過高,,導(dǎo)致GPU過載,。為解決這一問題,,OpenAI將對(duì)ChatGPT生成圖片的功能實(shí)施臨時(shí)限速,,降低單位時(shí)間內(nèi)的請(qǐng)求處理量,,以緩解GPU壓力,,并優(yōu)先保障文本生成和對(duì)話等核心功能的穩(wěn)定性,。
3月25日,OpenAI宣布正式推出GPT-4o圖像生成功能,。該功能迅速走紅,,用戶通過簡(jiǎn)單的文字描述或語音指令即可編輯、修改或生成圖片,,無需使用復(fù)雜的圖像編輯工具,。這種技術(shù)結(jié)合了自然語言處理與圖像生成,大大降低了圖片編輯的門檻,。GPT-4o是一個(gè)多模態(tài)AI模型,,能夠接受文本、音頻和圖像的組合輸入,,并生成相應(yīng)的圖像輸出,。
GPT-4o圖像生成功能具備四大核心優(yōu)勢(shì):精準(zhǔn)文本渲染、嚴(yán)格指令遵循,、深度知識(shí)調(diào)用及創(chuàng)意拓展能力,。測(cè)試表明,GPT-4o在生成帶有英文內(nèi)容的照片時(shí)表現(xiàn)良好,,但在處理中文字符時(shí)仍有待提升,。通過多輪對(duì)話優(yōu)化圖像時(shí),GPT-4o展現(xiàn)了強(qiáng)大的上下文連貫性,。例如,在生成一只戴著黑色墨鏡的老虎后,,進(jìn)一步要求戴上偵探帽并生成游戲場(chǎng)景,,GPT-4o成功實(shí)現(xiàn)了這一復(fù)雜指令。此外,,GPT-4o還能應(yīng)對(duì)包含多個(gè)不同物體的復(fù)雜網(wǎng)格圖生成任務(wù),,盡管存在一些指令缺失的情況。
在實(shí)用性測(cè)試中,GPT-4o生成的傳統(tǒng)中式風(fēng)格餐廳菜單和科學(xué)示意圖也表現(xiàn)出色,。盡管存在不足,,GPT-4o圖像生成功能的革新性依然顯著,為創(chuàng)意設(shè)計(jì),、教育教學(xué),、游戲開發(fā)等領(lǐng)域提供了強(qiáng)大工具。薩姆·奧爾特曼稱,,這一功能標(biāo)志著“創(chuàng)作自由的新高點(diǎn)”,,用戶將借此釋放更多視覺創(chuàng)意潛能。
作為AI領(lǐng)域的頭部玩家,,OpenAI背后的GPU儲(chǔ)備是業(yè)內(nèi)頂尖水準(zhǔn),。微軟作為OpenAI的主要投資者,在2024年購(gòu)買了大量英偉達(dá)的Hopper芯片,,使OpenAI的大模型得以在Azure云基礎(chǔ)設(shè)施上進(jìn)行訓(xùn)練,。新功能面臨的問題反映了AI多模態(tài)技術(shù)發(fā)展中資源與需求平衡的挑戰(zhàn)。
OpenAI計(jì)劃在未來幾個(gè)月內(nèi)推出GPT-5,,集成多項(xiàng)技術(shù),,包括推理模型o3的技術(shù)。此前,,OpenAI內(nèi)部代號(hào)為“獵戶座”的GPT-5項(xiàng)目已持續(xù)近兩年,,但目前進(jìn)度嚴(yán)重滯后。每次大型訓(xùn)練都需要數(shù)月時(shí)間處理大量數(shù)據(jù),,目的是讓“獵戶座”變得更聰明,。然而,該項(xiàng)目仍面臨諸多挑戰(zhàn),。
研究機(jī)構(gòu)Gartner預(yù)測(cè),,到2026年,多模態(tài)生成模型的商業(yè)價(jià)值將占AI市場(chǎng)的45%,。隨著谷歌與微軟等巨頭的持續(xù)投入,,生成式AI正從通用工具向產(chǎn)業(yè)基礎(chǔ)設(shè)施演變,但其社會(huì)倫理和監(jiān)管框架的完善仍有待探索,。
李蘭迪咬筆蓋這下殺我,!發(fā)絲隨風(fēng)飄動(dòng)故事感好強(qiáng)
2024-12-26 16:55:23李蘭迪咬筆蓋動(dòng)圖