ChatGPT動動嘴就能P圖 GPU壓力山大

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-03-28 12:16:22 每日經(jīng)濟(jì)新聞

隨著OpenAI的圖像生成功能完成重大升級,，新的問題也隨之而來,。OpenAI首席執(zhí)行官薩姆·奧爾特曼表示，ChatGPT的文生圖應(yīng)用需求過高，導(dǎo)致GPU過載,。為解決這一問題，OpenAI將對ChatGPT生成圖片的功能實施臨時限速,，降低單位時間內(nèi)的請求處理量,，以緩解GPU壓力，并優(yōu)先保障文本生成和對話等核心功能的穩(wěn)定性,。

3月25日,，OpenAI宣布正式推出GPT-4o圖像生成功能。該功能迅速走紅,，用戶通過簡單的文字描述或語音指令即可編輯,、修改或生成圖片，無需使用復(fù)雜的圖像編輯工具,。這種技術(shù)結(jié)合了自然語言處理與圖像生成,，大大降低了圖片編輯的門檻。GPT-4o是一個多模態(tài)AI模型,，能夠接受文本,、音頻和圖像的組合輸入，并生成相應(yīng)的圖像輸出,。

GPT-4o圖像生成功能具備四大核心優(yōu)勢：精準(zhǔn)文本渲染,、嚴(yán)格指令遵循,、深度知識調(diào)用及創(chuàng)意拓展能力。測試表明,，GPT-4o在生成帶有英文內(nèi)容的照片時表現(xiàn)良好,，但在處理中文字符時仍有待提升。通過多輪對話優(yōu)化圖像時,，GPT-4o展現(xiàn)了強大的上下文連貫性,。例如，在生成一只戴著黑色墨鏡的老虎后,，進(jìn)一步要求戴上偵探帽并生成游戲場景,，GPT-4o成功實現(xiàn)了這一復(fù)雜指令。此外,，GPT-4o還能應(yīng)對包含多個不同物體的復(fù)雜網(wǎng)格圖生成任務(wù),，盡管存在一些指令缺失的情況。

在實用性測試中,，GPT-4o生成的傳統(tǒng)中式風(fēng)格餐廳菜單和科學(xué)示意圖也表現(xiàn)出色,。盡管存在不足，GPT-4o圖像生成功能的革新性依然顯著,，為創(chuàng)意設(shè)計,、教育教學(xué)、游戲開發(fā)等領(lǐng)域提供了強大工具,。薩姆·奧爾特曼稱,，這一功能標(biāo)志著“創(chuàng)作自由的新高點”，用戶將借此釋放更多視覺創(chuàng)意潛能,。

作為AI領(lǐng)域的頭部玩家,，OpenAI背后的GPU儲備是業(yè)內(nèi)頂尖水準(zhǔn)。微軟作為OpenAI的主要投資者,，在2024年購買了大量英偉達(dá)的Hopper芯片,，使OpenAI的大模型得以在Azure云基礎(chǔ)設(shè)施上進(jìn)行訓(xùn)練。新功能面臨的問題反映了AI多模態(tài)技術(shù)發(fā)展中資源與需求平衡的挑戰(zhàn),。

OpenAI計劃在未來幾個月內(nèi)推出GPT-5,，集成多項技術(shù)，包括推理模型o3的技術(shù),。此前,，OpenAI內(nèi)部代號為“獵戶座”的GPT-5項目已持續(xù)近兩年，但目前進(jìn)度嚴(yán)重滯后,。每次大型訓(xùn)練都需要數(shù)月時間處理大量數(shù)據(jù),，目的是讓“獵戶座”變得更聰明。然而，該項目仍面臨諸多挑戰(zhàn),。

研究機構(gòu)Gartner預(yù)測,，到2026年，多模態(tài)生成模型的商業(yè)價值將占AI市場的45%,。隨著谷歌與微軟等巨頭的持續(xù)投入，生成式AI正從通用工具向產(chǎn)業(yè)基礎(chǔ)設(shè)施演變,，但其社會倫理和監(jiān)管框架的完善仍有待探索,。

(責(zé)任編輯：張小花 TT1000)

關(guān)閉

ChatGPT動動嘴就能P圖 GPU壓力山大

相關(guān)新聞

今日熱點

頻道熱點