盡管每一代GPT模型的擴(kuò)展都帶來了跨數(shù)學(xué),、寫作和編程等多個(gè)領(lǐng)域的性能提升,,但單純依賴數(shù)據(jù)和計(jì)算能力的擴(kuò)展所帶來的收益正在逐步減少,。在多個(gè)AI基準(zhǔn)測(cè)試中,,GPT-4.5的表現(xiàn)不及DeepSeek,、Anthropic以及OpenAI自身開發(fā)的新一代推理模型,。OpenAI研究副總裁Nick Ryder表示,預(yù)計(jì)GPT-4.5的能力提升幅度將與GPT-3.5升級(jí)至GPT-4時(shí)的變化相當(dāng),。OpenAI強(qiáng)調(diào),,GPT-4.5不是GPT-4o的直接替代品,后者仍然是公司API和ChatGPT平臺(tái)的主力模型,。
從性能上看,,GPT-4.5在多個(gè)方面超過了GPT-4o及其他許多AI模型。例如,,在OpenAI的SimpleQA基準(zhǔn)測(cè)試中,,GPT-4.5的表現(xiàn)優(yōu)于GPT-4o和OpenAI的推理模型o1、o3-mini,。然而,,在編程能力方面,GPT-4.5在SWE-Bench Verified基準(zhǔn)測(cè)試上的表現(xiàn)與GPT-4o和o3-mini相當(dāng),,但遜色于OpenAI的deep research和Anthropic的Claude 3.7 Sonnet,。在學(xué)術(shù)基準(zhǔn)測(cè)試如AIME和 GPQA上,GPT-4.5的表現(xiàn)也不及領(lǐng)先的AI推理模型,,但在數(shù)學(xué)和科學(xué)相關(guān)問題上仍然處于領(lǐng)先水平,。
打造GPT-4.5的過程充滿挑戰(zhàn)。彭博新聞此前報(bào)道稱,,該模型在公司內(nèi)部被稱為“Orion”,,但在去年未能達(dá)到OpenAI設(shè)定的性能基準(zhǔn)。為了解決這些問題,,GPT-4.5采用了與其前代模型相同的核心技術(shù),,并結(jié)合人類反饋來優(yōu)化回答內(nèi)容,。此外,,OpenAI還利用從GPT-4.0訓(xùn)練數(shù)據(jù)中提取的信息來進(jìn)一步訓(xùn)練GPT-4.5。分析認(rèn)為,,GPT-4.5的發(fā)布標(biāo)志著OpenAI時(shí)代的一個(gè)轉(zhuǎn)折點(diǎn),。未來,,OpenAI計(jì)劃在今年晚些時(shí)候發(fā)布GPT-5,將把GPT系列模型與o系列模型結(jié)合,,構(gòu)建能夠自主判斷需要思考多久再生成回答的AI系統(tǒng),。目前,OpenAI正在與軟銀及其他投資者洽談融資,,計(jì)劃籌集高達(dá)400億美元,,使其估值達(dá)到3000億美元。與此同時(shí),,Anthropic也在進(jìn)行一輪約35億美元的融資,,估值超過600億美元。