OpenAI推出GPT4.5研究預(yù)覽版情商更高,、幻覺(jué)更少

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-03-01 01:55:53 新浪財(cái)經(jīng)

OpenAI推出GPT4.5研究預(yù)覽版情商更高,、幻覺(jué)更少,！OpenAI周四在System Card報(bào)告中推出了GPT-4.5的研究預(yù)覽版，這是其迄今最大,、知識(shí)最豐富的模型,。該模型現(xiàn)已向每月訂閱費(fèi)用200美元的ChatGPT Pro用戶開(kāi)放，下周將向每月20美元的ChatGPT Plus用戶開(kāi)放,。OpenAI首席執(zhí)行官Altman表示,，屆時(shí)公司將增加數(shù)萬(wàn)塊GPU，提供算力支撐,。

GPT-4.5在GPT-4的基礎(chǔ)上進(jìn)一步擴(kuò)展了預(yù)訓(xùn)練,，設(shè)計(jì)上比強(qiáng)大的stem推理模型更通用。早期測(cè)試表明,，與GPT-4.5互動(dòng)感覺(jué)更自然,，它擁有更廣泛的知識(shí)庫(kù)，更符合用戶意圖,，情商更高,，適合寫(xiě)作、編程和解決實(shí)際問(wèn)題等任務(wù),，而且幻覺(jué)更少,。例如，在面對(duì)“我考試失敗了,，心情很低落”這樣的輸入時(shí),，GPT-4.5會(huì)先詢(xún)問(wèn)用戶是否想聊聊這個(gè)問(wèn)題，還是需要一些分散注意力的方法,，顯示出更高的情感智能,。早期測(cè)試顯示，GPT-4.5的幻覺(jué)率為37%,，而前代模型GPT-4o的幻覺(jué)率接近60%,。

GPT-4.5最初將作為“研究預(yù)覽版”，提供給一小部分軟件開(kāi)發(fā)者及支付每月200美元訂閱費(fèi)用的ChatGPT Pro用戶,。公司計(jì)劃從首批試用者那里收集反饋,。Altman在X平臺(tái)發(fā)文稱(chēng),，將在下周正式發(fā)布GPT-4.5時(shí)增加數(shù)萬(wàn)塊GPU。自2022年底推出ChatGPT以來(lái),，OpenAI陸續(xù)發(fā)布了多個(gè)日益先進(jìn)的系統(tǒng)，但目前面臨來(lái)自中國(guó)新興企業(yè)DeepSeek,、馬斯克旗下的xAI以及Anthropic等競(jìng)爭(zhēng)對(duì)手的激烈競(jìng)爭(zhēng),。這些公司在近幾周相繼推出了新的AI模型，如Anthropic的Claude 3.7 Sonnet和馬斯克旗下xAI的Grok 3,。

盡管每一代GPT模型的擴(kuò)展都帶來(lái)了跨數(shù)學(xué),、寫(xiě)作和編程等多個(gè)領(lǐng)域的性能提升，但單純依賴(lài)數(shù)據(jù)和計(jì)算能力的擴(kuò)展所帶來(lái)的收益正在逐步減少,。在多個(gè)AI基準(zhǔn)測(cè)試中,，GPT-4.5的表現(xiàn)不及DeepSeek、Anthropic以及OpenAI自身開(kāi)發(fā)的新一代推理模型,。OpenAI研究副總裁Nick Ryder表示,，預(yù)計(jì)GPT-4.5的能力提升幅度將與GPT-3.5升級(jí)至GPT-4時(shí)的變化相當(dāng)。OpenAI強(qiáng)調(diào),，GPT-4.5不是GPT-4o的直接替代品,，后者仍然是公司API和ChatGPT平臺(tái)的主力模型。

從性能上看,，GPT-4.5在多個(gè)方面超過(guò)了GPT-4o及其他許多AI模型,。例如，在OpenAI的SimpleQA基準(zhǔn)測(cè)試中,，GPT-4.5的表現(xiàn)優(yōu)于GPT-4o和OpenAI的推理模型o1,、o3-mini。然而,，在編程能力方面,，GPT-4.5在SWE-Bench Verified基準(zhǔn)測(cè)試上的表現(xiàn)與GPT-4o和o3-mini相當(dāng)，但遜色于OpenAI的deep research和Anthropic的Claude 3.7 Sonnet,。在學(xué)術(shù)基準(zhǔn)測(cè)試如AIME和 GPQA上，GPT-4.5的表現(xiàn)也不及領(lǐng)先的AI推理模型,，但在數(shù)學(xué)和科學(xué)相關(guān)問(wèn)題上仍然處于領(lǐng)先水平,。

打造GPT-4.5的過(guò)程充滿挑戰(zhàn)。彭博新聞此前報(bào)道稱(chēng),，該模型在公司內(nèi)部被稱(chēng)為“Orion”,，但在去年未能達(dá)到OpenAI設(shè)定的性能基準(zhǔn)。為了解決這些問(wèn)題,，GPT-4.5采用了與其前代模型相同的核心技術(shù),，并結(jié)合人類(lèi)反饋來(lái)優(yōu)化回答內(nèi)容,。此外，OpenAI還利用從GPT-4.0訓(xùn)練數(shù)據(jù)中提取的信息來(lái)進(jìn)一步訓(xùn)練GPT-4.5,。分析認(rèn)為,，GPT-4.5的發(fā)布標(biāo)志著OpenAI時(shí)代的一個(gè)轉(zhuǎn)折點(diǎn)。未來(lái),，OpenAI計(jì)劃在今年晚些時(shí)候發(fā)布GPT-5,，將把GPT系列模型與o系列模型結(jié)合，構(gòu)建能夠自主判斷需要思考多久再生成回答的AI系統(tǒng),。目前,，OpenAI正在與軟銀及其他投資者洽談融資，計(jì)劃籌集高達(dá)400億美元,，使其估值達(dá)到3000億美元,。與此同時(shí)，Anthropic也在進(jìn)行一輪約35億美元的融資,，估值超過(guò)600億美元,。

(責(zé)任編輯：盧其龍 CN070)

關(guān)閉

OpenAI推出GPT4.5研究預(yù)覽版 情商更高,、幻覺(jué)更少

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)

OpenAI推出GPT4.5研究預(yù)覽版情商更高,、幻覺(jué)更少