OpenAI在“雙十二”第一天宣布了重大更新,推出了最強(qiáng)推理模型o1的滿血版及其Pro版本,。同時(shí),ChatGPT也推出了每月200美元的Pro訂閱計(jì)劃,成為“世界最貴的大模型”,。
CEO奧特曼與三名員工圍坐在桌前,一邊演示一邊介紹新產(chǎn)品的特性,。發(fā)布會(huì)雖然僅持續(xù)不到15分鐘,,但信息量巨大。相比preview版本,,滿血o1在數(shù)學(xué)和代碼能力上大幅提升,,Pro版更進(jìn)一步。滿血版的推理速度比preview快60%,,并且支持多模態(tài)推理,。
滿血版已經(jīng)正式上線ChatGPT,而preview版則從用戶界面中消失,。Pro版是ChatGPT Pro訂閱用戶的特權(quán),,這些用戶還可以獲得o1滿血版的不限量訪問權(quán)限,。
接下來是演示環(huán)節(jié),。團(tuán)隊(duì)用滿血版o1(左邊)和o1-preview(右邊)進(jìn)行了一場(chǎng)競(jìng)速。他們問了一個(gè)關(guān)于二世紀(jì)羅馬皇帝的歷史問題,,滿血版o1在14秒內(nèi)完成回答,,而o1-preview用了33秒。經(jīng)過多次離線測(cè)試,,得出結(jié)論:滿血版o1的平均響應(yīng)速度比o1-preview快60%,。此外,通過一系列人類評(píng)估,,發(fā)現(xiàn)滿血版o1在推理時(shí)犯重大錯(cuò)誤的頻率比o1-preview少了34%,。
滿血o1還支持多模態(tài)輸入,具備視覺推理能力,。團(tuán)隊(duì)展示了一張數(shù)據(jù)中心草圖的照片,,并提問了一些復(fù)雜的問題。盡管故意省略了一個(gè)參數(shù),,滿血版o1依然選擇了正確的參數(shù)范圍,,并通過細(xì)致論證找出了準(zhǔn)確答案,。
團(tuán)隊(duì)還展示了Pro版的表現(xiàn)。面對(duì)一些高難度的生化問題,,Pro版在53秒后給出了答案,,并提供了詳細(xì)的推理過程。盡管Pro版價(jià)格較高,,其性能表現(xiàn)引發(fā)了廣泛關(guān)注,。
團(tuán)隊(duì)提到,后續(xù)將以API形式提供o1模型的一些功能,,包括結(jié)構(gòu)化輸出,、函數(shù)調(diào)用和圖像API等?;顒?dòng)結(jié)束前,,奧特曼講了一個(gè)關(guān)于圣誕老人使用大語言模型解決數(shù)學(xué)問題的笑話。
技術(shù)報(bào)告也在OpenAI官網(wǎng)上線,,展示了o1在數(shù)學(xué),、代碼和博士級(jí)科學(xué)問答上的成績(jī)。報(bào)告還強(qiáng)調(diào)了安全性,,顯示滿血版o1在檢測(cè)有害內(nèi)容和越獄測(cè)試中表現(xiàn)出更強(qiáng)的魯棒性,。
發(fā)布會(huì)之前,有網(wǎng)友從ChatGPT的JS代碼中發(fā)現(xiàn)了Pro版的蛛絲馬跡,,包括200美元的價(jià)格以及o1 pro模式,。此外,代碼中還出現(xiàn)了“GPT-4.5”的字樣,。有網(wǎng)友讓馬斯克的Grok結(jié)合X上的推文預(yù)測(cè)了OpenAI的發(fā)布內(nèi)容,,成功命中了此次發(fā)布的滿血o1。未來是否會(huì)推出更多產(chǎn)品,,值得期待,。