OpenAI于9月13日宣布了一項(xiàng)名為“OpenAI o1”的新推理模型系列的推出。此系列旨在處理復(fù)雜問(wèn)題,,通過(guò)深入思考和細(xì)致推理,,應(yīng)對(duì)科學(xué)、編程及數(shù)據(jù)領(lǐng)域的難題,。作為預(yù)覽,,OpenAI首先在ChatGPT和API接口上推出了OpenAI o1-preview。該公司認(rèn)為,,這一進(jìn)展標(biāo)志著人工智能推理能力的新紀(jì)元,,因此將模型命名重啟,以“OpenAI o1”為系列名稱,。
OpenAI o1系列包含三個(gè)版本:o1-preview,、o1及o1-mini。其中,,o1-mini設(shè)計(jì)為快速,、低成本的解決方案,適合無(wú)需廣泛背景知識(shí)的推理應(yīng)用,,價(jià)格較o1-preview低80%,。這些模型經(jīng)過(guò)特別訓(xùn)練,能自我修正思考方式,,識(shí)別并糾正錯(cuò)誤,,其表現(xiàn)可媲美博士生在高難度的物理、化學(xué)和生物任務(wù)上的成績(jī),。它們?cè)跀?shù)學(xué)競(jìng)賽和編程挑戰(zhàn)中亦展示出卓越性能,,如在國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽資格考中取得83%的分?jǐn)?shù),,大幅超越GPT-4o的13%正確率。
通過(guò)大規(guī)模強(qiáng)化學(xué)習(xí),,模型學(xué)會(huì)了利用思維鏈進(jìn)行高效思考,,如同人類面對(duì)難題時(shí)的深思熟慮。隨著時(shí)間與學(xué)習(xí)的深入,,o1的推理能力不斷提升,,能夠靈活調(diào)整策略,尤其在傳統(tǒng)方法失效時(shí)尋找替代方案,。
盡管o1系列在特定復(fù)雜問(wèn)題上展現(xiàn)出巨大潛力,,如輔助科研和編程任務(wù),但目前在日常應(yīng)用如文本編輯上,,GPT-4o仍更為實(shí)用,。OpenAI的研究員Noam Brown指出,o1的真正價(jià)值在于其長(zhǎng)期思考的能力,,未來(lái)模型有望延長(zhǎng)思考時(shí)間至數(shù)小時(shí)乃至數(shù)周,,盡管成本提高,卻可能帶來(lái)如癌癥藥物研發(fā)等領(lǐng)域的突破,。
新模型的體驗(yàn)?zāi)壳跋抻诓糠钟脩?,包括ChatGPT Plus和Team用戶,以及即將加入的企教用戶,。OpenAI計(jì)劃逐步開放訪問(wèn),,并增加瀏覽、文件圖片上傳功能,,同時(shí)繼續(xù)發(fā)展GPT系列其他模型,。安全性方面,,新模型的思維鏈推理機(jī)制為監(jiān)控和確保安全提供了新途徑,,公司也正與國(guó)際安全機(jī)構(gòu)合作,提前評(píng)估和測(cè)試模型,,以保障公開發(fā)布前后的安全可控性,。OpenAI發(fā)布最強(qiáng)水平大模型!