OpenAI發(fā)布最強(qiáng)水平大模型開啟通用復(fù)雜推理新時(shí)代

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2024-09-13 11:36:31 第一財(cái)經(jīng)

OpenAI于9月13日宣布了一項(xiàng)名為“OpenAI o1”的新推理模型系列的推出。此系列旨在處理復(fù)雜問(wèn)題,，通過(guò)深入思考和細(xì)致推理,，應(yīng)對(duì)科學(xué)、編程及數(shù)據(jù)領(lǐng)域的難題,。作為預(yù)覽,，OpenAI首先在ChatGPT和API接口上推出了OpenAI o1-preview。該公司認(rèn)為,，這一進(jìn)展標(biāo)志著人工智能推理能力的新紀(jì)元,，因此將模型命名重啟，以“OpenAI o1”為系列名稱,。

OpenAI o1系列包含三個(gè)版本：o1-preview,、o1及o1-mini。其中,，o1-mini設(shè)計(jì)為快速,、低成本的解決方案，適合無(wú)需廣泛背景知識(shí)的推理應(yīng)用,，價(jià)格較o1-preview低80%,。這些模型經(jīng)過(guò)特別訓(xùn)練，能自我修正思考方式,，識(shí)別并糾正錯(cuò)誤,，其表現(xiàn)可媲美博士生在高難度的物理、化學(xué)和生物任務(wù)上的成績(jī),。它們?cè)跀?shù)學(xué)競(jìng)賽和編程挑戰(zhàn)中亦展示出卓越性能,，如在國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽資格考中取得83%的分?jǐn)?shù),，大幅超越GPT-4o的13%正確率。

通過(guò)大規(guī)模強(qiáng)化學(xué)習(xí),，模型學(xué)會(huì)了利用思維鏈進(jìn)行高效思考,，如同人類面對(duì)難題時(shí)的深思熟慮。隨著時(shí)間與學(xué)習(xí)的深入,，o1的推理能力不斷提升,，能夠靈活調(diào)整策略，尤其在傳統(tǒng)方法失效時(shí)尋找替代方案,。

盡管o1系列在特定復(fù)雜問(wèn)題上展現(xiàn)出巨大潛力,，如輔助科研和編程任務(wù)，但目前在日常應(yīng)用如文本編輯上,，GPT-4o仍更為實(shí)用,。OpenAI的研究員Noam Brown指出，o1的真正價(jià)值在于其長(zhǎng)期思考的能力,，未來(lái)模型有望延長(zhǎng)思考時(shí)間至數(shù)小時(shí)乃至數(shù)周,，盡管成本提高，卻可能帶來(lái)如癌癥藥物研發(fā)等領(lǐng)域的突破,。

新模型的體驗(yàn)?zāi)壳跋抻诓糠钟脩?，包括ChatGPT Plus和Team用戶，以及即將加入的企教用戶,。OpenAI計(jì)劃逐步開放訪問(wèn),，并增加瀏覽、文件圖片上傳功能,，同時(shí)繼續(xù)發(fā)展GPT系列其他模型,。安全性方面,，新模型的思維鏈推理機(jī)制為監(jiān)控和確保安全提供了新途徑,，公司也正與國(guó)際安全機(jī)構(gòu)合作，提前評(píng)估和測(cè)試模型,，以保障公開發(fā)布前后的安全可控性,。OpenAI發(fā)布最強(qiáng)水平大模型！

(責(zé)任編輯：盧其龍 CN070)

關(guān)閉

OpenAI發(fā)布最強(qiáng)水平大模型 開啟通用復(fù)雜推理新時(shí)代

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)

OpenAI發(fā)布最強(qiáng)水平大模型開啟通用復(fù)雜推理新時(shí)代