OpenAI新模型草莓將接近博士水平認(rèn)知躍升,，挑戰(zhàn)復(fù)雜推理

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2024-09-13 10:51:00 每日經(jīng)濟(jì)新聞

在周五凌晨1點左右，AI領(lǐng)域邁入了一個新紀(jì)元,，隨著能夠執(zhí)行復(fù)雜推理任務(wù)的大規(guī)模模型的面世,。OpenAI官方宣布,，向其訂閱用戶正式推出OpenAI o1預(yù)覽模型,，這一備受矚目的模型被稱為“草莓”大模型,。OpenAI強調(diào),，這款新模型在處理復(fù)雜推理任務(wù)上達(dá)到了人工智能的新高度,，因此它被賦予了一個區(qū)別于“GPT-4”系列的獨有命名,，標(biāo)志著技術(shù)的重新計數(shù)與革新。

與以往模型依賴于學(xué)習(xí)數(shù)據(jù)模式來預(yù)測文本生成不同,，o1模型在回答問題前會進(jìn)行深入的思考,，模擬人類的思考過程。當(dāng)前，OpenAI僅釋出了o1-preview和o1-mini兩個版本,，并逐步向不同類型的用戶群體推廣,，值得注意的是，開發(fā)者使用該模型的成本相對較高,。

據(jù)透露,，o1模型的訓(xùn)練方式有了根本性變革，使其能夠高效解決編程,、數(shù)學(xué)及科學(xué)難題,，并以超乎人類的速度提供經(jīng)過深思熟慮的答案。o1-mini版則專注于編程應(yīng)用,，更為精簡,。從即時起，ChatGPT Plus和Team的付費用戶可選擇體驗這兩個模型,，而Enterprise和Edu用戶需等待至下周,。未來，免費用戶也將有機會接觸o1-mini,。OpenAI正探索自動為用戶提供最適合模型的方法,。

然而，對于開發(fā)者而言,，o1模型的使用成本高昂,，其API費用相比GPT-4o提升了三到四倍，每百萬個輸入或輸出token的費用分別達(dá)到15美元和60美元,，這反映了處理大規(guī)模文本的高成本,。

OpenAI的研究負(fù)責(zé)人Jerry Tworek揭示了o1模型訓(xùn)練方式的根本變化：它采用了新的優(yōu)化算法和定制的數(shù)據(jù)集，包含“推理數(shù)據(jù)”及特選的科學(xué)文獻(xiàn),。此外,，o1放棄了傳統(tǒng)模仿模式的訓(xùn)練方法，轉(zhuǎn)而采取“強化學(xué)習(xí)”,，通過獎勵和懲罰機制引導(dǎo)模型自我解決問題，并通過“思路鏈”進(jìn)行問題處理,，類似于人類的邏輯推理過程,。這一創(chuàng)新旨在提升模型的準(zhǔn)確性，減少不實回答,，盡管還不能完全避免“幻覺”現(xiàn)象,。

OpenAI視o1模型為實現(xiàn)AI從“高中生”到“理科博士生”智能飛躍的關(guān)鍵步驟，它在解決復(fù)雜推理問題上的能力超越了現(xiàn)有的大模型,，并能有效改進(jìn)機制性缺陷,。例如，o1模型能夠精確計算單詞中的字母數(shù)量,，或在編程問題中展現(xiàn)出更系統(tǒng)化的解題思路,，通過不斷試錯優(yōu)化答案,，提高了生成內(nèi)容的準(zhǔn)確性和質(zhì)量。

盡管如此,，o1預(yù)覽版仍存在一些限制,，如無法瀏覽實時網(wǎng)頁、上傳文件或圖片,，以及在某些領(lǐng)域的知識掌握上不如GPT-4o全面,。此外，它在處理某些問題時速度較慢,，且由于是純文本模型,，缺乏動態(tài)信息處理能力。OpenAI也承認(rèn),，新模型在某些情況下可能更容易產(chǎn)生“幻覺”,，即錯誤地自信給出答案，而不承認(rèn)對問題的無知,。為了保持競爭優(yōu)勢,，他們選擇在答案中展示思路鏈的摘要而非完整鏈條。

(責(zé)任編輯：張小花 TT1000)

關(guān)閉

OpenAI新模型草莓將接近博士水平 認(rèn)知躍升,，挑戰(zhàn)復(fù)雜推理

相關(guān)新聞

今日熱點

頻道熱點

OpenAI新模型草莓將接近博士水平認(rèn)知躍升,，挑戰(zhàn)復(fù)雜推理