在周五凌晨1點(diǎn)左右,,AI領(lǐng)域邁入了一個(gè)新紀(jì)元,,隨著能夠執(zhí)行復(fù)雜推理任務(wù)的大規(guī)模模型的面世。OpenAI官方宣布,,向其訂閱用戶正式推出OpenAI o1預(yù)覽模型,,這一備受矚目的模型被稱為“草莓”大模型。OpenAI強(qiáng)調(diào),,這款新模型在處理復(fù)雜推理任務(wù)上達(dá)到了人工智能的新高度,,因此它被賦予了一個(gè)區(qū)別于“GPT-4”系列的獨(dú)有命名,標(biāo)志著技術(shù)的重新計(jì)數(shù)與革新,。
與以往模型依賴于學(xué)習(xí)數(shù)據(jù)模式來(lái)預(yù)測(cè)文本生成不同,,o1模型在回答問題前會(huì)進(jìn)行深入的思考,模擬人類的思考過程,。當(dāng)前,,OpenAI僅釋出了o1-preview和o1-mini兩個(gè)版本,并逐步向不同類型的用戶群體推廣,,值得注意的是,,開發(fā)者使用該模型的成本相對(duì)較高。
據(jù)透露,,o1模型的訓(xùn)練方式有了根本性變革,,使其能夠高效解決編程、數(shù)學(xué)及科學(xué)難題,,并以超乎人類的速度提供經(jīng)過深思熟慮的答案,。o1-mini版則專注于編程應(yīng)用,更為精簡(jiǎn),。從即時(shí)起,,ChatGPT Plus和Team的付費(fèi)用戶可選擇體驗(yàn)這兩個(gè)模型,而Enterprise和Edu用戶需等待至下周,。未來(lái),,免費(fèi)用戶也將有機(jī)會(huì)接觸o1-mini,。OpenAI正探索自動(dòng)為用戶提供最適合模型的方法。
然而,,對(duì)于開發(fā)者而言,,o1模型的使用成本高昂,其API費(fèi)用相比GPT-4o提升了三到四倍,,每百萬(wàn)個(gè)輸入或輸出token的費(fèi)用分別達(dá)到15美元和60美元,,這反映了處理大規(guī)模文本的高成本。
OpenAI的研究負(fù)責(zé)人Jerry Tworek揭示了o1模型訓(xùn)練方式的根本變化:它采用了新的優(yōu)化算法和定制的數(shù)據(jù)集,,包含“推理數(shù)據(jù)”及特選的科學(xué)文獻(xiàn)。此外,,o1放棄了傳統(tǒng)模仿模式的訓(xùn)練方法,,轉(zhuǎn)而采取“強(qiáng)化學(xué)習(xí)”,通過獎(jiǎng)勵(lì)和懲罰機(jī)制引導(dǎo)模型自我解決問題,,并通過“思路鏈”進(jìn)行問題處理,,類似于人類的邏輯推理過程。這一創(chuàng)新旨在提升模型的準(zhǔn)確性,,減少不實(shí)回答,,盡管還不能完全避免“幻覺”現(xiàn)象。
OpenAI視o1模型為實(shí)現(xiàn)AI從“高中生”到“理科博士生”智能飛躍的關(guān)鍵步驟,,它在解決復(fù)雜推理問題上的能力超越了現(xiàn)有的大模型,,并能有效改進(jìn)機(jī)制性缺陷。例如,,o1模型能夠精確計(jì)算單詞中的字母數(shù)量,,或在編程問題中展現(xiàn)出更系統(tǒng)化的解題思路,通過不斷試錯(cuò)優(yōu)化答案,,提高了生成內(nèi)容的準(zhǔn)確性和質(zhì)量,。
盡管如此,o1預(yù)覽版仍存在一些限制,,如無(wú)法瀏覽實(shí)時(shí)網(wǎng)頁(yè),、上傳文件或圖片,以及在某些領(lǐng)域的知識(shí)掌握上不如GPT-4o全面,。此外,,它在處理某些問題時(shí)速度較慢,且由于是純文本模型,,缺乏動(dòng)態(tài)信息處理能力,。OpenAI也承認(rèn),新模型在某些情況下可能更容易產(chǎn)生“幻覺”,,即錯(cuò)誤地自信給出答案,,而不承認(rèn)對(duì)問題的無(wú)知,。為了保持競(jìng)爭(zhēng)優(yōu)勢(shì),他們選擇在答案中展示思路鏈的摘要而非完整鏈條,。
在周二凌晨1點(diǎn)的春季發(fā)布會(huì)上,,OpenAI繼“文生視頻模型”Sora后再次為市場(chǎng)帶來(lái)新驚喜
2024-05-14 09:07:05OpenAI新模型:圖文音頻全搞定