在周五凌晨1點左右,AI領(lǐng)域邁入了一個新紀(jì)元,,隨著能夠執(zhí)行復(fù)雜推理任務(wù)的大規(guī)模模型的面世,。OpenAI官方宣布,,向其訂閱用戶正式推出OpenAI o1預(yù)覽模型,,這一備受矚目的模型被稱為“草莓”大模型,。OpenAI強調(diào),,這款新模型在處理復(fù)雜推理任務(wù)上達(dá)到了人工智能的新高度,,因此它被賦予了一個區(qū)別于“GPT-4”系列的獨有命名,,標(biāo)志著技術(shù)的重新計數(shù)與革新。
與以往模型依賴于學(xué)習(xí)數(shù)據(jù)模式來預(yù)測文本生成不同,,o1模型在回答問題前會進(jìn)行深入的思考,,模擬人類的思考過程。當(dāng)前,OpenAI僅釋出了o1-preview和o1-mini兩個版本,,并逐步向不同類型的用戶群體推廣,,值得注意的是,開發(fā)者使用該模型的成本相對較高,。
據(jù)透露,,o1模型的訓(xùn)練方式有了根本性變革,使其能夠高效解決編程,、數(shù)學(xué)及科學(xué)難題,,并以超乎人類的速度提供經(jīng)過深思熟慮的答案。o1-mini版則專注于編程應(yīng)用,,更為精簡,。從即時起,ChatGPT Plus和Team的付費用戶可選擇體驗這兩個模型,,而Enterprise和Edu用戶需等待至下周,。未來,免費用戶也將有機會接觸o1-mini,。OpenAI正探索自動為用戶提供最適合模型的方法,。
然而,對于開發(fā)者而言,,o1模型的使用成本高昂,,其API費用相比GPT-4o提升了三到四倍,每百萬個輸入或輸出token的費用分別達(dá)到15美元和60美元,,這反映了處理大規(guī)模文本的高成本,。
OpenAI的研究負(fù)責(zé)人Jerry Tworek揭示了o1模型訓(xùn)練方式的根本變化:它采用了新的優(yōu)化算法和定制的數(shù)據(jù)集,包含“推理數(shù)據(jù)”及特選的科學(xué)文獻(xiàn),。此外,,o1放棄了傳統(tǒng)模仿模式的訓(xùn)練方法,轉(zhuǎn)而采取“強化學(xué)習(xí)”,,通過獎勵和懲罰機制引導(dǎo)模型自我解決問題,并通過“思路鏈”進(jìn)行問題處理,,類似于人類的邏輯推理過程,。這一創(chuàng)新旨在提升模型的準(zhǔn)確性,減少不實回答,,盡管還不能完全避免“幻覺”現(xiàn)象,。
OpenAI視o1模型為實現(xiàn)AI從“高中生”到“理科博士生”智能飛躍的關(guān)鍵步驟,它在解決復(fù)雜推理問題上的能力超越了現(xiàn)有的大模型,,并能有效改進(jìn)機制性缺陷,。例如,o1模型能夠精確計算單詞中的字母數(shù)量,,或在編程問題中展現(xiàn)出更系統(tǒng)化的解題思路,,通過不斷試錯優(yōu)化答案,,提高了生成內(nèi)容的準(zhǔn)確性和質(zhì)量。
盡管如此,,o1預(yù)覽版仍存在一些限制,,如無法瀏覽實時網(wǎng)頁、上傳文件或圖片,,以及在某些領(lǐng)域的知識掌握上不如GPT-4o全面,。此外,它在處理某些問題時速度較慢,,且由于是純文本模型,,缺乏動態(tài)信息處理能力。OpenAI也承認(rèn),,新模型在某些情況下可能更容易產(chǎn)生“幻覺”,,即錯誤地自信給出答案,而不承認(rèn)對問題的無知,。為了保持競爭優(yōu)勢,,他們選擇在答案中展示思路鏈的摘要而非完整鏈條。
5月14日深夜,,美國OpenAI公司舉辦線上“春季更新”活動,揭曉兩大核心內(nèi)容:發(fā)布最新旗艦?zāi)P虶PT-4o及在ChatGPT服務(wù)中增添多項免費功能
2024-05-14 07:49:16OpenAI新模型:絲滑如真人在周二凌晨1點的春季發(fā)布會上,,OpenAI繼“文生視頻模型”Sora后再次為市場帶來新驚喜
2024-05-14 09:07:05OpenAI新模型:圖文音頻全搞定