AI圈的頭條被DeepSeek占據(jù)多日,,直到OpenAI推出了全新的推理模型系列o3-mini。這次不僅向免費(fèi)用戶開放了推理模型,,而且成本相比之前的o1系列降低了15倍,。OpenAI表示這是其推理模型系列中最新、最具成本效益的模型,。
新模型上線后,,網(wǎng)友們迅速將其與國(guó)產(chǎn)大模型DeepSeek R1進(jìn)行對(duì)比。此前,,AI社區(qū)熱衷于用DeepSeek R1和其他模型進(jìn)行編程挑戰(zhàn),,比如編寫一個(gè)Python腳本,讓球在某個(gè)形狀內(nèi)彈跳并保持在形狀內(nèi),。這種任務(wù)需要模型識(shí)別物體間的碰撞,,并確保物理效果準(zhǔn)確。
在這項(xiàng)測(cè)試中,,DeepSeek R1曾表現(xiàn)出色,甚至超過了OpenAI的o1 pro,。不過,,隨著o3-mini的推出,,情況發(fā)生了變化,。有帖子聲稱o3-mini在某些方面超越了DeepSeek R1,引發(fā)了大量網(wǎng)友關(guān)注,。
例如,在一個(gè)開發(fā)者發(fā)布的測(cè)試中,,要求兩個(gè)模型分別編寫一個(gè)球在旋轉(zhuǎn)六邊形內(nèi)彈跳的Python程序,,小球需受重力和摩擦力影響。結(jié)果顯示,,o3-mini對(duì)碰撞和彈跳的處理更為出色,,而DeepSeek R1的小球似乎不受重力控制。