類(lèi)似的情況也出現(xiàn)在另一個(gè)測(cè)試中,要求模型模擬一個(gè)球在四維超立方體內(nèi)彈跳,。o3-mini展示了穩(wěn)定的幾何結(jié)構(gòu)和靈活的運(yùn)動(dòng)軌跡,,相比之下,DeepSeek R1的表現(xiàn)則顯得不夠精準(zhǔn),,小球的運(yùn)動(dòng)軌跡有些詭異,。
進(jìn)一步的測(cè)試使用了更復(fù)雜的提示詞,,如編寫(xiě)一個(gè)p5.js腳本,,模擬100個(gè)彩色小球在一個(gè)球體內(nèi)部彈跳。o3-mini完美滿足了所有要求,,而DeepSeek R1雖然表現(xiàn)不錯(cuò),,但仍有改進(jìn)空間。
這些結(jié)果表明,,o3-mini在理解真實(shí)世界的物理規(guī)律方面可能更具優(yōu)勢(shì)。OpenAI也在發(fā)布博客中提到,,o3-mini在科學(xué)問(wèn)題上的表現(xiàn)優(yōu)于前代模型,。對(duì)于大語(yǔ)言模型來(lái)說(shuō),理解和模擬物理狀態(tài)的能力是一個(gè)重要的突破,。