DeepSeek R1強(qiáng)在哪兒性價(jià)比路線玩轉(zhuǎn)AI競(jìng)技場(chǎng)

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-02-01 12:39:25 澎湃新聞

經(jīng)過一系列測(cè)試,，從創(chuàng)意寫作到復(fù)雜的教學(xué),，DeepSeek-R1 的綜合實(shí)力能夠與 OpenAI 的付費(fèi)高端模型相媲美,。這表明即使采取性價(jià)比路線,，也能在 AI 競(jìng)技場(chǎng)中取得優(yōu)異表現(xiàn),。

DeepSeek 發(fā)布其開放權(quán)重的 R1 推理模型僅一周時(shí)間,，便多次震驚海內(nèi)外,。不僅訓(xùn)練成本僅為 OpenAI 最先進(jìn)模型的一小部分,，性能還能與其媲美,。為了驗(yàn)證其實(shí)用性,，科技媒體資深編輯決定將 DeepSeek 的 R1 模型與 OpenAI 的 ChatGPT 模型進(jìn)行對(duì)比,，重點(diǎn)在于模擬用戶可能提出的日常問題。

測(cè)試中,，DeepSeek 的每個(gè)回答都與 ChatGPT 的 20 美元/月的 o1 模型和 200 美元/月的 o1 Pro 模型進(jìn)行對(duì)比,。測(cè)試涵蓋創(chuàng)意寫作、數(shù)學(xué),、指令遵循等領(lǐng)域,，并考慮了模型回答的正確性和主觀質(zhì)量因素。結(jié)果顯示,，在八項(xiàng)測(cè)試中,，DeepSeek：o1：o1 Pro 的比拼結(jié)果為 5：2：4。

在老爸笑話生成任務(wù)中,，三個(gè)模型都認(rèn)真對(duì)待了原創(chuàng)要求,。盡管有一些笑話在網(wǎng)上能找到類似例子，但總體上 DeepSeek R1 表現(xiàn)更出色,，尤其是自行車笑話和吸塵器樂隊(duì)笑話,。

關(guān)于亞伯拉罕·林肯發(fā)明籃球的故事創(chuàng)作，DeepSeek R1 以荒誕方式回應(yīng),，加入了許多有趣細(xì)節(jié),，贏得了團(tuán)隊(duì)青睞。而 ChatGPT o1 和 o1 Pro 則較為傳統(tǒng),，盡管后者嘗試了一些創(chuàng)新元素,。

另類藏頭詩(shī)任務(wù)中，DeepSeek R1 和 ChatGPT o1 都未能正確理解提示,，使用了每句話的第一個(gè)字母而非第二個(gè)字母,。只有 ChatGPT o1 Pro 成功完成了任務(wù)。

歷史顏色命名問題上,，三個(gè)模型都正確指出了“品紅”名稱的由來及其相關(guān)背景,。ChatGPT o1 Pro 在風(fēng)格上略勝一籌，提供了簡(jiǎn)潔且詳細(xì)的解釋,。

在挑戰(zhàn)巨型質(zhì)數(shù)的任務(wù)中,，DeepSeek R1 是唯一一個(gè)給出精確答案的模型，引用了公開計(jì)算結(jié)果,。而 ChatGPT 模型則表示沒有權(quán)威項(xiàng)目定位過該數(shù)值,，只能估算大致范圍。

趕飛機(jī)的時(shí)間表制定任務(wù)中,，三款模型都算對(duì)了基礎(chǔ)時(shí)間,。DeepSeek R1 提供了更多實(shí)用建議，如提前準(zhǔn)備行李和早餐,，并強(qiáng)調(diào)了交通延誤的風(fēng)險(xiǎn),。

追蹤球的下落任務(wù)中，所有模型都能正確推理出球的位置,。DeepSeek R1 特別指出杯子無密封蓋這一前提,，增加了趣味性。

復(fù)數(shù)集合測(cè)試中,，三個(gè)模型均生成了有效回答,，但 DeepSeek R1 在計(jì)算總位數(shù)時(shí)出現(xiàn)錯(cuò)誤。最終兩款 ChatGPT 模型因未出現(xiàn)算術(shù)錯(cuò)誤而勝出,。

DeepSeek-R1 展現(xiàn)了強(qiáng)大的綜合實(shí)力,，尤其是在某些特定任務(wù)中表現(xiàn)出色。這證明了通過正確的策略,，性價(jià)比高的方法同樣可以在 AI 競(jìng)技場(chǎng)中脫穎而出,。

(責(zé)任編輯：張蕾)

關(guān)閉

DeepSeek R1強(qiáng)在哪兒 性價(jià)比路線玩轉(zhuǎn)AI競(jìng)技場(chǎng)

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)

DeepSeek R1強(qiáng)在哪兒性價(jià)比路線玩轉(zhuǎn)AI競(jìng)技場(chǎng)