超越ChatGPT,，這個國產(chǎn)應(yīng)用在美國“登頂”了開源模型引發(fā)轟動

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-01-29 13:50:05 湖南日報

1月27日,，由杭州深度求索開發(fā)的Deepseek應(yīng)用登上蘋果中國地區(qū)和美國地區(qū)應(yīng)用商店免費APP下載排行榜榜首，在美區(qū)下載榜上超越了ChatGPT,。

Deepseek來自量化巨頭幻方量化旗下的大模型公司,。1月20日，該公司正式發(fā)布了推理大模型DeepSeek-R1,。這款模型因其性價比高,，在海外開發(fā)者社區(qū)中引起了廣泛關(guān)注,。作為一款開源模型，R1在數(shù)學(xué),、代碼,、自然語言推理等任務(wù)上的性能與OpenAI的模型相當(dāng)，并采用MIT許可協(xié)議,，支持免費商用,、任意修改和衍生開發(fā)。目前,，在國外大模型排名榜Chatbot Arena上,，DeepSeek-R1的基準(zhǔn)測試排名已經(jīng)升至全類別大模型第三，與OpenAI的最新版ChatGPT-4并列,，并在風(fēng)格控制類模型分類中與OpenAI的模型并列第一,。

更令人驚訝的是，據(jù)DeepSeek介紹,，R1的預(yù)訓(xùn)練費用僅為557.6萬美元,，在2048塊英偉達H800 GPU集群上運行55天完成，僅是OpenAI GPT-4模型訓(xùn)練成本的不到十分之一,。DeepSeek表示,，R1在后訓(xùn)練階段大規(guī)模使用了強化學(xué)習(xí)技術(shù)，在僅有極少標(biāo)注數(shù)據(jù)的情況下,，極大提升了模型推理能力,。此外，DeepSeek不僅將R1訓(xùn)練技術(shù)全部公開,，還蒸餾了6個小模型向社區(qū)開源,，允許用戶借此訓(xùn)練其他模型。

英偉達高級研究科學(xué)家Jim Fan認(rèn)為,，DeepSeek-R1可能是首個展示了強化學(xué)習(xí)飛輪可以發(fā)揮作用且能帶來持續(xù)增長的開源軟件項目,。“飛輪”用來形容AI系統(tǒng)中自我強化,、正向循環(huán)的過程,。DeepSeek的論文顯示，不同于過去AI模型往往依賴于監(jiān)督微調(diào),，R1完全由強化學(xué)習(xí)驅(qū)動,，證明了直接強化學(xué)習(xí)是可行的。

Jim Fan寫道,，我們正處于一個奇特的時間線上,，一家非美國公司正在踐行OpenAI最初的使命，即實現(xiàn)真正開放的前沿研究并讓所有人受益,。這種情況簡直無法理解,，但最有娛樂性的結(jié)果卻是可能性最大的結(jié)果,。

(責(zé)任編輯：張蕾)

關(guān)閉

超越ChatGPT,，這個國產(chǎn)應(yīng)用在美國“登頂”了 開源模型引發(fā)轟動

相關(guān)新聞

今日熱點

頻道熱點

超越ChatGPT,，這個國產(chǎn)應(yīng)用在美國“登頂”了開源模型引發(fā)轟動