1月27日,由杭州深度求索開(kāi)發(fā)的Deepseek應(yīng)用登上蘋(píng)果中國(guó)地區(qū)和美國(guó)地區(qū)應(yīng)用商店免費(fèi)APP下載排行榜榜首,,在美區(qū)下載榜上超越了ChatGPT。
Deepseek來(lái)自量化巨頭幻方量化旗下的大模型公司,。1月20日,該公司正式發(fā)布了推理大模型DeepSeek-R1,。這款模型因其性?xún)r(jià)比高,,在海外開(kāi)發(fā)者社區(qū)中引起了廣泛關(guān)注。作為一款開(kāi)源模型,,R1在數(shù)學(xué),、代碼、自然語(yǔ)言推理等任務(wù)上的性能與OpenAI的模型相當(dāng),,并采用MIT許可協(xié)議,,支持免費(fèi)商用、任意修改和衍生開(kāi)發(fā),。目前,,在國(guó)外大模型排名榜Chatbot Arena上,DeepSeek-R1的基準(zhǔn)測(cè)試排名已經(jīng)升至全類(lèi)別大模型第三,,與OpenAI的最新版ChatGPT-4并列,,并在風(fēng)格控制類(lèi)模型分類(lèi)中與OpenAI的模型并列第一。
更令人驚訝的是,,據(jù)DeepSeek介紹,,R1的預(yù)訓(xùn)練費(fèi)用僅為557.6萬(wàn)美元,在2048塊英偉達(dá)H800 GPU集群上運(yùn)行55天完成,,僅是OpenAI GPT-4模型訓(xùn)練成本的不到十分之一,。DeepSeek表示,R1在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù),,在僅有極少標(biāo)注數(shù)據(jù)的情況下,,極大提升了模型推理能力。此外,,DeepSeek不僅將R1訓(xùn)練技術(shù)全部公開(kāi),,還蒸餾了6個(gè)小模型向社區(qū)開(kāi)源,允許用戶(hù)借此訓(xùn)練其他模型,。
英偉達(dá)高級(jí)研究科學(xué)家Jim Fan認(rèn)為,,DeepSeek-R1可能是首個(gè)展示了強(qiáng)化學(xué)習(xí)飛輪可以發(fā)揮作用且能帶來(lái)持續(xù)增長(zhǎng)的開(kāi)源軟件項(xiàng)目?!帮w輪”用來(lái)形容AI系統(tǒng)中自我強(qiáng)化,、正向循環(huán)的過(guò)程,。DeepSeek的論文顯示,,不同于過(guò)去AI模型往往依賴(lài)于監(jiān)督微調(diào),,R1完全由強(qiáng)化學(xué)習(xí)驅(qū)動(dòng),證明了直接強(qiáng)化學(xué)習(xí)是可行的,。
Jim Fan寫(xiě)道,,我們正處于一個(gè)奇特的時(shí)間線(xiàn)上,一家非美國(guó)公司正在踐行OpenAI最初的使命,,即實(shí)現(xiàn)真正開(kāi)放的前沿研究并讓所有人受益,。這種情況簡(jiǎn)直無(wú)法理解,但最有娛樂(lè)性的結(jié)果卻是可能性最大的結(jié)果,。
DeepSeek掀起的大模型旋風(fēng)在中美兩地愈演愈烈,。1月27日,蘋(píng)果App Store中國(guó)區(qū)免費(fèi)榜顯示,,DeepSeek登上首位
2025-01-28 03:14:39DeepSeek在美區(qū)下載榜超越ChatGPT