DeepSeek不僅完全開源,,還放出了詳細(xì)的技術(shù)報(bào)告,,并開源了最大671B R1模型及多個(gè)尺寸的蒸餾模型,,采用寬松的MIT License協(xié)議,,允許任何人免費(fèi)使用、修改,、分發(fā),,包括商業(yè)用途。這種開放性使其受到廣泛支持,,被譽(yù)為真正的OpenAI,。
DeepSeek的訓(xùn)練成本也出乎意料地低,總訓(xùn)練成本僅為557.6萬美元,。這使得其在大模型市場上的邏輯發(fā)生了根本變化,,過去認(rèn)為非常燒錢的事情現(xiàn)在變得不再那么昂貴。此外,,DeepSeek模型性能強(qiáng)大,在某些評(píng)測中甚至超越了GPT-4o和o1,??紤]到其免費(fèi)使用和低廉的API價(jià)格,綜合用戶成本來看,,體驗(yàn)達(dá)到T1級(jí)別,。
DeepSeek來自幻方量化而非傳統(tǒng)互聯(lián)網(wǎng)大廠,更具理想主義氣息,。創(chuàng)始人梁文鋒近期備受關(guān)注,,他的言論被逐字解讀,增加了討論熱度,。相比之下,,DeepSeek商業(yè)氣息較少,更像是一個(gè)小而美的研究機(jī)構(gòu),。
美國明確表示要挑起AI競賽,,特朗普宣布5000億美元投資星際之門計(jì)劃,意圖遏制中國AI發(fā)展,。在這種背景下,,中國企業(yè)推出DeepSeek,對國內(nèi)來說是振奮人心的消息,。DeepSeek不僅降低了訓(xùn)練成本,,還在一定程度上削弱了對高性能顯卡的依賴,這對美國來說難以接受,。未來,,全世界的工程師可能會(huì)從Qwen和DeepSeek開始學(xué)習(xí)大模型,或許這將是中國公司首次掌握互聯(lián)網(wǎng)基建標(biāo)準(zhǔn)的機(jī)會(huì),。