DeepSeek的壓力最終傳遞到了黃仁勛身上,。英偉達(dá)美股股價(jià)盤(pán)前暴跌近11%,市值縮水超過(guò)3500億美元。資本市場(chǎng)開(kāi)始懷疑,,當(dāng)相對(duì)較少的算力也能實(shí)現(xiàn)與OpenAI相媲美的模型性能時(shí),,高端算力芯片是否正面臨新的泡沫,。
這種擔(dān)憂(yōu)情緒進(jìn)一步推高了DeepSeek的熱度,。短短一周內(nèi),,DeepSeek應(yīng)用在美區(qū)和中國(guó)區(qū)App Store免費(fèi)榜上均位列第一,,這是首次有AI助手類(lèi)產(chǎn)品超越ChatGPT登頂美區(qū)App Store,。由于用戶(hù)激增,DeepSeek在兩天內(nèi)接連出現(xiàn)服務(wù)宕機(jī)現(xiàn)象,,官方解釋稱(chēng)這可能與服務(wù)維護(hù)和請(qǐng)求限制有關(guān),。
新模型DeepSeek R1是引發(fā)這場(chǎng)全球用戶(hù)大討論的直接原因。R1不僅開(kāi)源,,還免費(fèi)供全球用戶(hù)無(wú)限調(diào)用,,打破了大廠(chǎng)間的資本比拼游戲,。相比OpenAI在模型上的閉源及付費(fèi)使用限制,DeepSeek用不到OpenAI十分之一的資源就做出了性能堪比o1的R1,。
Meta擔(dān)心即將發(fā)布的Llama 4在性能上可能無(wú)法趕上DeepSeek R1,。OpenAI CEO奧特曼也感受到了壓力,通過(guò)發(fā)布首個(gè)智能體Operator搶熱度,,并透露即將上線(xiàn)的o3-mini新消息,。
DeepSeek R1在數(shù)學(xué)、代碼,、自然語(yǔ)言推理等任務(wù)上的性能可與OpenAI o1模型正式版媲美,。其創(chuàng)新訓(xùn)練方法如R1-Zero路線(xiàn),直接將強(qiáng)化學(xué)習(xí)應(yīng)用于基礎(chǔ)模型,,無(wú)需依賴(lài)監(jiān)督微調(diào)和已標(biāo)注數(shù)據(jù),。這種方法提高了訓(xùn)練效率,減少了對(duì)人工干預(yù)的依賴(lài),。
短短一個(gè)月內(nèi),中國(guó)AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-27 08:21:32DeepSeek大模型強(qiáng)在哪