DeepSeek R1的成本遠(yuǎn)低于同類模型,。去年12月發(fā)布的DeepSeek-V3開源基礎(chǔ)模型,,性能對標(biāo)GPT-4o,,但訓(xùn)練成本僅為約557.6萬美元,。相比之下,,GPT-4o模型的訓(xùn)練成本約為1億美元,。DeepSeek R1每百萬輸入tokens的價格為1~4元人民幣,,每百萬輸出tokens為16元人民幣,,而OpenAI o1的運(yùn)行成本約為其30倍,。
DeepSeek R1的成功引發(fā)了廣泛關(guān)注,,包括斯坦福大學(xué)計算機(jī)科學(xué)系客座教授吳恩達(dá)和微軟董事長兼CEO薩提亞·納德拉在內(nèi)的多位大佬都對其表示關(guān)注。DeepSeek團(tuán)隊(duì)主要由年輕人才組成,,專注于模型研究而不考慮商業(yè)變現(xiàn),。公司選擇了一條理想主義路徑,只做基礎(chǔ)模型研究,,不急于商業(yè)化,。
DeepSeek R1已成為開源社區(qū)Hugging Face上下載量最高的大模型之一,下載量超過10萬次,。Meta AI首席科學(xué)家楊立昆認(rèn)為,,這證明開源模型正在超越專有模型,。DeepSeek未來計劃繼續(xù)開源旗艦?zāi)P停苿娱_源生態(tài)發(fā)展,。
DeepSeek的成功讓一些初創(chuàng)公司轉(zhuǎn)向其API,,因?yàn)槠鋬r格更具吸引力。字節(jié)跳動,、阿里通義以及智譜,、Kimi等團(tuán)隊(duì)也在積極研究DeepSeek。雷軍甚至挖來了DeepSeek的關(guān)鍵開發(fā)者羅福莉,,以增強(qiáng)小米的大模型團(tuán)隊(duì),。國內(nèi)大模型公司面臨壓力,如果不能快速跟進(jìn)R1級別的模型效果,,客戶可能會流失,。
短短一個月內(nèi),中國AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-27 08:21:32DeepSeek大模型強(qiáng)在哪