短短一個(gè)月內(nèi),,中國(guó)AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1,。這兩款模型成本低廉,,性能與OpenAI相當(dāng),,讓硅谷震驚,,并引發(fā)了Meta內(nèi)部的恐慌,,工程師們開始連夜嘗試復(fù)制DeepSeek的成果,。
Scale AI創(chuàng)始人Alexander Wang在采訪中表示,,DeepSeek在他們的測(cè)試?yán)锉憩F(xiàn)最好,與美國(guó)最好的模型相當(dāng),。他還提到,,DeepSeek-V3是中國(guó)科技界帶給美國(guó)的一個(gè)教訓(xùn),中國(guó)以更低的成本,、更快的速度和更強(qiáng)的實(shí)力追趕上來(lái)。
中國(guó)AI的新進(jìn)展引起了國(guó)外媒體的廣泛關(guān)注,,被視為對(duì)硅谷的一次警鐘,。尤其是在5000億美元的“星際之門”計(jì)劃公布之際,DeepSeek以極低的價(jià)格建立了一個(gè)突破性的AI模型,,而且沒(méi)有使用尖端芯片,,這引發(fā)了人們對(duì)于巨額資本投入是否有效的質(zhì)疑。
一名匿名Meta員工透露,,公司內(nèi)部因DeepSeek的模型進(jìn)入了恐慌模式,。DeepSeek-V3在基準(zhǔn)測(cè)試中已經(jīng)超越了Llama 4,而其訓(xùn)練預(yù)算僅為550萬(wàn)美元,。工程師們正在爭(zhēng)分奪秒地分析DeepSeek,,試圖復(fù)制其中的技術(shù)。管理層則為GenAI研發(fā)部門的巨額投入感到焦慮,,高管薪資甚至超過(guò)了訓(xùn)練整個(gè)DeepSeek V3的成本,。
短短一個(gè)月內(nèi),中國(guó)AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-26 15:51:02DeepSeek新模型火到海外短短一個(gè)月內(nèi),,中國(guó)AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型——DeepSeek-V3和DeepSeek-R1
2025-01-26 10:34:01DeepSeek讓Meta深陷恐慌