短短一個(gè)月內(nèi),,中國(guó)AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1。這兩款模型成本低廉,性能卻與OpenAI相當(dāng),,引發(fā)了硅谷的震動(dòng),,甚至讓Meta內(nèi)部陷入恐慌,工程師們開(kāi)始連夜嘗試復(fù)制DeepSeek的成果,。
Scale AI創(chuàng)始人Alexander Wang在采訪中表示,,DeepSeek在他們的測(cè)試中表現(xiàn)最佳,與美國(guó)最好的模型相當(dāng),。他之前曾評(píng)價(jià)說(shuō),,DeepSeek-V3是中國(guó)科技界帶給美國(guó)的一個(gè)苦澀教訓(xùn),指出當(dāng)美國(guó)休息時(shí),,中國(guó)科技界以更低的成本,、更快的速度和更強(qiáng)的實(shí)力迎頭趕上。
中國(guó)AI的新進(jìn)展也引起了國(guó)外媒體的關(guān)注,,他們認(rèn)為這些新進(jìn)展為硅谷敲響了警鐘,。特別是在5000億美元的“星際之門(mén)”計(jì)劃公布之際,DeepSeek以極低的價(jià)格建立了一個(gè)突破性的AI模型,,且沒(méi)有使用尖端芯片,,這讓人們質(zhì)疑巨額資本投入是否真的是最有效的方法。
一名Meta員工在匿名平臺(tái)teamblind上發(fā)帖稱,,由于DeepSeek-V3的表現(xiàn),,Meta已經(jīng)進(jìn)入恐慌模式。DeepSeek-V3在基準(zhǔn)測(cè)試中超越了Llama 4,,而其訓(xùn)練預(yù)算僅為550萬(wàn)美元,。Meta工程師們正爭(zhēng)分奪秒地分析DeepSeek的技術(shù),試圖復(fù)制其成果,。管理層則因GenAI研發(fā)部門(mén)的巨額投入感到焦慮,,因?yàn)橐粋€(gè)高管的薪資就超過(guò)了整個(gè)DeepSeek V3的訓(xùn)練成本,。
去年12月27日,,DeepSeek推出了開(kāi)源模型DeepSeek-V3,在聊天機(jī)器人競(jìng)技場(chǎng)排名第七,,在開(kāi)源模型中排名第一,,并被認(rèn)為是全球前十中性價(jià)比最高的模型。今年1月20日,,DeepSeek正式開(kāi)源R1推理模型,,允許所有人遵循MIT License蒸餾R1訓(xùn)練其他模型。1月24日,,DeepSeek-R1在聊天機(jī)器人競(jìng)技場(chǎng)綜合榜單上排名第三,,與頂尖推理模型o1并列。在高難度提示詞、代碼和數(shù)學(xué)等技術(shù)性領(lǐng)域,,DeepSeek-R1表現(xiàn)出色,,風(fēng)格控制方面也與o1并列第一。
著名投資公司A16z的創(chuàng)始人馬克·安德森稱贊Deepseek-R1是令人驚嘆的突破之一,,而且還是開(kāi)源的,。諾獎(jiǎng)得主、“AI教父”杰弗里·辛頓認(rèn)為,,中國(guó)的STEM教育比美國(guó)更好,,擁有更多受過(guò)良好教育的人才,這為AI的發(fā)展提供了堅(jiān)實(shí)的基礎(chǔ),。盡管美國(guó)試圖通過(guò)限制英偉達(dá)芯片來(lái)減緩中國(guó)的發(fā)展,,但這只會(huì)促使中國(guó)加速發(fā)展自己的技術(shù)。
斯坦福大學(xué)和Epoch AI的研究人員預(yù)測(cè),,到2027年,,最大型模型的訓(xùn)練成本將超過(guò)10億美元。但DeepSeek完全不同,,它的訓(xùn)練成本并不昂貴,,有可能徹底改變訓(xùn)練和推理領(lǐng)域的游戲規(guī)則。有投資者甚至認(rèn)為,,美股芯片股的股價(jià)也會(huì)面臨挑戰(zhàn),。
最近四天,國(guó)外媒體紛紛聚焦DeepSeek,,并一致認(rèn)為中國(guó)大模型的新進(jìn)展為硅谷敲響了警鐘,。Business Insider報(bào)道稱,DeepSeek-R1模型秉承開(kāi)放精神,,完全開(kāi)源,,給美國(guó)AI玩家?guī)?lái)了麻煩。CNBC邀請(qǐng)Perplexity CEO Aravind Srinivas分析為何DeepSeek會(huì)引發(fā)人們對(duì)美國(guó)在AI領(lǐng)域的全球領(lǐng)先地位是否正在縮小的擔(dān)憂,。英國(guó)《金融時(shí)報(bào)》報(bào)道,,加州大學(xué)伯克利分校AI政策研究員Ritwik Gupta指出,中國(guó)的系統(tǒng)工程師人才庫(kù)比美國(guó)大得多,,能夠更便宜地訓(xùn)練和運(yùn)行模型,。
短短一個(gè)月內(nèi),中國(guó)AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-27 08:21:32DeepSeek大模型強(qiáng)在哪短短一個(gè)月內(nèi),,中國(guó)AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-26 15:51:02DeepSeek新模型火到海外短短一個(gè)月內(nèi),,中國(guó)AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型——DeepSeek-V3和DeepSeek-R1
2025-01-26 10:34:01DeepSeek讓Meta深陷恐慌DeepSeek 給硅谷帶來(lái)的震撼持續(xù)不斷,。與幾個(gè)月前《黑神話·悟空》在歐美受到的追捧相比,,DeepSeek 的出現(xiàn)可謂石破天驚,,充滿了各種不可能和不合理
2025-01-26 14:46:44起底讓硅谷難安的DeepSeek