短短一個月內(nèi),中國AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1。這兩款模型成本低廉,,性能卻與OpenAI相當,引發(fā)了硅谷的震動,,甚至讓Meta內(nèi)部陷入恐慌,工程師們開始連夜嘗試復(fù)制DeepSeek的成果,。
Scale AI創(chuàng)始人Alexander Wang在采訪中表示,,DeepSeek在他們的測試中表現(xiàn)最佳,與美國最好的模型相當,。他之前曾評價說,,DeepSeek-V3是中國科技界帶給美國的一個苦澀教訓(xùn),指出當美國休息時,,中國科技界以更低的成本,、更快的速度和更強的實力迎頭趕上。
中國AI的新進展也引起了國外媒體的關(guān)注,,他們認為這些新進展為硅谷敲響了警鐘,。特別是在5000億美元的“星際之門”計劃公布之際,DeepSeek以極低的價格建立了一個突破性的AI模型,,且沒有使用尖端芯片,,這讓人們質(zhì)疑巨額資本投入是否真的是最有效的方法。
一名Meta員工在匿名平臺teamblind上發(fā)帖稱,,由于DeepSeek-V3的表現(xiàn),,Meta已經(jīng)進入恐慌模式。DeepSeek-V3在基準測試中超越了Llama 4,,而其訓(xùn)練預(yù)算僅為550萬美元,。Meta工程師們正爭分奪秒地分析DeepSeek的技術(shù),試圖復(fù)制其成果,。管理層則因GenAI研發(fā)部門的巨額投入感到焦慮,,因為一個高管的薪資就超過了整個DeepSeek V3的訓(xùn)練成本。
去年12月27日,,DeepSeek推出了開源模型DeepSeek-V3,,在聊天機器人競技場排名第七,在開源模型中排名第一,,并被認為是全球前十中性價比最高的模型,。今年1月20日,DeepSeek正式開源R1推理模型,,允許所有人遵循MIT License蒸餾R1訓(xùn)練其他模型,。1月24日,DeepSeek-R1在聊天機器人競技場綜合榜單上排名第三,,與頂尖推理模型o1并列,。在高難度提示詞、代碼和數(shù)學(xué)等技術(shù)性領(lǐng)域,,DeepSeek-R1表現(xiàn)出色,,風格控制方面也與o1并列第一。
短短一個月內(nèi),,中國AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-27 08:21:32DeepSeek大模型強在哪短短一個月內(nèi),,中國AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型——DeepSeek-V3和DeepSeek-R1
2025-01-26 10:34:01DeepSeek讓Meta深陷恐慌中國國產(chǎn)大模型Deepseek在硅谷引起了轟動,。從斯坦福到麻省理工,Deepseek R1幾乎一夜之間成為美國頂尖大學(xué)研究人員的首選模型
2025-01-27 15:33:19媒體揭秘國產(chǎn)大模型DeepSeek