1月27日,,中國(guó)深度求索公司開(kāi)發(fā)的DeepSeek在蘋(píng)果美國(guó)地區(qū)應(yīng)用商店免費(fèi)APP下載排行榜上超越了ChatGPT。最近發(fā)布的開(kāi)源模型DeepSeek-R1引起了全球范圍內(nèi)的廣泛關(guān)注,。
輿論認(rèn)為,,這一低成本、開(kāi)源的人工智能模型震動(dòng)了硅谷,讓競(jìng)爭(zhēng)對(duì)手感到擔(dān)憂,,也讓科學(xué)家們興奮不已,。多方評(píng)論指出,中國(guó)AI技術(shù)的快速發(fā)展,,讓美國(guó)的打壓政策顯得尷尬,。1月20日,深度求索發(fā)布了最新開(kāi)源模型DeepSeek-R1,,此后熱度不斷上升,,在國(guó)內(nèi)外引發(fā)了廣泛討論。頂級(jí)風(fēng)投A16Z創(chuàng)始人馬克·安德森評(píng)價(jià)稱(chēng),,DeepSeek-R1是他見(jiàn)過(guò)的最驚人,、最令人印象深刻的突破之一,并稱(chēng)贊其為給世界的一份意義深遠(yuǎn)的禮物,。
在硅谷,,幾乎每個(gè)人都在談?wù)揇eepSeek。有報(bào)道稱(chēng),,硅谷工程師正在瘋狂地分析DeepSeek,甚至有人將其稱(chēng)為中國(guó)的“ChatGPT時(shí)刻”,。DeepSeek的特點(diǎn)是低成本,、高性能和開(kāi)源。該模型的推理計(jì)算效率極高,,可以與一些頂尖的AI模型相媲美,,與硅谷前沿發(fā)展保持同步。
DeepSeek-R1在技術(shù)上實(shí)現(xiàn)了重要突破,,用純深度學(xué)習(xí)的方法讓AI自發(fā)涌現(xiàn)出推理能力,,在數(shù)學(xué)、代碼,、自然語(yǔ)言推理等任務(wù)上的性能比肩OpenAI的o1模型正式版,。據(jù)DeepSeek介紹,R1的預(yù)訓(xùn)練費(fèi)用只有557.6萬(wàn)美元,,遠(yuǎn)低于OpenAI GPT-4o模型的訓(xùn)練成本,。
加利福尼亞大學(xué)伯克利分校教授亞歷克斯·迪馬基表示,DeepSeek的技術(shù)路線揭示了一個(gè)事實(shí):達(dá)到頂尖性能未必需要巨額投入,,這對(duì)硅谷的燒錢(qián)競(jìng)賽無(wú)異于釜底抽薪,。開(kāi)源也是DeepSeek備受關(guān)注的原因之一,這意味著其他企業(yè)和研究人員可以共享基礎(chǔ)代碼,,構(gòu)建和發(fā)布自己的產(chǎn)品,。
英偉達(dá)資深科學(xué)家吉姆·范稱(chēng)贊DeepSeek是“非美國(guó)公司踐行OpenAI初心”的典范,通過(guò)開(kāi)放技術(shù)細(xì)節(jié)和訓(xùn)練方法,為全球研究者賦能,。德國(guó)馬克斯·普朗克光科學(xué)研究所的馬里奧·克倫也認(rèn)為,,DeepSeek-R1的開(kāi)源性非常出色,相比之下,,o1和其他模型都是閉源模型“黑匣子”,。
短短一個(gè)月內(nèi),中國(guó)AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-26 15:51:02DeepSeek新模型火到海外短短一個(gè)月內(nèi),,中國(guó)AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-27 08:21:32DeepSeek大模型強(qiáng)在哪