1月27日,,中國(guó)深度求索公司開發(fā)的DeepSeek在蘋果美國(guó)地區(qū)應(yīng)用商店免費(fèi)APP下載排行榜上超越了ChatGPT,。最近發(fā)布的開源模型DeepSeek-R1引起了全球范圍內(nèi)的廣泛關(guān)注,。
輿論認(rèn)為,,這一低成本,、開源的人工智能模型震動(dòng)了硅谷,,讓競(jìng)爭(zhēng)對(duì)手感到擔(dān)憂,,也讓科學(xué)家們興奮不已,。多方評(píng)論指出,,中國(guó)AI技術(shù)的快速發(fā)展,,讓美國(guó)的打壓政策顯得尷尬,。1月20日,深度求索發(fā)布了最新開源模型DeepSeek-R1,,此后熱度不斷上升,,在國(guó)內(nèi)外引發(fā)了廣泛討論。頂級(jí)風(fēng)投A16Z創(chuàng)始人馬克·安德森評(píng)價(jià)稱,,DeepSeek-R1是他見過(guò)的最驚人,、最令人印象深刻的突破之一,并稱贊其為給世界的一份意義深遠(yuǎn)的禮物,。
在硅谷,,幾乎每個(gè)人都在談?wù)揇eepSeek。有報(bào)道稱,,硅谷工程師正在瘋狂地分析DeepSeek,,甚至有人將其稱為中國(guó)的“ChatGPT時(shí)刻”。DeepSeek的特點(diǎn)是低成本,、高性能和開源,。該模型的推理計(jì)算效率極高,可以與一些頂尖的AI模型相媲美,,與硅谷前沿發(fā)展保持同步,。
DeepSeek-R1在技術(shù)上實(shí)現(xiàn)了重要突破,用純深度學(xué)習(xí)的方法讓AI自發(fā)涌現(xiàn)出推理能力,,在數(shù)學(xué),、代碼、自然語(yǔ)言推理等任務(wù)上的性能比肩OpenAI的o1模型正式版,。據(jù)DeepSeek介紹,,R1的預(yù)訓(xùn)練費(fèi)用只有557.6萬(wàn)美元,遠(yuǎn)低于OpenAI GPT-4o模型的訓(xùn)練成本,。
加利福尼亞大學(xué)伯克利分校教授亞歷克斯·迪馬基表示,,DeepSeek的技術(shù)路線揭示了一個(gè)事實(shí):達(dá)到頂尖性能未必需要巨額投入,這對(duì)硅谷的燒錢競(jìng)賽無(wú)異于釜底抽薪,。開源也是DeepSeek備受關(guān)注的原因之一,,這意味著其他企業(yè)和研究人員可以共享基礎(chǔ)代碼,構(gòu)建和發(fā)布自己的產(chǎn)品,。
英偉達(dá)資深科學(xué)家吉姆·范稱贊DeepSeek是“非美國(guó)公司踐行OpenAI初心”的典范,,通過(guò)開放技術(shù)細(xì)節(jié)和訓(xùn)練方法,為全球研究者賦能,。德國(guó)馬克斯·普朗克光科學(xué)研究所的馬里奧·克倫也認(rèn)為,,DeepSeek-R1的開源性非常出色,相比之下,,o1和其他模型都是閉源模型“黑匣子”,。
短短一個(gè)月內(nèi),中國(guó)AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-26 15:51:02DeepSeek新模型火到海外