由國(guó)產(chǎn)大模型公司杭州深度求索開(kāi)發(fā)的Deepseek應(yīng)用在27日登頂蘋果中國(guó)地區(qū)和美國(guó)地區(qū)應(yīng)用商店免費(fèi)APP下載排行榜,在美區(qū)下載榜上超越了ChatGPT,受到廣泛關(guān)注,。Deepseek被認(rèn)為是大模型行業(yè)的最大“黑馬”,在外網(wǎng)被不少人稱為“神秘的東方力量”,。
DeepSeek成立于2023年7月17日,專注于開(kāi)發(fā)先進(jìn)的大語(yǔ)言模型(LLM)及相關(guān)技術(shù),。2024年12月,,DeepSeek發(fā)布了V3版本。AI數(shù)據(jù)服務(wù)公司Scale AI創(chuàng)始人Alexander Wang發(fā)帖稱,,DeepSeek-V3是中國(guó)科技界帶給美國(guó)的苦澀教訓(xùn),,指出當(dāng)美國(guó)休息時(shí),中國(guó)科技界以更低的成本,、更快的速度和更強(qiáng)的實(shí)力追趕上來(lái),。
今年1月20日,,DeepSeek正式開(kāi)源R1推理模型,其“物美價(jià)廉”的特性在海外開(kāi)發(fā)者社區(qū)中引發(fā)轟動(dòng),。目前,,在國(guó)外大模型排名榜Chatbot Arena上,DeepSeek-R1的基準(zhǔn)測(cè)試排名已升至全類別大模型第三,,與OpenAI的ChatGPT-4最新版并列,,并在風(fēng)格控制類模型分類中與OpenAI的o1模型并列第一。
DeepSeek備受關(guān)注的原因在于性價(jià)比高,、開(kāi)源以及推理能力的提升,。DeepSeek R1成本很低,預(yù)訓(xùn)練費(fèi)用僅為557.6萬(wàn)美元,,不到OpenAI GPT-4模型訓(xùn)練成本的十分之一,。API定價(jià)大約是OpenAI o1運(yùn)行成本的三十分之一。DeepSeek采用開(kāi)源模式,,公布了相關(guān)論文,,整個(gè)過(guò)程可復(fù)現(xiàn)。加州大學(xué)伯克利分校,、香港科技大學(xué),、知名人工智能公司HuggingFace等紛紛成功復(fù)現(xiàn),復(fù)現(xiàn)成本甚至低至幾十美元,。
中國(guó)DeepSeek的模型是開(kāi)源的,,將制造這些模型的知識(shí)免費(fèi)提供給全世界,,確保沒(méi)有人能夠真正壟斷它,。相比之下,美國(guó)公司如OpenAI,、Anthropic或谷歌并未開(kāi)源任何強(qiáng)大的模型,。英偉達(dá)高級(jí)研究科學(xué)家Jim Fan表示,我們正身處這樣一個(gè)歷史時(shí)刻:一家非美國(guó)公司正在延續(xù)OpenAI最初的使命——通過(guò)真正開(kāi)放的前沿研究賦能全人類,??此撇缓铣@恚钣腥さ慕Y(jié)局往往最可能成真,。
在推理能力方面,,據(jù)DeepSeek介紹,其最新發(fā)布的模型DeepSeek-R1在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù),,在僅有極少標(biāo)注數(shù)據(jù)的情況下,,極大提升了模型推理能力。在數(shù)學(xué),、代碼,、自然語(yǔ)言推理等任務(wù)上,,性能比肩OpenAI o1正式版。這種卓越的性能不僅吸引了科技界的廣泛關(guān)注,,也讓投資界看到了其巨大的商業(yè)潛力,。
DeepSeek團(tuán)隊(duì)不到140人,工程師和研發(fā)人員幾乎都來(lái)自清華大學(xué),、北京大學(xué),、中山大學(xué)、北京郵電大學(xué)等國(guó)內(nèi)頂尖高校,,工作時(shí)間都不長(zhǎng),。《黑神話:悟空》制作人馮驥評(píng)價(jià)DeepSeek:這可能是個(gè)國(guó)運(yùn)級(jí)別的科技成果,。