來自中國的“神秘力量” 火爆全球 DeepSeek引領(lǐng)科技新潮流

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-01-27 17:24:07 百家號

由國產(chǎn)大模型公司杭州深度求索開發(fā)的Deepseek應(yīng)用在27日登頂蘋果中國地區(qū)和美國地區(qū)應(yīng)用商店免費APP下載排行榜,，在美區(qū)下載榜上超越了ChatGPT,，受到廣泛關(guān)注。Deepseek被認(rèn)為是大模型行業(yè)的最大“黑馬”,，在外網(wǎng)被不少人稱為“神秘的東方力量”,。

來自中國的“神秘力量” 火爆全球

DeepSeek成立于2023年7月17日,，專注于開發(fā)先進(jìn)的大語言模型（LLM）及相關(guān)技術(shù)。2024年12月,，DeepSeek發(fā)布了V3版本,。AI數(shù)據(jù)服務(wù)公司Scale AI創(chuàng)始人Alexander Wang發(fā)帖稱，DeepSeek-V3是中國科技界帶給美國的苦澀教訓(xùn),，指出當(dāng)美國休息時,，中國科技界以更低的成本、更快的速度和更強的實力追趕上來,。

來自中國的“神秘力量” 火爆全球 DeepSeek引領(lǐng)科技新潮流

今年1月20日,，DeepSeek正式開源R1推理模型，其“物美價廉”的特性在海外開發(fā)者社區(qū)中引發(fā)轟動,。目前,，在國外大模型排名榜Chatbot Arena上，DeepSeek-R1的基準(zhǔn)測試排名已升至全類別大模型第三,，與OpenAI的ChatGPT-4最新版并列,，并在風(fēng)格控制類模型分類中與OpenAI的o1模型并列第一。

來自中國的“神秘力量” 火爆全球 DeepSeek引領(lǐng)科技新潮流

DeepSeek備受關(guān)注的原因在于性價比高,、開源以及推理能力的提升,。DeepSeek R1成本很低，預(yù)訓(xùn)練費用僅為557.6萬美元,，不到OpenAI GPT-4模型訓(xùn)練成本的十分之一,。API定價大約是OpenAI o1運行成本的三十分之一。DeepSeek采用開源模式,，公布了相關(guān)論文,，整個過程可復(fù)現(xiàn)。加州大學(xué)伯克利分校,、香港科技大學(xué),、知名人工智能公司HuggingFace等紛紛成功復(fù)現(xiàn)，復(fù)現(xiàn)成本甚至低至幾十美元,。

來自中國的“神秘力量” 火爆全球 DeepSeek引領(lǐng)科技新潮流

中國DeepSeek的模型是開源的，將制造這些模型的知識免費提供給全世界,，確保沒有人能夠真正壟斷它,。相比之下，美國公司如OpenAI,、Anthropic或谷歌并未開源任何強大的模型,。英偉達(dá)高級研究科學(xué)家Jim Fan表示，我們正身處這樣一個歷史時刻：一家非美國公司正在延續(xù)OpenAI最初的使命——通過真正開放的前沿研究賦能全人類,?？此撇缓铣＠?，但最有趣的結(jié)局往往最可能成真。

在推理能力方面,，據(jù)DeepSeek介紹,，其最新發(fā)布的模型DeepSeek-R1在后訓(xùn)練階段大規(guī)模使用了強化學(xué)習(xí)技術(shù)，在僅有極少標(biāo)注數(shù)據(jù)的情況下,，極大提升了模型推理能力,。在數(shù)學(xué)、代碼,、自然語言推理等任務(wù)上,，性能比肩OpenAI o1正式版。這種卓越的性能不僅吸引了科技界的廣泛關(guān)注,，也讓投資界看到了其巨大的商業(yè)潛力,。

DeepSeek團(tuán)隊不到140人，工程師和研發(fā)人員幾乎都來自清華大學(xué),、北京大學(xué),、中山大學(xué)、北京郵電大學(xué)等國內(nèi)頂尖高校,，工作時間都不長,。《黑神話：悟空》制作人馮驥評價DeepSeek：這可能是個國運級別的科技成果,。

(責(zé)任編輯：張小花 TT1000)

關(guān)閉

來自中國的“神秘力量” 火爆全球 DeepSeek引領(lǐng)科技新潮流

相關(guān)新聞

今日熱點

頻道熱點