DeepSeek服務(wù)再次出現(xiàn)“宕機”,。1月27日11點左右,,DeepSeek官網(wǎng)一度顯示網(wǎng)頁和API不可用,但功能隨后恢復(fù),。此前一天,,DeepSeek也經(jīng)歷了一次短暫的服務(wù)波動,官方稱問題在數(shù)分鐘內(nèi)得到解決,,可能與新模型發(fā)布后的訪問量激增有關(guān),。1月27日早間,DeepSeek應(yīng)用登頂蘋果中國地區(qū)和美國地區(qū)應(yīng)用商店免費APP下載排行榜,,在美區(qū)超越了ChatGPT,。1月24日,DeepSeek-R1在大模型排名中升至全類別第三,其中風(fēng)格控制類模型分類與OpenAI o1并列第一,,競技場得分為1357分,,略高于OpenAI o1的1352分。該模型每百萬個token的查詢成本僅為0.14美元,,遠低于OpenAI的7.50美元,,并且允許開源。
DeepSeek的崛起讓華爾街算力板塊投資者感到不安,。寒武紀一度大跌近10%,,天孚通信、中際旭創(chuàng),、工業(yè)富聯(lián),、中興通訊等科技權(quán)重股也有不同程度下跌。英偉達美股夜盤跌超5%,,博通跌超4%,。納斯達克指數(shù)期貨跌超1.7%。軟銀集團股價一度下跌近6%,,藤倉大跌超8%,,東京電子和Disco均跌超3%。
網(wǎng)絡(luò)社群中,,越來越多的人將DeepSeek的出現(xiàn)與英偉達近期的回調(diào)聯(lián)系在一起,。有美股大V表示,DeepSeek創(chuàng)造了一個AI巨頭們的痛苦時刻,,投資者應(yīng)對此保持警惕,。海外媒體和市場評論員也將其視為美國股市的一大威脅。
DeepSeek的開發(fā)者為杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司,,成立于2023年7月,。該公司由寧波程恩企業(yè)管理咨詢合伙企業(yè)(有限合伙)和梁文鋒共同持股。梁文鋒是金融圈知名人士,,創(chuàng)立了國內(nèi)量化私募巨頭幻方量化,。他來自湛江市吳川市覃巴鎮(zhèn)米歷嶺村,父母均為小學(xué)語文老師,。他在數(shù)學(xué)學(xué)科表現(xiàn)出極大天賦,,初中時期就學(xué)完了高中數(shù)學(xué),甚至開始學(xué)習(xí)大學(xué)數(shù)學(xué),。
目前,,梁文鋒持股寧波程恩50.1%,寧波程信柔兆企業(yè)管理咨詢合伙企業(yè)(有限合伙)持股49.8%,,寧波程普商務(wù)咨詢有限公司持股0.1%,。寧波程信由梁文鋒,、鄭達韡、李歡,、陳哲等自然人共同持股。
1月20日,,深度求索正式發(fā)布DeepSeek-R1大模型,,并同步開源模型權(quán)重。DeepSeek-R1在后訓(xùn)練階段大規(guī)模使用了強化學(xué)習(xí)技術(shù),,提升了模型推理能力,,在數(shù)學(xué)、代碼,、自然語言推理等任務(wù)上性能比肩OpenAI o1正式版,。《黑神話:悟空》的主創(chuàng)馮驥高度評價DeepSeek,,指出其強大,、便宜、開源,、免費,、聯(lián)網(wǎng)和支持本土開發(fā)六大優(yōu)點。
在美國硅谷,,多位人工智能行業(yè)意見領(lǐng)袖對DeepSeek-R1表達贊賞,。微軟CEO薩蒂亞·納德拉表示,他們開發(fā)出了一款開源模型,,在推理計算方面表現(xiàn)出色,。曾投資過OpenAI的投資人馬克·安德里森認為,DeepSeek-R1是一項令人驚嘆的突破,,并且是開源的,,是對全世界的大禮。
DeepSeek-V3的研發(fā)費用為558萬美元,,訓(xùn)練成本不到GPT-4o的1/20,,僅用了2048張H100的GPU集群,用時53天,。相比之下,,全球AI第一梯隊的頭部公司至少需要1.6萬張以上的GPU進行訓(xùn)練。市場認為,,DeepSeek R1的成功可能削弱了市場對英偉達AI芯片需求的預(yù)期,。
DeepSeek是一家低調(diào)的創(chuàng)業(yè)公司,注冊地位于杭州市拱墅區(qū)環(huán)城北路169號匯金國際大廈西1幢1201室,。記者實地探訪發(fā)現(xiàn),,該公司拒絕進一步交流,。加入的官方交流群公告顯示,暫不對外進行項目合作,,也不提供私有化部署及相關(guān)支持服務(wù),。
1月27日,DeepSeek概念股引爆A股,,多只成分股高開或漲停,。多家上市公司披露與DeepSeek的合作情況。昆侖萬維攜手新加坡南洋理工大學(xué)成功開發(fā)Q*算法,,顯著提升現(xiàn)有大模型推理能力,。每日互動則接入多個國內(nèi)外通用大模型,結(jié)合自身數(shù)據(jù)積累和挖掘能力,,開發(fā)垂直場景類大模型應(yīng)用,。但也有一些公司表示未與DeepSeek合作。