DeepSeek-V3的研發(fā)費(fèi)用為558萬美元,訓(xùn)練成本不到GPT-4o的1/20,,僅用了2048張H100的GPU集群,,用時(shí)53天,。相比之下,,全球AI第一梯隊(duì)的頭部公司至少需要1.6萬張以上的GPU進(jìn)行訓(xùn)練,。市場(chǎng)認(rèn)為,,DeepSeek R1的成功可能削弱了市場(chǎng)對(duì)英偉達(dá)AI芯片需求的預(yù)期,。
DeepSeek是一家低調(diào)的創(chuàng)業(yè)公司,注冊(cè)地位于杭州市拱墅區(qū)環(huán)城北路169號(hào)匯金國(guó)際大廈西1幢1201室,。記者實(shí)地探訪發(fā)現(xiàn),,該公司拒絕進(jìn)一步交流。加入的官方交流群公告顯示,,暫不對(duì)外進(jìn)行項(xiàng)目合作,,也不提供私有化部署及相關(guān)支持服務(wù)。
1月27日,,DeepSeek概念股引爆A股,,多只成分股高開或漲停。多家上市公司披露與DeepSeek的合作情況,。昆侖萬維攜手新加坡南洋理工大學(xué)成功開發(fā)Q*算法,,顯著提升現(xiàn)有大模型推理能力。每日互動(dòng)則接入多個(gè)國(guó)內(nèi)外通用大模型,,結(jié)合自身數(shù)據(jù)積累和挖掘能力,,開發(fā)垂直場(chǎng)景類大模型應(yīng)用。但也有一些公司表示未與DeepSeek合作,。
短短一個(gè)月內(nèi),,中國(guó)AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-27 08:21:32DeepSeek大模型強(qiáng)在哪