在過(guò)去一周的開(kāi)源周上,,DeepSeek連續(xù)五天發(fā)布重磅消息,,令市場(chǎng)贊嘆不已。就在外界以為這場(chǎng)盛宴即將結(jié)束時(shí),DeepSeek又帶來(lái)了一個(gè)令人震驚的消息:其V3/R1推理系統(tǒng)理論日利潤(rùn)高達(dá)346萬(wàn)元人民幣,,成本利潤(rùn)率高達(dá)545%。
市場(chǎng)的超高“暴利”引發(fā)了廣泛關(guān)注,,人們開(kāi)始討論如何解讀這個(gè)利潤(rùn)率,,以及這對(duì)算力、云產(chǎn)業(yè)鏈,、大模型同行和生態(tài)意味著什么,。科技博主們對(duì)此提出了各自的看法,。
目前公布的545%利潤(rùn)率是基于特定條件下的理論計(jì)算,,實(shí)際利潤(rùn)率要低得多。根據(jù)DeepSeek官方的說(shuō)法,,R1模型的利潤(rùn)率約為85%,,而按照V3的定價(jià),利潤(rùn)率會(huì)降至70%左右,。即便如此,,這個(gè)數(shù)字仍然非常可觀,。對(duì)比Anthropic 2024年的預(yù)期利潤(rùn)率61%,,可以看出盡管OpenAI和Anthropic在成本控制上可能不如DeepSeek極致,但它們憑借更高的定價(jià)和更慷慨的客戶也能實(shí)現(xiàn)類似的高利潤(rùn)率,。
DeepSeek的案例證明,,即使在硬件條件相對(duì)有限的情況下(使用H800),通過(guò)極致的infra優(yōu)化,,也能實(shí)現(xiàn)極高的算力利用率和性能,。這意味著有效算力的重要性將凸顯,行業(yè)將更加關(guān)注算力利用率,,而不僅僅是單純的算力堆砌,。此外,國(guó)產(chǎn)芯片的上限也有望提升,。一些科技博主認(rèn)為,,算力效率的提升并不會(huì)減少算力需求,反而會(huì)刺激更多應(yīng)用場(chǎng)景的出現(xiàn),推動(dòng)算力需求持續(xù)增長(zhǎng),。但也有人認(rèn)為,,DeepSeek已經(jīng)將英偉達(dá)“擊倒”,全球的AI需求并沒(méi)有那么高,。
DeepSeek的成功案例讓AI云計(jì)算與傳統(tǒng)云計(jì)算的相似性更加明顯,,兩者都面臨低峰期閑置率和高峰期穩(wěn)定性的挑戰(zhàn)。大規(guī)模集群和高并發(fā)利用率能顯著降低成本,,用戶數(shù)量越多,,平抑波動(dòng)的能力越強(qiáng),算力冗余需求越低,。擁有自身業(yè)務(wù)的云廠商可能比沒(méi)有自身業(yè)務(wù)的云廠商更具成本優(yōu)勢(shì),。此外,私有云部署的吸引力可能下降,,普通云計(jì)算/AI應(yīng)用需要為高強(qiáng)度用戶并發(fā)預(yù)留更多空間,。
過(guò)去一周,,中國(guó)的人工智能大模型成為硅谷乃至全球科技界的熱議話題。引發(fā)這場(chǎng)討論的是中國(guó)人工智能初創(chuàng)公司深度求索(DeepSeek)
2025-01-27 10:02:46幻方DeepSeek如何震驚硅谷