DeepSeek 風靡全球,,成為過去一周人們熱議的話題。其每日流量遠超Claude,、Perplexity甚至Gemini,。對于長期關注該領域的人來說,DeepSeek 并不是新事物,,幾個月來一直在討論這家公司,。雖然公司本身并不新,,但近期的炒作確實引人注目。SemiAnalysis 一直認為 DeepSeek 具有才華,,但直到最近才引起美國公眾的關注,。
情況與上個月相比發(fā)生了變化。隨著算法改進速度加快,,對Nvidia和GPU的需求減少,,導致產(chǎn)能過剩。盡管杰文斯悖論被夸大了,,但它確實反映了這些模型引發(fā)的需求變化,,影響了H100和H200的定價。
High-Flyer 是一家中國對沖基金,,也是在交易算法中使用人工智能的早期采用者,。他們在2021年投資了10,000個A100 GPU,這筆投資后來獲得了回報,。2023年5月,High-Flyer 分拆出“DeepSeek”,,專注于進一步的人工智能能力開發(fā),。起初由于外部投資者興趣不大,,缺乏商業(yè)模式,,High-Flyer 自籌資金。如今,,High-Flyer 和 DeepSeek 經(jīng)常共享資源,包括人力和計算資源,。DeepSeek 已經(jīng)發(fā)展成為一個嚴肅且協(xié)調一致的努力項目,,GPU 投資超過5億美元。
據(jù)估計,,DeepSeek 擁有大約50,000個Hopper GPU,其中包括10,000臺H800和10,000臺H100,。他們還訂購了更多H20,這些GPU由High-Flyer和DeepSeek共享,,用于交易,、推理、培訓和研究,。總服務器資本支出接近13億美元,,運營成本高達7.15億美元,。
DeepSeek 在招聘方面非常注重能力和好奇心,定期在北大和浙江大學等頂尖大學舉辦招聘活動,。他們提供極具競爭力的薪資,,吸引了大量人才,。目前有約150名員工,發(fā)展迅速,。由于資金自足,DeepSeek 能夠快速實施創(chuàng)意,,并擁有自己的數(shù)據(jù)中心,為實驗提供了更多空間,。
DeepSeek 的預訓練成本僅為600萬美元,,但這只是總成本的一部分,。實際硬件支出遠高于5億美元,,包括研發(fā)和TCO等重要部分。例如,,Claude 3.5 Sonnet 的訓練成本為數(shù)千萬美元。DeepSeek 通過出口管制滯后等因素獲得了龐大的集群,。
11月13日以來,,A股經(jīng)歷階段性調整,,各指數(shù)與行業(yè)板塊呈現(xiàn)普跌態(tài)勢,市場整體觀望情緒加重,。
2024-11-25 09:42:30業(yè)內解析A股本輪階段性調整