3月1日,,DeepSeek在知乎開設官方賬號,發(fā)布了《DeepSeek-V3/R1推理系統概覽》技術文章,,首次公開了模型推理系統的優(yōu)化細節(jié)及成本利潤率等關鍵信息,標志著“DeepSeek開源周”正式結束,。不久前,月之暗面,、微軟研究院、清華大學,、階躍星辰等項目參與者也在知乎分享了研究成果和經歷。知乎是AI從業(yè)者和創(chuàng)業(yè)者密度最高的社區(qū)之一,,此次DeepSeek選擇知乎作為發(fā)布平臺,進一步引領了全網重要的AI趨勢,。
DeepSeek在知乎發(fā)布的文章詳細介紹了V3/R1推理系統。該系統的目標是提高吞吐量并降低延遲,。為實現這些目標,,DeepSeek采用了大規(guī)模跨節(jié)點專家并行(EP)方案,,盡管這增加了系統的復雜性。文章主要探討了如何使用EP增加批量大小,、隱藏傳輸耗時以及進行負載均衡,。
文章還披露了DeepSeek的成本和利潤率。假設GPU租賃成本為2美元/小時,,總成本為每天87,072美元,。如果所有tokens按DeepSeek R1的定價計算,,理論上一天的總收入可達562,027美元,,成本利潤率為545%。
“DeepSeek開源周”從2月24日至2月28日,,陸續(xù)開源了多個最新技術進展,,包括FlashMLA,、DeepEP,、DeepGEMM和3FS四個項目,以及DualPipe,、EPLB等代碼庫,。每次發(fā)布都在知乎引發(fā)了熱烈討論和贊嘆,。
知乎大模型話題優(yōu)秀答主、算法工程師劉聰NPL評價稱:“DeepSeek和OpenAI一樣重要,?!睒I(yè)內人士認為,“DeepSeek開源周”的重要性甚至超過了OpenAI的發(fā)布會,。DeepSeek通過大量開源有力回應了歐美關于其故意壓低訓練成本的說法,并證明了訓練鏈路上存在巨大優(yōu)化空間,。知乎編程話題優(yōu)秀答主平凡也表示,,這些工作在國外的AI公司幾乎不可能完成。
此次收官文章再次激發(fā)了知乎上對AI的討論熱情,,相關問題下聚集了許多從業(yè)者。事實上,,發(fā)完論文后在知乎親自回答已成為人工智能研究者的風潮,。例如,2月20日,,月之暗面開源MoBA框架的研發(fā)人員鹿恩哲和蘇劍林在知乎講述了研發(fā)思路,引發(fā)業(yè)界對稀疏注意力框架的討論,。微軟研究院,、清華大學團隊以及階躍星辰開源模型參與者也分享了各自的研究成果與歷程,,被業(yè)界稱為一次“思維鏈開源”。
知乎匯聚了廣泛的互聯網,、AI、機器人等科技領域的從業(yè)者,,成為他們交流思想的重要場所,。全球矚目的DeepSeek將知乎作為開源周的最后一站,,進一步印證了知乎作為AI討論第一陣地的獨特價值。
每經AI快訊,2月28日,,DeepSeek開源周第五天,,DeepSeek在官方X賬號宣布開源3FS,它是所有Deepseek數據訪問的助推器
2025-02-28 11:52:14DeepSeek開源周第五天吉利與階躍星辰合作研發(fā)的兩款多模態(tài)大模型已正式開源,。這兩款模型分別是開源視頻生成模型Step-Video-T2V和業(yè)內首款產品級開源語音交互大模型Step-Audio
2025-02-19 08:09:19DeepSeek后又一大模型向全球開源DeepSeek發(fā)布了新一代開源大模型DeepSeek-R1,。該模型在數學、代碼、自然語言推理等任務上的性能與美國OpenAI公司的最新o1大模型相當
2025-01-21 22:05:22DeepSeek又有重大突破