DeepSeek發(fā)文收官開源周知乎引領(lǐng)AI趨勢發(fā)布

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-03-02 18:06:39 央廣網(wǎng)

3月1日,，DeepSeek在知乎開設(shè)官方賬號，發(fā)布了《DeepSeek-V3/R1推理系統(tǒng)概覽》技術(shù)文章,，首次公開了模型推理系統(tǒng)的優(yōu)化細(xì)節(jié)及成本利潤率等關(guān)鍵信息,，標(biāo)志著“DeepSeek開源周”正式結(jié)束。不久前,，月之暗面,、微軟研究院、清華大學(xué)、階躍星辰等項(xiàng)目參與者也在知乎分享了研究成果和經(jīng)歷,。知乎是AI從業(yè)者和創(chuàng)業(yè)者密度最高的社區(qū)之一，此次DeepSeek選擇知乎作為發(fā)布平臺,，進(jìn)一步引領(lǐng)了全網(wǎng)重要的AI趨勢,。

DeepSeek在知乎發(fā)布的文章詳細(xì)介紹了V3/R1推理系統(tǒng)。該系統(tǒng)的目標(biāo)是提高吞吐量并降低延遲,。為實(shí)現(xiàn)這些目標(biāo),，DeepSeek采用了大規(guī)模跨節(jié)點(diǎn)專家并行（EP）方案,，盡管這增加了系統(tǒng)的復(fù)雜性,。文章主要探討了如何使用EP增加批量大小、隱藏傳輸耗時(shí)以及進(jìn)行負(fù)載均衡,。

文章還披露了DeepSeek的成本和利潤率,。假設(shè)GPU租賃成本為2美元/小時(shí)，總成本為每天87,072美元,。如果所有tokens按DeepSeek R1的定價(jià)計(jì)算,，理論上一天的總收入可達(dá)562,027美元，成本利潤率為545%,。

“DeepSeek開源周”從2月24日至2月28日,，陸續(xù)開源了多個(gè)最新技術(shù)進(jìn)展，包括FlashMLA,、DeepEP,、DeepGEMM和3FS四個(gè)項(xiàng)目，以及DualPipe,、EPLB等代碼庫,。每次發(fā)布都在知乎引發(fā)了熱烈討論和贊嘆。

知乎大模型話題優(yōu)秀答主,、算法工程師劉聰NPL評價(jià)稱：“DeepSeek和OpenAI一樣重要,。”業(yè)內(nèi)人士認(rèn)為,，“DeepSeek開源周”的重要性甚至超過了OpenAI的發(fā)布會(huì),。DeepSeek通過大量開源有力回應(yīng)了歐美關(guān)于其故意壓低訓(xùn)練成本的說法，并證明了訓(xùn)練鏈路上存在巨大優(yōu)化空間,。知乎編程話題優(yōu)秀答主平凡也表示,，這些工作在國外的AI公司幾乎不可能完成。

此次收官文章再次激發(fā)了知乎上對AI的討論熱情,，相關(guān)問題下聚集了許多從業(yè)者,。事實(shí)上，發(fā)完論文后在知乎親自回答已成為人工智能研究者的風(fēng)潮。例如,，2月20日,，月之暗面開源MoBA框架的研發(fā)人員鹿恩哲和蘇劍林在知乎講述了研發(fā)思路，引發(fā)業(yè)界對稀疏注意力框架的討論,。微軟研究院,、清華大學(xué)團(tuán)隊(duì)以及階躍星辰開源模型參與者也分享了各自的研究成果與歷程，被業(yè)界稱為一次“思維鏈開源”,。

知乎匯聚了廣泛的互聯(lián)網(wǎng),、AI、機(jī)器人等科技領(lǐng)域的從業(yè)者,，成為他們交流思想的重要場所,。全球矚目的DeepSeek將知乎作為開源周的最后一站，進(jìn)一步印證了知乎作為AI討論第一陣地的獨(dú)特價(jià)值,。

(責(zé)任編輯：張小花 TT1000)

關(guān)閉

DeepSeek發(fā)文收官開源周 知乎引領(lǐng)AI趨勢發(fā)布

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)

DeepSeek發(fā)文收官開源周知乎引領(lǐng)AI趨勢發(fā)布