DeepSeek 引發(fā)全球熱議的神秘力量

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-02-02 11:56:34 大河網(wǎng)

盡管春節(jié)假期已經(jīng)過半,，但“來自東方的神秘力量的DeepSeek”仍在全球范圍內(nèi)引起熱議。各路業(yè)內(nèi)人士繼續(xù)從不同角度分析DeepSeek的模型和技術(shù)文章,。

北京時(shí)間1月31日,，英偉達(dá)宣布DeepSeek-R1模型登陸NVIDIA NIM,。同一時(shí)段內(nèi)，亞馬遜和微軟也接入了DeepSeek-R1模型,。英偉達(dá)稱,，DeepSeek-R1是最先進(jìn)的大語言模型。

韓國Mirae Asset Securities Research的一名分析師在X上撰寫長文分析稱,，這一突破是通過實(shí)施大量細(xì)粒度優(yōu)化和使用英偉達(dá)的匯編式PTX編程實(shí)現(xiàn)的,，而非通過CUDA中的某些功能。CUDA是由英偉達(dá)開發(fā)的一種通用編程框架,，允許開發(fā)者利用其圖形處理器進(jìn)行通用計(jì)算,。

如果DeepSeek真的繞過了CUDA，這表明其在研發(fā)大模型時(shí)采用了不同的技術(shù)路徑,。在DeepSeek-V3的技術(shù)博文中,，DeepSeek表示其使用了英偉達(dá)的PTX語言。如果DeepSeek的開發(fā)者能夠很好地使用PTX語言,，相比使用CUDA提供的編程接口,，可以更精細(xì)地控制GPU之間的數(shù)據(jù),、權(quán)重和梯度傳輸。然而,，使用PTX編寫的代碼復(fù)雜且難以維護(hù),，需要專業(yè)度較高的開發(fā)者。

繞過CUDA的做法具有一定的技術(shù)難度,，要求開發(fā)者既要懂AI模型算法,，又要懂計(jì)算機(jī)系統(tǒng)架構(gòu)以高效分配硬件資源。如果沒有同時(shí)掌握這兩方面技能的開發(fā)者,，則需要協(xié)調(diào)不同人員,。從DeepSeek的技術(shù)報(bào)告來看，其主體實(shí)現(xiàn)還是基于CUDA的相關(guān)接口,，但在描述中提到繞開了CUDA來寫通信,，這意味著它招聘了具備不同技能的人才，并將這些人才很好地結(jié)合起來,。

這也說明DeepSeek擁有一些擅長寫PTX語言的內(nèi)部開發(fā)者,。假如未來使用國產(chǎn)GPU，DeepSeek在硬件適配方面會更加得心應(yīng)手,，只需了解這些硬件驅(qū)動(dòng)提供的一些基本函數(shù)接口,，就可以仿照英偉達(dá)GPU硬件的編程接口編寫相關(guān)代碼，使自家大模型更容易適配國產(chǎn)硬件,。

從學(xué)術(shù)研究角度來看，DeepSeek的技術(shù)并沒有特別突出,，但在工程上卻非常有技巧,。考慮到AMD已經(jīng)宣布集成DeepSeek-V3到MI300X GPU,，未來可能會有更多GPU廠商與DeepSeek合作,。韓國分析師在同一篇X文章中指出，這凸顯了DeepSeek非凡的工程水平,，并表明美國對華制裁加劇的“GPU短缺危機(jī)”激發(fā)了他們的緊迫感和創(chuàng)造力,。

(責(zé)任編輯：張小花 TT1000)

關(guān)閉

DeepSeek 引發(fā)全球熱議的神秘力量

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)