盡管春節(jié)假期已經(jīng)過半,,但“來自東方的神秘力量的DeepSeek”仍在全球范圍內(nèi)引起熱議,。各路業(yè)內(nèi)人士繼續(xù)從不同角度分析DeepSeek的模型和技術(shù)文章。
北京時間1月31日,,英偉達宣布DeepSeek-R1模型登陸NVIDIA NIM,。同一時段內(nèi),亞馬遜和微軟也接入了DeepSeek-R1模型,。英偉達稱,,DeepSeek-R1是最先進的大語言模型。
韓國Mirae Asset Securities Research的一名分析師在X上撰寫長文分析稱,,這一突破是通過實施大量細粒度優(yōu)化和使用英偉達的匯編式PTX編程實現(xiàn)的,,而非通過CUDA中的某些功能。CUDA是由英偉達開發(fā)的一種通用編程框架,,允許開發(fā)者利用其圖形處理器進行通用計算,。
如果DeepSeek真的繞過了CUDA,這表明其在研發(fā)大模型時采用了不同的技術(shù)路徑,。在DeepSeek-V3的技術(shù)博文中,,DeepSeek表示其使用了英偉達的PTX語言。如果DeepSeek的開發(fā)者能夠很好地使用PTX語言,,相比使用CUDA提供的編程接口,,可以更精細地控制GPU之間的數(shù)據(jù)、權(quán)重和梯度傳輸,。然而,,使用PTX編寫的代碼復雜且難以維護,需要專業(yè)度較高的開發(fā)者,。
繞過CUDA的做法具有一定的技術(shù)難度,,要求開發(fā)者既要懂AI模型算法,又要懂計算機系統(tǒng)架構(gòu)以高效分配硬件資源,。如果沒有同時掌握這兩方面技能的開發(fā)者,,則需要協(xié)調(diào)不同人員,。從DeepSeek的技術(shù)報告來看,其主體實現(xiàn)還是基于CUDA的相關(guān)接口,,但在描述中提到繞開了CUDA來寫通信,,這意味著它招聘了具備不同技能的人才,并將這些人才很好地結(jié)合起來,。
這也說明DeepSeek擁有一些擅長寫PTX語言的內(nèi)部開發(fā)者,。假如未來使用國產(chǎn)GPU,DeepSeek在硬件適配方面會更加得心應手,,只需了解這些硬件驅(qū)動提供的一些基本函數(shù)接口,,就可以仿照英偉達GPU硬件的編程接口編寫相關(guān)代碼,使自家大模型更容易適配國產(chǎn)硬件,。
從學術(shù)研究角度來看,,DeepSeek的技術(shù)并沒有特別突出,但在工程上卻非常有技巧,??紤]到AMD已經(jīng)宣布集成DeepSeek-V3到MI300X GPU,未來可能會有更多GPU廠商與DeepSeek合作,。韓國分析師在同一篇X文章中指出,,這凸顯了DeepSeek非凡的工程水平,并表明美國對華制裁加劇的“GPU短缺危機”激發(fā)了他們的緊迫感和創(chuàng)造力,。
美國國家航空航天局成為最新一家禁止員工使用中國DeepSeek人工智能技術(shù)并阻止其系統(tǒng)訪問DeepSeek平臺的美國聯(lián)邦機構(gòu)
2025-02-01 18:48:12NASA禁用DeepSeekDeepSeek發(fā)布了新一代開源大模型DeepSeek-R1。該模型在數(shù)學,、代碼,、自然語言推理等任務(wù)上的性能與美國OpenAI公司的最新o1大模型相當
2025-01-21 22:05:22DeepSeek又有重大突破