2月24日,,DeepSeek啟動(dòng)了“開源周”,,并開源了首個(gè)代碼庫(kù)FlashMLA,。該代碼庫(kù)是針對(duì)Hopper GPU優(yōu)化的高效MLA解碼內(nèi)核,,專為處理可變長(zhǎng)度序列設(shè)計(jì),,現(xiàn)已投入生產(chǎn)使用,。在H800 GPU上,,F(xiàn)lashMLA能實(shí)現(xiàn)3000 GB/s的內(nèi)存帶寬和580 TFLOPS的計(jì)算性能,。
簡(jiǎn)單來說,F(xiàn)lashMLA是一種優(yōu)化方案,,使大語(yǔ)言模型在H800這樣的GPU上運(yùn)行得更快,、更高效,特別適用于高性能AI任務(wù),。這一代碼能夠加速大語(yǔ)言模型的解碼過程,,提高模型的響應(yīng)速度和吞吐量,對(duì)于實(shí)時(shí)生成任務(wù)(如聊天機(jī)器人,、文本生成等)尤為重要,。
MLA(多層注意力機(jī)制)是一種改進(jìn)的注意力機(jī)制,旨在提高Transformer模型在處理長(zhǎng)序列時(shí)的效率和性能,。通過多個(gè)頭的并行計(jì)算,,MLA讓模型能夠同時(shí)關(guān)注文本中不同位置和不同語(yǔ)義層面的信息,從而更全面,、更深入地捕捉長(zhǎng)距離依賴關(guān)系和復(fù)雜語(yǔ)義結(jié)構(gòu),。
此前,有從業(yè)者解析DeepSeek架構(gòu)時(shí)提到,,MLA的本質(zhì)是對(duì)KV(Key-Value緩存機(jī)制)的有損壓縮,,提高了存儲(chǔ)信息的效率。這項(xiàng)技術(shù)首次在DeepSeek-V2中引入,,目前是開源模型中顯著減小KV緩存大小的最佳方法之一,。
DeepSeek表示,F(xiàn)lashMLA就像給AI推理引擎裝上了一臺(tái)“渦輪增壓器”,,使大模型在處理復(fù)雜任務(wù)時(shí)更快,、更省資源,并降低了技術(shù)門檻,。FlashMLA的意義不僅在于技術(shù)優(yōu)化,,更是打破算力壟斷、加速AI普及的關(guān)鍵一步,。
具體來說,,F(xiàn)lashMLA可以突破GPU算力瓶頸,降低成本,。傳統(tǒng)解碼方法在處理不同長(zhǎng)度的序列時(shí),,GPU的并行計(jì)算能力會(huì)被浪費(fèi),,而FlashMLA通過動(dòng)態(tài)調(diào)度和內(nèi)存優(yōu)化,使Hopper GPU(如H100)的算力得到充分利用,,相同硬件下吞吐量顯著提升,。這意味著企業(yè)可以用更少的GPU服務(wù)器完成同樣的任務(wù),直接降低推理成本,。
另一方面,,F(xiàn)lashMLA可以推動(dòng)大模型落地應(yīng)用。現(xiàn)實(shí)場(chǎng)景中的可變長(zhǎng)度序列(如聊天對(duì)話,、文檔生成)需要?jiǎng)討B(tài)處理,,但傳統(tǒng)方法需要填充到固定長(zhǎng)度,導(dǎo)致計(jì)算冗余,。FlashMLA支持動(dòng)態(tài)處理變長(zhǎng)輸入,,讓AI應(yīng)用(如客服機(jī)器人、代碼生成)響應(yīng)更快,、更流暢,,用戶體驗(yàn)提升,加速商業(yè)化落地,。
此前高效的解碼內(nèi)核多由科技巨頭閉源壟斷(如CUDA優(yōu)化庫(kù)),,中小企業(yè)和研究者難以復(fù)現(xiàn)。FlashMLA開源后,,開發(fā)者可以免費(fèi)獲得“工業(yè)級(jí)優(yōu)化方案”,,降低技術(shù)門檻,促進(jìn)更多創(chuàng)新應(yīng)用(如垂直領(lǐng)域小模型)的誕生,。
有網(wǎng)友在DeepSeek的帖子下留言稱,,“鯨魚正在掀起波浪!”(注:DeepSeek的企業(yè)LOGO是鯨魚),。也有網(wǎng)友希望DeepSeek開源網(wǎng)頁(yè)搜索相關(guān)的代碼,,并提到,“DeepSeek是真正的開放人工智能”,。
這僅僅是開始,,上周2月21日DeepSeek宣布,接下來會(huì)陸續(xù)開源五個(gè)代碼庫(kù),,“以完全透明的方式分享我們微小但真誠(chéng)的進(jìn)展”。這些在線服務(wù)中的基礎(chǔ)構(gòu)建模塊已經(jīng)經(jīng)過文檔化,、部署,,并在生產(chǎn)環(huán)境中經(jīng)過實(shí)戰(zhàn)檢驗(yàn)。DeepSeek表示自己是探索AGI的小公司,,作為開源社區(qū)的一部分,,每分享一行代碼都會(huì)成為加速AI行業(yè)發(fā)展的集體動(dòng)力。DeepSeek強(qiáng)調(diào)沒有高不可攀的象牙塔,只有純粹的車庫(kù)文化和社區(qū)驅(qū)動(dòng)的創(chuàng)新,。
每經(jīng)AI快訊,2月28日,,DeepSeek開源周第五天,,DeepSeek在官方X賬號(hào)宣布開源3FS,它是所有Deepseek數(shù)據(jù)訪問的助推器
2025-02-28 11:52:14DeepSeek開源周第五天過去一周,,中國(guó)的人工智能大模型成為硅谷乃至全球科技界的熱議話題。引發(fā)這場(chǎng)討論的是中國(guó)人工智能初創(chuàng)公司深度求索(DeepSeek)
2025-01-27 10:02:46幻方DeepSeek如何震驚硅谷