5月19日,,英偉達(dá)CEO黃仁勛宣布全球最小AI超級(jí)計(jì)算機(jī)DGX Spark已全面投產(chǎn),,預(yù)計(jì)數(shù)周內(nèi)就緒,。這款設(shè)備被稱為“桌面級(jí)AI超算”,,由英偉達(dá)超級(jí)芯片驅(qū)動(dòng),,將數(shù)據(jù)中心級(jí)算力首次壓縮至150×150×50.5mm的臺(tái)式機(jī)形態(tài)機(jī)身內(nèi),,支持開發(fā)者在本地完成大模型的訓(xùn)練,、微調(diào)和推理,,并實(shí)現(xiàn)與云端算力的無縫遷移,。這標(biāo)志著AI開發(fā)正式進(jìn)入“個(gè)人時(shí)代”,。
DGX Spark的核心是英偉達(dá)專為臺(tái)式機(jī)優(yōu)化的GB10 Grace Blackwell超級(jí)芯片,采用第五代Tensor Core架構(gòu),,支持FP4精度計(jì)算,,每秒運(yùn)算能力高達(dá)1,000萬億次,專為生成式AI和物理AI模型設(shè)計(jì),。通過NVLink-C2C互連技術(shù),,CPU與GPU間的數(shù)據(jù)帶寬提升至第五代PCIe的五倍,解決了傳統(tǒng)架構(gòu)中內(nèi)存密集型任務(wù)效率低下的問題,。
DGX Spark的性能參數(shù)使其能夠本地運(yùn)行2000億參數(shù)的AI大模型,,雙機(jī)互聯(lián)時(shí)可擴(kuò)展至4050億參數(shù),遠(yuǎn)超普通AI工作站,。預(yù)裝了NVIDIA全棧AI平臺(tái),,用戶可直接調(diào)用Cosmos-Reason世界基礎(chǔ)模型和GR00T N1機(jī)器人模型,大幅降低開發(fā)門檻,。
DGX Spark的研發(fā)始于英偉達(dá)2022年啟動(dòng)的Project DIGITS項(xiàng)目,。今年1月,該項(xiàng)目以“全球最小AI超算”身份亮相CES展,,引發(fā)行業(yè)關(guān)注,。經(jīng)過三個(gè)月的優(yōu)化,,英偉達(dá)于3月19日正式發(fā)布DGX Spark,并同步開放預(yù)訂,。DGX Spark的量產(chǎn)由華碩,、戴爾、惠普和聯(lián)想等頭部廠商共同完成,,預(yù)計(jì)年內(nèi)覆蓋全球數(shù)百萬開發(fā)者,。
黃仁勛表示,DGX Spark的推出不僅是硬件突破,,更是“AI原生計(jì)算機(jī)”這一新品類誕生的標(biāo)志,,未來將推動(dòng)邊緣計(jì)算與生成式AI的深度融合。DGX Spark的投產(chǎn)正值A(chǔ)I行業(yè)從“云端壟斷”向“端云協(xié)同”轉(zhuǎn)型的關(guān)鍵期,。隨著生成式AI應(yīng)用爆發(fā),,開發(fā)者對(duì)本地化算力的需求激增。據(jù)廣發(fā)證券測算,,2025年全球AI推理算力需求將是訓(xùn)練算力的三倍以上,,而傳統(tǒng)云端部署面臨數(shù)據(jù)隱私、延遲和成本壓力,。DGX Spark的出現(xiàn)使中小型企業(yè)和個(gè)人開發(fā)者能夠以消費(fèi)級(jí)成本獲得超算級(jí)算力,,推動(dòng)AI創(chuàng)新門檻大幅降低。