在人工智能芯片的競爭中,,英偉達(dá)憑借其強大的技術(shù)實力和完整的生態(tài)系統(tǒng),構(gòu)筑了難以逾越的壁壘,。然而,,隨著AI應(yīng)用場景的擴(kuò)展,特別是在推理階段的需求爆發(fā),,AMD等競爭者正在尋找突破口,。
最新消息顯示,AMD利用DeepSeek模型走紅的機(jī)會,,宣布將新的DeepSeek-V3模型集成到Instinct MI300X GPU上,。這一集成旨在與SGLang配合使用,以實現(xiàn)最佳性能,。DeepSeek-V3專門針對AI推理進(jìn)行了優(yōu)化,,表明AMD正在積極布局AI應(yīng)用落地場景。
這種合作反映了AI行業(yè)格局的變化,。過去兩年,,大模型的訓(xùn)練需求主導(dǎo)了算力市場,英偉達(dá)憑借CUDA生態(tài)和H100系列GPU占據(jù)絕對優(yōu)勢,。但隨著大模型進(jìn)入應(yīng)用落地階段,,推理需求激增,企業(yè)更關(guān)注成本,、能效和部署靈活性,。AMD瞄準(zhǔn)這一窗口期,試圖通過優(yōu)化推理性能打破英偉達(dá)的壟斷,。
AMD的Instinct MI300X是其AI戰(zhàn)略的核心武器,。這款采用Chiplet設(shè)計的GPU集成1460億晶體管,配備192GB HBM3內(nèi)存,,專為大規(guī)模AI推理設(shè)計,。據(jù)AMD數(shù)據(jù),,MI300X的推理性能較英偉達(dá)H100提升30%,內(nèi)存帶寬達(dá)5.3TB/s,,尤其擅長實時對話,、圖像生成等低延遲任務(wù)。不過,,MI300X面臨生態(tài)短板和產(chǎn)能瓶頸兩大挑戰(zhàn),。
AI芯片領(lǐng)域的領(lǐng)軍企業(yè)英偉達(dá)就近期關(guān)于其AI芯片延期發(fā)布的傳言進(jìn)行了回應(yīng)
2024-08-04 21:05:19英偉達(dá)回應(yīng)AI芯片推遲發(fā)布