在人工智能芯片的競爭中,,英偉達憑借其強大的技術實力和完整的生態(tài)系統(tǒng),,構筑了難以逾越的壁壘,。然而,,隨著AI應用場景的擴展,,特別是在推理階段的需求爆發(fā),AMD等競爭者正在尋找突破口,。
最新消息顯示,,AMD利用DeepSeek模型走紅的機會,宣布將新的DeepSeek-V3模型集成到Instinct MI300X GPU上,。這一集成旨在與SGLang配合使用,,以實現(xiàn)最佳性能。DeepSeek-V3專門針對AI推理進行了優(yōu)化,,表明AMD正在積極布局AI應用落地場景,。
這種合作反映了AI行業(yè)格局的變化。過去兩年,,大模型的訓練需求主導了算力市場,,英偉達憑借CUDA生態(tài)和H100系列GPU占據(jù)絕對優(yōu)勢。但隨著大模型進入應用落地階段,,推理需求激增,,企業(yè)更關注成本、能效和部署靈活性。AMD瞄準這一窗口期,,試圖通過優(yōu)化推理性能打破英偉達的壟斷,。
AMD的Instinct MI300X是其AI戰(zhàn)略的核心武器。這款采用Chiplet設計的GPU集成1460億晶體管,,配備192GB HBM3內存,,專為大規(guī)模AI推理設計。據(jù)AMD數(shù)據(jù),,MI300X的推理性能較英偉達H100提升30%,,內存帶寬達5.3TB/s,尤其擅長實時對話,、圖像生成等低延遲任務,。不過,MI300X面臨生態(tài)短板和產(chǎn)能瓶頸兩大挑戰(zhàn),。
英偉達的CUDA生態(tài)已形成近乎壟斷的開發(fā)者壁壘,,全球90%的AI框架依賴其工具鏈。盡管AMD推出開源的ROCm平臺并適配PyTorch,、TensorFlow,,但遷移成本高、社區(qū)支持不足的問題依然突出,。例如,,Meta雖采用MI300X運行Llama 3.1模型的推理任務,但訓練階段仍依賴英偉達芯片,。此外,,2023年底臺積電先進封裝產(chǎn)能緊張導致MI300X交付延遲,部分客戶轉投英偉達,,也暴露出AMD在供應鏈管理上的脆弱性,。
為應對挑戰(zhàn),AMD加速硬件迭代并強化生態(tài)合作,。2024年6月,,AMD推出了升級版的MI325X芯片,這款產(chǎn)品采用了8個計算芯片,、4個I/O芯片和8個內存芯片的復雜設計,,通過2.5D和3D封裝技術實現(xiàn)整合。在性能方面,,MI325X提供了1.3petaFLOPS的BF/FP16性能,,或2.6petaFLOPS的FP8性能,超過了英偉達的H200,。特別是在內存容量上,,MI325X配備了288GB的HBM3e內存,,是H200的兩倍多,內存帶寬達到6TB/S,。
然而,,MI325X依舊存在明顯短板。與英偉達的產(chǎn)品相比,,AMD在FP8(8位浮點數(shù))支持方面存在劣勢,。由于軟件庫vLLM對FP8支持有限,AMD不得不在許多基準測試中使用FP16,,這意味著相同規(guī)模的AI模型在AMD芯片上需要更多內存。
面對這些技術挑戰(zhàn),,AMD已經(jīng)規(guī)劃了明確的產(chǎn)品路線圖,。AMD計劃2025年推出MI355X,性能較MI325X再提升80%,,并采用3nm工藝,。更重要的是,AMD還暗示了代號為“CDNA next”的下一代產(chǎn)品將帶來“重大架構升級”,,可能包括異構多芯片部署或光子內存擴展等創(chuàng)新技術,,并將支持FP4和FP6數(shù)據(jù)類型,這一改進有望解決目前在低精度計算方面的短板,。
除了技術創(chuàng)新,,AMD還通過一系列戰(zhàn)略投資加強其在AI領域的競爭力。2024年7月,,AMD以6.65億美元收購歐洲最大私人AI實驗室Silo AI。這家實驗室擁有300名專家,,在開發(fā)定制化大語言模型和MLOps工具方面具有深厚積累,。此次收購有效補強了AMD的AI服務能力:Silo AI能夠為客戶提供從模型訓練到部署的全流程支持,而AMD則可以借此將硬件,、軟件和服務整合為完整的“端到端解決方案”,。值得一提的是,Silo AI為歐洲企業(yè)開發(fā)的“主權AI”模型(如支持歐盟多語言的Poro和Viking)已經(jīng)在AMD平臺上直接運行,,這為AMD在歐洲市場構建起獨特的區(qū)域性優(yōu)勢,。
2024年12月,AMD領投了MIT初創(chuàng)公司Liquid AI的2.5億美元A輪融資,。Liquid AI提出的“液態(tài)神經(jīng)網(wǎng)絡”摒棄傳統(tǒng)Transformer架構,,模仿線蟲神經(jīng)系統(tǒng)設計動態(tài)權重更新機制。其模型LFM-1B在自然語言處理任務中,,以1/10的參數(shù)量達到同等規(guī)模模型的性能,,且推理能效提升90%。這一技術有望解決Transformer在長序列建模和邊緣計算中的瓶頸。AMD的押注不僅是為了搶占下一代AI架構的先機,,也是為了在英偉達主導的“大模型軍備競賽”外開辟新戰(zhàn)場,。
2025年1月,,AMD又以2000萬美元投資AI制藥公司Absci,,首次進軍生命科學領域,。Absci利用AI從頭設計抗體,借助AMD的MI300X芯片,,其“集成藥物創(chuàng)造平臺”可將抗體設計周期縮短至6周。AMD看中的是生命科學領域對高效推理的需求——基因測序,、蛋白質模擬等任務需要海量并行計算,,而英偉達在該市場的布局尚未形成壁壘,。與Absci合作,,將幫助AMD擴大芯片應用場景,,還可積累生物計算領域的專屬優(yōu)化經(jīng)驗,。
盡管AMD在某些關鍵AI任務上能夠提供更快的速度和更低的價格,但英偉達的優(yōu)勢仍然明顯,。英偉達CEO黃仁勛曾表示,,即使競爭對手的芯片免費提供,從總擁有成本來看也無法與英偉達競爭,。這種底氣源自英偉達在AI軟件生態(tài)系統(tǒng)和整體解決方案方面長期建立的優(yōu)勢地位,。
另一方面,亞馬遜,、谷歌等云廠商自研AI芯片也在持續(xù)擠壓第三方供應商的空間,。此外,地緣政治風險也不容忽視——美國對華芯片出口限制也在迫使AMD調整中國市場策略,,而英偉達憑借更早的全球化布局更具韌性。
不過,,市場格局正在發(fā)生變化,。隨著AI芯片的主戰(zhàn)場從訓練向推理階段轉移,性價比和能效比將變得越來越重要,。一些機構已經(jīng)開始考慮在推理任務中使用替代方案,,原因是英偉達芯片的價格和能耗都相對較高,。這為AMD等競爭者提供了機會。
在接受《時代》雜志采訪時,,AMD CEO蘇姿豐表示,,AI是一個重大的技術變革機遇。她強調,,AMD的優(yōu)勢在于能夠提供端到端的AI解決方案,,并在與合作伙伴協(xié)作方面表現(xiàn)出色。這種戰(zhàn)略思維反映在AMD的投資布局上,,從芯片研發(fā)到軟件優(yōu)化,,從人才儲備到應用場景拓展,AMD正在構建全方位的AI生態(tài)系統(tǒng),。
展望未來,,雖然短期內難以撼動英偉達的主導地位,但隨著AI應用場景的不斷豐富和市場需求的持續(xù)增長,,AMD通過技術創(chuàng)新和戰(zhàn)略投資,正在逐步縮小與領導者的差距,。在這場技術變革中,,最終的贏家可能是能夠為不同應用場景提供最優(yōu)解決方案的參與者。
AI芯片領域的領軍企業(yè)英偉達就近期關于其AI芯片延期發(fā)布的傳言進行了回應
2024-08-04 21:05:19英偉達回應AI芯片推遲發(fā)布