算力方面,針對(duì)國產(chǎn)芯片性能瓶頸及單卡集群的局限性問題,,業(yè)界提出了“混元異構(gòu)集群”的解決方案,。
目前,國產(chǎn)芯片與國外芯片之間存在代差,,使用單一品牌芯片集群存在固定的,、無法解決的弱項(xiàng)。“通過混合強(qiáng)弱芯片形成混元集群,,再采用算法適配使整體接近高性能芯片,,就能夠打破單一集群限制,實(shí)現(xiàn)高效協(xié)同,?!苯鹄诒硎尽?/p>
然而,,構(gòu)建高效能的多卡集群需要解決技術(shù)復(fù)雜性,、資源分散、生態(tài)支持等一系列問題,,盡管市場上眾多廠商標(biāo)榜具備多集群管理能力,,但行之有效的并不多?!罢嬲龑?shí)現(xiàn)跨多集群協(xié)同的廠商極少,,許多異構(gòu)計(jì)算僅限于兩個(gè)集群間?!睏钫鸨硎?,北電數(shù)智針對(duì)性推出的算力管理平臺(tái)“前進(jìn)·AI異構(gòu)計(jì)算平臺(tái)”,致力于實(shí)現(xiàn)多集群合作,,當(dāng)前已搭建包含三個(gè)國產(chǎn)混元集群,,達(dá)產(chǎn)后將形成2000PFLOPS的智能算力供給。
“打破算力延遲,,讓不同算力集群能夠?qū)崿F(xiàn)高效協(xié)同作戰(zhàn),,是下一階段必然的發(fā)展趨勢?!眳窃勒f到,,其中涉及到很多細(xì)碎的功夫是必須要去做的,包括算子庫的補(bǔ)齊,、通信庫的補(bǔ)齊等等,。只有把每個(gè)細(xì)節(jié)都做好,才能讓芯片無差別地支撐各種不同的底座大模型,。
同時(shí),,相對(duì)算力供給包銷、租賃模式的局限性,,按token定價(jià)的模式則大幅降低了算力的使用成本,。“算力中心的運(yùn)營目標(biāo)應(yīng)該是為企業(yè)提供像水電一樣的基礎(chǔ)算力設(shè)施,,用戶使用了算力或模型服務(wù)才開始計(jì)費(fèi),,即插即用。”吳岳分析到,,當(dāng)前按token計(jì)費(fèi)的模式,,主要是幫助中小企業(yè)解決普遍存在的算力應(yīng)用難題,在面對(duì)像醫(yī)院這一類傳統(tǒng)客戶的垂類模型訓(xùn)練時(shí),,成本甚至可以降到原來的1/10左右,。
算法方面,在構(gòu)建好的芯片混元集群基礎(chǔ)上,,運(yùn)用專業(yè)算法實(shí)現(xiàn)芯片的異構(gòu)調(diào)度,,能夠保證跨集群訓(xùn)練的穩(wěn)定性,可以解決算力和模型之間的連接問題,。
2024中國算力大會(huì)將于9月27日至29日在河南鄭州舉行,華為將參與此次大會(huì),,主題定為“共贏算力新時(shí)代”
2024-09-25 09:12:00華為將參加2024中國算力大會(huì)