中國研究人員開發(fā)了一種高性能算法,,能夠大幅提升NVIDIA消費(fèi)級GPU的科學(xué)計(jì)算性能,,最高可達(dá)800倍,。這一創(chuàng)新成果來自深圳北理莫斯科大學(xué)的研究團(tuán)隊(duì),該校由北京理工大學(xué)和莫斯科國立羅蒙諾索夫大學(xué)聯(lián)合創(chuàng)立,。
新算法主要增強(qiáng)了近場動力學(xué)的計(jì)算效率,。近場動力學(xué)是一種先進(jìn)的非局部理論,,用于解決材料斷裂,、損壞等復(fù)雜物理問題,,在航空,、工程和軍事等領(lǐng)域有廣泛應(yīng)用,。然而,,傳統(tǒng)方法在處理這類問題時(shí)效率較低。
研究團(tuán)隊(duì)基于NVIDIA CUDA編程技術(shù),,創(chuàng)建了PD-General框架,,優(yōu)化了算法設(shè)計(jì)和內(nèi)存管理,充分利用了GPU的大規(guī)模并行計(jì)算能力,。實(shí)驗(yàn)結(jié)果顯示,,在一塊普通的RTX 4070顯卡上,新算法比傳統(tǒng)串行算法快800倍,,相比新的OpenMP并行算法也提升了100倍,。
在涉及上百萬粒子的大規(guī)模模擬中,新算法只需不到5分鐘即可完成4000步迭代,。而在大規(guī)模2D單軸拉伸問題中,,新算法僅用不到2分鐘就完成了695萬次單精度迭代。
該算法的應(yīng)用前景廣泛,,包括改進(jìn)航空器結(jié)構(gòu)材料應(yīng)力與失效模型,、提升建筑與工業(yè)材料測試效率以及加快防御性材料的抗沖擊研究。最重要的是,,這一算法不需要高性能GPU芯片,,普通消費(fèi)級家用GPU就能勝任。如果能支持國產(chǎn)GPU硬件,,將更加理想,。