中國研究人員開發(fā)了一種高性能算法,能夠大幅提升NVIDIA消費級GPU的科學(xué)計算性能,,最高可達(dá)800倍,。這一創(chuàng)新成果來自深圳北理莫斯科大學(xué)的研究團隊,該校由北京理工大學(xué)和莫斯科國立羅蒙諾索夫大學(xué)聯(lián)合創(chuàng)立,。
新算法主要增強了近場動力學(xué)的計算效率,。近場動力學(xué)是一種先進的非局部理論,用于解決材料斷裂,、損壞等復(fù)雜物理問題,,在航空,、工程和軍事等領(lǐng)域有廣泛應(yīng)用。然而,,傳統(tǒng)方法在處理這類問題時效率較低,。
研究團隊基于NVIDIA CUDA編程技術(shù),創(chuàng)建了PD-General框架,,優(yōu)化了算法設(shè)計和內(nèi)存管理,,充分利用了GPU的大規(guī)模并行計算能力。實驗結(jié)果顯示,,在一塊普通的RTX 4070顯卡上,,新算法比傳統(tǒng)串行算法快800倍,相比新的OpenMP并行算法也提升了100倍,。
在涉及上百萬粒子的大規(guī)模模擬中,,新算法只需不到5分鐘即可完成4000步迭代。而在大規(guī)模2D單軸拉伸問題中,,新算法僅用不到2分鐘就完成了695萬次單精度迭代。
該算法的應(yīng)用前景廣泛,,包括改進航空器結(jié)構(gòu)材料應(yīng)力與失效模型,、提升建筑與工業(yè)材料測試效率以及加快防御性材料的抗沖擊研究。最重要的是,,這一算法不需要高性能GPU芯片,,普通消費級家用GPU就能勝任。如果能支持國產(chǎn)GPU硬件,,將更加理想,。