美媒稱,,在美國電子計算機協(xié)會的系統(tǒng)、程序,、語言和應(yīng)用程序大會上,,來自美國麻省理工學(xué)院、法國替代能源與原子能委員會,、奧多比系統(tǒng)軟件公司的研究人員展示了一種能針對稀疏數(shù)據(jù)編寫出優(yōu)化代碼的新系統(tǒng),。與現(xiàn)有的非優(yōu)化軟件包相比,這種代碼能將數(shù)據(jù)分析速度提高100倍,。
據(jù)美國每日科學(xué)網(wǎng)站10月31日報道,人們生活在大數(shù)據(jù)時代,,但大多數(shù)數(shù)據(jù)卻是“稀疏”的,。比如,想象一下,,一張巨大的圖表繪制出了亞馬遜網(wǎng)站的所有顧客與所有產(chǎn)品之間的關(guān)系,,如果用1來表示某個特定顧客購買的每件產(chǎn)品,用0來表示沒有購買的產(chǎn)品,。那么這張圖表上的絕大部分是0,。
對于稀疏數(shù)據(jù),,分析算法會做大量0的相加和相乘,,而這種計算是無用的。為了避免這種情況,,程序員會通過編寫定制代碼來避開0項,,但這種代碼十分復(fù)雜,通常只適用于少量問題,。
在美國電子計算機協(xié)會的系統(tǒng),、程序,、語言和應(yīng)用程序大會上,來自美國麻省理工學(xué)院,、法國替代能源與原子能委員會,、奧多比系統(tǒng)軟件公司的研究人員展示了一種能針對稀疏數(shù)據(jù)編寫出優(yōu)化代碼的新系統(tǒng)。
報道稱,,與現(xiàn)有的非優(yōu)化軟件包相比,,這種代碼能將數(shù)據(jù)分析速度提高100倍。它的性能可與針對特定稀疏數(shù)據(jù)精心手動優(yōu)化的代碼相媲美,,而程序員要做的工作卻少得多,。
該系統(tǒng)名為Taco,即“張量代數(shù)編譯器”的英文縮寫,。在計算機學(xué)術(shù)語中,,像之前所說的亞馬遜網(wǎng)站圖表那樣的數(shù)據(jù)結(jié)構(gòu)被稱為“矩陣”,而“張量”就像是一種更多緯度的矩陣,。
近年來,,張量的數(shù)學(xué)運算——張量代數(shù)——對于大數(shù)據(jù)分析和機器學(xué)習(xí)都變得至關(guān)重要。自愛因斯坦時代以來,,它也一直是科學(xué)研究的一個主題,。
以往,在處理張量代數(shù)時,,數(shù)學(xué)軟件會先把張量運算分解成各個組成部分,。例如,如果某個運算過程需先把兩個張量相乘,,然后再與第三個張量相加,,那么軟件會對前兩個張量運行標(biāo)準(zhǔn)的張量乘法程序,保存結(jié)果,,然后再運行標(biāo)準(zhǔn)的張量加法程序,。
但在大數(shù)據(jù)時代,這么做卻太耗費時間,。研究論文第一作者,、來自麻省理工學(xué)院的弗雷德里克·舍爾斯塔德解釋說,要完成對大型數(shù)據(jù)集的高效運算,,那么每一組張量運算都需要自己的“內(nèi)核”,即計算模板,。