因此,可以認(rèn)為ACCEL的時鐘頻率是500M,,也就是一個時鐘周期2納秒。等于是說,,幾個時鐘周期,,ACCEL就把計算任務(wù)辦完了。而在傳統(tǒng)計算機(jī)里,,無論是CPU還是GPU,這類計算任務(wù)都要很多個時鐘周期的,,做個乘法就要好多步,。并行是說,,海量數(shù)據(jù)可以組成向量加速,但對某個數(shù)據(jù)處理的時鐘周期是省不了的,。
所以清華論文報告說,,在進(jìn)行ImageNet三類物體分類時,,ACCEL的計算速度約相當(dāng)于4550個TOPS。TOPS是Tera Operations Per Second,,代表每秒1萬億次操作。這個計算速度確實(shí)能有商用GPU的3000多倍,,因為GPU每秒能有1萬億次操作已經(jīng)很好了,。所謂“算力是商用GPU的3000多倍”,就是這么來的,。但這個說法,,究竟是哪里不對呢,?
真正的問題,在于持續(xù)計算,。ACCEL確實(shí)能在幾納秒之內(nèi)處理一幅圖像的光信號,但它能不能持續(xù)運(yùn)算,,真的用一秒時間,,完成4550TOPS的運(yùn)算量?這就不行了,,因為準(zhǔn)備任務(wù)是需要時間的。例如以它的計算速度,,一秒能處理1億個圖片,,但把這么多圖片的光信號在一秒內(nèi)發(fā)送給它,,是不可能的。實(shí)際準(zhǔn)備一個圖片需要的時間就不短,,真正的瓶頸是在這兒。
ACCEL芯片測試準(zhǔn)備
ACCEL芯片是一個光電芯片,,它的輸入是光信號,要把它運(yùn)行起來,需要準(zhǔn)備好光信號輸入,,而這是個相當(dāng)復(fù)雜的任務(wù),。按論文描述,,清華團(tuán)隊要搭起光學(xué)鏡片組,才能將識別目標(biāo)的光信號輸入給ACCEL進(jìn)行處理,,換下一個識別目標(biāo)要不少操作,。而GPU、CPU在計算機(jī)系統(tǒng)中應(yīng)用多年了,,處理輸入已經(jīng)很成熟了,,所以能將海量數(shù)據(jù)組織起來,象流水線一樣送到運(yùn)算核心不停處理,。高性能GPU的核心技術(shù)之一,,就是海量數(shù)據(jù)輸入管理,要用到上百G的高速存儲器,,多級緩存。
所以,,論總的算力ACCEL并不大,,它只是對整個流程中的一步處理得極快,而這一步快的代價是另一些步驟慢,。一個比喻是,一個士兵面前正好有一個敵人,,他開槍只用1秒鐘就消滅了一個敵人。但這不代表他可以一小時消滅3600個敵人,,更不是說他可以一個人頂3000多個人,。如果有人說他的“戰(zhàn)力”有3000多個士兵這么多,,這就錯得離譜,。再一個比喻是,,一張弓,可以在1秒內(nèi)讓箭飛出100米,,速度很快,。但是,不能說它的“運(yùn)送能力”是1小時360公里,,因為沒法持續(xù)飛,。如果射一箭,人走過去再射一箭,,這樣接力,,一小時跑不了多遠(yuǎn),。
英偉達(dá)不僅自身實(shí)現(xiàn)了蛻變,,也深刻影響了眾多科技企業(yè)的命運(yùn)
2024-09-23 05:49:54又一芯片公司2024中國算力大會將于9月27日至29日在河南鄭州舉行,華為將參與此次大會,,主題定為“共贏算力新時代”
2024-09-25 09:12:00華為將參加2024中國算力大會