因此,,可以認為ACCEL的時鐘頻率是500M,,也就是一個時鐘周期2納秒,。等于是說,,幾個時鐘周期,,ACCEL就把計算任務辦完了,。而在傳統(tǒng)計算機里,,無論是CPU還是GPU,,這類計算任務都要很多個時鐘周期的,,做個乘法就要好多步。并行是說,,海量數(shù)據(jù)可以組成向量加速,,但對某個數(shù)據(jù)處理的時鐘周期是省不了的,。
所以清華論文報告說,在進行ImageNet三類物體分類時,,ACCEL的計算速度約相當于4550個TOPS,。TOPS是Tera Operations Per Second,代表每秒1萬億次操作,。這個計算速度確實能有商用GPU的3000多倍,,因為GPU每秒能有1萬億次操作已經很好了。所謂“算力是商用GPU的3000多倍”,,就是這么來的,。但這個說法,究竟是哪里不對呢,?
真正的問題,,在于持續(xù)計算。ACCEL確實能在幾納秒之內處理一幅圖像的光信號,,但它能不能持續(xù)運算,,真的用一秒時間,完成4550TOPS的運算量,?這就不行了,,因為準備任務是需要時間的。例如以它的計算速度,,一秒能處理1億個圖片,,但把這么多圖片的光信號在一秒內發(fā)送給它,是不可能的,。實際準備一個圖片需要的時間就不短,,真正的瓶頸是在這兒。
ACCEL芯片測試準備
ACCEL芯片是一個光電芯片,,它的輸入是光信號,,要把它運行起來,需要準備好光信號輸入,,而這是個相當復雜的任務,。按論文描述,清華團隊要搭起光學鏡片組,,才能將識別目標的光信號輸入給ACCEL進行處理,,換下一個識別目標要不少操作。而GPU,、CPU在計算機系統(tǒng)中應用多年了,,處理輸入已經很成熟了,所以能將海量數(shù)據(jù)組織起來,象流水線一樣送到運算核心不停處理,。高性能GPU的核心技術之一,,就是海量數(shù)據(jù)輸入管理,要用到上百G的高速存儲器,,多級緩存,。
所以,論總的算力ACCEL并不大,,它只是對整個流程中的一步處理得極快,,而這一步快的代價是另一些步驟慢。一個比喻是,,一個士兵面前正好有一個敵人,,他開槍只用1秒鐘就消滅了一個敵人。但這不代表他可以一小時消滅3600個敵人,,更不是說他可以一個人頂3000多個人。如果有人說他的“戰(zhàn)力”有3000多個士兵這么多,,這就錯得離譜,。再一個比喻是,一張弓,,可以在1秒內讓箭飛出100米,,速度很快。但是,,不能說它的“運送能力”是1小時360公里,,因為沒法持續(xù)飛。如果射一箭,,人走過去再射一箭,,這樣接力,一小時跑不了多遠,。
英偉達不僅自身實現(xiàn)了蛻變,,也深刻影響了眾多科技企業(yè)的命運
2024-09-23 05:49:54又一芯片公司在9月10日的凌晨1點,蘋果的發(fā)布會拉開了帷幕,。發(fā)布會上,,蘋果揭曉了其最新的A18芯片,這款芯片采用了先進的3納米工藝制造,,將首次裝載于iPhone16系列之中
2024-09-10 08:50:04蘋果A18芯片發(fā)布:CPU提升30%12月14日,,2024科學家創(chuàng)新大會在雄安召開。會上,,多位院士專家討論了遙感產業(yè)的未來發(fā)展,,認為推動算力“上天”將成為產業(yè)未來發(fā)展的大趨勢
2024-12-17 02:16:45我國將構建天地一體化算力網絡2024中國算力大會將于9月27日至29日在河南鄭州舉行,華為將參與此次大會,,主題定為“共贏算力新時代”
2024-09-25 09:12:00華為將參加2024中國算力大會