四年前,谷歌面臨一道難題,如果每個(gè)用戶每天都會(huì)花費(fèi)三分鐘時(shí)間來(lái)使用語(yǔ)音識(shí)別服務(wù)的話,那么公司將不得不將數(shù)據(jù)中心規(guī)模再翻一倍,以便處理海量的語(yǔ)音數(shù)據(jù)和AI計(jì)算。
不過(guò)為了滿足這樣的需求,谷歌并沒有去建設(shè)更大的數(shù)據(jù)中心,而是轉(zhuǎn)為開發(fā)適用于AI計(jì)算的高性能轉(zhuǎn)用硬件。
最終,名為TPU(Tensor Processing Unit)的處理器誕生了,其是一種專門為加速深層神經(jīng)網(wǎng)絡(luò)運(yùn)算能力而研發(fā)的芯片。
今天,谷歌在一篇博文中提到了在TPU上所取得的一系列成績(jī)。
谷歌表示,相比類似的服務(wù)器級(jí)Intel Haswell CPU和NVIDIA K80 GPU,TPU在AI運(yùn)算測(cè)試中的平均速度要快15-30倍。更重要的是,TPU的每瓦性能要比普通的GPU高出25-80倍。
谷歌數(shù)據(jù)中心自2015年以來(lái)一直在使用TPU來(lái)加速AI服務(wù),而且首獲了理想的效果,其能夠更快的處理用戶發(fā)送的請(qǐng)求,降低結(jié)果反饋的延遲。
值得一提的是,谷歌認(rèn)為現(xiàn)在的TPU仍在硬件和軟件方面存在很大的優(yōu)化空間,比如假定用上了NVIDIA K80 GPU中的GDDR5內(nèi)存,那么TPU就可以發(fā)揮出更好的性能。
此外,谷歌工程師還為TPU開發(fā)了名為CNN1的軟件,其可以讓TPU的運(yùn)行速度比普通CPU高出70多倍!