就在宣布計劃開發(fā)新版本Power系列處理器的近20個月之后,IBM近日推出了首款基于這個新芯片的設(shè)備,并表示它是計算密集型人工智能工作負(fù)載的最佳選擇。
最新基于Linux的AC922 Power Systems可以加速深度學(xué)習(xí)訓(xùn)練時間,縮短4倍。除了處理器的性能提升之外,該系統(tǒng)還采用了最新的PCIe 4.0擴展總線、Nvidia NVLink 2.0高速互連以及OpenCapi——一種用于將微處理器與內(nèi)存、加速器、IO設(shè)備以及其他處理器的接口架構(gòu)。IBM表示,這種組合能讓性能提升10倍。
Pund-IT總裁、首席分析師Charles King表示:“Power9在遷移數(shù)據(jù)方面是絕對出色的,這對以AI為中心的流程來說至關(guān)重要。因為AI依賴于數(shù)千次反復(fù)進行的深度學(xué)習(xí)練習(xí),所以Power9系統(tǒng)可以減少大量時間。”
AC 922服務(wù)器采用2個Power9處理器,最多6個由NVLink接口連接的Nividia GPU。“這對任何加速工作負(fù)載來說都是非常棒的,”IBM洪高性能計算、人工智能和機器學(xué)習(xí)副總裁Sumit Gupta這樣表示。
“機器學(xué)習(xí)數(shù)據(jù)集是巨大的,我們把數(shù)據(jù)遷移到加速器上的速度要遠(yuǎn)遠(yuǎn)快于遷移到英特爾系統(tǒng)上。”IBM表示,Power9將是美國能源部“Summit”和“Sierra”超級計算機的核心。
IBM最近經(jīng)常提及摩爾定律曲線的終結(jié),該定律稱處理器密度每年會翻一番,持續(xù)超過50年。隨著CPU速度緩慢提高,系統(tǒng)制造商一直在尋找諸如GPU等外部加速器來提升性能。這就是為什么引入PCIe 4.0和NVLink 2.0很重要的原因。NVLink 2.0可以的通信性能可以達到每秒25千兆比特,這是英特爾x86系統(tǒng)中采用PCIe 3.0速度的7到10倍。
Moor Insights&Strategy總裁兼首席分析師Patrick Moorhead表示:“Power9就像是瑞士軍刀版的AI加速器。你可以接入地球上性能最高的加速器,配置連貫的內(nèi)存,這意味著加速器可以直接訪問系統(tǒng)內(nèi)存。”
使用協(xié)同處理器可以使用板載加速器上并行運行任務(wù)來提升整體性能,但是CPU制造了一個瓶頸。他說:“最大的問題就是數(shù)據(jù)通過網(wǎng)絡(luò)到達CPU內(nèi)存,每個加速器也有它自己的內(nèi)存,這樣你需要將數(shù)據(jù)遷移到加速器。”
每個GPU有16GB的內(nèi)存,CPU和GPU之間的帶寬速度影響整體性能。Gupta表示:“從本質(zhì)上講,Power9有三個接口可加速連接到其他設(shè)備以及連接到存儲級內(nèi)存的速度。”
NVLink 2.0是其中最重要的,Moorhead表示。“首先增加PCIe是一個很大的提升,但是我相信增加NVLink會更加顯著。這讓企業(yè)在同一臺服務(wù)器上使用多個GPU獲得性能和一致性的優(yōu)勢。”
IBM在4年前成立了OpenPower聯(lián)盟,旨在取代英特爾的主導(dǎo)地位,專注于協(xié)作開發(fā)和高性能系統(tǒng)。該組織吸引了包括Google在內(nèi)的300多名成員,但是并沒有對英特爾的市場份額產(chǎn)生重大影響。Google在2016年春季宣布計劃在Power9芯片的基礎(chǔ)上構(gòu)建一個新的服務(wù)器,但自那之后,卻鮮少有對該項目的描述。
IBM表示,Power9是對醞釀4年的處理器家族的重建。有一系列系統(tǒng)計劃在2018年公布,但IBM沒有提供具體細(xì)節(jié)。Pund-IT公司的King表示,這是值得等待的,Power9是一個“AI巨擎。如果Power9和IBM相關(guān)系統(tǒng)如期供貨的話,那將給很多AI項目和計劃帶來重要影響”。
IBM并沒有透露定價,但是Gupta表示,成本與x86系統(tǒng)相比是有競爭力的。