公有云提供商越來越多地為大計算量應(yīng)用提供基于GPU的云服務(wù),但組織需要合適的技能和預(yù)算來部署它們。
數(shù)據(jù)分析、人工智能和機器學(xué)習(xí)越來越受重視,這也就引導(dǎo)企業(yè)開始仔細研究圖形處理單元。
作為回應(yīng),頂級云供應(yīng)商Amazon Web Services(AWS)、Microsoft和Google現(xiàn)在已經(jīng)能夠提供支持圖形處理單元(GPU)的公共云實例。雖然這些GPU云實例具有很大的潛力,但它仍處于開發(fā)的早期階段。因此,現(xiàn)在還存在一些障礙,例如成本和很多定制開發(fā)工作(在許多情況下)。
不斷變化的市場
傳統(tǒng)上,資源密集型系統(tǒng)(也被稱為高性能計算(HPC))是面向研究、工程和視頻開發(fā)的技術(shù)。典型應(yīng)用包括基因組學(xué),計算金融,視頻渲染和可視化。
HPC系統(tǒng)在特殊配置的服務(wù)器上需要大量的處理能力。開發(fā)經(jīng)常需要花費數(shù)年時間,應(yīng)用也需要幾天或更長時間才能在高端專用系統(tǒng)上運行。因此,這些應(yīng)用難以構(gòu)建,運行成本高,大多數(shù)企業(yè)都無法實現(xiàn)。
但最近,HPC市場動態(tài)發(fā)生了變化。這些系統(tǒng)已經(jīng)從定制的CPU轉(zhuǎn)移到商業(yè)設(shè)備上。像Nvidia和Intel這樣的廠商將其GPU定位為適合HPC市場,而頂級的公有云供應(yīng)商依靠他們來支持HPC服務(wù)。
此外,客戶資料也已更改。歷史上,HPC系統(tǒng)通常部署在利基市場,但已經(jīng)以自己的方式進入了企業(yè)的主流。預(yù)計隨著物聯(lián)網(wǎng)的出現(xiàn),企業(yè)處理的大量數(shù)據(jù)將呈指數(shù)級增長。隨著公司不斷地收集和挖掘更大的數(shù)據(jù)庫,他們正在尋求軟件來幫助進行自動化處理。因此,GPU系統(tǒng)(包括GPU云實例)已成為人工智能和機器學(xué)習(xí)應(yīng)用的計算引擎。
供應(yīng)商整合了其GPU云實例陣容
向GPU轉(zhuǎn)移的這一趨勢引起了最近進入這一市場的頂級公有云供應(yīng)商的關(guān)注。在2016年第四季度,AWS和Microsoft Azure都分別公開了新的GPU云實例——分別是P2實例類型和N系列,而在二月份,Google也加入了戰(zhàn)團,開始GPU支持(目前正處于測試階段)。
雖然這些實例類型非常適合機器學(xué)習(xí)和其他計算密集型應(yīng)用,但仍然存在幾個影響采用的障礙。首先,這些服務(wù)通常是昂貴的。AWS和Microsoft Azure每小時每GPU的價格為0.90美元,而Google GPU云實例的價格為每小時0.70美元。相比之下,AWS針對通用計算實例定價為每小時0.0059美元。
此外,這個市場依賴于定制開發(fā)和高度專業(yè)的編程工具。熱門框架包括Apache Spark,Caffe,Apache SystemML,MXNet,TensorFlow和Torch。大多數(shù)企業(yè)的IT部門都缺乏編寫和管理使用這些框架構(gòu)建應(yīng)用程序的技能。組織需要對員工培訓(xùn)和認(rèn)證計劃來管理這些部署進行投資。
HPC、機器學(xué)習(xí)等計算密集型應(yīng)用不斷受到企業(yè)的歡迎。而GPU云實例可以幫助支持這些工作負載,昂貴的價格和經(jīng)驗的缺乏可能會影響許多企業(yè)在短期內(nèi)部署。