金山云發(fā)布面向AI高端GPU服務(wù)器實(shí)現(xiàn)最高30倍加速

責(zé)任編輯:xfuesx

2017-05-18 17:21:26

摘自:IT新聞網(wǎng)

5月18日,金山云正式推出基于NVIDIA Tesla P40平臺(tái)的GPU云服務(wù)器,目前已在金山云官網(wǎng)上線。在專屬云方面,金山云提供專屬云服務(wù),在專屬云中自定義創(chuàng)建任意配置的GPU云服務(wù)器和普通云服務(wù)器來應(yīng)對(duì)業(yè)務(wù)挑戰(zhàn)。

5月18日,金山云正式推出基于NVIDIA Tesla P40平臺(tái)的GPU云服務(wù)器,目前已在金山云官網(wǎng)上線。據(jù)悉,金山云還即將推出基于P40平臺(tái)的系列產(chǎn)品——GPU物理服務(wù)器,兩款服務(wù)器將分別針對(duì)深度學(xué)習(xí)的兩個(gè)步驟——線下訓(xùn)練和線上推理,提供細(xì)分支持。

GPU云服務(wù)器和物理服務(wù)器定位高端,擁有強(qiáng)大的運(yùn)算能力,在實(shí)際應(yīng)用中,相比于目前市面上友商普遍采用的前一代M40平臺(tái),Tesla P40可實(shí)現(xiàn)1.4倍到1.7倍的加速比,在推理應(yīng)用中,相比于CPU,可降低30倍以上的延遲,相比于M40推理吞吐提升4倍以上。同時(shí),P40系列GPU服務(wù)器也伴隨金山云IAAS服務(wù),在計(jì)算、網(wǎng)絡(luò)、存儲(chǔ)、專屬云四個(gè)方面實(shí)現(xiàn)全面提升,具有強(qiáng)勁的競(jìng)爭(zhēng)力,可幫助客戶打造頂級(jí)深度學(xué)習(xí)平臺(tái),笑傲新興的人工智能(AI)江湖。

定位高端,專治客戶痛點(diǎn)

如今,人工智能被看作是繼蒸汽機(jī)、電力、計(jì)算機(jī)之后的第四次工業(yè)革命。有預(yù)測(cè)認(rèn)為,到2018年,廣義的中國人工智能市場(chǎng)規(guī)模將達(dá)上千億元人民幣。目前包括谷歌、微軟、亞馬遜、Facebook、BAT、小米在內(nèi)的國內(nèi)外知名科技企業(yè),均已將人工智能作為核心戰(zhàn)略。人工智能創(chuàng)業(yè)公司如雨后春筍一般出現(xiàn)。對(duì)于人工智能領(lǐng)域的公司來說,其對(duì)于GPU資源的需求是巨大的,但面臨著種種應(yīng)用上的困境。

具體來說,不光是人工智能領(lǐng)域的創(chuàng)業(yè)公司,很多互聯(lián)網(wǎng)公司和傳統(tǒng)軟件公司也遇到了這樣的難題:互聯(lián)網(wǎng)公司的人工智能業(yè)務(wù)需要輕資產(chǎn)和大規(guī)模計(jì)算能力;傳統(tǒng)軟件公司希望借助人工智能提升軟件競(jìng)爭(zhēng)能力,但對(duì)GPU服務(wù)器這種IAAS資源了解不多,更不會(huì)維護(hù);創(chuàng)業(yè)公司搶占人工智能風(fēng)口,需要最新的技術(shù)和硬件支持,但不想使用過多的資金購買GPU硬件,又缺乏系統(tǒng)運(yùn)維資源。

針對(duì)這些需求和痛點(diǎn),金山云提供了解決之道:即GPU服務(wù)器加上頂級(jí)人工智能 IAAS平臺(tái)。此次推出的P40系列GPU服務(wù)器,分為物理服務(wù)器和云服務(wù)器兩種,分別對(duì)應(yīng)的是人工智能的核心驅(qū)動(dòng)力,即深度學(xué)習(xí)的兩個(gè)步驟——線下訓(xùn)練和線上推理,為其提供細(xì)分支持。

金山云GPU物理服務(wù)器專門針對(duì)線下訓(xùn)練而生,其配備8顆NVIDIA Tesla P40,192GB顯存和256GB內(nèi)存,總計(jì)提供30720個(gè)并行計(jì)算核心和最高96TFlops的單精度浮點(diǎn)計(jì)算能力。Tesla P40在訓(xùn)練AlexnetOWT、GoogLenet、VGG-D、Incep v3、RetNet-50等流行網(wǎng)絡(luò)時(shí),相比于目前市面上友商普遍采用的前一代的M40,可實(shí)現(xiàn)1.4倍到1.7倍的加速比。

GPU云服務(wù)器則針對(duì)線上推理而生,其可提供1/2/4顆NVIDIA Tesla P40,滿足客戶在深度學(xué)習(xí)上的推理、基于GPU的大數(shù)據(jù)分析、圖形渲染等服務(wù)器端GPU計(jì)算工作負(fù)載。尤其是在推理應(yīng)用中,相比于CPU,可降低30倍以上的延遲,相比于M40推理吞吐提升4倍以上。

四重特性為客戶打造頂級(jí)AI IAAS平臺(tái)

P40系列GPU服務(wù)器在計(jì)算、網(wǎng)絡(luò)、存儲(chǔ)、專屬云四個(gè)方面,具有強(qiáng)勁的競(jìng)爭(zhēng)力,為客戶打造頂級(jí)的AI IAAS平臺(tái)。

在計(jì)算方面,P40系列有著P3E PRO GPU加速實(shí)例,單機(jī)8顆NVIDIA Tesla P40 GPU能夠達(dá)到96Tera FLOPS的單精度浮點(diǎn)計(jì)算能力,再加上兩顆2690V4至強(qiáng)處理器,總計(jì)可以達(dá)到97.16TeralFLOPS的單精度浮點(diǎn)計(jì)算能力;P3E PRO GPU加速實(shí)例,單機(jī)提供192GB的顯存和346GB/s的顯存帶寬,可充分發(fā)揮P40在訓(xùn)練場(chǎng)景下的計(jì)算能力。

在網(wǎng)絡(luò)配置方面,首先,P40系列GPU服務(wù)器有著靈活的VPC網(wǎng)絡(luò),P3E PRO GPU加速實(shí)例,可以和其他金山云云主機(jī)實(shí)例一樣靈活使用金山云VPC網(wǎng)絡(luò),客戶可以通過VPC提供的VPN、DC或者Peering通道,與自己的其他IAAS資源對(duì)接,無論這些資源是在金山云的其它地區(qū),還是客戶自己的IDC機(jī)房或辦公室。

第二,面對(duì)多機(jī)多卡的需求,P40系列GPU服務(wù)器支持100Gb RDMA網(wǎng)絡(luò),網(wǎng)絡(luò)基于RoCE協(xié)議,支持P3E/P3E PRO GPU服務(wù)器點(diǎn)到點(diǎn)的100Gb連接。

第三,對(duì)于大規(guī)模計(jì)算加速任務(wù),最大支持256個(gè)GPU服務(wù)器組成的100Gb無損無收斂集群,總計(jì)可以支持2048片GPU卡協(xié)同工作,為客戶打造頂級(jí)超算平臺(tái)。

在存儲(chǔ)方面,首先,P40系列GPU服務(wù)器配備本地SSD固態(tài)硬盤,單機(jī)8片SSD總計(jì)提供1400MB/s寫入帶寬,同時(shí)提供1-3ms的低延遲IO,適合大量文件的隨機(jī)讀寫。

第二,P40系列GPU服務(wù)器可以使用金山云集群文件系統(tǒng),可以和其它金山云云服務(wù)器實(shí)例一樣,通過業(yè)務(wù)網(wǎng)絡(luò)接入KS3存儲(chǔ)資源,同時(shí)還提供KS3的文件系統(tǒng)接口和容器倉庫接口,可以提供2000MB/s的讀寫帶寬。

在專屬云方面,金山云提供專屬云服務(wù),在專屬云中自定義創(chuàng)建任意配置的GPU云服務(wù)器和普通云服務(wù)器來應(yīng)對(duì)業(yè)務(wù)挑戰(zhàn)。專屬云為客戶提供如下特性:

第一,專屬的IAAS資源。這些資源在使用期間,歸客戶專屬,不會(huì)調(diào)度其他客戶的云服務(wù)器上來。

第二,自定義虛擬化比例。不再受到線上套餐及虛擬比例限制,客戶可以根據(jù)業(yè)務(wù)情況,自定義虛擬比例以高效利用資源。

第三,動(dòng)態(tài)增減集群節(jié)點(diǎn)??蛻艨梢愿鶕?jù)業(yè)務(wù)情況增加或者減少專屬集群的節(jié)點(diǎn)數(shù)量。

第四,時(shí)間維度的靈活性??梢栽谌我鈺r(shí)間創(chuàng)建/銷毀VM實(shí)例。

人工智能大潮已經(jīng)來臨,在國內(nèi),各行各業(yè)都在爭(zhēng)相布局,以占得先機(jī)。在云計(jì)算和深度學(xué)習(xí)方面有龐大需求的客戶,努力抓住人工智能時(shí)代的新機(jī)遇,獲得更加快速、高效建設(shè)人工智能業(yè)務(wù)的能力,以實(shí)現(xiàn)業(yè)務(wù)和產(chǎn)品上的創(chuàng)新,基于此,Tesla P40系列GPU服務(wù)器將成為客戶的理想選擇。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)