在本屆GTC China 2018大會上,英偉達(dá)特別舉辦了媒體講解會,詳細(xì)介紹了RAPIDS的工作原理以及市場受眾。尤其值得一提的是DLI——深度學(xué)習(xí)學(xué)院,目前有12萬的開發(fā)者正在接受了英偉達(dá)人工智能的培訓(xùn)。
揭秘英偉達(dá)RAPIDS平臺 數(shù)據(jù)科學(xué)在2010年變得非常興盛,正好是在那個節(jié)點摩爾定律不再像以前那么管用了。2010年CPU的速度足夠快的已經(jīng)可以支持人工智能和機(jī)器學(xué)習(xí)了,但是在那之后大數(shù)據(jù)發(fā)展的非常快,CPU卻沒有更快的速度發(fā)展,以至于到現(xiàn)在CPU能夠去處理的機(jī)器學(xué)習(xí)內(nèi)容和實際上所需要的數(shù)據(jù)科學(xué)家需要的算力,兩者有很大的鴻溝。
英偉達(dá)創(chuàng)始人兼CEO黃仁勛曾表示,“數(shù)據(jù)分析和機(jī)器學(xué)習(xí)是高性能計算市場中最大的細(xì)分市場,不過目前尚未實現(xiàn)加速。全球最大的行業(yè)均在海量服務(wù)器上運行機(jī)器學(xué)習(xí)算法,目的在于了解所在市場和環(huán)境中的復(fù)雜模式,同時迅速、精準(zhǔn)地做出將直接影響其決策的預(yù)測。”
有了RAPIDS之后,就可以把深度學(xué)習(xí)的能力擴(kuò)展到其它領(lǐng)域、大數(shù)據(jù)的領(lǐng)域。深度學(xué)習(xí)對于非結(jié)構(gòu)化數(shù)據(jù)比較好,比如:語音、視頻、圖片,但是機(jī)器學(xué)習(xí)是要用于結(jié)構(gòu)性的數(shù)據(jù)。
RAPIDS是什么?一個完全開源的軟件平臺。要用三個關(guān)鍵詞來概括,那就是面向數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)、開源和軟件平臺。人們使用RAPIDS一般出于兩個原因:一是數(shù)據(jù)科學(xué)家,希望自己的工作做得更快;二是不用學(xué)其他的軟件,利用已有軟件足矣。
RAPIDS希望幫助企業(yè)以“前所未有”的速度分析海量數(shù)據(jù)并進(jìn)行精準(zhǔn)的業(yè)務(wù)預(yù)測,用戶只需要進(jìn)行非常小代碼的變化量,將典型訓(xùn)練時間從數(shù)天減少到數(shù)小時,或者從數(shù)小時減少到數(shù)分鐘。這給數(shù)據(jù)科學(xué)家?guī)砹藰O大的信心。
據(jù)悉,RAPIDS首次為數(shù)據(jù)科學(xué)家提供了他們需要用來在GPU上運行整個數(shù)據(jù)科學(xué)管線的工具。最初的RAPIDS基準(zhǔn)分析利用了XGBoost機(jī)器學(xué)習(xí)算法在NVIDIA DGX-2™ 系統(tǒng)上進(jìn)行訓(xùn)練,結(jié)果表明,與僅有CPU的系統(tǒng)相比,其速度能加快50倍,大大提高效率,節(jié)省時間。
解決方案架構(gòu)與工程團(tuán)隊副總裁Marc Hamilton在解答記者提問時特別舉了一個真實案例。在中國或者別的大的國家,政府的衛(wèi)生部門會從醫(yī)院、醫(yī)生和患者那里收取數(shù)據(jù),來探討“人是怎么樣可以生病的”。在冬天的時候,不管是人的流感,亦或是禽流感,它們的傳播速度都是非??斓摹T谥袊奶魬?zhàn)就在于人口超過10億的國家,大家去醫(yī)院,醫(yī)院是不夠的。政府就可以用XGBoost,在去醫(yī)院的造訪人來尋找規(guī)律。如果去處理這些數(shù)據(jù)需要花4個月的時間就沒有用了,因為到夏天的話大家都很健康,“流感季”也結(jié)束了。所以如果用已有的機(jī)器學(xué)習(xí)改三行代碼,然后用數(shù)據(jù)跑一遍,只需要花4個小時而不是4個月的話,今天就可以給人發(fā)出警告,現(xiàn)在是很糟糕的流感季節(jié),大家盡量不要出去。
華大基因世界上最大的基因組也使用英偉達(dá)RAPIDS XGBoost對癌癥特異性肽和正常肽進(jìn)行分類,比在CPU上快10倍。
目前,英偉達(dá)云上有600個應(yīng)用程序,它們都是基于GPU加速,并且加速有不同的方式。
深度學(xué)習(xí)學(xué)院助力AI開發(fā)者 在越來越多的領(lǐng)域中,深度學(xué)習(xí)方面的專長將成為核心技能。為了能夠?qū)⑹澜缟献顬轭I(lǐng)先的深度學(xué)習(xí)和AI技術(shù)帶給整個開發(fā)者群體,英偉達(dá)在2016年成立了深度學(xué)習(xí)學(xué)院。
英偉達(dá)深度學(xué)習(xí)學(xué)院通過培訓(xùn)研究人員開發(fā)者以及數(shù)據(jù)科學(xué)家,用深度學(xué)習(xí)的方式來解決面臨最具挑戰(zhàn)性的問題。通過建立實驗室,開發(fā)課程,讓數(shù)據(jù)科學(xué)家、研究人員和開發(fā)者能夠用親身實踐的方式去學(xué)習(xí)深度學(xué)習(xí)。
英偉達(dá)開發(fā)者計劃全球副總裁Greg Estes 強(qiáng)調(diào),“GPU之上,如果沒有軟件、沒有應(yīng)用程序,那么沒人會買你的GPU。因此,在我的眼里,開發(fā)者是最重要的,所以我們花很大的力氣關(guān)注開發(fā)者的社區(qū)”。
英偉達(dá)的開發(fā)者計劃有四個方面,分別是“開發(fā)者計劃”、“深度學(xué)習(xí)學(xué)院”、“英偉達(dá)GPU云”和初創(chuàng)加速計劃。截至目前,開發(fā)者社區(qū)人數(shù)已經(jīng)超過100萬,有60萬個GPU相關(guān)的應(yīng)用程序。
除了人工智能,DLI還提供一些其他課程,包括無人駕駛汽車、健康、衛(wèi)生、金融服務(wù)、娛樂及安全城市。為了方便,他們把所有課程放在云端,開發(fā)者使用普通的筆記本電腦就能學(xué)習(xí),并且DLI還提供親手操作的環(huán)境,讓所有開發(fā)者能夠從深度學(xué)習(xí)學(xué)院中學(xué)到的不同的技術(shù)、不同的工作、不同的數(shù)據(jù)。
Greg Estes介紹,“我們會教你怎樣利用數(shù)據(jù)、利用人工智能框架,讓它對圖像進(jìn)行識別、分類,以及如何把這些學(xué)習(xí)知識,開發(fā)到一個應(yīng)用程序中。”他還提到,不同的人工智能應(yīng)用程序,它們會使用不同的神經(jīng)網(wǎng)絡(luò),例如圖像識別用CNN,機(jī)器人學(xué)動作會用到強(qiáng)化學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)等。
英偉達(dá)越來越注重國內(nèi)的AI開發(fā)者,眾所周知中國是人工智能非常重要的一個市場。“初創(chuàng)加速計劃”就是針對開發(fā)者的“,目前已有將近四千人加入。
英偉達(dá)在國內(nèi)還有多家認(rèn)證合作伙伴,訓(xùn)練超過9000人,其中已有100個開發(fā)者獲得了認(rèn)證。2019年在中國獲得培訓(xùn)的開發(fā)者會超過10000人。
另外,英偉達(dá)還通過“DLI校園大使計劃”,通過認(rèn)證的教職人員和研究者向?qū)W生人員和教學(xué)人員免費教授DLI課程。目前,中國已有11位“校園大使”,共培訓(xùn)出500多名學(xué)生、教職人員和研究人員。
IDC的數(shù)據(jù)預(yù)測,兩年以后,也就是到2020年,80%的應(yīng)用里面都會含有AI的成分。不得不說,英偉達(dá)這盤棋下的真大!