「動手學(xué)深度學(xué)習(xí)」在B站火到?jīng)]誰,加這個免費實操平臺,妥妥天花板

責(zé)任編輯:yang

2021-12-24 10:51:54

摘自:CSDN

論 AI 圈活菩薩,非李沐老師莫屬。

前有編寫「動手學(xué)深度學(xué)習(xí)」,成就圈內(nèi)入門經(jīng)典,后又在B站免費講斯坦福 AI 課,一則艱深硬核講論文的視頻播放量36萬,不少課題組從導(dǎo)師到見習(xí)本科生都在追番。

如此給勁的分享,難怪不少人驕傲自稱「已拜在老師門下」——

而最近,我發(fā)現(xiàn)有平臺干了個更給勁的事。

這個平臺無償提供算力不說,還將入門經(jīng)典「動手學(xué)深度學(xué)習(xí)」放進(jìn)平臺,免費供大家學(xué)習(xí)和實操,名曰:Amazon SageMaker Studio Lab 。

圖片

按介紹說法,該平臺基于 JupyterLab,提供免費 GPU 和 CPU 算力+15G永久存儲功能,還與 GitHub 鏈接,支持主流機器學(xué)習(xí)工具組件和開源資源包使用,開發(fā)者可結(jié)合「動手學(xué)深度學(xué)習(xí)」教材自行訓(xùn)練模型、看結(jié)果。

而且,他們還號稱申請只需一個郵箱,不要官方賬號,更不用填什么信用卡。

真有這么好的事?

今天就帶著大家一起親測試試。

 

1.真能實操「動手學(xué)深度學(xué)習(xí)」案例?

通過鏈接 studiolab.sagemaker.aws ,我們即可登入 web 端平臺,探探虛實。

  • 哪能找到「動手學(xué)深度學(xué)習(xí)」?

從界面能看到,平臺提供 GPU/CPU 算力選擇,而且,可直接開啟使用,確實無需付款。

右下角,我們就能看到那本 Dive into Deep Learning (縮寫為 D2L )。

直接點擊 Open D2L notebooks 可打開:

圖片

開啟項目后,系統(tǒng)自動加載D2L資源,并存儲在我們的云上文件夾中。

README 文件也一并打開好了,在這里面,系統(tǒng)環(huán)境配置、全書概要、面向受眾、目錄框架一應(yīng)俱全。文末還有每個章節(jié)鏈接,從中能直接進(jìn)入。

圖片

到這,就可以通過平臺結(jié)合課程內(nèi)容與實操來學(xué)習(xí)深度學(xué)習(xí)了——

那么實操效果如何?

  • 哪兒哪兒的代碼,都能運行給你看

以經(jīng)典中的經(jīng)典的 AlexNet 部分為例,感受一下。

平臺上,AlexNet 沿襲發(fā)展、基礎(chǔ)原理解釋均呈現(xiàn)出來,模型的定義構(gòu)建代碼均可運行。

為保證初學(xué)者更好理解,還能構(gòu)建單通道數(shù)據(jù)示例,觀察 AlexNet 內(nèi)部8個層的輸出情況,目的嘛,在于幫我們直觀了解不同層的作用:

圖片

最關(guān)鍵的是,訓(xùn)練模型環(huán)節(jié)也開放實操,選中代碼部分運行即可。

不過該過程允許時間較長,我們在 GPU 選項下訓(xùn)練大約使用7分鐘,慢慢等吧!

圖片

△眼看曲線緩緩慢慢畫出來

值得一提的是,由于整個界面都能作為 Notebook 添加代碼,記錄學(xué)習(xí)思考——

因此,即便我們課程完成,還能在文末添加代碼欄,對照著章節(jié)末尾習(xí)題,編程實現(xiàn)作業(yè)。

  • 從數(shù)理基礎(chǔ)到實操環(huán)境配置,都安排得明明白白

上面展示還只是一個小節(jié)。其實,從全連接層、卷積、池化等概念介紹,到 ResNet、DenseNet 講解…在 Amazon SageMaker Studio Lab 免費環(huán)境中均有呈現(xiàn)及實操,都安排得明明白白。

平臺還貼心地考慮到我們的高數(shù)線性代數(shù)基礎(chǔ)不一,不是每個人都過了90分,還把單變量微積分、最大似然等數(shù)理基礎(chǔ)介紹和代碼實現(xiàn)都給出來了,還附上環(huán)境配置方法,一副很靠譜的架勢。

圖片

經(jīng)過上面驗證,這個 Amazon SageMaker Studio Lab 確實可免費又完整地實操大神的「動手學(xué)深度學(xué)習(xí)」——

對希望入門乃至深度掌握 AI/ML 這門技術(shù)的人來說,這種理論+實踐型的研習(xí)方式自然更為高效,日后切換到實際工作或科研甚至創(chuàng)業(yè)中,過渡也更為無縫。

事實上,它的能力還不僅這個水平。

 

2.一個面向開發(fā)者的免費平臺

從名字上你也發(fā)現(xiàn)了,推出 Amazon SageMaker Studio Lab 的幕后企業(yè)是亞馬遜云科技。

這家前沿技術(shù)大廠此次推出免費平臺,不只將「動手學(xué)深度學(xué)習(xí)」做成理論+實操練習(xí)場,更想面向數(shù)據(jù)科學(xué)家、企業(yè)開發(fā)者、高校師生——

提供一個免費低門檻入門機器學(xué)習(xí)的普惠機會。

其實在亞馬遜云科技之前,業(yè)內(nèi)已有多個開放機器學(xué)習(xí)平臺——

那么,這回的 Amazon SageMaker Studio Lab ,又有什么值得關(guān)注的新亮點?

我們一起先從配置看起。

平臺提供15G以上永久存儲,16G內(nèi)存,4個 CPU ,GPU 為英偉達(dá) Tesla T4 ,比目前其他主流平臺稍高。

由于使用了較新架構(gòu)的英偉達(dá) Tesla T4 ,其混合精度運算速度指標(biāo)相應(yīng)也更高,此外,免費版與 SageMaker Studio 使用相同架構(gòu),相當(dāng)于疊加一層企業(yè)級 Buff ,穩(wěn)定性更有保障。

圖片

值得我們注意的是,平臺宣傳的是4小時 GPU+12小時 CPU ,但實際上,我們到時間后仍可再次開啟 Runtime ,原來的文件依然存在。

不過如果你想挖幣,還是算了…

平臺明令禁止使用 SageMaker Studio Lab 進(jìn)行生產(chǎn)行為,挖掘加密貨幣查到直接封號。

說完配置,再看下實操。

從操作性上來說, Amazon SageMaker Studio Lab 相比其他平臺更簡潔直觀。

界面不僅僅能建立 Jupyter Notebook 文件,還支持我們直接新建 Terminal 標(biāo)簽頁、 Markdown 格式文件。

此外,這個平臺配置有 Conda 和 Pip 資源包管理器,避免我們重復(fù)安裝開源軟件包,省事省心。

拉取 GitHub 項目甚至無需使用命令行,點擊左側(cè)按鈕即可。

圖片

若克隆項目中有 yml 環(huán)境配置文件,在建立項目同時,也會同步建立好 Conda 環(huán)境。

圖片

平臺還與 Github 關(guān)聯(lián)。

在我們自己的 Github 項目 README 文檔中加入以下內(nèi)容:

[![Open In Studio Lab]

(https://studiolab.sagemaker.aws/studiolab.svg)](https://studiolab.sagemaker.aws/import/github/org/repo/blob/master/path/to/notebook.ipynb)

即可加入「 Open in Studio Lab 」按鈕——

他人只需一鍵,即可接入 Amazon SageMaker Studio Lab 平臺。

圖片

當(dāng)然,我們也可以通過手動上傳或拷貝的方式新建 ipynb 。

以經(jīng)典的圖像分類算法舉例。

從其他平臺拷貝一份 ipynb 文件后,無需修改即可使用,最多也就是手動安裝依賴項。

圖片

實測訓(xùn)練模型的速度與其他平臺基本相同,有時,甚至稍快。

圖片

最后,得看看很多人關(guān)心的數(shù)據(jù)安全問題。

我們做機器學(xué)習(xí),經(jīng)常拿著大量人臉隱私信息,甚至是尚未脫敏的醫(yī)院病患信息,為保護他人隱私和數(shù)據(jù)安全,還得看看這方面情況。

Amazon SageMaker Studio Lab 脫胎于企業(yè)級應(yīng)用,承諾每個人數(shù)據(jù)均通過加密保護,且如果刪除賬戶,所有相關(guān)數(shù)據(jù)也均相應(yīng)刪除,平臺方承諾,不做保留。

目前,已有很多名校名企用上了 Amazon SageMaker Studio Lab ,并為其站臺背書。

這里面,有 ENIAC 誕生地的賓夕法尼亞大學(xué)工程學(xué)院,也有美國加州圣克拉拉大學(xué)金融系,還有 Hugging Face 。

國內(nèi)關(guān)注者也不少。

南方某985理工院校機器學(xué)習(xí)領(lǐng)域博士生表示,他們課題組方向雖然是傳統(tǒng)機器學(xué)習(xí),但仍需深度學(xué)習(xí)方式輔助驗證。

由于實驗室的計算設(shè)備好幾年前購入的,隨著人員與研究方向的增加,特別是在投稿前夕,計算資源的爭搶情況很普遍。Amazon SageMaker Studio Lab 對他們來說,的確有吸引力。

圖片

說完該免費平臺的種種優(yōu)點,下個問題就是:怎么申請?

這里展開講講。

無需亞馬遜云科技賬號,登陸官方鏈接:

studiolab.sagemaker.aws/requestAccount ,填寫郵箱及相關(guān)信息即可。

圖片

不過,為保證大家早日通過申請用起來,有些 Tips ,希望大家留意:

建議語言用英文,填寫清楚相關(guān)機構(gòu)名稱,所留郵箱后綴與所在機構(gòu)英文名匹配,這樣的申請更可信靠譜。

滿足上述條件,親測24小時內(nèi)就能獲得邀請,注意查收郵箱。

 

3.無縫遷移的進(jìn)階版

前面已經(jīng)提到了, Amazon SageMaker Studio Lab 與專業(yè)版 Amazon SageMaker Studio 為同一架構(gòu),所以,如果想從初學(xué)免費版遷移專業(yè)版,肯定不是大事兒。

對專業(yè)開發(fā)者來說,這當(dāng)然提供更多進(jìn)階科研及創(chuàng)業(yè)的可能。

更具體看,專業(yè)版 Amazon SageMaker Studio 從頭到尾已經(jīng)提供給開發(fā)者一套相當(dāng)全面的功能:

比如提供大規(guī)模分布式訓(xùn)練,面向我們生產(chǎn)性的大模型訓(xùn)練需求。使用分區(qū)算法,在 GPU 實例中自動拆分大模型和數(shù)據(jù)集,提升并行度加快訓(xùn)練速度。

比如數(shù)據(jù)標(biāo)注功能 Ground Truth Plus ,拉上了人類專家,結(jié)合機器學(xué)習(xí)輔助預(yù)標(biāo)記,大幅降低標(biāo)注錯誤,提升標(biāo)注速率。

再比如 Amazon SageMaker Data Wrangler ,該功能面向機器學(xué)習(xí)中的數(shù)據(jù)準(zhǔn)備階段,可通過可視化界面進(jìn)行數(shù)據(jù)選擇、清理、探查。只需一鍵導(dǎo)入,無需代碼即可快速標(biāo)準(zhǔn)化、轉(zhuǎn)換大批量、結(jié)構(gòu)五花八門的數(shù)據(jù)?!杆拇蟆怪坏牡虑诰筒捎昧嗽擁椆δ埽編讉€月才能完成的數(shù)據(jù)準(zhǔn)備,現(xiàn)在壓縮到幾天完成。

圖片

此外,Amazon SageMaker Studio 還包括訪問權(quán)限控制管理、模型監(jiān)控、無服務(wù)器推理功能、推理配置推薦…直至全周期的工業(yè)化 AI/ML 服務(wù),都給包圓了。

圖片

上述種種,不少是今年亞馬遜云科技 re:Invent 2021 新推出的功能,很大程度展示出這家企業(yè)對需求的理解和技術(shù)的前瞻性——

對專業(yè)開發(fā)者、數(shù)據(jù)科學(xué)家,不管是研究,還是創(chuàng)業(yè),這些功能均提供了更多可能性。

更有意思的是,亞馬遜云科技著眼點似乎并不止于經(jīng)營業(yè)務(wù),還有很多「不掙錢」的普惠性活動提供給我們。

機器學(xué)習(xí)馬拉松項目就是一個體現(xiàn)。

該活動一年好幾場,平臺一方會在AI相關(guān)領(lǐng)域應(yīng)用中拿出試題,涵蓋 AI 自動化編程、對災(zāi)害進(jìn)行預(yù)防或定損等等方面。

活動將會測試挑戰(zhàn)者 CV 、NLP 等方面技能高低,這期間,相關(guān)平臺、資源也由平臺方提供。優(yōu)勝者會得到最高5萬美元的獎品。

圖片

像這種面向?qū)嶋H需求,又將技術(shù)普惠開發(fā)者的活動還有很多,而且,各有好玩之處或社會價值。

有0門檻即可入門機器學(xué)習(xí)的自動駕駛競速賽 Amazon DeepRacer ,關(guān)注者數(shù)百萬,參與開發(fā)者已有14萬;

也有活動跟非盈利性組織 Girls in Tech 合作,幫助更多女性了解并上手機器學(xué)習(xí),消除科技圈的性別差距;

還有最新推出,在圈內(nèi)引發(fā)高度關(guān)注的 Amazon SageMaker Canvans ,面向0代碼經(jīng)驗的企業(yè)內(nèi)部分析師、運營者,幫他們在實際業(yè)務(wù)中應(yīng)用到機器學(xué)習(xí)這門技術(shù)。

圖片

 

4.技術(shù)大廠退居幕后

最后,如何評價亞馬遜云科技的 SageMaker Studio Lab ?

經(jīng)營角度看,這些做法對未來自家生態(tài)構(gòu)建當(dāng)然有利,是頭部企業(yè)保持身位的必要動作。此外,大批企業(yè)動輒年薪50萬招相關(guān)從業(yè)者,對很多開發(fā)者也是好事。

畢竟,人工智能短缺肉眼可見,大部分開發(fā)者有豐富編程經(jīng)驗和數(shù)理基礎(chǔ),唯一擋板就是:不熟悉機器學(xué)習(xí)。補上這塊就喝湯,何樂不為?

不過,從行業(yè)維度看,上述動作也確實在推動前沿技術(shù)落地——

不過這里的推動,不在于更快,而在于更廣。

要知道,一百年前汽車剛發(fā)明,只有機械專家才能成為車主,以至于當(dāng)時社會,司機都是一個手握前沿技術(shù)的職業(yè)。

也要知道,三十年前,PC 和互聯(lián)網(wǎng)只是少部分開發(fā)者的玩具,以至于開發(fā)網(wǎng)站都能讓人迅速暴富,積累起萬丈高樓一樣高的資產(chǎn)。

所以,百年前的人無法理解一個人人可開車的社會,所以,30年前的人們也很難想象自己可以動動手指擁有屬于自己的互聯(lián)網(wǎng)平臺。

今天放在機器學(xué)習(xí)上也一樣。即便是最前沿的科技界大師,也只能窺見AI落地版圖的小部分狀貌。只有一再降維,這項技術(shù)才能走進(jìn)千行百業(yè)場景,在不同背景不同經(jīng)歷的人手里才會產(chǎn)生不同頻率的回響——

這既是亞馬遜云科技普惠布局的價值體現(xiàn),也是李沐老師等大拿的公心所在。

那么,將來 AI 技術(shù)還能釋放多大能量?

答案還得從每位個體開發(fā)者、每個場景裂隙里,去尋找。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號