國內(nèi)首個支持千億參數(shù)大模型訓(xùn)練AI計算框架MindSpore 1.2發(fā)布

責(zé)任編輯:zhaoxiaoqin

2021-04-29 17:47:49

[中國,深圳,2021年4月26日]華為開發(fā)者大會2021(Cloud)期間(簡稱HDC. Cloud 2021),國內(nèi)首個支持千億參數(shù)大模型訓(xùn)練的AI計算框架MindSpore 1.2正式發(fā)布。最新1.2版本帶來了AI框架領(lǐng)域“全自動并行、全場景AI、可解釋推薦模型”三大創(chuàng)新,讓開發(fā)者盡享AI開發(fā)。 

圖片2.jpg

全自動并行

在靜態(tài)圖模式下,MindSpore融合了流水線并行、模型并行和數(shù)據(jù)并行三種并行技術(shù),開發(fā)者只需編寫單機算法代碼,添加少量并行標(biāo)簽,即可實現(xiàn)訓(xùn)練過程的自動切分,使得并行算法性能調(diào)優(yōu)時間從月級降為小時級,同時訓(xùn)練性能相比業(yè)界標(biāo)桿提升40%。

在動態(tài)圖模式下,MindSpore獨特的函數(shù)式微分設(shè)計,能從一階微分輕易地擴展到高階微分,并進行整圖性能優(yōu)化,大幅提升動態(tài)圖性能;結(jié)合創(chuàng)新的通訊算子融合和多流并行機制,較其它AI框架,MindSpore動態(tài)圖性能提升60%。

全場景AI

MindSpore實現(xiàn)了在云、邊、端不同場景下硬件設(shè)備的快速應(yīng)用、高效運行與有效協(xié)同。通過全場景AI的能力,Huawei Watch GT的抬腕識別率提升了80%,時延小于5ms,模型小于1KB,大幅提升了用戶體驗。

·在云端:通過自適應(yīng)模型切分和服務(wù)內(nèi)分布式并行調(diào)度技術(shù),可支持超大模型在多張加速卡上的推理部署,且推理性能較目前業(yè)界領(lǐng)先的serving服務(wù)方式提升30%;

·在邊緣側(cè):通過自適應(yīng)模型壓縮技術(shù),將CV類(Computer Vision計算機視覺)模型壓縮2/3,推理時間縮短50%,用戶側(cè)實測精度損失<1%,能有效解決邊緣側(cè)算力瓶頸;

·在端側(cè):模型即代碼,將模型編譯到代碼里,實現(xiàn)了極小的ROM(Read-Only Memory儲存內(nèi)存)占用。同時,通過算子數(shù)據(jù)重排技術(shù)提升端側(cè)Cache命中率,可降低推理時延,解決在超輕量IOT設(shè)備進行部署時受設(shè)備類型、內(nèi)存等所限制的難題。

可解釋推薦模型

MindSpore內(nèi)置業(yè)界首個語義級可解釋推薦模型TB-Net,基于原創(chuàng)知識圖譜雙向傳導(dǎo)技術(shù),從知識圖譜的海量關(guān)系路徑中,精準(zhǔn)識別影響用戶行為的核心特征和關(guān)鍵路徑,提供個性化推薦和語義級的解釋,可解釋性評估指標(biāo)相比業(yè)界模型提升63%。

自2020年3月開源以來,MindSpore社區(qū)擁有逾17萬名開發(fā)者,軟件下載量超過24萬,在超過10個行業(yè)規(guī)模使用。此外,在碼云(Gitee)上MindSpore的代碼活躍度、影響力、社區(qū)活躍度、團隊構(gòu)建、流行趨勢綜合排名第一。目前,MindSpore已是發(fā)展最快的AI開源社區(qū)。

作為華為ICT基礎(chǔ)設(shè)施業(yè)務(wù)面向全球開發(fā)者的年度盛會,華為開發(fā)者大會2021(Cloud)(簡稱HDC.Cloud 2021)于2021年4月24日-26日在深圳舉行。本屆大會以#每一個開發(fā)者都了不起#為主題,將匯聚業(yè)界大咖、華為科學(xué)家、頂級技術(shù)專家、天才少年和眾多開發(fā)者,共同探討和分享云、計算、人工智能等最新ICT技術(shù)在行業(yè)的深度創(chuàng)新和應(yīng)用。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號