體量如此龐大的數(shù)字經(jīng)濟(jì),有賴于背后云計(jì)算技術(shù)的飛速發(fā)展,有賴于國(guó)際領(lǐng)先的科技企業(yè)提供的新一代算力、存儲(chǔ)等IT基礎(chǔ)設(shè)施解決方案,正是有了這樣強(qiáng)大的IT基礎(chǔ)設(shè)施,才有了金融、制造、電信等領(lǐng)域的提質(zhì)增效和數(shù)字化轉(zhuǎn)型。
面對(duì)如今云計(jì)算、大數(shù)據(jù)、人工智能等技術(shù)的深入產(chǎn)業(yè)和進(jìn)一步發(fā)展,當(dāng)下企業(yè)在進(jìn)行數(shù)智化轉(zhuǎn)型過程中,又將需要怎樣的新算力?
在近日至頂科技與新華網(wǎng)客戶端聯(lián)合打造的《對(duì)話數(shù)字中國(guó)》欄目中,由至頂科技CEO兼總編輯高飛主持,國(guó)家標(biāo)準(zhǔn)委云計(jì)算專委會(huì)委員&國(guó)內(nèi)數(shù)據(jù)中心算力基礎(chǔ)設(shè)施與綠色節(jié)能領(lǐng)域資深專家張昆、拜耳醫(yī)藥保健有限公司處方藥事業(yè)部數(shù)據(jù)科學(xué)與客戶洞察總監(jiān)王威、英特爾首席架構(gòu)師許淵、HPE中國(guó)首席方案架構(gòu)師武剛共同參與了主題為《企業(yè)數(shù)智化轉(zhuǎn)型,需要怎樣的新算力?》的高端對(duì)話。
在這次對(duì)話中,幾位行業(yè)專家一同深入探討了如何通過技術(shù)創(chuàng)新應(yīng)對(duì)數(shù)字經(jīng)濟(jì)需求和智能變革挑戰(zhàn),由此為企業(yè)帶來更高效、更智能、更綠色的新一代智算解決方案。
01 通用算力再提升
數(shù)字化、智能化已經(jīng)成為當(dāng)下全球各大產(chǎn)業(yè)的主流發(fā)展趨勢(shì),我國(guó)金融、通信、制造等各類產(chǎn)業(yè)中的企業(yè)也都在加快數(shù)智化轉(zhuǎn)型步伐,在這一過程中,以數(shù)據(jù)中心為典型代表的算力基礎(chǔ)設(shè)施的重要作用日益凸顯,如今的數(shù)據(jù)中心已經(jīng)成為不容忽視的新型基礎(chǔ)設(shè)施。
面對(duì)這樣的發(fā)展趨勢(shì),國(guó)家標(biāo)準(zhǔn)委云計(jì)算專委會(huì)委員&國(guó)內(nèi)數(shù)據(jù)中心算力基礎(chǔ)設(shè)施與綠色節(jié)能領(lǐng)域資深專家張昆認(rèn)為,當(dāng)下數(shù)據(jù)中心應(yīng)該從兩個(gè)方面提升能力:
一是適應(yīng)更加多元的算力性能需求。
面對(duì)不同應(yīng)用時(shí),數(shù)據(jù)中心會(huì)幻化成不同形態(tài),例如AI智算中心、高性能計(jì)算中心、云計(jì)算中心,乃至滿足最基礎(chǔ)的辦公上網(wǎng)需求的機(jī)房或者數(shù)據(jù)中心。不同應(yīng)用對(duì)于硬件基礎(chǔ)設(shè)施的架構(gòu)設(shè)計(jì)、傳輸效率、功率密度有著不同的要求,一些數(shù)據(jù)中心需要更多GPU,一些數(shù)據(jù)中心需要NPU或特殊的CPU,有些則對(duì)網(wǎng)絡(luò)、存儲(chǔ)性能有更高要求。
二是用更低成本滿足多元化算力需求。
目前要通過更低成本滿足多元化算力需求有兩條路徑:
第一條路徑是通過智能數(shù)據(jù)中心管理平臺(tái)來實(shí)現(xiàn),用AI來管理數(shù)據(jù)中心,通過數(shù)據(jù)中心去支撐AI,由此可以實(shí)現(xiàn)從AI到數(shù)據(jù)中心,然后又回到AI;
第二條路徑是尋找性能更強(qiáng)、融合性的新型CPU,這樣的CPU需要有更多核心、更強(qiáng)的適應(yīng)能力。
作為數(shù)據(jù)中心處理器的主要供應(yīng)商,英特爾同樣看到了數(shù)據(jù)中心對(duì)于算力的多樣化需求,英特爾首席架構(gòu)師許淵指出,“面對(duì)不同場(chǎng)景需要不同算力的客戶,英特爾在去年發(fā)布第五代英特爾®至強(qiáng)®可擴(kuò)展處理器增加了AI相關(guān)能力后,今年發(fā)布的英特爾®至強(qiáng)®6處理器不再只有一種核心,而是分為了能效核和性能核兩種核心。”
實(shí)際上,英特爾今年面向數(shù)據(jù)中心的處理器——至強(qiáng)系列處理器進(jìn)行了一次重磅的品牌升級(jí),升級(jí)后不僅品牌命名更為簡(jiǎn)介,還先后在6月和9月分別對(duì)外發(fā)布了英特爾®至強(qiáng)®6能效核處理器和英特爾®至強(qiáng)®6性能核處理器。
英特爾®至強(qiáng)®6能效核處理器專門針對(duì)高核心密度和規(guī)模擴(kuò)展任務(wù)所需的高效能進(jìn)行了優(yōu)化,適用于微服務(wù)等任務(wù)并行、基于標(biāo)量的工作負(fù)載,英特爾®至強(qiáng)®6性能核處理器則針對(duì)高性能計(jì)算進(jìn)行了優(yōu)化,單核性能得到了進(jìn)一步提升,適用于通用計(jì)算、數(shù)據(jù)和Web服務(wù)、科學(xué)計(jì)算、AI等場(chǎng)景。
作為更為直接的數(shù)據(jù)中心解決方案供應(yīng)商,無論是服務(wù)器、存儲(chǔ)等硬件基礎(chǔ)設(shè)施,還是DataFabric數(shù)據(jù)平臺(tái)、Cloud Phsics解決方案,HPE已經(jīng)有諸多成熟的數(shù)據(jù)中心解決方案,不過,HPE中國(guó)首席方案架構(gòu)師武剛表示,“隨著時(shí)代的發(fā)展、AI的到來,HPE自2016年開始就在面向AI進(jìn)行架構(gòu)演化,諸如針對(duì)SGI、Determined AI、MAPR的收購(gòu),到現(xiàn)在Opsramp平臺(tái)和解決方案的構(gòu)建,這些都為未來打造HPE的AI工廠奠定了基礎(chǔ)。”
正是基于這樣的前瞻布局以及與英特爾的強(qiáng)強(qiáng)聯(lián)手,在過去幾年里,HPE為AI環(huán)境的構(gòu)建,以及產(chǎn)業(yè)從多核時(shí)代走到生成式AI時(shí)代,提供了不容忽視的支持。
在這樣的算力基礎(chǔ)設(shè)施持續(xù)升級(jí)、多元化進(jìn)程中,醫(yī)藥行業(yè)得到了快速發(fā)展。
拜耳是一家擁有150多年歷史的生命科學(xué)企業(yè),致力于醫(yī)藥保健和農(nóng)業(yè)領(lǐng)域的創(chuàng)新,拜耳醫(yī)藥保健有限公司處方藥事業(yè)部數(shù)據(jù)科學(xué)與客戶洞察總監(jiān)王威指出,“真實(shí)世界數(shù)據(jù)的爆發(fā)式增長(zhǎng)為醫(yī)藥行業(yè)帶來了快速發(fā)展的機(jī)遇,如今醫(yī)院數(shù)據(jù)已經(jīng)可以聯(lián)網(wǎng),每位患者可以方便地查詢到自己的檢查結(jié)果,監(jiān)管機(jī)構(gòu)也得以用AI方式進(jìn)行藥品監(jiān)管,制藥企業(yè)借助算力基礎(chǔ)設(shè)施升級(jí)實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型,以此提升業(yè)務(wù)運(yùn)營(yíng)效率……。”
醫(yī)藥行業(yè)這些變化都得益于算力基礎(chǔ)設(shè)施的發(fā)展,也對(duì)算力提出了更高的需求。
當(dāng)然,拜耳在醫(yī)藥領(lǐng)域的創(chuàng)新發(fā)展,同樣離不開對(duì)人工智能技術(shù)的應(yīng)用。
02 AI場(chǎng)景再優(yōu)化
醫(yī)療保健作為拜耳的核心業(yè)務(wù),拜耳已經(jīng)在醫(yī)療保健中的醫(yī)療影像診斷中開發(fā)了大量AI應(yīng)用,以此幫助放射科醫(yī)生減輕工作負(fù)擔(dān)、提升診斷效率。
據(jù)王威透露,拜耳現(xiàn)在已經(jīng)在通過生成式AI和云計(jì)算技術(shù),幫助企業(yè)構(gòu)建可擴(kuò)展的AI軟件,“通過加速開發(fā)和部署AI醫(yī)療應(yīng)用,我們希望將不斷增長(zhǎng)的醫(yī)療影像數(shù)據(jù)轉(zhuǎn)化為有價(jià)值的洞察,優(yōu)化工作流程,并最終落實(shí)到患者照護(hù)等場(chǎng)景中。”
醫(yī)療影像形成的數(shù)據(jù)在醫(yī)療行業(yè)中占比將近90%,這些數(shù)據(jù)不僅數(shù)據(jù)量龐大,而且數(shù)據(jù)復(fù)雜度高,因而對(duì)算力也提出了很高的要求,王威指出,“全球每年產(chǎn)生數(shù)十億張醫(yī)療影像仍在繼續(xù)增加處理和理解這些圖像的工作量,我們需要基于強(qiáng)大算力開發(fā)和維護(hù)新知識(shí)的AI工具,從而有效處理和分析這些數(shù)據(jù)。”
就在人工智能技術(shù)場(chǎng)景化對(duì)算力提出更高需求時(shí),英特爾也看到了這樣的AI算力需求并就計(jì)算架構(gòu)針對(duì)AI做了大量?jī)?yōu)化和技術(shù)創(chuàng)新。
許淵指出,從我們視角來看,英特爾將AI算力分為三個(gè)階段:
第一,數(shù)據(jù)準(zhǔn)備階段,這一階段涉及各類數(shù)據(jù)采集和預(yù)處理;
第二,數(shù)據(jù)訓(xùn)練和調(diào)優(yōu)階段,數(shù)據(jù)訓(xùn)練和調(diào)優(yōu)需要更強(qiáng)的算力,我們需要把模型一遍一遍進(jìn)行訓(xùn)練,從而達(dá)到最優(yōu)效果;
第三,數(shù)據(jù)推理階段,我們看到越來越多客戶希望把場(chǎng)景和算力結(jié)合起來發(fā)揮最大作用,這也是在推理階段我們需要考慮的。
實(shí)際上,英特爾早在2018年的架構(gòu)日上就對(duì)外提出了XPU戰(zhàn)略,即由標(biāo)量(Scalar)、矢量(Vector)、矩陣(Matrix)、空間(Spatial)組成的SVMS架構(gòu),分別對(duì)應(yīng)CPU、GPU、加速器和FPGA,可以進(jìn)行多種異構(gòu)組合。
三年后,在2021年的架構(gòu)日上,英特爾對(duì)外發(fā)布了兩類x86 CPU內(nèi)核、兩大數(shù)據(jù)中心SoC、兩款獨(dú)立GPU,以及變革性的客戶端多核性能混合架構(gòu)。
英特爾這樣的戰(zhàn)略布局和產(chǎn)品矩陣,覆蓋了從數(shù)據(jù)準(zhǔn)備、訓(xùn)練、調(diào)優(yōu)到推理的全過程,這其中,英特爾不僅提供高性能的AI加速芯片,同時(shí)也提供了高性價(jià)比的AI加速芯片。
許淵特別指出,“一提到AI加速,我們普遍會(huì)想到設(shè)計(jì)專用的芯片或單元,從英特爾角度來看,我們希望在通用計(jì)算平臺(tái)上也能擁有一定的AI加速能力,從而降低總體擁有成本,所以我們?cè)谟⑻貭?reg;至強(qiáng)®6處理器中,在傳統(tǒng)的英特爾®AMX指令集中加入了對(duì)FP16數(shù)據(jù)類型的支持,從而支持更多模型。”
2022年11月30日,ChatGPT的面世拉開了生成式AI的大幕,也讓人工智能技術(shù)更進(jìn)一步,武鋼認(rèn)為,“如何對(duì)包括生成式AI在內(nèi)的人工智能技術(shù)進(jìn)行有效利用是目前產(chǎn)業(yè)的主要發(fā)展方向。”
為此,HPE正在基于AI原生架構(gòu)搭載自有AI基礎(chǔ)設(shè)施,例如通過基于機(jī)器學(xué)習(xí)的數(shù)據(jù)管理平臺(tái)解決數(shù)據(jù)準(zhǔn)備工作,基于開發(fā)環(huán)境提供數(shù)據(jù)開發(fā)技術(shù)支持,基于MLIS提供推理服務(wù),與此同時(shí),HPE也在構(gòu)建基于云的AI訓(xùn)練和推理,以此應(yīng)對(duì)人工智能時(shí)代對(duì)于數(shù)據(jù)中心的獨(dú)特需求。
智能化是當(dāng)下全球企業(yè)面臨的另一個(gè)轉(zhuǎn)型機(jī)會(huì),然而,企業(yè)需要的往往不只是新技術(shù),而是更為實(shí)際的產(chǎn)業(yè)價(jià)值,如何基于企業(yè)現(xiàn)有知識(shí)庫(kù)、語料庫(kù)等打造人工智能解決方案,并通過這樣的解決方案為醫(yī)療、制造、生命科學(xué)等領(lǐng)域帶來實(shí)際價(jià)值就成了關(guān)鍵。
HPE中國(guó)首席方案架構(gòu)師武剛認(rèn)為,“未來企業(yè)一定會(huì)從傳感器在邊緣側(cè)搜集數(shù)據(jù)到AI推理形成的決策參考、人工決策,最終走向RPA,乃至完全自動(dòng)化,并形成相應(yīng)的混合解決方案。”
面對(duì)這樣的行業(yè)趨勢(shì),HPE自2016年起陸續(xù)推出了HPE Primera、HPE Alletra等智能存儲(chǔ)解決方案。也正是基于這樣的產(chǎn)品和解決方案,HPE與瑪莎拉蒂M(fèi)SG車隊(duì)合作,通過采用HPE服務(wù)器和解決方案將賽道數(shù)據(jù)實(shí)時(shí)同步到位于摩洛哥的總部,并打造出了具備人工智能技術(shù)優(yōu)勢(shì)的邊緣設(shè)備,車隊(duì)采用HPE Nimble存儲(chǔ)和搭載了英特爾®至強(qiáng)®處理器的HPE ProLiant DL360 Gen10服務(wù)器,在確保數(shù)據(jù)安全的同時(shí),實(shí)現(xiàn)了數(shù)據(jù)快速處理和AI工作負(fù)載的性能優(yōu)化。
至于應(yīng)該如何優(yōu)化數(shù)據(jù)中心架構(gòu)才能讓AI算力更好地服務(wù)于產(chǎn)業(yè),張昆認(rèn)為需要考慮兩方面因素:
第一,解決好資源總量的限制問題。
數(shù)據(jù)中心的資源投入總量和實(shí)時(shí)性要能夠滿足快速增長(zhǎng)的AI大模型應(yīng)用需要,實(shí)現(xiàn)存儲(chǔ)和計(jì)算的高效協(xié)同,以及AI推理訓(xùn)練過程中海量運(yùn)算可容忍時(shí)延與數(shù)據(jù)中心整體運(yùn)行效率之間的最優(yōu)平衡。
第二,要能夠滿足不斷變化熱點(diǎn)需求的實(shí)時(shí)性挑戰(zhàn)。
當(dāng)前全球數(shù)字經(jīng)濟(jì)發(fā)展勢(shì)頭迅猛,各類應(yīng)用熱點(diǎn)變化很快,如何在整體算力資源基本充足但分布結(jié)構(gòu)不均衡的前提下,通過高效合理的資源調(diào)度來更好地滿足那些新興局部熱點(diǎn)應(yīng)用所提出的算力支撐要求,需要為數(shù)據(jù)中心量身定制一套先進(jìn)適用的智能化監(jiān)測(cè)管理系統(tǒng),從而實(shí)現(xiàn)對(duì)數(shù)據(jù)中心各類軟硬件資源的實(shí)時(shí)監(jiān)測(cè)全覆蓋和資源調(diào)度智能化。
在監(jiān)控上不僅要實(shí)時(shí)監(jiān)控設(shè)備運(yùn)行故障,還要監(jiān)控資源供需壓力和矛盾,通過智能化監(jiān)測(cè)管理系統(tǒng)和算法優(yōu)化來實(shí)現(xiàn)資源分配的安全合理和及時(shí)高效。
這是人工智能技術(shù)迅猛發(fā)展對(duì)算力基礎(chǔ)設(shè)施提出的獨(dú)特需求,當(dāng)然,這不是算力基礎(chǔ)設(shè)施需要面對(duì)的唯一挑戰(zhàn),綠色低碳是算力基礎(chǔ)設(shè)施在人工智能時(shí)代需要應(yīng)對(duì)的另一挑戰(zhàn)。
03 綠色低碳可持續(xù)
全球已建成或處于不同建設(shè)階段的數(shù)據(jù)中心已經(jīng)超過7000個(gè),如果這些數(shù)據(jù)中心全部運(yùn)行起來,每年耗電總量將會(huì)達(dá)到508太瓦時(shí),這一耗電量比澳大利亞或意大利全年的總發(fā)電量還要多。
數(shù)據(jù)中心耗電量激增,同樣源于人工智能技術(shù)迅猛發(fā)展帶來的算力需求。
據(jù)《紐約客》雜志此前報(bào)道,OpenAI的ChatGPT每天耗電超過50萬千瓦時(shí)用于處理約2億用戶的對(duì)話請(qǐng)求,相當(dāng)于美國(guó)家庭日用電量的1.7萬倍還要多。
面對(duì)與日俱增的電力需求,數(shù)據(jù)中心如何實(shí)現(xiàn)綠色低碳發(fā)展就成了另一個(gè)重要挑戰(zhàn)。
張昆指出,數(shù)據(jù)中心面向綠色低碳目前主要有三種思路:
第一,盡可能采用新技術(shù)、新方案從而達(dá)到兩個(gè)效果:第一個(gè)效果是進(jìn)一步提高單體散熱效率,例如采用液冷、自然冷卻等來實(shí)現(xiàn);第二個(gè)效果是進(jìn)一步降低設(shè)備功耗,例如通過降低服務(wù)器功率或減少非必要能源損耗來降低功耗。
第二,進(jìn)一步加強(qiáng)數(shù)據(jù)中心內(nèi)部節(jié)能管理,使用智能能耗管理平臺(tái)全方位監(jiān)控?cái)?shù)據(jù)中心內(nèi)部能耗并通過AI技術(shù)做出智能化判斷,從而減少不必要的電量損失,例如及時(shí)發(fā)現(xiàn)能耗異常點(diǎn)并有針對(duì)性地提出智能化解決方案,進(jìn)一步優(yōu)化空間布局、功率、能量分配,甚至在大型數(shù)據(jù)中心實(shí)現(xiàn)無人無感或低照度智能運(yùn)維。
第三,在數(shù)據(jù)中心內(nèi)部進(jìn)一步提高可再生能源供給和使用,例如增加太陽(yáng)能、風(fēng)能、冷源水能,以及自然低溫環(huán)境等的應(yīng)用。
作為已經(jīng)作出承諾要在2040年實(shí)現(xiàn)前,在整個(gè)運(yùn)營(yíng)過程中實(shí)現(xiàn)溫室氣體凈零排放的英特爾一直在從產(chǎn)品、供應(yīng)鏈、產(chǎn)業(yè)標(biāo)準(zhǔn)多個(gè)層面推動(dòng)綠色低碳。
從產(chǎn)品層面來看,英特爾在今年特別推出了針對(duì)能效提升進(jìn)行了產(chǎn)品設(shè)計(jì)的能效核(E-core),據(jù)許淵介紹,“與第五代處理器相比,英特爾®至強(qiáng)®6能效核處理器每瓦性能提升了1.5倍,這意味著同等負(fù)載下能源消耗將會(huì)大幅降低。”
從標(biāo)準(zhǔn)制定層面來看,英特爾推出了DC-MHS 服務(wù)器行業(yè)設(shè)計(jì)標(biāo)準(zhǔn)、發(fā)布了綠色數(shù)據(jù)中心技術(shù)框架,聯(lián)合行業(yè)合作伙伴發(fā)布了《綠色數(shù)據(jù)中心創(chuàng)新實(shí)踐——冷板液冷系統(tǒng)設(shè)計(jì)參考》,許淵指出,我們?cè)谥袊?guó)也在與很多合作伙伴一起推動(dòng)液冷標(biāo)準(zhǔn)持續(xù)落地。
英特爾自身踐行綠色低碳的一個(gè)數(shù)據(jù)是,2020至2021年,英特爾在中國(guó)節(jié)電近2200萬千瓦時(shí)。
HPE同樣有一整套解決方案來通過低碳排放降低數(shù)據(jù)中心PUE,例如HPE推出的HPE Right Mix Advisor就是可以監(jiān)控每一款應(yīng)用碳足跡的工具,HPE也在研究通過熱能再利用和磁懸浮無油壓縮提升數(shù)據(jù)中心的節(jié)能減排能力,甚至為數(shù)據(jù)中心帶來額外營(yíng)收。
據(jù)武剛介紹,“我們HPE ProLiant DL360 Gen10到HPE ProLiant DL360 Gen11這樣的服務(wù)器更新?lián)Q代,就可以節(jié)省75%的碳使用。”
當(dāng)人工智能技術(shù)再次成為全球熱潮時(shí),企業(yè)數(shù)智化轉(zhuǎn)型也邁入了一個(gè)新的階段,這時(shí),以數(shù)據(jù)中心為代表的算力基礎(chǔ)設(shè)施開始面臨新的需求和挑戰(zhàn),至頂科技CEO兼總編輯高飛對(duì)此也指出,“如今的數(shù)據(jù)中心已經(jīng)變成了一個(gè)龐大的智能體,本身也在進(jìn)行著數(shù)字化、智能化改造,關(guān)于數(shù)據(jù)中心的綠色、能效和性能,我們需要更多考慮其中的平衡之道。”