而這也正是華為海思、高通、蘋果等企業(yè)能夠在芯片業(yè)務(wù)上一年一旗艦的快速推出產(chǎn)品的核心原因。
當(dāng)然,既然已經(jīng)在智能終端領(lǐng)域只手遮天,下一步就必然是利潤更豐富、前景更好的數(shù)據(jù)中心領(lǐng)域了。
在2011至2013年,以高通、Calxeda、SeaMicro為首的ARM陣營曾向數(shù)據(jù)中心領(lǐng)域發(fā)起了一輪聲勢浩大的進(jìn)攻。
希望憑借更好的能效、海量的核心數(shù)量來在云化數(shù)據(jù)中心領(lǐng)域攫取一塊市場。不過面對強大的Intel以及相對貧弱應(yīng)用和生態(tài)系統(tǒng),當(dāng)初信心滿滿的各路ARM英豪最終也都偃旗息鼓。
高通數(shù)據(jù)中心業(yè)務(wù)被邊緣化,甚少有新消息傳出,SeaMicro被AMD收購,Calxeda耗盡現(xiàn)金流倒地而亡……
雖然第一批ARM數(shù)據(jù)中心方案的探索者沒有成功,但ARM并沒有放棄自己對數(shù)據(jù)中心市場的野心。被迫退回原有市場的ARM做了兩手準(zhǔn)備,并在5年之后重新殺向數(shù)據(jù)中心市場。
發(fā)力HPC領(lǐng)域
2011年,日本超算Kyo在人類歷史上首次實現(xiàn)了10petaflops(億億次)的計算性能。從Kyo開始,人類也就開始了向E級計算(百億億次)挑戰(zhàn)的征程。
根據(jù)全球各大超算強國公布的下一代E級超算時間表來看,美國、中國、日本和歐盟的對應(yīng)產(chǎn)品都將在2020-2023年之間完成組裝和調(diào)試。而除了性能之外,各國對E級超算的核心需求除了性能之外就是自主可控了。
由于沒有自己的專屬處理器架構(gòu)(Intel、AMD及IBM同為美國公司,他們掌握核心專利的x86、POWER架構(gòu)可以理解為美國的專屬產(chǎn)品),中國、日本及歐盟無一例外的將目光投向了更加開放的ARM架構(gòu)。
其中中國的天河3號將采用飛騰公司研發(fā)的FT2000Plus64核ARM芯片(中國另有一套曙光公司的神威E級方案,處理器采用SW26010,屬于RISC架構(gòu))。
日本的后京(PostKyo或PostK)將采用富士通的A64fxARM架構(gòu)64核心處理器;而歐盟的E級超算雖還沒有明確具體架構(gòu),但預(yù)計會在CPU方面采用ARM架構(gòu)、在加速卡方面采用RISC-V開源指令集。
巨頭們的選擇雖然有些無奈,但在RISC-V、OpenSPARC等開源架構(gòu)中,ARM仍舊是平臺生態(tài)最好、產(chǎn)品最完善的一種。
另一方面,ARM公司在ARMv8.2A架構(gòu)中加入的SVE(ScalableVectorExtension)技術(shù)也能夠在很大程度上提升對應(yīng)的ARM處理器在大規(guī)?;ヂ?lián)場景中的性能表現(xiàn),使其更適合應(yīng)用在HPC這種大規(guī)模集群之上。
至此,在象征計算技術(shù)最前沿的E級超算領(lǐng)域,ARM架構(gòu)基本占領(lǐng)了五分之三的份額,實現(xiàn)了對數(shù)據(jù)中心市場的躍鼎打擊。
云化數(shù)據(jù)中心里的ARM
雖然E級超算對ARM架構(gòu)青睞有加,但這顯然不能給ARM公司貢獻(xiàn)多少有意義的營收。ARM的真正發(fā)力點仍需要放在商用數(shù)據(jù)中心市場上。
而隨著主流Linux系統(tǒng)對ARM處理器支持的越來越好,以Marvell公司ThunderX處理器為代表的ARM陣營也開始了向商用數(shù)據(jù)中心領(lǐng)域的再一次進(jìn)發(fā)。
在大型數(shù)據(jù)中心紛紛完成云化之后,下一步的發(fā)展方向便是容器化及其背后對應(yīng)的serverless模式。
在強大的Kubernetes加持下,以往復(fù)雜而臃腫的應(yīng)用和服務(wù)可以被更加輕量化、擴(kuò)展和迭代更方便的微服務(wù)模式所取代。而對于數(shù)據(jù)中心來說,這種更加碎片化的應(yīng)用交付和部署模式顯然可以進(jìn)一步提升硬件的利用率,并進(jìn)一步降低云的成本。
這種碎片化的應(yīng)用或計算在很多情況下并不會產(chǎn)生太高的計算需求,如果仍以龐大的x86CPU核心或vCPU來運行的話顯然會產(chǎn)生一定程度的浪費。
而以ThunderXCN99802.5GHz處理器為例,1790美元售價將包含32個核心、128線程以及56個PCIe3.0通道和8個DDR4內(nèi)存通道以及高達(dá)2TB的內(nèi)存支持;功耗也只是180W。
另一方面,ThunderX處理器內(nèi)部還集成了一個高性能25Gbps網(wǎng)絡(luò)控制器,相當(dāng)于為服務(wù)器提供了一個廉價的高性能網(wǎng)絡(luò)集成方案。
除了Marvell的ThunderX2之外,華為也推出了自己的鯤鵬920處理器及對應(yīng)的泰山服務(wù)器產(chǎn)品。
相對于ThunderX2,鯤鵬920直接采用了更先進(jìn)的7nm工藝和ARMv8.2架構(gòu),并在180W的TDP之下提供了64個運行于2.6GHz頻率的核心、8個DDR4內(nèi)存通道和40個lane的PCIe4.0連接。
當(dāng)然,華為也發(fā)揮了自身在網(wǎng)絡(luò)技術(shù)方面的優(yōu)勢,為鯤鵬920內(nèi)置了一個100Gb的RoCE控制器。
目前,AWS已經(jīng)批量部署了自己的基于ThunderX2方案的ARMbased服務(wù)器,并開始對外提供服務(wù)。而各家ARMbased服務(wù)器產(chǎn)品也大多瞄準(zhǔn)云計算、分布式存儲等數(shù)據(jù)中心的核心應(yīng)用場景以及一些原生Android服務(wù)的新領(lǐng)域。
ARM在數(shù)據(jù)中心市場能成功嗎?
與第一次沖擊不同,此次在助推ARM向數(shù)據(jù)中心市場前進(jìn)的廠商包括了Marvell和華為等資深企業(yè)級廠商。
他們均在數(shù)據(jù)中心市場中擁有廣泛的合作生態(tài)和豐富的商業(yè)經(jīng)驗,這無疑會給ARM在數(shù)據(jù)中心市場中的發(fā)展提供強大的支持。
雖然現(xiàn)在來給ARM在數(shù)據(jù)中心市場上的表現(xiàn)定結(jié)論還太早,但在吸取了第一次的教訓(xùn)并獲得了強大的支持后,ARM未來的數(shù)據(jù)中心之路顯然會走的更好、更遠(yuǎn)。