一家來自中國的初創(chuàng)企業(yè)在今年的Hot Chips大會上亮出了迄今為止最震撼人心的ARM服務(wù)器處理器方案。順帶一提,甲骨文方面則借此機(jī)會公布了其首款集成有Infiniband的Sparc處理器。
這家名為飛騰信息技術(shù)有限公司的年輕廠商誕生于2012年,其宣稱自家處理器采用64個自定義ARMv8計算核心,采用28納米制程工藝并擁有最高2 GHz主頻。由于每運(yùn)算周期可處理高達(dá)四條指令,這意味著其最大運(yùn)算能力將達(dá)到每秒5120億次浮點(diǎn)運(yùn)算。
這款代號為“火星”的設(shè)計方案超越了當(dāng)前各類高端ARM服務(wù)器芯片,包括目前正處于樣品展示階段的Cavium 48核心ThunderX處理器以及另一款仍處于開發(fā)當(dāng)中的博通方案。今年2月,EZchip公司曾表示其將發(fā)布一款采用28納米制程的100核心ARMv8處理器,但其正式推出時間定為2017年。
這款“火星”處理器的設(shè)計方案尚未公開,但齊聚一堂的分析師以及微處理器設(shè)計師們已經(jīng)開始將注意力轉(zhuǎn)移到其身上,—部分原因是飛騰公司在此前可以說是寂寂無名。
與IBM的Power 8處理器一樣,火星也采用了外部三級緩存以及內(nèi)存控制器設(shè)計
Insight64公司(位于加利福尼亞州薩拉托加)負(fù)責(zé)人Nathan Brookwood贊嘆道,“這是目前為止公布的最震撼人心的64位ARM芯片,性能非常強(qiáng)勁,而且絕對是本次大會上最大的驚喜。”
AMD公司研究員兼會議主持者Sam Naffziger則將“火星”形容為一套“擁有出色緩存層級與良好帶寬匹配”的上佳設(shè)計方案。
Hot Chips大會的組織者們亦對飛騰公司發(fā)來的論文感到驚訝,畢竟這是一家他們聞所未聞的年輕企業(yè)。在此之前,Hot Cips大會還曾經(jīng)收到過幾篇由中國政府及高校組建的龍芯處理器構(gòu)建團(tuán)隊發(fā)來的論文。
Hot Chips大會的組織者之一Ralph Wittig表示,“我很驚訝今年龍芯團(tuán)隊沒有拿出什么新的成果,但我們從飛騰方面收到了相關(guān)論文,并聽說他們這家初創(chuàng)企業(yè)有信心在ARM領(lǐng)域大展身手,他們的外部內(nèi)存模塊跟IBM的Power 8設(shè)計方案比較相似,作為項目委員會,飛騰的成果給我們留下了深刻印象。”
更具神秘色彩的是,飛騰公司的一位工程經(jīng)理沒能在大會期間順利拿到赴美簽證。為了解決問題,他決定在位于天津及廣州的公司辦公室里通過手機(jī)展示幻燈片內(nèi)容。
一位熟悉飛騰公司的與會者表示,該團(tuán)隊并非脫胎于龍芯項目組。該公司的天津分部還由于此前發(fā)生的重大爆炸事故而一片狼藉。
在對SpecCPU 2006基準(zhǔn)測試進(jìn)行模擬運(yùn)行時,“火星”處理器作為64核心芯片分別在整數(shù)運(yùn)算與浮點(diǎn)運(yùn)算項目中拿到了672分與585分。不過觀察人士指出,這一成績換算至單一核心性能就顯得有些疲軟了。
這款芯片被整體劃分為多個八核心層,其中每四個計算核心共享4 MB緩存容量。八塊外部芯片總計提供129 MB三級緩存及16條DDR3-1600通道。
飛騰的自定義64位ARM計算核心擁有192個物理寄存器。其重排序緩沖器能夠容納最高160條指令,而整體通道中的指令容納數(shù)量則在210條左右。
飛騰公司自主設(shè)計的64位ARM核心,其代號為“小米”
這款芯片按順序分發(fā)并清理指令,并以無序方式進(jìn)行指令執(zhí)行。其采用一套主動式分支預(yù)測機(jī)制并擁有多線程能力。
“火星”支持MPI與Open MP接口以實現(xiàn)多處理系統(tǒng)。另一款尚處于開發(fā)階段的處理器代號為“地球”,其將擁有業(yè)界最低之成本與功耗水平,且主要面向目前的各類大型數(shù)據(jù)中心。
“我敢肯定,火星將成為世界上第一款64核心的ARMv8處理器,”飛騰公司研究員Charles Zhang通過電話向Hot Chips大會的各位與會者們宣稱。“這是個很好的開端……在接下來的幾年中,我們將開發(fā)出更為強(qiáng)大的CPU方案。”
火星處理器的最大弊端之一在于其龐大的體積,分析師們指出。想利用這樣巨大的芯片實現(xiàn)運(yùn)營收益實在不是易事。
甲骨文公司在本屆Hot Chips大會上公布了一款新的服務(wù)器處理器,這是其首款集成了Infiniband的芯片產(chǎn)品。這款代號為Sonoma的芯片是新家族中的首位成員,同時能夠為甲骨文數(shù)據(jù)庫及其它軟件方案提供加速功能。
Sonoma是一款采用20納米制程工藝的芯片,其中包含八個M7級Sparc計算核心,每核心最高可支持八線程。它封裝有兩個DDR4內(nèi)存控制器,單插槽內(nèi)存容量上限為1 TB,且峰值內(nèi)存?zhèn)鬏攷挒槊棵?7 GB。
這款芯片還包含一個PCI Express Gen 3控制器,外加四條用于多處理器協(xié)同工作的每秒16 Gb傳輸鏈路。
甲骨文Sonoma芯片上近五分之一面積用于容納Infiniband
集成Inifniband占用了這款芯片占五分之一的表面積。其采用兩連56G Infiniband鏈路且支持虛擬化功能,擁有32個虛擬獨(dú)立Infiniband適配器。
甲骨文公司將Infiniband內(nèi)置于芯片當(dāng)中,從而最大程度優(yōu)化其使用效果并保障自有知識產(chǎn)權(quán),一位設(shè)計團(tuán)隊成員解釋稱。這款芯片還擁有其它幾種潛在用途,甲骨文方面能夠借此利用Infiniband讓一系列現(xiàn)有系統(tǒng)實現(xiàn)集群化、存儲以及其它應(yīng)用能力。
Sonoma芯片當(dāng)中包含四個數(shù)據(jù)庫加速塊,且針對甲骨文軟件產(chǎn)品作出了優(yōu)化。該芯片還提供一個小型元數(shù)據(jù)塊,可作為緩沖區(qū)以避免內(nèi)存溢出并防止HeartBleed等惡意攻擊的出現(xiàn)。
“這是一款令人印象深刻的芯片,而且也為芯片集成Infiniband吹響了前進(jìn)的號角,”分析師Brookwood表示,“甲骨文公司已經(jīng)在利用Infiniband訪問存儲資源方面表現(xiàn)出了遠(yuǎn)超其它同業(yè)企業(yè)的積極態(tài)度,相比之下各競爭對手仍在利用獨(dú)立芯片實現(xiàn)Infiniband功能。”