伴隨著SC15超算大會(huì)新一期世界HPC性能TOP500的公布,"天河二號(hào)"領(lǐng)銜的當(dāng)今世界性能最強(qiáng)的500臺(tái)超級(jí)計(jì)算機(jī)已經(jīng)揭曉。然而,如果要比誰(shuí)的性能能耗比最高、最"綠色",這些上榜的超級(jí)計(jì)算機(jī)系統(tǒng)恐怕要另有一番排列。
本次TOP500發(fā)布會(huì)也給出了這個(gè)問題的答案。按照Rmax(即最好的Linpack性能)和能耗之比重新排列,本次TOP500中11臺(tái)電源效率最高的系統(tǒng)被遴選出來。其中,來自中科曙光的Sugon Cluster W780i高居第二位,堪稱"綠色"中的"深綠"。
推出中國(guó)首款量產(chǎn)液冷服務(wù)器
高性能計(jì)算系統(tǒng)發(fā)展至今,需要解決的兩大問題:性能和能耗。Sugon Cluster W780i就是通過采用由Nvdia提供的 GPU加速器異構(gòu)系統(tǒng)來提高性能功耗比。除此之外,曙光的節(jié)能事業(yè)還有一項(xiàng)"秘密武器":液冷技術(shù)。
在今年6月舉辦的2015創(chuàng)新技術(shù)大會(huì)上,中科曙光就發(fā)布了中國(guó)首款可量產(chǎn)的液冷服務(wù)器:曙光TC4600E-LP冷板液冷服務(wù)器。與該服務(wù)器相配套的制冷解決方案能大幅降低整機(jī)功耗并降低機(jī)房噪音,機(jī)房全年P(guān)UE(負(fù)載耗能占比)可輕松降至1.20以下。服務(wù)器也因此得到了實(shí)現(xiàn)高密度、低噪音、低傳熱溫差、自然冷卻的效果。
值得一提的是,這款液冷服務(wù)器所需要的"冷卻水"是很容易獲得的30℃的水,不需用壓縮機(jī)等裝置。此外,在液冷環(huán)境中,服務(wù)器的CPU可超頻運(yùn)行,計(jì)算性能因此可提高12%.
有國(guó)外研究顯示CPU核溫每提高10℃,可靠性降低一半,液冷服務(wù)器的CPU核溫比風(fēng)冷極限溫度可低20-30℃,CPU可靠性也得到了大幅度提高。"TC4600E-LP實(shí)際上是TC4600E服務(wù)器的液冷版本,以后曙光服務(wù)器都會(huì)同時(shí)開發(fā)液冷和風(fēng)冷兩種版本。"曙光數(shù)據(jù)中心產(chǎn)品事業(yè)部總經(jīng)理沈衛(wèi)東介紹說,該液冷技術(shù)的實(shí)現(xiàn)是通過將服務(wù)器最熱的部分——高密度CPU的散熱用液冷解決,與'浸沒式'液冷有所區(qū)別。
未來液冷或顛覆行業(yè)創(chuàng)新
冷板式液冷服務(wù)器是業(yè)內(nèi)液冷模式的一種,暫時(shí)尚未觸及服務(wù)器物理外形的變革。而另外一種液冷模式——浸沒式,則有可能在服務(wù)器架構(gòu)上帶來顛覆式改變。
"目前冷板式液冷技術(shù)不太會(huì)改變服務(wù)器現(xiàn)有的物理形態(tài),只是用冷板代替了原來的CPU的散熱片,這一步比較容易實(shí)現(xiàn)。" 沈衛(wèi)東介紹說,浸沒式則是"浸泡版"的冷板式,"冷板式實(shí)際上是一種中間替代方案,浸沒式才是最終的結(jié)果。"
曙光公司近日在浸沒式液冷服務(wù)器上也取得了重大突破。在本次SC大會(huì)上,中科曙光發(fā)布了其自主研發(fā)的新一代液冷展機(jī)——"RoboBlades浸沒式液冷刀片服務(wù)器".沈衛(wèi)東指出,該液冷展機(jī)的誕生為服務(wù)器浸沒式液冷技術(shù)的產(chǎn)業(yè)化應(yīng)用掃除了維護(hù)性障礙。
"未來的浸沒式服務(wù)器或許是一個(gè)'缸':大量貼在一起的主板,緊湊地浸泡在這個(gè)'缸'里面。預(yù)計(jì)該結(jié)構(gòu)服務(wù)器的功率密度可以20倍于今天的產(chǎn)品。沈衛(wèi)東說:"隨著浸沒式液冷技術(shù)的應(yīng)用和普及,未來服務(wù)器形態(tài)、制冷方式以及數(shù)據(jù)中心建設(shè)模式將迎來革命性變化。屆時(shí)(浸沒式液冷服務(wù)器)不但會(huì)拋棄現(xiàn)有服務(wù)器的外形,甚至?xí)绊懻麄€(gè)行業(yè)——除了冷卻行業(yè),他可能會(huì)影響到上游(如芯片設(shè)計(jì)等)很多行業(yè)。"
部署液冷服務(wù)器不會(huì)加大數(shù)據(jù)中心成本
液冷,顧名思義,液體注入服務(wù)器,通過冷熱交換帶走服務(wù)器的散熱。目前曙光公司對(duì)液冷技術(shù)使用會(huì)使相應(yīng)服務(wù)器的成本提高約30%-40%.不過,這并不會(huì)增加數(shù)據(jù)中心的建設(shè)成本。
"發(fā)熱部件CPU和部分電源模塊的熱量占服務(wù)器的70%,采用液冷技術(shù)后可以減少2/3的風(fēng)冷(設(shè)備)投入。"沈衛(wèi)東指出,液冷系統(tǒng)不需要壓縮機(jī),替代空調(diào)機(jī)"肯定是便宜了",可降低數(shù)據(jù)中心基礎(chǔ)設(shè)施投入。
如果不是新建機(jī)房而引入液冷服務(wù)器,綜合考核液冷冷卻器投入和風(fēng)冷空調(diào)系統(tǒng)投入,液冷服務(wù)器所需的基礎(chǔ)投入對(duì)風(fēng)冷系統(tǒng)仍有優(yōu)勢(shì),而服務(wù)器部分的"超支"一般可在1年到1年半在節(jié)能方面的表現(xiàn)回收成本。
此外,針對(duì)一些用戶對(duì)液冷服務(wù)器液體泄漏的顧慮,曙光的技術(shù)團(tuán)隊(duì)調(diào)研了多種快速插拔方案,并在過去3年里做了大量的實(shí)驗(yàn)證實(shí)了其液冷服務(wù)器在該方面的可靠性。據(jù)悉,量產(chǎn)的TC4600E-LP液冷服務(wù)器已應(yīng)用于建于曙光大廈的"地球數(shù)值模擬裝置"原型系統(tǒng)上,如今正承擔(dān)來自中科院大氣所等單位所賦予的"解讀地球"的計(jì)算任務(wù)。