導(dǎo)語(yǔ)
夏日的夜晚,當(dāng)望著星空腦海中就浮現(xiàn)出后羿射日、女?huà)z補(bǔ)天、夸父追日、嫦娥奔月等等故事,這些神話總是生動(dòng)地展示古人對(duì)神秘宇宙的努力探索。每每聽(tīng)到我們的宇宙飛船在太空有新的消息,都會(huì)激動(dòng)不已,這是人類孜孜追求的事情,在現(xiàn)代科技文明變得越來(lái)越明朗。
載入史冊(cè)的時(shí)刻 37年來(lái)首次月面軟著陸
回顧中國(guó)嫦娥三號(hào)探測(cè)器奔月之旅,環(huán)繞月球,并登陸月球,由著陸器和“玉兔號(hào)”月球車組成的嫦娥三號(hào)在月球虹灣地區(qū)降落,當(dāng)月球車目前已成功探測(cè)并傳送有關(guān)月球表面形貌,地質(zhì)構(gòu)造,礦物及化學(xué)成分的數(shù)據(jù)和三維圖像時(shí),我們實(shí)現(xiàn)了最近37 年來(lái)的第一次月面軟著陸,這一時(shí)刻載入史冊(cè)。
中國(guó)的探月工程分為“ 繞、落、回”三個(gè)階段,時(shí)間跨度從2007年到2020年,但其實(shí)測(cè)器的軟著陸是登月計(jì)劃中最困難的一項(xiàng)任務(wù)。即2015年以后, 研制和發(fā)射小型采樣返回艙、月表鉆巖機(jī)、月表采樣器、機(jī)器人操作臂等, 采集關(guān)鍵性樣品返回地球, 對(duì)著陸區(qū)進(jìn)行考察, 為下一步載人登月探測(cè)、建立月球前哨站的選址提供數(shù)據(jù)資料。此段工程的結(jié)束將使我國(guó)航天技術(shù)邁上一個(gè)新的臺(tái)階。
最困難任務(wù)背后的“核心團(tuán)隊(duì)”
落月過(guò)程中,中科院上海天文臺(tái)在跟蹤、測(cè)量、監(jiān)視探測(cè)器動(dòng)力下降時(shí)扮演了關(guān)鍵的角色。如此重大意義的工程背后必然有更強(qiáng)大的數(shù)據(jù)中心作支撐!
此前,天文臺(tái)搬遷到一個(gè)新數(shù)據(jù)中心并向幾個(gè)供應(yīng)商咨詢有關(guān)適用于嫦娥三號(hào)探月基礎(chǔ)設(shè)施的技術(shù)要求。中科院上海天文臺(tái)選定長(zhǎng)期合作伙伴戴爾作為數(shù)據(jù)中心的重要供應(yīng)商。通過(guò)與戴爾基礎(chǔ)架構(gòu)咨詢服務(wù)合作,天文臺(tái)設(shè)計(jì)并配置了能夠滿足其帶寬,高強(qiáng)度計(jì)算,以及性能需求的解決方案。
在追蹤嫦娥三號(hào)登月之旅的過(guò)程中,中科院上海天文臺(tái)負(fù)責(zé)其中的甚長(zhǎng)基線干涉測(cè)量(VLBI ) 系統(tǒng),是追蹤嫦娥三號(hào)奔月的幾個(gè)子系統(tǒng)之一。它由五個(gè)大型射電望遠(yuǎn)鏡組成一個(gè)網(wǎng)絡(luò),不斷地測(cè)量探測(cè)器軌道與位置信息。該VLBI 系統(tǒng)需要高性能計(jì)算集群進(jìn)行實(shí)時(shí)數(shù)據(jù)傳輸、存貯及處理。
?戴爾卓越HPCC方案——保障奔月之利器
20 天的精密衛(wèi)星軌道實(shí)時(shí)追蹤, 60秒內(nèi)的實(shí)時(shí)數(shù)據(jù)處理、結(jié)果傳送。
中科院上海天文臺(tái)VLBI 指揮控制中心副主任設(shè)計(jì)師陳中說(shuō),“ 我們的任務(wù)是在為期20 天的精密衛(wèi)星軌道追蹤中,進(jìn)行數(shù)據(jù)的實(shí)時(shí)測(cè)量并把結(jié)果傳送到北京航天飛行控制中心。該中心對(duì)探測(cè)器發(fā)送命令使其安全地自行控制降落。在這個(gè)過(guò)程中,我們用射電望遠(yuǎn)鏡收集了大量的數(shù)據(jù)并依靠HPCC 進(jìn)行處理,同時(shí)在不到60 秒的時(shí)間內(nèi)把所需的計(jì)算結(jié)果傳送到控制中心。”
?戴爾卓越HPCC——包含什么內(nèi)容?
陳中這樣解釋,“ 我們花了相當(dāng)多的時(shí)間與戴爾在項(xiàng)目的早期測(cè)試HPCC 解決方案,并確保它符合我們的具體要求。戴爾能夠提供完整的端到端解決方案,包括硬件,軟件和涉及在月球軟著陸的密集期所需的特定支持服務(wù)。”
這套解決方案包括了采用戴爾 PowerEdge M1000e 刀片機(jī)箱的可擴(kuò)容的、高密度的戴爾 PowerEdge M620 、R720 和 R910 服務(wù)器,確保高可用性、高效準(zhǔn)確的數(shù)據(jù)處理以及數(shù)據(jù)中心空間的充分利用。
與此同時(shí),戴爾網(wǎng)絡(luò)M6220 交換機(jī)和 Mellanox M6301Q 交換機(jī)確保天文臺(tái)可以滿足嚴(yán)格的要求,提供40GbE 網(wǎng)絡(luò)帶寬。該解決方案還包括戴爾PowerVault MD1200 直連存儲(chǔ)和戴爾Precision T7500 塔式工作站,用來(lái)監(jiān)控天文臺(tái)與北京控制中心的視頻流。減少碳排放也是數(shù)據(jù)中心的一個(gè)核心目標(biāo),通過(guò)部署戴爾刀片服務(wù)器所實(shí)現(xiàn)的能源節(jié)省滿足了上海天文臺(tái)的需求。
“ 我們很高興能夠與戴爾長(zhǎng)期合作并討論我們的技術(shù)需求。在這個(gè)過(guò)程中戴爾團(tuán)隊(duì)成為值得信賴的顧問(wèn),使我們能夠制定相關(guān)要求?;谒麄兊膶I(yè)精神和高超技術(shù),我們選擇了戴爾作為我們的合作伙伴。” 陳中說(shuō)道。
?降低探月潛在風(fēng)險(xiǎn)—— OME主動(dòng)監(jiān)控探月進(jìn)程的高級(jí)系統(tǒng)管理控制臺(tái)
OME是Open Manage Essentials系統(tǒng)管理控制臺(tái)解決方案的簡(jiǎn)稱,簡(jiǎn)單又強(qiáng)大!
為了確保天文臺(tái)團(tuán)隊(duì)可以監(jiān)控基礎(chǔ)設(shè)施并提供積極主動(dòng)的支持,他們安裝了戴爾OpenManage Essentials 。以往每臺(tái)機(jī)器都需要人工監(jiān)控,但OpenManage 的系統(tǒng)管理控制臺(tái)卻提供了簡(jiǎn)單、自動(dòng)化的硬件管理。
通過(guò)使用Open Manage ,戴爾團(tuán)隊(duì)在項(xiàng)目啟動(dòng)前一個(gè)月檢查了所有的基礎(chǔ)設(shè)施并對(duì)所有固件進(jìn)行升級(jí)。這兩項(xiàng)任務(wù)有助于大大減少可能影響探月任務(wù)的潛在風(fēng)險(xiǎn)。
數(shù)據(jù)中心成功實(shí)施幾個(gè)月后,HPCC 平臺(tái)在籌備降落月球所需的數(shù)據(jù)處理過(guò)程中發(fā)揮了關(guān)鍵作用。探測(cè)器數(shù)據(jù)通過(guò)網(wǎng)絡(luò)實(shí)時(shí)傳遞到 HPCC 的處理平臺(tái),接著轉(zhuǎn)發(fā)到后臺(tái)系統(tǒng)進(jìn)行精細(xì)處理和分析,以便在降落月面時(shí)減少風(fēng)險(xiǎn)。
另外,通過(guò)與戴爾團(tuán)隊(duì)的廣泛規(guī)劃,天文臺(tái)消除了單點(diǎn)故障帶來(lái)的風(fēng)險(xiǎn)并實(shí)現(xiàn)了高可用性。為了確保天文臺(tái)滿足其應(yīng)用程序的I/O 密集需求并避免HPCC 的 NFS 瓶頸,該解決方案利用Lustre的并行分布式文件系統(tǒng),通過(guò)在四個(gè)存儲(chǔ)節(jié)點(diǎn)傳播數(shù)據(jù)來(lái)提供冗余。這意味著在落月時(shí)用來(lái)控制探測(cè)器所需的數(shù)據(jù)即使系統(tǒng)發(fā)生故障也仍舊可以保持高度可用。
陳中表示:作為整個(gè)過(guò)程的中間點(diǎn),HPCC提供了一項(xiàng)關(guān)鍵的功能。在系統(tǒng)完全不宕機(jī)的情況下,我們實(shí)現(xiàn)了高可用性,同時(shí)滿足了實(shí)時(shí)數(shù)據(jù)的要求以及對(duì)探月工程的承諾。
世上前所未有的復(fù)雜任務(wù) 戴爾通過(guò)技術(shù)助攻關(guān)
中科院上海天文臺(tái)的 VLBI 數(shù)據(jù)中心把從嫦娥三號(hào)衛(wèi)星接收到的數(shù)據(jù)經(jīng)過(guò)復(fù)雜處理,然后發(fā)送到北京控制中心的時(shí)間差距從之前嫦娥二號(hào)執(zhí)行任務(wù)時(shí)的 10 分鐘降低到 1 分鐘之內(nèi)。
但,戴爾HPCC解決方案則有更大的突破!
陳中說(shuō)道,“HPCC 有著實(shí)時(shí)數(shù)據(jù)的要求。我們需要數(shù)據(jù)在 60 秒完成多點(diǎn)數(shù)據(jù)接收、海量數(shù)據(jù)處理分析和實(shí)時(shí)發(fā)送,此項(xiàng)時(shí)間框架是世界上前所未有的。但我們通過(guò)技術(shù)攻關(guān),開(kāi)發(fā)新算法,并配合戴爾的高性能硬件實(shí)現(xiàn)了快速傳輸數(shù)據(jù)的目標(biāo),最快時(shí)只用 15 秒。 較為復(fù)雜的任務(wù),比如在特殊的弧段,則需要大約 45 秒傳送。”
由于包括中科院上海天文臺(tái)的VLBI 網(wǎng)絡(luò)在內(nèi)的一系列系統(tǒng)所提供的數(shù)據(jù),嫦娥三號(hào)探測(cè)器得以安全在月球表面著陸。著陸過(guò)程中所觀測(cè)的數(shù)據(jù)將用于正在進(jìn)行的科學(xué)研究,并支持未來(lái)的月球探測(cè)。
對(duì)于此,陳中用北京航天的賀電來(lái)表達(dá)他對(duì)戴爾的贊賞,賀電稱:“在任務(wù)準(zhǔn)備和執(zhí)行過(guò)程中,中科院上海天文臺(tái)發(fā)揚(yáng)科學(xué)求實(shí)精神,嚴(yán)慎細(xì)實(shí),攻堅(jiān)克難,為任務(wù)的圓滿成功作出了卓越貢獻(xiàn)。”
真正白金級(jí)別 戴爾ProSupport Plus的關(guān)鍵意義
陳中的贊賞除了過(guò)硬的解決方案,還包括戴爾設(shè)立的一個(gè)專屬應(yīng)急團(tuán)隊(duì),這個(gè)團(tuán)隊(duì)支持嫦娥三號(hào)的探月任務(wù)。在技術(shù)客戶經(jīng)理的主動(dòng)協(xié)調(diào)下,該團(tuán)隊(duì)在探月任務(wù)開(kāi)始之前采取一系列預(yù)防性的措施,確保在任務(wù)執(zhí)行階段把服務(wù)響應(yīng)時(shí)間和解決問(wèn)題的時(shí)間降低了一半。
ProSupport Plus的意義就在于,能夠立即診斷并積極解決可能影響任務(wù)的任何問(wèn)題。零宕機(jī)很好地證明了該團(tuán)隊(duì)為天文臺(tái)所提供的服務(wù)。
而這支團(tuán)隊(duì)在整個(gè)探月過(guò)程中提供高品質(zhì)的ProSupport Plus 白金專業(yè)支持服務(wù),確保VLBI 關(guān)鍵系統(tǒng)的穩(wěn)定性。在關(guān)鍵任務(wù)執(zhí)行階段,戴爾提供了 HPCC 備件并派遣幾位工程師到VLBI 數(shù)據(jù)中心,以便快速解決任何由于部件故障引起的意外情況。
如今,探月第三期工程的目標(biāo)是月面巡視勘察與采樣返回,其中前期主要是研制和發(fā)射新型軟著陸月球巡視車。而戴爾與中科院上海天文臺(tái)的高性能計(jì)算集群平臺(tái),將繼續(xù)助力中國(guó)探月工程圓滿完成既定任務(wù)!
結(jié)語(yǔ)
戴爾通過(guò)HPCC 平臺(tái)滿足航天任務(wù)的長(zhǎng)期技術(shù)要求、高可用性助力關(guān)鍵系統(tǒng)控制落月;數(shù)據(jù)可以在低至15秒內(nèi)從上海天文臺(tái)傳送到北京控制中心、通過(guò)比以往快一半的響應(yīng)速度消除宕機(jī)時(shí)間、成功軟著陸。
戴爾 - 致力于通過(guò)卓越技術(shù)為正在進(jìn)行的科學(xué)探測(cè)服務(wù)!