“RVIZ解決方案幫助我們無縫過渡到遠程工作方式,我們的工作一分鐘也沒有中斷。部署后,我們可以快速靈活地適應(yīng)意外情況,并避免災(zāi)情像過去那樣造成嚴重破壞。將來,我們可能會將該解決方案推廣到公司的其他領(lǐng)域。”
——PGS首席地質(zhì)師 Hermann Lebit博士
PGS是一家數(shù)據(jù)驅(qū)動型企業(yè)。該公司利用最新技術(shù)來提供一系列地震和油藏服務(wù),包括地震資料采集、數(shù)據(jù)處理和成像、巖石物理分析和儲層表征。PGS數(shù)據(jù)資料庫包含超過850,000平方公里的三維數(shù)據(jù)和670,000線路公里的二維地震數(shù)據(jù)。
PGS首席地質(zhì)師Hermann Lebit博士是公司休斯頓解析團隊的主管。“我們使用的數(shù)據(jù)集規(guī)模非常龐大,包括海床下方的數(shù)百萬張地震圖像,以便詳細了解某個區(qū)域的地質(zhì)狀況。整個行業(yè)利用這種洞察力確定是否有可能在那里發(fā)現(xiàn)碳氫化合物。”
敲響警鐘
在PGS,解析團隊發(fā)揮著關(guān)鍵作用。當(dāng)哈維颶風(fēng)造成的洪水淹沒休斯頓時,支持團隊工作開展的基礎(chǔ)架構(gòu)癱瘓,對公司造成了極其嚴重的影響。
以前,解析團隊依賴高性能工作站來運行行業(yè)標(biāo)準軟件,如Petrel®和PaleoScan™,以進行建模、分析和解析地震數(shù)據(jù)。可洪水導(dǎo)致這些工作站全部停止運行。Lebit博士回顧說:“我們有六個星期幾乎無法工作。最后,PSG倫敦辦事處的一些工作站恢復(fù)了運行。但是,這不足以恢復(fù)正常運營,我們不得不輪班工作。這為我們敲響了警鐘。過去,我們過分依賴自己的分布式工作站基礎(chǔ)架構(gòu),我們再也不想陷入那種境地了。”
“我們的工作需要處理大量數(shù)據(jù)和圖形。為了高效完成工作,我們需要高性能計算應(yīng)用像在辦公室里一樣遠程平穩(wěn)地運行。處理大型數(shù)據(jù)集時,延時是一個主要問題,這會嚴重影響生產(chǎn)效率。” PGS項目解析師Taylor Buckley補充。
能夠經(jīng)受任何打擊
PGS恢復(fù)元氣后,解析團隊立即開始著手提高自己的抗災(zāi)能力。Lebit博士表示:“我們需要一個集中化的解決方案,以便團隊能夠隨時隨地遠程訪問任何數(shù)據(jù)。” 該團隊評估了幾個可能的解決方案,包括傳統(tǒng)桌面虛擬化設(shè)置,但對它們的性能水平并不滿意。
該公司最終選擇了聯(lián)想遠程可視化解決方案(RVIZ)——由行業(yè)領(lǐng)導(dǎo)者聯(lián)想、NVIDIA、Red Hat、Mechdyne、Leostream和PCPC Direct共同開發(fā)的端到端解決方案。RVIZ解決方案將移動工作站連接到集中式服務(wù)器,同時確保數(shù)據(jù)存儲的安全,以便用戶運行高性能應(yīng)用程序,以4K或更高分辨率顯示圖形,而不論它們處在什么位置。
PGS向該聯(lián)合解決方案的主要開發(fā)和部署合作伙伴PCPC Direct詳細說明了它的技術(shù)要求。在24個月內(nèi),PCPC Direct與聯(lián)想、NVIDIA、Red Hat、Mechdyne和Leostream合作,設(shè)計了RVIZ解決方案,并對它進行了測試和驗證。
一流的端到端解決方案
配有NVIDIA T4 Tensor Core GPU的聯(lián)想 ThinkSystem SR650服務(wù)器是RVIZ解決方案的主要組件,它們部署在高度安全的休斯頓數(shù)據(jù)中心,該中心是一個戰(zhàn)略位置,即使發(fā)生洪災(zāi)或其他危險,也不會遭到損壞。這些服務(wù)器利用Red Hat虛擬化技術(shù)進行了虛擬化,并通過ThinkSystem NE10032/NE1072T RackSwitch網(wǎng)絡(luò)連接到全閃存聯(lián)想 ThinkSystem DM5000F存儲陣列。NVIDIA Quadro Virtual Data Center Workstation(Quadro vDWS)軟件對聯(lián)想服務(wù)器中的GPU進行了虛擬化,以便讓多個虛擬機共享這些GPU。
每臺服務(wù)器都安裝了四個T4 GPU,這樣,兩臺用戶配置文件大小為8 GB的服務(wù)器就可以支持16名用戶。Mechdyne TGX高性能遠程桌面軟件利用NVIDIA T4 GPU進行編碼和解碼,在遠程設(shè)備——第二代聯(lián)想 ThinkPad P1移動工作站——上實現(xiàn)GPU加速,以提高性能,降低延時并實現(xiàn)低帶寬流式傳輸。Leostream平臺將充當(dāng)遠程用戶與數(shù)據(jù)中心服務(wù)器資源之間的中間媒介,允許解析團隊利用互聯(lián)網(wǎng)連接根據(jù)需要從任何位置訪問他們的應(yīng)用程序。
快速響應(yīng)不斷變化的環(huán)境
另一次災(zāi)難發(fā)生時,PGS已經(jīng)使用RVIZ解決方案幾個月時間。這次發(fā)生的是新冠疫情,在此期間,解析團隊不得不進行遠程工作。
Buckley回憶說:“實際上,在采取居家隔離措施時,我們?nèi)匀辉跍y試RVIZ解決方案。非常幸運的是,我們部署了RVIZ解決方案,它幫助我們無縫過渡到遠程工作方式。我們的工作一分鐘也沒有中斷。”
Lebit博士確認說:“正是因為有了RVIZ解決方案,我們的工作在疫情期間沒有受到任何影響。我們都可以在家工作,完全不需要暫停。所有數(shù)據(jù)都進行了集中存儲,因此,大家可以通過任何互聯(lián)網(wǎng)連接訪問所需數(shù)據(jù)。這種GPU加速遠程體驗意味著,即使要求最嚴苛的應(yīng)用也可以平穩(wěn)運行。” “實際上,隔離措施甚至還提高了生產(chǎn)率。對于能夠在家工作,我的整個團隊都感到非常高興,因為他們可以按自己的進度自由靈活地安排工作。對個人來說,我不用每天花一小時往返辦公室,而是更高效地利用這段時間。RVIZ解決方案讓我們獲得了領(lǐng)先優(yōu)勢,幫助我們輕松適應(yīng)了工作模式的變化。”
高效協(xié)作
除了提高靈活性和生產(chǎn)效率以外,RVIZ解決方案還大大強化了協(xié)作和安全性。“過去,我們必須將數(shù)據(jù)集加載到桌邊的各個工作站上。這意味著,如果一名團隊成員希望與同事共享數(shù)據(jù)或結(jié)果,他們必須完成復(fù)制過程,以將其加載到另一個工作站上。”
Buckley說:“考慮到我們使用的數(shù)據(jù)集的大小,這種復(fù)制方法的工作效率非常低?,F(xiàn)在,使用聯(lián)想的集中式全閃存存儲后,我們可以極其迅速地訪問數(shù)據(jù)。RVIZ解決方案完全改變了我們實施項目的方式。以前,每個工作站都像是孤島。如今,我們可以拖放數(shù)據(jù),更高效地進行協(xié)作。因此我們可以不斷優(yōu)化工作流程,進一步提高生產(chǎn)率。”
使用RVIZ解決方案,PGS還可以優(yōu)化備份過程。過去,解析團隊的工作站全都單獨進行備份,并且在一定程度上進行臨時安排?,F(xiàn)在,所有數(shù)據(jù)都進行集中存儲,并定期進行備份,這避免了數(shù)據(jù)丟失。
隨著遠程工作成為新常態(tài),至少在不遠的將來,PGS解析團隊將通過RVIZ解決方案做好充分準備——通過數(shù)據(jù)中心向員工的遠程筆記本電腦提供強大的虛擬工作站。