曾經(jīng)演繹千年等一回傳奇愛情故事的杭州,近日再次上演了一場舉國矚目的愛情故事。不過這次卻是活生生的愛情悲劇,男主人公在飽受夜以繼日加班加點的摧殘下,還遭受著愛情失意的重擊。男主人最終將心中怒火發(fā)泄在了服務器身上,對服務器進行“格式化 ”處理,并將其視作愛情的陪葬品而踏上不歸之路。
近日,一則有關“運維小伙因加班失戀 格式化所有服務器后自殺”的消息在微博上不脛而走。該消息的曝光,不僅凸顯了IT從業(yè)人士身心健康的問題,而且也暴露出IT運維、尤其是服務器的管理存在著重大漏洞。
援引該微博原文:“杭州某高新技術開發(fā)公司,一名運維,長期以來飽受公司加班的摧殘 ,近段時間,女友應無法忍受他長期加班,遂與之分手。此男悲痛欲絕,傷心之余,格式化并關閉所有服務器之后跳樓自殺。”
微博內(nèi)容截圖
從以上內(nèi)容我們可以做以下解讀:男主人公飽受長期加班勞累之苦;男主人公承受因此帶來的失戀之苦;男主人公不堪忍受、泄憤至服務器并踏上不歸之路。在這則故事的背后,雖然有著令人扼腕長嘆的憐惜和無奈,但勾起人們反省的卻更多的是警示和教訓:
長期加班緣何成為了IT運維人員的工作常態(tài)?身為運維人員是如何取得服務器“生殺”大權的?報警系統(tǒng)在服務器被格式化、關閉操作之時緣何失靈?要知道,如果報警系統(tǒng)能及時響應,就極有可能挽救一條生命!當然,成為愛情陪葬品的服務器(包括基于該服務器上的應用)在被格式化、被關閉后,也極有可能通過異地容災備份來恢復被刪除被關閉的服務。但我們同樣要知道,如果沒有事先采取這種異地災備方案,那么后果是不堪設想的;而且身為普通IT運維人員,就能隨隨便便獲得服務器root級別權限并進行格式化、關閉等非常規(guī)操作,其暴露出來的漏洞更是令人匪夷所思。
[page]
毫無疑問,這位運維小伙沒有走出愛情失意帶來的陰影,而問題的根本貌似出現(xiàn)在長期的加班問題上。對于IT行業(yè)來說,加班是家常便飯的事。筆者此前也曾經(jīng)講過,加班是份內(nèi)的事,這個社會尤其是這個行業(yè),特別需要有奉獻精神的人存在。但如果經(jīng)常加班或者說長期加班成為了常態(tài)化,那就需要值得警惕了。
值得警惕的,并不僅僅是對工作抱以抵觸的情緒,更應該注意的是如何平衡好工作和生活,如何在長期加班帶來痛苦之余調(diào)理好身心健康。當然,更應該注意并值得反思的是,作為支撐各行各業(yè)、最具創(chuàng)新和高效活力的IT基礎設施,緣何沒有實現(xiàn)IT所倡導的智能化、自動化、標準化甚至是開放化。正所謂“己所不欲勿施于人”,身為IT行業(yè)的企業(yè)自身,其實更應該“以身作則”實現(xiàn)高效化、智能化、自動化的IT運維和管理。也許這些“化”真正落地并融入到了IT運維中,對IT職員來說,需要的就不會是夜以繼日的加班,而是彰顯IT高效智能、開放創(chuàng)新引來的一陣陣驚羨歡呼。
IT運維不應該寄托于長期加班來實現(xiàn)本應有的高效、靈活,在此強調(diào)的本意并不在工作職責,而是凸顯IT系統(tǒng)在設計、部署、管理、維護方面存在的問題:
IT標準化,顧名思義就是要設計、部署基于標準的IT架構平臺。具體表現(xiàn)在采用成熟、可靠的服務器、存儲、網(wǎng)絡模塊,并根據(jù)企業(yè)自身業(yè)務的應用情況,配置和部署不同規(guī)格的系統(tǒng)平臺。在由貼合用戶自身應用場景的各個子系統(tǒng)(包括處理器、內(nèi)存、磁盤、電源等)組成的平臺上,形成一套可經(jīng)受驗證并符合公司統(tǒng)一標準流程的IT平臺。IT標準化,能夠帶來高效、快速并且豐富的解決方案,無論在運維管理還是在升級配置,都能輕易實現(xiàn)預期目標。
IT運維應該遵循“標準化、自動化、智能化”體系規(guī)范
大數(shù)據(jù)時代,是一個更加強調(diào)數(shù)據(jù)價值的時代。IT運維對應的平臺,無論出乎何種目的,都是為了支撐某項服務。智能化也就是在不斷發(fā)展的平臺和需求不斷提高的雙層背景下,成為了未來趨勢的價值載體。
另外,IT運維也特別需要引入自動化工作流程。眾所周知,IT運維80%的工作量都可通過系統(tǒng)實現(xiàn)自動監(jiān)測、診斷、修復、報警、通知管理員等工作,其他小部分時間都是可以通過遠程異地實現(xiàn)人工干預或者親臨現(xiàn)場進行配件更換等工作。杭州這家高新技術開發(fā)公司,既然其業(yè)務本身就是高新技術開發(fā),就更應該重視這種自動化運維所發(fā)揮的作用了。
此次事件其實更多的凸顯IT運維中的安全管理問題。身為運維人員,他是如何取得服務器“生殺”大權的?在擁有服務器root級別權限,對其進行格式化和關閉操作時,報警系統(tǒng)緣何失靈?
一般來說,IT系統(tǒng)運維的主要任務是在確保服務器性能和功能的前提下,提高系統(tǒng)的安全性。而要做到這一點,服務器的訪問權限控制策略無疑是其中的一個重要環(huán)節(jié)。在訪問權限控制策略方面,盡量遵循“授予其所需要的最小權限”,也就是給用戶提供“剛好夠用 ”的訪問權限,而不能提供目前不用、未來可用的訪問權限。由于本文所關注的這位IT運維人員,其具體職責不明,因此,并不能具體分析其權限的類型和大小。
不過,我們完全可以推導出他在IT運維中的管理員屬性。在IT系統(tǒng)中,管理員是泛指,既包括系統(tǒng)管理員,也包括數(shù)據(jù)庫管理員,當然也包括公司IT部門的最高管理員一職,等等。在系統(tǒng)配置、數(shù)據(jù)備份與還原等不同工作職責范圍內(nèi),應該有相應的管理員賬戶。
根據(jù)介紹,這位IT運維人員對服務器進行了格式化和關閉操作,這種操作級別在所有的管理員訪問權限中是最高一級的,而且通常也需要通過一個流程實現(xiàn)層層報備才可實現(xiàn)。這位男主人公將個人恩怨發(fā)泄在服務器身上,將服務器運行的應用和數(shù)據(jù)內(nèi)容格式化處理,想必是利用了系統(tǒng)管理中的漏洞,包括root級別訪問權限和報警監(jiān)測系統(tǒng)的漏洞。而這些漏洞,在通常的IT系統(tǒng)運維中,是至關重要、最需要加以避免的。
利用漏洞獲取root訪問權限
另外,此次事件也進一步凸顯出異地容災備份的重要性。異地災備,在金融、電信、能源等領域的重要性尤為重要,每一分每一秒的宕機事故,都會給企業(yè)帶來沉重的財產(chǎn)損失和難以挽回的良好聲譽。對于事件中的高新技術開發(fā)公司來說,服務器上跑的應用可能更多的是基于測試、開發(fā)、模擬等更貼近實驗性的業(yè)務,這些業(yè)務應用(甚至其中的某些測試結果、數(shù)據(jù)等)都直接關系到公司產(chǎn)品的開發(fā)和推廣,進而影響到企業(yè)的整體利益。
異地災備示意(來源:zmanda)
異地災備,首先要滿足“異地”和“備份”的最基本要求。需要在一定距離以上,甚至可能需要跨區(qū)域進行數(shù)據(jù)備份。其次,可以根據(jù)業(yè)務應用情況選擇定期全局備份或者增量備份。而且,也需要關注系統(tǒng)主機本身的備份。比如該事件中,服務器被強行關閉,即可視作是“主機系統(tǒng)”徹底宕機。在這種情況下,還需要有備份服務器,而這些都應該基于“ 異地”來實現(xiàn)。
在事已至此的情況下,我們只能寄希望于“事先”的“萬事俱備”,并希望借此悲劇事件折射出來的管理漏洞,能讓其他企業(yè)用戶加強服務器的管理和IT員工的職責分工,同時也希望更多的IT運維人員了解,服務器不應該成為愛情的陪葬品。
責編點評
王迪 從一個事件引發(fā)對服務器容災備份的深思,異地災備方案是有效保障企業(yè)服務器數(shù)據(jù)的安全方案之一,特別是在人為情況下產(chǎn)生非常規(guī)操作,如何讓IT運維實現(xiàn)高效管理、靈活部署值得關注。