避免數(shù)據(jù)中心停機(jī),基礎(chǔ)設(shè)施人員如何合作

責(zé)任編輯:vivian

2012-03-31 08:49:13

摘自:比特網(wǎng)

IT和設(shè)施人員越來越依賴彼此來為數(shù)據(jù)中心客戶提供高可用性的服務(wù)。通過針對(duì)性地處理這些常見的導(dǎo)致運(yùn)營障礙的干擾性因素,并采用以上提及的清晰界定的流程,數(shù)據(jù)中心公司可大大提高…

IT和設(shè)施人員越來越依賴彼此來為數(shù)據(jù)中心客戶提供高可用性的服務(wù)。你的公司是否有效地處理了這個(gè)關(guān)鍵關(guān)系中最重要的部分?要自信地回答這個(gè)問題,了解一下這兩類人員共同承當(dāng)?shù)哪男┴?zé)任導(dǎo)致了最常見的可用性故障是有幫助的。

之后,我們就可以采用這些通過驗(yàn)證的方法來將可用性風(fēng)險(xiǎn)減少至最小。行業(yè)數(shù)據(jù)顯示,在由設(shè)備導(dǎo)致的計(jì)算機(jī)運(yùn)營故障當(dāng)中,大多數(shù)是發(fā)生在機(jī)房而非基礎(chǔ)設(shè)施建筑中。

背后的原因很簡單:人們通常是在機(jī)房而非放置支持設(shè)備的建筑物里出現(xiàn)。風(fēng)險(xiǎn)通常是復(fù)雜的,一方面是因?yàn)闄C(jī)房由多個(gè)部門管理,一方面是因?yàn)橹С謾C(jī)房的多個(gè)系統(tǒng)的運(yùn)營需要各種各樣的技能。

鑒于這些因素,發(fā)生混亂及失誤的機(jī)率非常高。要避免這種情況,就需要各個(gè)部門通力合作,清晰定義關(guān)鍵任務(wù)的具體流程及責(zé)任人。

布線和連接流程

這是一個(gè)最需要優(yōu)先考慮的事項(xiàng)。一個(gè)成功的IT/設(shè)施團(tuán)隊(duì)需要清晰地界定哪些部門及個(gè)人可安裝及移除機(jī)房中的電源、網(wǎng)絡(luò)電纜及連接。各個(gè)部門需要就各自負(fù)責(zé)的工作劃分清晰的界線,并達(dá)成一致性意見。他們需要定義設(shè)施部門應(yīng)將電源線連在服務(wù)器機(jī)柜的哪一邊;

哪個(gè)部門將負(fù)責(zé)將配電單元(PDU)whip連接到一個(gè)獨(dú)立的計(jì)算機(jī)設(shè)備上;

哪個(gè)部門有權(quán)移除網(wǎng)絡(luò)連接器等。圖表或相片需要配上職責(zé)界限的書面說明,以進(jìn)一步明晰各自的職責(zé)。每個(gè)部門只能允許2~3個(gè)人來負(fù)責(zé)這些關(guān)鍵布線任務(wù):其中一個(gè)人負(fù)主要責(zé)任,而其他人則負(fù)責(zé)支持工作。這些角色的連續(xù)性是非常重要的,因?yàn)檫B續(xù)性可以保證一致性,并將發(fā)生誤差的可能性最小化。

硬件總體規(guī)劃

從IT及設(shè)施部門各自分派一個(gè)人來負(fù)責(zé)計(jì)算機(jī)硬件總體規(guī)劃的準(zhǔn)備和管理工作是下一個(gè)最重要的目標(biāo)。這兩個(gè)人需要每周碰頭,決定新購進(jìn)的電腦應(yīng)安裝在樓面及機(jī)柜中的哪個(gè)地方。

需要準(zhǔn)備一張計(jì)算機(jī)機(jī)房平面圖,并根據(jù)環(huán)境的變化而定期更新。這張平面圖需要展示指定區(qū)域(為特定類別計(jì)算機(jī)硬件提前預(yù)留的空間占到3/4)中所部署的所有機(jī)柜、機(jī)架及獨(dú)立設(shè)備。機(jī)架的正視圖應(yīng)顯示從底部到頂部需要安裝的硬件及其具體安裝位置。IT代表人員需要確??傮w規(guī)劃會(huì)考慮到各項(xiàng)特殊要求,包括連接、與其他硬件或網(wǎng)絡(luò)設(shè)備的通信需求及距離限制等。

設(shè)備團(tuán)隊(duì)成員需要確保總體規(guī)劃考慮專門的制冷及電力需求,例如,如果制冷功能從活動(dòng)地板提供,就在機(jī)柜底部放置一個(gè)高熱能的服務(wù)器。IT及設(shè)施管理人員都需要委派一名后備人員。沒有IT及設(shè)施管理總體規(guī)劃負(fù)責(zé)人的允許,不可安裝或拆裝計(jì)算機(jī)硬件。

更少的人力——更少的問題

第三個(gè)減小風(fēng)險(xiǎn)的方法就是減少可以訪問機(jī)房的人員數(shù)量。如果將訪問機(jī)房的人數(shù)最小化,發(fā)生失誤的風(fēng)險(xiǎn)性也可大大減少。這需要高級(jí)管理人員強(qiáng)有力的支持。只有每周至少需要在機(jī)房工作一天的人員才可在沒有人陪同的情況下獨(dú)自進(jìn)入機(jī)房。其他人員在進(jìn)入機(jī)房時(shí)都需要有他人在場。入選的某些工作人員,如果對(duì)機(jī)房工作程序有一個(gè)透徹的了解,可使用臨時(shí)工作卡進(jìn)入機(jī)房。每個(gè)季度,需要由管理人員審閱這個(gè)訪問清單,以確定個(gè)人再次訪問機(jī)房的要求。

保證程序上的清晰性

設(shè)施和IT人員還可采用另外一種方式大幅度減少機(jī)房環(huán)境的風(fēng)險(xiǎn)性:每個(gè)將要進(jìn)入機(jī)房的個(gè)人需要閱讀整套數(shù)據(jù)中心機(jī)房工作程序指南。這個(gè)文件應(yīng)該描述工作活動(dòng)中的所有注意事項(xiàng),通常是10~15頁長。各個(gè)部門的經(jīng)理需要與允許進(jìn)入機(jī)房工作的員工及供應(yīng)商(不管是否有人陪伴)一同閱讀這份文件。簽名的復(fù)印件需要?dú)w檔并且每年更新。對(duì)于這些有人陪伴參觀機(jī)房(非工作)的人員,需要閱讀該文件的簡縮版。

通過針對(duì)性地處理這些常見的導(dǎo)致運(yùn)營障礙的干擾性因素,并采用以上提及的清晰界定的流程,數(shù)據(jù)中心公司可大大提高數(shù)據(jù)中心運(yùn)營的連續(xù)性。此外,應(yīng)用的連續(xù)運(yùn)營也將大大提高數(shù)據(jù)中心正常運(yùn)行時(shí)間的長度。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)