帶寬
處于不同地區(qū)的兩個(gè)或者多個(gè)機(jī)房要打通,很多時(shí)候要經(jīng)過(guò)廣域網(wǎng)才行。當(dāng)然,有些實(shí)力超強(qiáng)的數(shù)據(jù)中心也可能單獨(dú)建設(shè)一條光纜隧道,通過(guò)光傳輸直連,這種情況非常少見(jiàn),建設(shè)成本要比租用運(yùn)營(yíng)商的網(wǎng)絡(luò)要昂貴得多。更多的時(shí)候是向運(yùn)營(yíng)商租用帶寬,通過(guò)在兩個(gè)機(jī)房之間建立一條VPN隧道,達(dá)到打通的目的,這個(gè)帶寬大小要根據(jù)機(jī)房的實(shí)際需要,也要考慮運(yùn)營(yíng)商能提供多大的帶寬。原則上,能進(jìn)行本地機(jī)房轉(zhuǎn)發(fā)的,盡量不走跨機(jī)房,減少跨機(jī)房的流量負(fù)擔(dān),這樣可以減少租用運(yùn)營(yíng)商網(wǎng)絡(luò)帶寬的費(fèi)用。機(jī)房的建設(shè)不要過(guò)于分散,減少機(jī)房之間的通道,各地機(jī)房都要匯聚連接到大規(guī)模的機(jī)房上,減少不必要的跨機(jī)房業(yè)務(wù),從而節(jié)省帶寬費(fèi)用。運(yùn)營(yíng)商的網(wǎng)絡(luò)帶寬各地均有不同,機(jī)房要盡量建設(shè)在網(wǎng)絡(luò)發(fā)到的地區(qū),以免運(yùn)營(yíng)商帶寬大大地限制住跨機(jī)房的流量訪(fǎng)問(wèn)。做跨機(jī)房的業(yè)務(wù)部署時(shí),首先就要考慮機(jī)房出入口的帶寬是否能滿(mǎn)足,如果不能滿(mǎn)足,一票否決,這樣的跨機(jī)房業(yè)務(wù)不能建設(shè)和部署。
安全
在數(shù)據(jù)中心機(jī)房?jī)?nèi)部,可以部署各種軟硬件的安全防護(hù)措施,以確保數(shù)據(jù)安全。但機(jī)房之間的數(shù)據(jù)交互,這些數(shù)據(jù)就不受機(jī)房的控制了,在廣域網(wǎng)傳輸時(shí),數(shù)據(jù)中心機(jī)房的安全難以發(fā)揮作用。這時(shí)的數(shù)據(jù)有的可能是增加了外層IP頭,做了封裝,但內(nèi)層報(bào)文依然有可能被人所截獲并被還原出來(lái)。有的可能是在發(fā)送和接收的機(jī)房安全設(shè)備上做加密,但這些加密算法并非不可破譯,只要被人掌握了破譯方法,在傳輸?shù)倪^(guò)程中依然有可能被盜取數(shù)據(jù)。各種廣域網(wǎng)的網(wǎng)絡(luò)協(xié)議本身是存在安全漏洞的,萬(wàn)一發(fā)生攻擊,被人攻破利用,數(shù)據(jù)就會(huì)泄密,帶來(lái)的損失可能是致命性的。最近出現(xiàn)一種量子通信,其安全性達(dá)到了前所未有的高度,也許在未來(lái)跨機(jī)房的應(yīng)用場(chǎng)景中能得到廣泛應(yīng)用,這樣可以大大提升跨機(jī)房數(shù)據(jù)傳輸?shù)陌踩?。另外,在機(jī)房之間要盡量傳遞計(jì)算數(shù)據(jù)或者中間過(guò)程數(shù)據(jù),對(duì)于一些涉及個(gè)人信息或者商業(yè)機(jī)密的數(shù)據(jù),盡量不要在跨機(jī)房的業(yè)務(wù)中反復(fù)傳遞,即使要傳遞,也盡量采用線(xiàn)下的方式。通過(guò)人為拷貝到存儲(chǔ)設(shè)備中,比如U盤(pán),移動(dòng)硬盤(pán),PC等,在機(jī)房之間轉(zhuǎn)移和傳遞,減少數(shù)據(jù)在網(wǎng)絡(luò)中傳輸泄露的風(fēng)險(xiǎn)。
延時(shí)
數(shù)據(jù)中心內(nèi)部網(wǎng)絡(luò)通信延時(shí)一般在300us(0.3ms)左右,但跨機(jī)房通信延時(shí)可能高達(dá)50000us(50ms),在進(jìn)行業(yè)務(wù)部署的時(shí)候要充分考慮跨機(jī)房的延時(shí)問(wèn)題。有的業(yè)務(wù)系統(tǒng),跨機(jī)房還有訪(fǎng)問(wèn)數(shù)據(jù)流量,這時(shí)就要考慮延時(shí)時(shí)間,對(duì)于跨機(jī)房的訪(fǎng)問(wèn)超時(shí)時(shí)間要設(shè)置得長(zhǎng)些;有的業(yè)務(wù)系統(tǒng),跨機(jī)房做數(shù)據(jù)備份,一份數(shù)據(jù)通過(guò)機(jī)房之間的鏈路傳遞到另外的機(jī)房,本身就消耗了一定時(shí)間,所以備用機(jī)房得到的數(shù)據(jù)總是延后的,要根據(jù)延時(shí)的時(shí)間來(lái)確定主備系統(tǒng)的數(shù)據(jù)差異,避免數(shù)據(jù)發(fā)生紊亂。尤其是在進(jìn)行主備切換時(shí),一定要確保數(shù)據(jù)的平滑交接,不出現(xiàn)丟失數(shù)據(jù)的情況;有的業(yè)務(wù)系統(tǒng),跨機(jī)房要實(shí)現(xiàn)虛擬機(jī)的遷移,以此來(lái)提升系統(tǒng)可靠性。虛擬機(jī)要實(shí)現(xiàn)跨機(jī)房的遷移就需要部署一個(gè)大二層的網(wǎng)絡(luò),而傳統(tǒng)的數(shù)據(jù)中心機(jī)房?jī)?nèi)部都是全三層轉(zhuǎn)發(fā)的,現(xiàn)在要通過(guò)二層打通,就需要借助VXLAN技術(shù),構(gòu)建一套虛擬的網(wǎng)絡(luò),實(shí)現(xiàn)虛擬機(jī)在機(jī)房之間任意遷移。延時(shí)過(guò)大,就會(huì)影響到遷移的速度,在虛擬機(jī)技術(shù)實(shí)現(xiàn)上也要充分考慮到延時(shí)的影響。
抖動(dòng)
在跨機(jī)房的整個(gè)通信鏈路中,影響因子很多,任何一點(diǎn)發(fā)生變化,都可能帶來(lái)整條鏈路的通信抖動(dòng),從而對(duì)設(shè)計(jì)方案的穩(wěn)定性提出更高的要求。在廣域網(wǎng)傳遞數(shù)據(jù),機(jī)房之間需要經(jīng)過(guò)幾條或十幾條路由才能抵達(dá),這中間任意一條路由有變化或者震蕩,都會(huì)影響兩機(jī)房之間的通信。還有,中間任意一條經(jīng)過(guò)的鏈路如果有震蕩或者錯(cuò)包也可能會(huì)導(dǎo)致兩機(jī)房之間的通信。有時(shí)這種網(wǎng)絡(luò)抖動(dòng)是不可避免的,也很難去排查,因?yàn)橹虚g經(jīng)過(guò)了太多的鏈路和網(wǎng)絡(luò)設(shè)備,這些設(shè)備還可能分屬于不同的運(yùn)營(yíng)商或不同國(guó)家,就算排查起來(lái)也是非常漫長(zhǎng),除非是影響長(zhǎng)時(shí)間大面積斷網(wǎng)的大事件,像這種偶爾有個(gè)網(wǎng)絡(luò)抖動(dòng),一般數(shù)據(jù)中心機(jī)房也只有忍氣吞聲的份兒了。既然抖動(dòng)不可避免,就得想辦法克服。在機(jī)房之間跑的網(wǎng)絡(luò)協(xié)議,重傳機(jī)制和超時(shí)時(shí)間要設(shè)置得長(zhǎng)一些,對(duì)抖動(dòng)不敏感。比如在端口上,可以增加延遲DOWN或UP的配置,當(dāng)出現(xiàn)鏈路抖動(dòng)或者錯(cuò)包時(shí),只要不超過(guò)設(shè)定的時(shí)間,端口都不會(huì)DOWN。因?yàn)槎丝贒OWN了后,很多協(xié)議和流量就徹底中斷了,而通過(guò)延遲DOWN配置就可避免抖動(dòng)帶來(lái)端口DOWN,減少對(duì)跨機(jī)房流量轉(zhuǎn)發(fā)影響。
數(shù)據(jù)中心跨機(jī)房技術(shù)要面對(duì)很多挑戰(zhàn),本文著重介紹了幾個(gè)方面。雖然跨機(jī)房面臨這樣那樣的問(wèn)題,但依然無(wú)法阻擋數(shù)據(jù)中心跨機(jī)房建設(shè)的熱情。數(shù)據(jù)中心建設(shè)不能一味地尋求大,建設(shè)得再大,也有無(wú)法再擴(kuò)的那一天,這時(shí)多機(jī)房技術(shù)則更符合數(shù)據(jù)中心未來(lái)發(fā)展的實(shí)際情況。未來(lái)的數(shù)據(jù)中心必將通過(guò)跨機(jī)房技術(shù),利用多機(jī)房?jī)?yōu)勢(shì)來(lái)提升整體業(yè)務(wù)能力。