国产精品亚洲天堂2020资源,午夜欧美国产

調(diào)查報告：數(shù)據(jù)中心互聯(lián)面臨的難題(上)

責(zé)任編輯：vivian

2011-12-31 08:54:26

摘自：it168

為了實現(xiàn)重要商業(yè)應(yīng)用的零誤工，一些企業(yè)把數(shù)據(jù)中心也聯(lián)合起來，這樣一來當(dāng)某個數(shù)據(jù)中心出現(xiàn)故障時，上面的應(yīng)用可以切換到另外一個數(shù)據(jù)中心。

為了實現(xiàn)重要商業(yè)應(yīng)用的零誤工，一些企業(yè)把數(shù)據(jù)中心也聯(lián)合起來，這樣一來當(dāng)某個數(shù)據(jù)中心出現(xiàn)故障時，上面的應(yīng)用可以切換到另外一個數(shù)據(jù)中心。服務(wù)器虛擬化技術(shù)的出現(xiàn)，如VM遷移，使這一選擇更具靈活性。有些企業(yè)更勝一籌，通過創(chuàng)建相互連接的數(shù)據(jù)中心同時在兩個不同的數(shù)據(jù)中心里運行相同的應(yīng)用。

雖然有許多關(guān)于此部署的架構(gòu)決策，但或許最關(guān)鍵的是兩個數(shù)據(jù)中心如何通過DCI連接。應(yīng)用與虛擬化軟件的要保持同步，則需要兩個數(shù)據(jù)中心之間的延時非常短，通常要控制在毫秒范圍。這一要求在IT和數(shù)據(jù)中心設(shè)計師創(chuàng)建DCI架構(gòu)性時起到了舉足輕重的作用。

由DCI連接的應(yīng)用需要使用以太網(wǎng)，這樣就會帶來巨大的挑戰(zhàn)，包括延時問題，還可能創(chuàng)建環(huán)路從而導(dǎo)致網(wǎng)絡(luò)崩潰。有多種方案可以應(yīng)對這種挑戰(zhàn)，包括使用運營商服務(wù)，如Virtual Private LAN服務(wù)，但是這些方案也存在自身局限性。

例如，當(dāng)VPLS 可用來阻止運營商網(wǎng)絡(luò)中的循環(huán)時，它不會阻止客戶內(nèi)部網(wǎng)絡(luò)中出現(xiàn)循環(huán)。VPLS可能帶來延時并因此影響應(yīng)用的使用?？蛻艋蛟S想使用Multichassis Link Aggregation之類的技巧，在這種技巧中，兩到多個以太網(wǎng)交換機在本地合并到一起使兩條以太網(wǎng)連接成為一條。

其他選擇還包括使用暗光纖和DWDM，二者都可以提供很快的連接。雖然暗光纖和DWDM都很貴，但是它們能為DCI提供最優(yōu)連接。

數(shù)據(jù)中心互聯(lián)增強應(yīng)用有效性

應(yīng)用如果出現(xiàn)故障，對企業(yè)的損失是比較大的，特別那些關(guān)乎關(guān)鍵業(yè)務(wù)的系統(tǒng)。阻止應(yīng)用故障的策略之一就是創(chuàng)建數(shù)據(jù)中心的互聯(lián)，或是用DCI連接兩個數(shù)據(jù)中心，這樣當(dāng)故障出現(xiàn)在一個數(shù)據(jù)中心的時候，應(yīng)用會繼續(xù)在另一個數(shù)據(jù)中心里運行。在ITIL推薦要發(fā)揮所有固有資產(chǎn)價值以及使用積極數(shù)據(jù)中心模式的倡導(dǎo)下，這種方法得到了進(jìn)一步發(fā)展。

有兩種方法可在兩個數(shù)據(jù)中心中創(chuàng)建可用性較高的應(yīng)用。第一是選擇一個應(yīng)用，在其中一個數(shù)據(jù)中心中使用這個應(yīng)用，而另外一個數(shù)據(jù)中心則作為備用。這樣，當(dāng)?shù)谝粋€數(shù)據(jù)中心出現(xiàn)故障時，應(yīng)用會轉(zhuǎn)換到另一個數(shù)據(jù)中心繼續(xù)運作。監(jiān)控管理技術(shù)，如VMmare的vMotion，可以讓虛擬機從一個物理服務(wù)器轉(zhuǎn)移到另一個服務(wù)器上，通過此項操作來實現(xiàn)進(jìn)程的持續(xù)運作。

第二種選擇是應(yīng)用同步化，這樣就可以在兩個數(shù)據(jù)中心里同時運行應(yīng)用。群集，共享和存儲復(fù)制等技術(shù)都有助于實現(xiàn)同步化。

但是許多有應(yīng)用運行的群集和復(fù)制技術(shù)都需要共享一個以太網(wǎng)，而且以太網(wǎng)數(shù)據(jù)會通過單點播放/多點播放或廣播的形式發(fā)送給集群中的所有要素（服務(wù)器，數(shù)據(jù)庫和存儲）。

問題在于，雖然以太網(wǎng)可在數(shù)據(jù)中心電纜上傳輸幾百米，但是它的局限性也會對企業(yè)創(chuàng)建DCI形成阻礙。這些阻礙包括延時和帶寬挑戰(zhàn)。

運營商也提供了一些服務(wù)期望能應(yīng)對諸如此類的挑戰(zhàn)，但是這些服務(wù)在部署方面仍然存在局限性，而且還不足以保障應(yīng)用的高可用性。我們將審查這些挑戰(zhàn)并介紹一些可創(chuàng)建DCI連接的替代物。最佳選擇是使用Multichassis Link Aggregation （MLAG）等技術(shù)，因為它們使用了暗光纖和DWDM服務(wù)。

延時問題

延時是一個比較麻煩的問題。造成延時的原因主要有三個，最主要的就是距離。距離越遠(yuǎn)，電子信號的傳輸時間就越長。

兩個數(shù)據(jù)中心之間最常見的延時底線由VM遷移來決定，如用于VMware vSphere服務(wù)器的vMotion，它可以讓虛擬機從一個物理機組遷移到另一個機組。VMware稱，源服務(wù)器和目標(biāo)服務(wù)器之間的延時必須小于5毫秒（vMotion Metro 許可證更改了vMotion TCP堆棧使其支持動態(tài)套接緩沖，這樣便調(diào)整了TCP協(xié)議堆棧中里的內(nèi)存數(shù)據(jù)包緩沖，按照延時/帶寬情況優(yōu)化性能，可以容許稍長一點的延時）。

你的企業(yè)有沒有為改善網(wǎng)絡(luò)制定預(yù)算？

▲圖一：改善網(wǎng)絡(luò)連接的預(yù)算

實踐結(jié)果是數(shù)據(jù)中心的距離在50-75 公里范圍內(nèi)可以進(jìn)行可靠的VM遷移。

遺憾的是，這個距離對于較嚴(yán)重的災(zāi)難恢復(fù)計劃而言還不夠（如颶風(fēng)，地震或是區(qū)域性的電信故障）。因此企業(yè)要平衡應(yīng)用應(yīng)對災(zāi)難恢復(fù)要求的彈性。

延時還會影響存儲復(fù)制，特別是在同步復(fù)制中，數(shù)據(jù)塊寫入必須在兩個站點間在5-10毫秒內(nèi)復(fù)制完，這要取決于恢復(fù)點的目標(biāo)恢復(fù)時間。

對于同步操作而言，延時的影響比較小，因為寫入確認(rèn)可以在不影響存儲源的情況下被接收到，而且請求/響應(yīng)順序沒有通過寫入確認(rèn)來限制。但是如果你計劃進(jìn)行亞秒故障轉(zhuǎn)移，通常需要進(jìn)行同步存儲來確保數(shù)據(jù)不被丟失。

另一個導(dǎo)致延時的不顯著因素是運營商往往使用隧道協(xié)議，如MPLS，ATM或SONET.MPLS網(wǎng)絡(luò)的問題在于運營商不能保障網(wǎng)絡(luò)中兩站點之間的路徑。運營商網(wǎng)絡(luò)可能在一個城市的多個節(jié)點跳動，這樣以太網(wǎng)絡(luò)幀在轉(zhuǎn)發(fā)時會增加處理延時。

最后一個導(dǎo)致延時的要素是帶寬。網(wǎng)速快當(dāng)然延時就短；例如，1G接口的延時為5.7毫秒，但是10G接口的延時僅為0.57毫秒。簡而言之，改善延時問題的簡單方法就是使用高帶寬網(wǎng)絡(luò)。

QoS挑戰(zhàn)

應(yīng)用在兩個數(shù)據(jù)中心之間的有效性也會影響QoS設(shè)置的限制。以太網(wǎng)有五個可用的QoS類可以對數(shù)據(jù)流進(jìn)行分類管理，這樣便能限制第二層數(shù)據(jù)中心互聯(lián)可以處理的服務(wù)量。

同時，在DCI上你還有兩股不同類型的數(shù)據(jù)來維持應(yīng)用的有效性：突發(fā)性，高帶寬應(yīng)用和低延時，持續(xù)爆發(fā)的監(jiān)控遷移數(shù)據(jù)流。因此，你必須設(shè)計好QoS設(shè)置使其滿足兩種數(shù)據(jù)的需求。

注意，不論有多少帶寬可用，都可能出現(xiàn)瞬時數(shù)據(jù)爆發(fā)占用所有帶寬，從而使你的QoS設(shè)置失效。這種情況可能出現(xiàn)在數(shù)據(jù)路徑的任何一處，即便是以微秒來計算的數(shù)據(jù)爆發(fā)都嚴(yán)重影響整體傳輸性能。網(wǎng)絡(luò)阻滯可能導(dǎo)致各種數(shù)據(jù)回流，致使問題復(fù)雜化。

Traffic Trombone

創(chuàng)建DCI過程中以太網(wǎng)面臨的另一種挑戰(zhàn)是“Traffic Trombone（網(wǎng)絡(luò)內(nèi)部的信息往返流動）”（圖3）。以在線商務(wù)為例：它有面向公眾的Web/應(yīng)用服務(wù)器，該服務(wù)器可連接至內(nèi)部數(shù)據(jù)庫服務(wù)器。假設(shè)，有一個VLAN已被擴(kuò)展到第二個數(shù)據(jù)中心。

如果該Web服務(wù)器在兩個數(shù)據(jù)中心間徘徊，它會保留相同的IP地址，所有數(shù)據(jù)都必須穿過DCI鏈接。如圖3所示，里面包括了出入外部用戶端的數(shù)據(jù)以及出入數(shù)據(jù)庫的數(shù)據(jù)。

另需增加的帶寬嚴(yán)重限制了該方案的可擴(kuò)展性而且還增加了帶寬的成本。供應(yīng)商正推出DNS負(fù)載平衡之類的傳輸系統(tǒng)，因為這樣的系統(tǒng)可以隨時將數(shù)據(jù)流發(fā)送到新地址，不過它們的實用性還不足。例如，如果你的數(shù)據(jù)庫沒有用類似Web服務(wù)器這樣的監(jiān)管平臺進(jìn)行虛擬化，你如何能對推動數(shù)據(jù)庫服務(wù)器及其相關(guān)應(yīng)用和Web服務(wù)器機制進(jìn)行管理呢？

阻止循環(huán)

以太網(wǎng)為DCI的創(chuàng)建帶來了另一個技術(shù)性障礙。以太網(wǎng)創(chuàng)建于30年前，是一種本地網(wǎng)絡(luò)協(xié)議，所以當(dāng)時沒有考慮到跨機器擴(kuò)展。就設(shè)計而言，以太網(wǎng)是一種多路存取技術(shù)，所以可通過網(wǎng)絡(luò)上的所有端點接收以太網(wǎng)廣播和多點傳播幀。

因此，當(dāng)主機發(fā)送以太網(wǎng)廣播或多點播幀時，這個幀必須通過所有以太網(wǎng)進(jìn)行轉(zhuǎn)發(fā)，包括DCI.當(dāng)廣播幀循環(huán)回到以太網(wǎng)網(wǎng)絡(luò)時，它就會被所有交換機轉(zhuǎn)發(fā)，即便它此前已被廣播。這就制造了一種快速消耗所有網(wǎng)絡(luò)帶寬的條件，而結(jié)果便是導(dǎo)致網(wǎng)絡(luò)癱瘓。

數(shù)年前開發(fā)的生成樹協(xié)議就是為了阻止這種循環(huán)，而且它現(xiàn)在仍在沿用，盡管Rapid Spanning Tree Protocol （RSTP）已經(jīng)在可靠性和速度方面有所超越。

問題是Spanning Tree不能在長距離傳輸中效果不好。當(dāng)網(wǎng)絡(luò)延時超過250毫秒時，RSTP就不再能阻止循環(huán)。

結(jié)論便是Spanning Tree不能在創(chuàng)建DCI時有效阻止循環(huán)。試一下你就會發(fā)現(xiàn)它易受單向數(shù)據(jù)流的影響，而其他操作都會出現(xiàn)故障。雖然存在單向鏈路檢測協(xié)議（UDLD）這樣的補丁，但是運營商的服務(wù)很有可能會攔截UDLD或是其他減少STP限制的功能。

供應(yīng)商開發(fā)出了很多技術(shù)復(fù)雜的方案用于解決循環(huán)問題。三種最常見的方案就是VPLS，MLAG/PortChannel和OTV.

數(shù)據(jù)中心數(shù)據(jù)流 RSTP