大數(shù)據(jù)應(yīng)用:那些塊狀的“作業(yè)模式”

責(zé)任編輯:editor008

2014-12-04 09:33:26

摘自:太平洋電腦網(wǎng)

隨著大數(shù)據(jù)在企業(yè)中的應(yīng)用逐漸深入,企業(yè)在構(gòu)建大數(shù)據(jù)服務(wù)平臺(tái)的時(shí)候只是關(guān)注數(shù)據(jù)中心、機(jī)房、服務(wù)器等硬件設(shè)備的性能這些參數(shù),其實(shí)大數(shù)據(jù)在企業(yè)當(dāng)中的應(yīng)用時(shí)非常廣泛的,大數(shù)據(jù)應(yīng)用程序需要處理大規(guī)模信息,而且在出于彈性的考慮將數(shù)據(jù)復(fù)制到多個(gè)位置時(shí),信息的規(guī)模變得越來(lái)越大。

隨著大數(shù)據(jù)在企業(yè)中的應(yīng)用逐漸深入,企業(yè)在構(gòu)建大數(shù)據(jù)服務(wù)平臺(tái)的時(shí)候只是關(guān)注數(shù)據(jù)中心、機(jī)房、服務(wù)器等硬件設(shè)備的性能這些參數(shù),其實(shí)大數(shù)據(jù)在企業(yè)當(dāng)中的應(yīng)用時(shí)非常廣泛的,大數(shù)據(jù)應(yīng)用程序需要處理大規(guī)模信息,而且在出于彈性的考慮將數(shù)據(jù)復(fù)制到多個(gè)位置時(shí),信息的規(guī)模變得越來(lái)越大。

這就需要企業(yè)在構(gòu)建大數(shù)據(jù)網(wǎng)絡(luò)和服務(wù)平臺(tái)的時(shí)候,需要將大數(shù)據(jù)的不同屬性規(guī)模進(jìn)行劃分和歸類,并將大數(shù)據(jù)應(yīng)用分割成很多個(gè)小的“作業(yè)模式”進(jìn)行信息的處理工作。

大數(shù)據(jù)應(yīng)用需要“彈性”

如果有一組分布式資源必須通過(guò)互聯(lián)網(wǎng)絡(luò)進(jìn)行協(xié)調(diào)時(shí),可用性就變得至關(guān)重要。如果網(wǎng)絡(luò)出現(xiàn)故障,那么造成的后果是出現(xiàn)不連續(xù)的壞計(jì)算資源與數(shù)據(jù)集。

大多數(shù)網(wǎng)絡(luò)架構(gòu)和工程師的主要關(guān)注點(diǎn)是正常運(yùn)行時(shí)間。但是,網(wǎng)絡(luò)故障時(shí)間的根源又各不相同。大量數(shù)據(jù)都會(huì)有一個(gè)數(shù)據(jù)源,這些所謂的數(shù)據(jù)源就是來(lái)源于不同的結(jié)構(gòu)層,數(shù)據(jù)之間進(jìn)行協(xié)作和應(yīng)用,當(dāng)中出現(xiàn)差錯(cuò)是肯定避免不了的。

上面這類問(wèn)題就需要企業(yè)的IT管理部門設(shè)計(jì)一套能適應(yīng)故障的彈性網(wǎng)絡(luò),并以此來(lái)保障大數(shù)據(jù)服務(wù)和管理平臺(tái)的安全平穩(wěn)運(yùn)行,除了傳統(tǒng)的平均故障時(shí)間間隔方法,大數(shù)據(jù)網(wǎng)絡(luò)的真正設(shè)計(jì)標(biāo)準(zhǔn)一定要包含上述的彈性特質(zhì)。

大數(shù)據(jù)擁塞問(wèn)題要解決

大數(shù)據(jù)應(yīng)用程序不僅僅是規(guī)模大,而且還有一種我稱為突發(fā)性的特性。當(dāng)一個(gè)作業(yè)啟動(dòng)之后,數(shù)據(jù)就開(kāi)始流轉(zhuǎn)。在高流量時(shí)間段里,擁塞是一個(gè)嚴(yán)重的問(wèn)題。

因此,網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)時(shí)應(yīng)該盡可能減少擁塞點(diǎn)。按照可用性的設(shè)計(jì)標(biāo)準(zhǔn),減少擁塞要求網(wǎng)絡(luò)具有較高的路徑多樣性,這樣才能允許網(wǎng)絡(luò)將流量分散到大量不同的路徑上。

數(shù)據(jù)一致性比延遲更重要

根據(jù)很多項(xiàng)測(cè)試可以發(fā)現(xiàn),絕大多數(shù)的大數(shù)據(jù)應(yīng)用其實(shí)延遲并不大,如果計(jì)算時(shí)間的數(shù)量級(jí)為幾秒鐘或幾分鐘,那么即使網(wǎng)絡(luò)上出現(xiàn)較大延遲也是無(wú)所謂的。

大數(shù)據(jù)應(yīng)用程序一般具有較高的同步性。這意味著作業(yè)是并行執(zhí)行的,而各個(gè)作業(yè)之間較大的性能差異可能會(huì)引發(fā)應(yīng)用程序的故障。因此,網(wǎng)絡(luò)不僅要足夠高效,而且要在空間和時(shí)間上具有一致的性能。

網(wǎng)絡(luò)分割是解決大數(shù)據(jù)難題的有效途徑

我們前文說(shuō)了,將不同數(shù)據(jù)源的大數(shù)據(jù)模型進(jìn)行分割,并將這些小型的數(shù)據(jù)源分批進(jìn)行處理,這樣一來(lái)就解決了企業(yè)大數(shù)據(jù)平臺(tái)管理難的問(wèn)題了。在最簡(jiǎn)單的形式上,分割可能意味著要將大數(shù)據(jù)流量與其他網(wǎng)絡(luò)流量分離,這樣應(yīng)用程序產(chǎn)生的突發(fā)流量也不會(huì)影響其他關(guān)鍵任務(wù)工作負(fù)載。

同時(shí),企業(yè)還需要在一些場(chǎng)合當(dāng)中及你選哪個(gè)網(wǎng)絡(luò)負(fù)載的邏輯分離或者物理分離,因?yàn)檫@種分離能夠讓企業(yè)的IT架構(gòu)師們輕松對(duì)企業(yè)的大數(shù)據(jù)服務(wù)平臺(tái)進(jìn)行更好的劃分。

D1Net評(píng)論:

企業(yè)在運(yùn)用大數(shù)據(jù)平臺(tái)時(shí),必須要關(guān)注以上幾個(gè)點(diǎn),除此之外,企業(yè)要讓IT架構(gòu)師對(duì)自身的大數(shù)據(jù)服務(wù)平臺(tái)進(jìn)行劃分,細(xì)化大數(shù)據(jù)的應(yīng)用價(jià)值,只有這樣,才能將大數(shù)據(jù)價(jià)值發(fā)揮到最大化。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)