關(guān)于如何定義大數(shù)據(jù)和分析的總體架構(gòu)的不確定性是中小企業(yè)在大數(shù)據(jù)和分析部署方面落后的原因之一。在很多情況下,對(duì)于混合計(jì)算、數(shù)據(jù)集市、主數(shù)據(jù)庫(kù)等趨勢(shì)發(fā)展情況,以及對(duì)安全和治理的控制將如何發(fā)揮,他們正在等待和觀望。
最后,將會(huì)提供一個(gè)大家都可以遵循的新興的最佳實(shí)踐數(shù)據(jù)架構(gòu)。在這個(gè)架構(gòu)中:云計(jì)算服務(wù)正被用于存儲(chǔ)和處理大數(shù)據(jù),而內(nèi)部部署數(shù)據(jù)中心用于在企業(yè)開發(fā)本地?cái)?shù)據(jù)集市。
以下來(lái)仔細(xì)看看這個(gè)大數(shù)據(jù)和分析架構(gòu)背后的原因:
云計(jì)算的作用
如果企業(yè)規(guī)模較小,那么購(gòu)買在數(shù)據(jù)中心并行處理大數(shù)據(jù)的服務(wù)器集群是很昂貴的,更不用說(shuō)雇傭或培訓(xùn)那些知道如何優(yōu)化、升級(jí)和維護(hù)并行處理環(huán)境的非常昂貴的專業(yè)人員了。選擇現(xiàn)場(chǎng)處理和存儲(chǔ)數(shù)據(jù)的企業(yè)也對(duì)硬件、軟件和存儲(chǔ)設(shè)備進(jìn)行了大量投資。而采購(gòu)大數(shù)據(jù)硬件和軟件,以及將計(jì)算處理和存儲(chǔ)外包給云端,所有這些都將花費(fèi)大量的費(fèi)用。
內(nèi)部部署計(jì)算
數(shù)據(jù)治理(例如,安全和合規(guī)性問(wèn)題)是企業(yè)不愿將所有任務(wù)關(guān)鍵型數(shù)據(jù)交付給云計(jì)算的原因之一,因?yàn)檫@些云計(jì)算數(shù)據(jù)的管理更加困難。因此,一旦數(shù)據(jù)在云端處理完畢,許多企業(yè)選擇將數(shù)據(jù)遷移到自己的內(nèi)部數(shù)據(jù)中心。
許多企業(yè)選擇使用他們的數(shù)據(jù)中心還有另一個(gè)原因:關(guān)注開發(fā)這些數(shù)據(jù)的專有應(yīng)用程序和算法,因?yàn)樵S多云計(jì)算提供商的政策是客戶在云端開發(fā)的任何應(yīng)用程序可能會(huì)與其他客戶共享。
通過(guò)將應(yīng)用程序保留在內(nèi)部部署的數(shù)據(jù)中心,并開發(fā)一個(gè)可以將較小的數(shù)據(jù)集市從中分離出來(lái)的本地主數(shù)據(jù)集,企業(yè)可以直接控制其數(shù)據(jù)和應(yīng)用程序。
分析管理者需要什么?
(1)企業(yè)應(yīng)該了解并同意其云計(jì)算提供商處理和保護(hù)自己的數(shù)據(jù)
例如,如果企業(yè)需要對(duì)數(shù)據(jù)進(jìn)行匿名化處理,則應(yīng)該將其實(shí)施的過(guò)程記錄下來(lái),并與其云計(jì)算提供商達(dá)成一致,因?yàn)樵朴?jì)算提供商將進(jìn)行匿名化處理。如果企業(yè)想清理自己的數(shù)據(jù),其清理的過(guò)程也應(yīng)該向其云計(jì)算提供商提供詳細(xì)的書面說(shuō)明。例如,企業(yè)是否只希望將美國(guó)所有州的縮寫進(jìn)行統(tǒng)一(例如,“Tenn”和“Tennessee”=“TN”)還是要對(duì)數(shù)據(jù)進(jìn)行其他編輯,以便統(tǒng)一且易于處理?最后,無(wú)論企業(yè)的業(yè)務(wù)是運(yùn)行在云計(jì)算服務(wù)提供商的專用租戶還是多租戶環(huán)境中,云計(jì)算提供商都應(yīng)該能夠保證企業(yè)的數(shù)據(jù)永遠(yuǎn)不會(huì)與其他客戶共享。
(2)企業(yè)的本地大數(shù)據(jù)和分析架構(gòu)應(yīng)該記錄符合大數(shù)據(jù)需求的新政策和程序
企業(yè)的許多IT部門完全錯(cuò)過(guò)了這個(gè)任務(wù)。他們只是開始實(shí)施大數(shù)據(jù)項(xiàng)目,卻忘記現(xiàn)有的應(yīng)用程序開發(fā)政策和程序來(lái)自交易的應(yīng)用領(lǐng)域。企業(yè)不要犯這個(gè)錯(cuò)誤。與其相反,企業(yè)需要在與大數(shù)據(jù)交互的可能性較高的領(lǐng)域(如存儲(chǔ)、數(shù)據(jù)庫(kù)管理、應(yīng)用程序)中修改政策和程序。
(3)災(zāi)難恢復(fù)計(jì)劃應(yīng)在內(nèi)部部署和云端部署時(shí)更新和測(cè)試大數(shù)據(jù)
在進(jìn)行基于云端的災(zāi)難恢復(fù)(DR)測(cè)試的情況下,企業(yè)應(yīng)該在合同中包含用于記錄和執(zhí)行災(zāi)難恢復(fù)(DR)的規(guī)定。災(zāi)難恢復(fù)(DR)計(jì)劃(側(cè)重于事務(wù)數(shù)據(jù)和系統(tǒng))也應(yīng)該及時(shí)更新,并包括大數(shù)據(jù)和分析的恢復(fù)和測(cè)試腳本的恢復(fù)。
版權(quán)聲明:本文為企業(yè)網(wǎng)D1Net編譯,轉(zhuǎn)載需注明出處為:企業(yè)網(wǎng)D1Net,如果不注明出處,企業(yè)網(wǎng)D1Net將保留追究其法律責(zé)任的權(quán)利。