大數(shù)據(jù)的概念是伴隨著云計(jì)算、社交網(wǎng)絡(luò)、移動(dòng)互聯(lián)網(wǎng)等新興技術(shù)所帶來的存儲(chǔ)和分析難題,如果你還認(rèn)為這與你無關(guān),那就錯(cuò)了。
雖然在某種程度上,對(duì)于今年的流行術(shù)語“大數(shù)據(jù)”的激烈反彈已經(jīng)開始了。Forrester公司的杰姆斯科比拉斯如此雄辯地指出,“那些光鮮閃亮的術(shù)語被吹捧的太高而無法在長期支撐了,現(xiàn)在是時(shí)候讓我們來揭開其廬山真面目了。”
但輕度的反感與濫用的術(shù)語標(biāo)簽并不否定現(xiàn)實(shí)。對(duì)于相當(dāng)一部分的信息專業(yè)人士來說,“大數(shù)據(jù)”是很重要的一部分?,F(xiàn)在開始曲線學(xué)習(xí)吧,而不要等到您的事業(yè)出現(xiàn)了危機(jī)或者IT業(yè)界已經(jīng)發(fā)出新的倡議,呼吁從業(yè)者遵守合規(guī)性和業(yè)務(wù)流程自動(dòng)化。
“大數(shù)據(jù)”有何不同?
“物聯(lián)網(wǎng)”的大門打開了一個(gè)全新的世界電子存儲(chǔ)信息(ESI)
大數(shù)據(jù)的一個(gè)方面是其正在收集的新的數(shù)字化活動(dòng),從新一代的數(shù)字設(shè)備記錄和進(jìn)行潛在的分析。從具備GPS功能的手機(jī)和汽車,到利用自己的IP地址的傳感器和監(jiān)測(cè)工具,都在收集和儲(chǔ)存環(huán)顧四周的數(shù)據(jù)信息。
實(shí)用系統(tǒng)、運(yùn)輸系統(tǒng)及零售系統(tǒng)都在收集了解我們?nèi)绾问褂觅Y源,商店和旅游等相關(guān)信息。側(cè)重于遵守、隱私保護(hù)和相關(guān)政策的重點(diǎn)信息專業(yè)人員需要認(rèn)識(shí)到這種新的ESI資源,包括在他們的企業(yè)數(shù)據(jù)中,作為電子發(fā)現(xiàn)要求的潛在測(cè)繪來源。
大數(shù)據(jù)基礎(chǔ)設(shè)施的應(yīng)用程序是創(chuàng)建用于解決之前并不存在的問題
新的數(shù)據(jù)庫架構(gòu)和軟件框架已經(jīng)出現(xiàn),專門設(shè)計(jì)用于分布在無數(shù)的節(jié)點(diǎn)和服務(wù)器的重應(yīng)用,存儲(chǔ)大量數(shù)據(jù)。社交業(yè)務(wù)、移動(dòng)交易和云服務(wù)的興起,加快了數(shù)據(jù)縮放和存儲(chǔ),需要一種新的方法。
大多數(shù)的這些新的框架和數(shù)據(jù)庫都有其根源在開放源代碼的世界里,開發(fā)者經(jīng)常創(chuàng)造新問題的還沒有進(jìn)入主流的解決方法。諸如雅虎、IBM、蘋果、亞馬遜、推特、易趣網(wǎng)等許多最大的網(wǎng)上交流和交易的供應(yīng)商,我們同時(shí)作為消費(fèi)者和專業(yè)人士使用這些企業(yè)的服務(wù),有助于這些企業(yè)的創(chuàng)新以及開放發(fā)展。開源軟件推廣運(yùn)動(dòng)的教父EricS.Raymond說,好軟件起源于開發(fā)者的發(fā)燒友似的愛好。新問題需要新的解決方案。新的數(shù)字內(nèi)容、信息和通信需要新的架構(gòu)。
其他人的數(shù)據(jù),可以幫助您的業(yè)務(wù)
有的學(xué)院派認(rèn)為,2012年只有少數(shù)非常大的全球性的企業(yè),或流行的社交網(wǎng)絡(luò)平臺(tái)真正面臨大數(shù)據(jù)的問題。但是,我們可以回想一下IBM總裁托馬斯 沃森曾在50年代后期所做的那個(gè)著名的“預(yù)測(cè)”:我認(rèn)為全球市場(chǎng)可能只需要5臺(tái)電腦。
創(chuàng)新是推動(dòng)創(chuàng)造性地運(yùn)用新的工具,解決新的問題,從而發(fā)現(xiàn)新的機(jī)會(huì)。事實(shí)上,許多企業(yè)不是這樣的,他們?cè)诙唐趦?nèi),在企業(yè)內(nèi)部存在著大數(shù)據(jù)的問題。但社會(huì)平臺(tái)的訪問數(shù)據(jù)進(jìn)行研究或其他某些市場(chǎng)目的,常常是通過API,這就意味著大數(shù)據(jù)可用于更好的業(yè)務(wù)決策。
優(yōu)化領(lǐng)先一代的企業(yè),分析內(nèi)容趨勢(shì),并實(shí)時(shí)了解一個(gè)行業(yè),而不是依靠歷史數(shù)據(jù),是非常有價(jià)值的。CXO級(jí)別的企業(yè)管理人員需要開始思考如何訪問這些數(shù)據(jù)用來改善分析,降低成本,找到新的收入機(jī)會(huì),并從大量的信息中提取價(jià)值。
開放數(shù)據(jù)倡議范圍(從國家到地方各級(jí)政府部門)也為格局分析、新的產(chǎn)品或服務(wù)開辟了新的機(jī)會(huì),使企業(yè)挖掘到由公共機(jī)構(gòu)收集和維護(hù)的豐富的統(tǒng)計(jì)內(nèi)容。
結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)之間的界線越來越模糊
這對(duì)于內(nèi)容和信息管理技術(shù)市場(chǎng)可能是極具破壞性的。數(shù)據(jù)庫大師和內(nèi)容管理專家之間幾十年的鴻溝將開始溶解。新一代數(shù)據(jù)庫架構(gòu)已經(jīng)支持非結(jié)構(gòu)化內(nèi)容和非規(guī)范化的大規(guī)模數(shù)據(jù)。社交平臺(tái)和云服務(wù)將繼續(xù)推動(dòng)這一需要,采用新結(jié)構(gòu)。
“數(shù)據(jù)鏈接”出現(xiàn)在企業(yè)的實(shí)際使用情況下,新的引擎,幫助跨多個(gè)系統(tǒng)連接內(nèi)容,也有助于模糊的結(jié)構(gòu)化/非結(jié)構(gòu)化的界線。倡議,諸如ApacheStanbol項(xiàng)目治理這樣的發(fā)展倡議努力,從一系列前沿內(nèi)容管理開發(fā)其目的是從多種來源提高非結(jié)構(gòu)化文檔語義信息。
想象一下案件管理系統(tǒng)攝取新的投訴,并具有分析引擎,自動(dòng)識(shí)別和鏈接的名稱,或產(chǎn)品所需的內(nèi)部或外部數(shù)據(jù)。自動(dòng)化數(shù)字過程可以加速企業(yè)信息的融合,無論是結(jié)構(gòu)化和非結(jié)構(gòu)化的資源。
下一步該怎么做呢?
超越流行術(shù)語,了解潛在的創(chuàng)新,以及新的風(fēng)險(xiǎn)。了解這些可能對(duì)于您的企業(yè)意味著什么。想想新的方法可以幫助帶來新的顧客,或者是現(xiàn)有分析數(shù)據(jù)范圍的擴(kuò)大,并提取以前看不到的模式或價(jià)值。
不要驚慌,但也千萬不要忽視大數(shù)據(jù)。五六年前,許多專業(yè)人士選擇將“Web2.0”的崛起或社交網(wǎng)站的興起拋在腦后,以為其并不適用于他們的業(yè)務(wù)。今天,我們看到,在線交流和合作正在成為常態(tài)。了解并學(xué)習(xí)以前的破壞性模式,千萬不要忽視和落后。信息專業(yè)人員需要想想明天的挑戰(zhàn)計(jì)劃。
大數(shù)據(jù)可能在當(dāng)下的2012年還不是你的首要問題,但2015年之后呢?
IT行業(yè)的浪潮永遠(yuǎn)不會(huì)等待任何一個(gè)人,錯(cuò)過便是落后。