云計算公司Replicon聯(lián)合創(chuàng)始人兼CEO Raj Narayanaswamy指出:“今天,每一個行業(yè)和企業(yè)都面臨著將數(shù)據(jù)轉(zhuǎn)化為明確的成果的艱巨任務。數(shù)據(jù)的指數(shù)級增長意味著,每一個組織都極其有必要去建立合適的體系結(jié)構(gòu)來使得數(shù)據(jù)的利用達到最大化。獲得成功的關(guān)鍵是建立一個全面的數(shù)據(jù)產(chǎn)業(yè)價值鏈,包括數(shù)據(jù)發(fā)掘、集成和評估,而不是按照傳統(tǒng)的做法部署以應用程序為中心的模式。”
對于一個企業(yè)來說, 理解數(shù)據(jù)集成的重要性是創(chuàng)造新的價值的前提。假若對數(shù)據(jù)的理解仍然維持在單一和特定用途的層面,那么在數(shù)據(jù)開發(fā)過程中容易出現(xiàn)缺乏靈活性、信息不全面的情況,在利用數(shù)據(jù)開發(fā)未來機遇方面,組織或?qū)萦诒粍拥木车亍6晒Φ睦拥膭t要數(shù)亞馬遜和Salesforce了,這兩家公司借助策略性的數(shù)據(jù)管理方式而在短期內(nèi)獲得了規(guī)模式的增長。
數(shù)據(jù)應用的周期或許可以劃分為七個步驟:發(fā)現(xiàn)、獲取、加工、篩選、集成、分析和揭露。其中每一個步驟都至關(guān)重要,每一個有效用的策略也許都是建立在由上述七個步驟組成的數(shù)據(jù)體系之上的。云計算公司LiasonTechnologies的首席執(zhí)行官Bob Renner對此作出了總結(jié)性分析“人們大部分的注意力(市場價值觀)都放在了分析和結(jié)果量化的最后階段——蘊藏著商務決策的階段。這也確實是數(shù)據(jù)分析在歷經(jīng)萬難之后最終的價值所在。但是,沒有了前面的準備步驟,我們也不可能一步登天地就能在最后一步獲得想要的結(jié)果。事實上,在開始使用分析算法來對數(shù)據(jù)進行解讀之前,數(shù)據(jù)科學家都要花費大量的時間進行數(shù)據(jù)清理,以保證數(shù)據(jù)的質(zhì)量。”
良好的數(shù)據(jù)科學離不開高質(zhì)量的數(shù)據(jù)資料和管控數(shù)據(jù)質(zhì)量的必要步驟,尤其是往往遭到忽視的數(shù)據(jù)集成。通常來說,有價值的大數(shù)據(jù)都是在這一個步驟里發(fā)現(xiàn)的。如果組織在一開始就以另一種心態(tài)(非如今固化的理念)來著手數(shù)據(jù)管理,他們就能夠在控制成本和效用上掌握主動權(quán)。
那么,我們將如何可以從當前宣傳大于實用的狀況中獲得突破呢?首先,如前文所述,充分理解大數(shù)據(jù)應用完整的操作周期,做到不忽視任何一個步驟的重要性,然后從傳統(tǒng)的以應用為中心的傳統(tǒng)思想中解放出來,建立靈活的、可持續(xù)利用的數(shù)據(jù)分析框架。“數(shù)據(jù)驅(qū)動的發(fā)現(xiàn)從根本上改變了我們工作和生活的方式,而那些掌握了大數(shù)據(jù)應用的人可以說是掌握了一項和同齡人競爭的優(yōu)勢。”(《大交易:市場回報最大化的簡單策略》 彼得·范)那些在大數(shù)據(jù)技術(shù)迸發(fā)時期就獲得了巨大利益價值的組織,他們不僅關(guān)注那些外界一直在炒作的功能,而且對想要實現(xiàn)的營收、利潤以及其他業(yè)務成果都投入了認真的思考。