無論新創(chuàng)公司或傳統(tǒng)企業(yè),愈來愈多組織將未來押注在巨量資料。根據(jù) IDG Enterprise,過去一年以來,曾執(zhí)行數(shù)據(jù)專案的公司數(shù)量增加了 125%1,CapGemini 與 EMC 共同執(zhí)行的調(diào)查則顯示2,70% IT 決策者認為,能否充分運用大數(shù)據(jù)關(guān)鍵價值,將左右公司的前景;65% 的受訪者更直言,如果沒能擁抱大數(shù)據(jù),公司很可能日落西山,失去競爭力。從林林總總的數(shù)字中,可以觀察到企業(yè)十分重視巨量資料,但是實際上,巨量資料專案卻很容易失敗,而且往往重蹈覆轍。Gartner 研究總監(jiān) Svetlana Sicular 列舉了八個最常出現(xiàn)的錯誤3,小心別掉進陷阱中。
管理層的惰性:根據(jù) Fortune Knowledge Group 的調(diào)查,62% 的企業(yè)領(lǐng)導人依然仰賴直覺;下決策時,61% 以真實世界的情境為優(yōu)先考量,而非數(shù)據(jù)。Svetlana Sicular 敘述,Gartner 曾經(jīng)服務一家家喻戶曉的旅游公司,他們采取了大數(shù)據(jù)技術(shù),執(zhí)行點擊流(clickstream)分析,以了解消費者在網(wǎng)站上瀏覽與購買的流程,結(jié)果竟然發(fā)現(xiàn)他們的消費模式與公司高層的銷售模式居然完全相反。在結(jié)案報告中這家旅行公司寫道:「這個技術(shù)有效的解決了我們的疑惑,其結(jié)果劇烈了改變原有的業(yè)務,為了充分實踐數(shù)據(jù)呈現(xiàn)的洞見,我們更替了全新的管理團隊?!?/p>
他質(zhì)問,有多少公司的領(lǐng)導層需要砍掉重練呢?
選擇錯誤的使用案例:有些公司的實力跟不上野心,選擇遠超過自身負荷能力的大數(shù)據(jù)專案,又或者企圖使用舊方法執(zhí)行新專案,兩者都無可避免將走上失敗之途。
問錯問題:數(shù)據(jù)科學是由產(chǎn)業(yè)知識(比如零售、金融)、數(shù)學與統(tǒng)計、程式結(jié)合的復雜混合體。很多公司增聘了資料科學家,他們可能是程式高手也懂統(tǒng)計,卻缺乏了最重要的成分:產(chǎn)業(yè)知識。Svetlana Sicular 建議,應從產(chǎn)業(yè)中找到對的人才,因為「學習 Hadoop 比了解商業(yè)內(nèi)涵簡單」。
缺乏必要的技能:這點與「問錯問題」類似。曾有一家金融機構(gòu)想要調(diào)查人們的生活習慣如何影響他們購買退休方案的偏好,不過「習慣」太多種,執(zhí)行這個專案的負責人把問題限縮到抽菸/不抽菸,但是失敗了。後來 Svetlana Sicular 與從事醫(yī)療產(chǎn)業(yè)的人士聊到這個專案時發(fā)現(xiàn),他們并不問這種非黑即白的問題(抽不抽菸),而是「你抽菸幾年了?」、「你戒菸幾次了?」、「你最後一次吸菸是什麼時候?」總之,進行大數(shù)據(jù)分析時,應該找到熟稔特定專業(yè)領(lǐng)域的人士——醫(yī)療、語言學、行為心理學家、社會人類學家等等,IT 部門以外的專業(yè)人士。
大數(shù)據(jù)之外,無法預料的問題:資料分析只是巨量資料專案的一部份,訪問與處理數(shù)據(jù)的能力同樣重要,不過諸如網(wǎng)絡壅塞、人員訓練不足等等都有可能阻礙專案執(zhí)行。
企業(yè)策略不一:如果巨量資料專案被隔絕於公司核心業(yè)務之外,那大概注定失敗,如果公司把云端或其他策略置於巨量資料之前,那失敗的機率當然又更高了。
大數(shù)據(jù)孤島(silos):很多人喜愛談論「數(shù)據(jù)湖(data lake)」、「數(shù)據(jù)中心(data hubs)」,但是現(xiàn)實狀況是,很多公司嘗試建立數(shù)據(jù)水坑(data puddle),行銷數(shù)據(jù)水坑、制造數(shù)據(jù)水坑等等等等,但是彼此楚河漢界,不相往來。對組織而言,巨量資料只在水坑之間的高墻倒下、彼此匯流才會更凸顯價值。只是,辦公室政治或政策,往往抹煞了資料集體發(fā)揮的可能性。
問題回避:這在藥物產(chǎn)業(yè)中最為明顯,藥廠無法進行情緒分析,因為病人服用某種實驗藥物後,只要一出現(xiàn)頭痛等副作用,就得回報 FDA。由於過程太麻煩,甚至可能碰上法律責任,因此藥廠傾向回避此類措施,結(jié)果可能錯失珍貴的發(fā)現(xiàn)。
美國媒體 InformationWeek 編輯 Matt Asay 認為4,企業(yè)組織執(zhí)行巨量資料專案時,也應注入「迭代」(iterate)的精神,別好高騖遠,從能夠快速發(fā)現(xiàn)問題的小規(guī)模開始進行實驗,并且邀請內(nèi)部員工共同參與。利用大數(shù)據(jù)解決問題的關(guān)鍵,在於靈活且開放的數(shù)據(jù)基礎建設,讓員工不斷調(diào)整實際方案,直至他們的努力結(jié)出豐盈的果實,唯有如此,公司才能降低失敗的恐懼,真正嚐到巨量資料的甜美滋味。