目前,大數(shù)據(jù)正掀起一場革命,“數(shù)據(jù)就是生產(chǎn)力”這個說法也正從“預(yù)言”變成現(xiàn)實。
無論是哪一個行業(yè),都再也沒有辦法躲避這一浪潮。無論是分析傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù),還是分析其他千奇百怪、內(nèi)涵豐富的數(shù)據(jù),比如來自社交媒體網(wǎng)站、各種客服渠道的海量非結(jié)構(gòu)化信息,對企業(yè)而言,都將成為提高競爭力、盈利能力以及最重要的創(chuàng)新能力的關(guān)鍵。
但是,對于企業(yè)的CIO、CTO們來說,真正把數(shù)據(jù)轉(zhuǎn)化為驅(qū)動企業(yè)發(fā)展的生產(chǎn)力,并非那么簡單。在這一方面,中國在大數(shù)據(jù)產(chǎn)業(yè)上的理念、痛點,與美國有著非常大的差距。
中美大數(shù)據(jù)“三年差距”差在哪里
“企業(yè)數(shù)據(jù)分析,中美在理念方面相差2-3年,而在實際執(zhí)行層面或許有5年左右的差距。”美國數(shù)據(jù)分析科學(xué)家、Taste Analytics創(chuàng)始人及全美五大可視化研究中心的Derek Wang(汪曉宇)博士告訴記者。
3-5年的差距,在瞬息萬變的信息社會,是一道不小的鴻溝。那么這道鴻溝,到底是怎么造成的呢?在汪曉宇博士看來,中美大數(shù)據(jù)產(chǎn)業(yè)的差別,主要有人員配置、技術(shù)開發(fā)和商業(yè)架構(gòu)三個方面。
首先,人才培養(yǎng)上的差異,是“五年鴻溝”的根本原因。
現(xiàn)在美國企業(yè)最熱門的職位,非“數(shù)據(jù)科學(xué)家”莫屬。這類在企業(yè)里掌握著數(shù)據(jù)“魔力”的人才,其實是大數(shù)據(jù)分析實際執(zhí)行層面的關(guān)鍵。在汪曉宇博士看來,未來的人才是“T”字型人才,數(shù)據(jù)分析師就是典型代表。“T”的一橫代表著,他們對多領(lǐng)域和行業(yè),比如金融、計算機(jī)、統(tǒng)計、商業(yè)和營銷等都有過接觸,有著跨行業(yè)的基礎(chǔ)知識和視野;而“豎”代表著,他們對某個領(lǐng)域的專業(yè)理解和縱深積累。
美國在數(shù)據(jù)分析方面的教育上,就在努力轉(zhuǎn)型,實踐這種“T”字型理念:科研項目不再是由 計算機(jī)系、商學(xué)院或者統(tǒng)計專業(yè)的學(xué)生單獨進(jìn)行,而是多個專業(yè)融合起來,形成整體戰(zhàn)略方向。這樣培養(yǎng)出來的人才,具備業(yè)務(wù)、營銷、統(tǒng)計和計算機(jī)的多維度技能 和知識面,才能被成為“數(shù)據(jù)科學(xué)家”。
這種前沿的教育理念,即使在美國,也才出現(xiàn)不到三、四年。但它取得的效果是根本性的——正是在這樣的教育方式下,美國才培養(yǎng)出了第一批數(shù)據(jù)科學(xué)家,引導(dǎo)了企業(yè)的數(shù)據(jù)革命。這也反映出了中美人才梯隊和培養(yǎng)機(jī)制的巨大區(qū)別。
而中國受到傳統(tǒng)教育體制的限制,更重視縱深的專業(yè)技能,也就是“T”的那一“豎”,缺少 跨學(xué)科和專業(yè)的綜合性體制的建立。這樣培養(yǎng)出來的人才,不知道橫向的概念,只見樹木而不見森林,造成企業(yè)用人的時候,還需要花很多時間,對畢業(yè)生進(jìn)行重新 培訓(xùn),額外花費很多時間和金錢。但是,最為關(guān)鍵的還是,他們無法主動引導(dǎo)企業(yè)建立和完善數(shù)據(jù)分析機(jī)制,讓企業(yè)可以在短時間內(nèi)就從“數(shù)據(jù)分析”中受益。
汪曉宇博士說,與此相反,“T”字型的畢業(yè)生,不是重新需要訓(xùn)練的學(xué)徒,而是已經(jīng)基本掌 握了既定的分析方法的“熟練工”,他們可以幫助企業(yè)建立新的分析模型,甚至有自己成系列的解決方案帶給企業(yè),可以激發(fā)相互的生產(chǎn)力和數(shù)據(jù)分析能動性,這比 單單的商業(yè)分析員或者IT員工,價值都要大得多。
其次,技術(shù)工具上的差異,讓這道鴻溝難以短時間內(nèi)跨越。
人才沒有到位最直接的后果就是,企業(yè)在進(jìn)行數(shù)據(jù)分析時,仍然只能選擇大而全、千篇一律的整體解決方案,無法創(chuàng)新地結(jié)合多種工具,對某個類型的數(shù)據(jù)進(jìn)行深入地挖掘和分析,這樣就無法發(fā)掘出數(shù)據(jù)真正的價值。
汪曉宇博士說,美國企業(yè)已經(jīng)普遍開始追求垂直創(chuàng)新的小工具,進(jìn)行非??v深的研究,比如 Taste Analytics的非結(jié)構(gòu)化數(shù)據(jù)分析工具,就已經(jīng)吸引了多個財富500強客戶,幫他們專注非結(jié)構(gòu)化數(shù)據(jù)的分析;但是現(xiàn)在中國市場上,流行的產(chǎn)品解決形態(tài) 仍然是諸如SAP、SAS這類的的整體解決方案,雖然可以覆蓋到數(shù)據(jù)分析的基本方面,但是卻失去了對數(shù)據(jù)的深入挖掘能力。
“事實上,非結(jié)構(gòu)化數(shù)據(jù)的模塊化更加靈敏,不是傳統(tǒng)的單一解決方案可以做到的。” 汪曉宇博士說,“在美國,企業(yè)傾向于使用的BI(Business Intelligence,商業(yè)智能)工具,都是橫向加縱向的組合,這樣才能提取出數(shù)據(jù)的真正價值。”
第三,商業(yè)架構(gòu)被這道鴻溝影響,也在反向加深著鴻溝。
人才、技術(shù)和商業(yè),都存在著鏈條式的關(guān)系。人才的差別讓創(chuàng)新工具無法得到廣泛的使用,而技術(shù)形態(tài)的差異導(dǎo)致中美在大數(shù)據(jù)商業(yè)架構(gòu)上也呈現(xiàn)出不同特點。汪曉宇博士說,中美對大數(shù)據(jù)分析的清晰度是不一樣。美國企業(yè)高層既可以在大方向上知道大數(shù)據(jù)可以做什么,又明白應(yīng)該怎么把數(shù)據(jù)分析應(yīng)用到策略里,和經(jīng)濟(jì)效益直接掛鉤。
比如,和美國CIO、CTO們說起產(chǎn)品時,他們可以迅速做出反應(yīng),考慮的是應(yīng)該怎么把產(chǎn) 品放到他們的解決方案中間去,和現(xiàn)有業(yè)務(wù)進(jìn)行快速整合。“我們和美國的企業(yè)聊,他們很快就意識到自己的非結(jié)構(gòu)數(shù)據(jù)化分析沒做好,下一步,他們就主動談起應(yīng) 該怎么把Taste Analytics的非結(jié)構(gòu)數(shù)據(jù)化分析應(yīng)用到他們的戰(zhàn)略中去。”
但是,國內(nèi)的理解是仍然是偏整體化的。雖然大數(shù)據(jù)已經(jīng)得到了普遍認(rèn)可,但是企業(yè)只接受概 念和這個趨勢,仍然無從深入,沒有清晰認(rèn)識到它應(yīng)該怎么和業(yè)務(wù)、經(jīng)濟(jì)效益掛鉤。“最主要還是沒有發(fā)揮企業(yè)內(nèi)部分析師等人的能動性,” 汪曉宇博士說,“數(shù)據(jù)科學(xué)家還不存在,或者說整個體系還不成熟。”
中美CIO、CTO痛點存在差異
但是,這五年差距并不是一開始就存在的。在汪曉宇博士看來,美國企業(yè)已經(jīng)交過學(xué)費、走過 彎路了,才走到現(xiàn)在這一步。“其實最開始,大家都不知道應(yīng)該怎么做。但是美國企業(yè)愿意交學(xué)費、雇傭首席數(shù)據(jù)科學(xué)家、使用新工具,對數(shù)據(jù)的理解已經(jīng)脫離了概 念層面,真正從大數(shù)據(jù)的利用上獲得了效益。”汪曉宇博士說。
而國內(nèi)還處在嘗試和吃螃蟹的階段,對數(shù)據(jù)的理解很表面化。“人人都說好,但是看不到真正的價值。”汪曉宇博士說,“要想打破這個困局,就需要決策層的決心,真正去咬下第一口螃蟹。”但是從另外一個方面來說,中美數(shù)據(jù)分析也不能雷同。因為數(shù)據(jù)是人產(chǎn)生的,中國消費者和美國差異非常大,數(shù)據(jù)的反饋途徑也不一樣,所以,也不能盲目照搬美國。
在和國內(nèi)的20多家企業(yè)聊的時候,汪曉宇博士也發(fā)現(xiàn),國內(nèi)的瓶頸是數(shù)據(jù)采集點很有限。比如分析客戶的郵件和網(wǎng)絡(luò)聊天記錄時,他發(fā)現(xiàn),人們更喜歡直接打電話和客服溝通,這種商品環(huán)境就需要獨特的解決方案。所以Taste Analytics在國內(nèi)加大了語音分析服務(wù)的比重。
另外,數(shù)據(jù)采集之后的數(shù)據(jù)交易環(huán)節(jié),中美也是不一樣的。在美國,A銀行可以公開買到B銀 行的數(shù)據(jù),但是國內(nèi)企業(yè)通常只能看到自己的內(nèi)部數(shù)據(jù),而無法看到競爭對手以及整體行業(yè)趨勢;甚至在社交網(wǎng)絡(luò)上,數(shù)據(jù)的差異也很明顯,比如社交網(wǎng)絡(luò)上的第三 方數(shù)據(jù),美國真實性就比中國要更高。
數(shù)據(jù)分析和交易的不同,導(dǎo)致了中美CIO、CTO痛點的差異。對此,Taste Analytics的首席數(shù)據(jù)分析師俞立博士就有非常深的體驗。 他表示,在他和國內(nèi)公司交流的過程中發(fā)現(xiàn),國內(nèi)缺乏數(shù)據(jù)的人才和工具,同時,數(shù)據(jù)分析也無法和企業(yè)經(jīng)濟(jì)效益掛鉤。
“大數(shù)據(jù)光環(huán)很好,但是如何用不知道,給誰用也不知道,那么離他們真正使用產(chǎn)生經(jīng)濟(jì)效 益,還有2-3 步的過程。”俞立博士說。 比如他們接觸到一個大型運營商就曾經(jīng)希望基于大數(shù)據(jù)給他們的客戶推薦業(yè)務(wù),但是交流之后發(fā)現(xiàn),他們對非結(jié)構(gòu)化數(shù)據(jù)分析的理解還停留在簡單的輿情分析上。也 就是說,他們想做的系統(tǒng),其實還是美國5、6年以前就存在的推薦系統(tǒng)。
痛點難點這么多,怎么破?
對于中國企業(yè)如何應(yīng)對數(shù)據(jù)分析領(lǐng)域的痛點,汪曉宇博士看得非常清楚。作為前北卡大學(xué)夏洛特分校的助理敎?zhǔn)凇⑾穆逄匾曈X中心主任以及Taste Analytics的CEO,他對中美的大數(shù)據(jù)分析產(chǎn)業(yè)都有著很深的理解。
在汪曉宇博士看來,最根本的解決方法在于改變?nèi)瞬排囵B(yǎng)的機(jī)制,讓企業(yè)把眼 光放長遠(yuǎn),和高校合作。 “CIO和CTO應(yīng)該多和高校合作,深入到員工池里培養(yǎng)人才。”汪曉宇博士說。這一點已經(jīng)成為美國企業(yè)和高校的共識。在美國,企業(yè)們會對高校進(jìn)行資助,并 且根據(jù)企業(yè)的需求和實踐,來影響學(xué)校的課程,把課程傾向于實踐的方向,這樣可以讓高校更有針對性地培養(yǎng)人才。
而對于企業(yè)來說,另外很重要的一點就是,不要害怕交學(xué)費,應(yīng)當(dāng)大膽嘗試新工具。汪曉宇博士認(rèn)為,企業(yè)不要怕花學(xué)費,應(yīng)該嘗試新的解決方案,嘗試新的BI工具,因為只有嘗試了,才知道那個工具會產(chǎn)生怎樣的價值;如果總是尋求舊的解決方案,那么企業(yè)將無法真正挖掘出數(shù)據(jù)的價值。
第三,保持開放的心態(tài),公開非機(jī)密數(shù)據(jù),實現(xiàn)行業(yè)共贏。 從學(xué)術(shù)角度看,大數(shù)據(jù)分析的技術(shù)基礎(chǔ)無非統(tǒng)計學(xué)、深度和機(jī)器學(xué)習(xí)這三個既成的方向,但是要真正應(yīng)用到企業(yè),一方面,企業(yè)應(yīng)該多看其他行業(yè)怎么做,舉一反三,實現(xiàn)跨行業(yè)的理解;另一方面可以適當(dāng)?shù)毓_非機(jī)密數(shù)據(jù),鼓勵所有人一起挖掘企業(yè)數(shù)據(jù)的價值。
比如美國知名流媒體服務(wù)商Netflix,就曾經(jīng)在一個網(wǎng)絡(luò)數(shù)據(jù)分析機(jī)器學(xué)習(xí)的社區(qū)上拿 出100萬美元的高額獎金,鼓勵人們用任何工具,分析他們的數(shù)據(jù)。 “把核心數(shù)據(jù)拿出來,讓大家?guī)椭治觯趥鹘y(tǒng)產(chǎn)業(yè)數(shù)據(jù)分析的解決方案基礎(chǔ)上,嘗試新的方案。這樣整個行業(yè)才可以得到整體發(fā)展。”汪曉宇博士說。