強大的計算能力,令人難以置信的數(shù)據(jù)量,以及獲得驚人進展且能夠讓所有行業(yè)各種規(guī)模的企業(yè)都可以輕易獲取的分析技術(shù)匯集在一起,改變了業(yè)務(wù)決策的面貌。數(shù)據(jù)科學(xué)家和業(yè)務(wù)分析師擁有一個不同尋常的“沙盒”,可以在里面建立模型,測試想法,確定應(yīng)對挑戰(zhàn)的解決方案,并利用機遇。
人們對分析能力是否是企業(yè)正面資產(chǎn)的問題并沒有真正的疑問。然而,仍然存在的巨大挑戰(zhàn)是如何彌合數(shù)據(jù)科學(xué)家在實驗室中取得成果與能夠?qū)嶋H應(yīng)用到企業(yè)當(dāng)中的成果之間的鴻溝。如果不采用有效手段將成果轉(zhuǎn)化為其他人可以理解、使用和執(zhí)行的東西,數(shù)據(jù)科學(xué)小組得力工作的影響將大打折扣。
將實驗室和企業(yè)連接起來,或更重要的是將分析和行動連接起來,是數(shù)據(jù)驅(qū)動型企業(yè)的重要一步。為此,我提出以下五個步驟,幫助企業(yè)將分析層面的成果轉(zhuǎn)化為公司層面的成功:
步驟1:記錄數(shù)據(jù)
當(dāng)用戶注意到一個業(yè)務(wù)解決方案時,應(yīng)該很容易找出是哪些數(shù)據(jù)構(gòu)成洞察力的基礎(chǔ)。這種透明度對信任的建立至關(guān)重要。決策者不是數(shù)據(jù)科學(xué)家并不意味著他們對業(yè)務(wù)知之甚少。決策者需要相信使用的數(shù)據(jù)來源得當(dāng),隨后的分析是建立在高質(zhì)量、可靠的數(shù)據(jù)之上。簡言之,人們需要信任和理解數(shù)據(jù)。
步驟2:讓用戶自己運行查詢
授權(quán)用戶自己運行查詢至關(guān)重要。 許多了解自己數(shù)據(jù)的用戶就想自己運行查詢。 有些用戶希望深入了解最本質(zhì)的SQL。這些用戶希望查看查詢過程的詳細信息,并跟蹤被執(zhí)行的步驟。對于希望深入了解查詢內(nèi)部工作機制的高管或管理人員來說,記錄下來的查詢,包括一路創(chuàng)建的任何中間數(shù)據(jù)對象可能都是重要的。
步驟3:記錄并解釋分析
一旦對可信的數(shù)據(jù)集進行累積,并加以分析,則需要明確所使用的分析方法。 盡管并非分析下游的每個人都將需要這種信息,但是在整個企業(yè)倡導(dǎo)使用分析技術(shù),并在這個企業(yè)建立信任基石的超級用戶和決策者需要這種信息。有了解釋分析技術(shù)如何應(yīng)用的文檔,希望了解信息獲取方式的高級用戶可以根據(jù)需求自行獲取信息,而無需等待與數(shù)據(jù)科學(xué)團隊會晤。
步驟4:應(yīng)用可視化技術(shù)
與解釋分析技術(shù)密切相關(guān)的是應(yīng)用業(yè)務(wù)用戶可以理解的可視化技術(shù)。對于了解網(wǎng)絡(luò)圖表如何在不同模塊和場景下使用的數(shù)據(jù)科學(xué)家來說,西格瑪(sigma)可視化技術(shù)可能能夠提供深入的洞察力;然而,對于有要務(wù)在身和有其他關(guān)切的業(yè)務(wù)前線人員來說,同樣圖表更簡單的版本可能也是必要的。另一方面,一般的柱狀圖可能便于理解,但由于過于簡單,可能深度不夠,難以支撐業(yè)務(wù)決策。這不是關(guān)于過度簡化的問題:遠不是。尋找合適的可視化途徑是一種重要的平衡行為,將為業(yè)務(wù)用戶提供情境,以便他們更全面的理解和應(yīng)用分析洞察力。
步驟5:改進計劃
數(shù)據(jù)分析本質(zhì)上是一個迭代過程。它不是部署一次,獲得百分之百 “正確的”結(jié)果,然后就完事的過程。不僅洞察力會隨著時間的推移而變化,數(shù)據(jù)分析如何與業(yè)務(wù)完美結(jié)合也是一個有機的不斷演變的過程。建立一個反饋機制,花費時間和精力理解哪些行得通,哪些行不通,以及這些行得通或行不通背后的原因,是區(qū)分專為一次性成功而設(shè)計的流程和專為提供持續(xù)成果而設(shè)計的數(shù)據(jù)分析技術(shù)的關(guān)鍵因素。
數(shù)據(jù)分析的成功之路并不會因為突然將每個人都變成分析師或數(shù)據(jù)科學(xué)家之后而鑄造。它需要認識到數(shù)據(jù)團隊和業(yè)務(wù)團隊各自的優(yōu)勢,并確保存在一個交流界面,以鼓勵對方團隊變得更為強大。