當今在商業(yè)領域的競爭就是了解你的客戶。消費者期待個性化的服務和令人滿意的體驗,而與他們互動品牌無關(guān)的東西都可能導致客戶選擇其他品牌。
各行業(yè)的許多組織都在努力獲取他們所需的客戶數(shù)據(jù),以便在所有與客戶的接觸中提供個性化的和情景的體驗。最近,數(shù)據(jù)湖已被吹捧為管理所收集的各種客戶數(shù)據(jù)的最佳方式,許多大數(shù)據(jù)和分析解決方案都側(cè)重于使用自助式方法來利用數(shù)據(jù)湖價值。
將所有客戶數(shù)據(jù)都轉(zhuǎn)儲到數(shù)據(jù)湖中是不夠的;特別是當分析引擎與其收到的數(shù)據(jù)質(zhì)量一樣好時。根據(jù)研究公司Forrester Inc.最近的一份報告,只有25%的業(yè)務和技術(shù)決策者表示,他們實施大數(shù)據(jù)解決方案后增加了收入。這意味著大多數(shù)公司并沒有有效地利用客戶數(shù)據(jù)形成的見解來更好地服務和留住客戶,F(xiàn)orrester公司說道。
是什么阻礙了企業(yè)在客戶互動中使用大數(shù)據(jù)?數(shù)據(jù)湖和使用客戶互動分析之間存在著兩個瓶頸。一個是建立黃金記錄,準確和完整的客戶視圖,另一個是克服流程中的延遲--在數(shù)據(jù)、分析和執(zhí)行層面--通過正確的渠道或接觸實時與客戶互動。
數(shù)據(jù)湖和黃金記錄
讓我們先看看建立黃金記錄所面臨的挑戰(zhàn)吧。黃金記錄的概念超出了所謂的360度客戶視圖或客戶的單一視圖范疇。它是來自整個企業(yè)的更豐富和全面的數(shù)據(jù)集合,涉及到將有關(guān)客戶的所有已知信息收集到整個組織都能訪問的數(shù)據(jù)控制中心點。
構(gòu)建良好的黃金記錄至關(guān)重要,因為數(shù)據(jù)驅(qū)動的客戶互動質(zhì)量高度依賴于數(shù)據(jù)本身的質(zhì)量(準確性、完整性、相關(guān)性和及時性)。不正確的數(shù)據(jù)會導致不相關(guān)的報價、冗余方法以及順序混亂或提供過時的報價。數(shù)據(jù)湖是一個很好的存儲庫,但組織選擇數(shù)據(jù)湖(原始數(shù)據(jù)種類繁多,數(shù)據(jù)量大,數(shù)據(jù)捕獲簡便等)的很多原因都會放大他們所面臨的質(zhì)量問題。
其解決方案是應用嚴謹且周密的數(shù)據(jù)匹配策略,該策略利用探索性、概率性和機器學習方法來掌握數(shù)據(jù)并創(chuàng)建持久化的關(guān)鍵結(jié)構(gòu),然后插入自動化流程來管理數(shù)據(jù)并為客戶互動生成恰當?shù)?ldquo;預測”。添加自動化流程可簡化黃金記錄的創(chuàng)建過程,使其隨時間推移更容易維護。這就是客戶數(shù)據(jù)平臺(CDP)應該做的事情,盡管很少的數(shù)據(jù)平臺能做到這一點。真正高質(zhì)量的數(shù)據(jù)需要很多因素,諸如跨源數(shù)據(jù)提取,名稱和地址標準化,調(diào)整確定性和概率匹配以及解決問題、審計和合規(guī)性所需的人工流程。它并不是出于內(nèi)心的愿望,大多數(shù)客戶數(shù)據(jù)平臺提供商都會試圖掩蓋這種復雜性。但是,相信我,如果跳過這些步驟,結(jié)果分析會產(chǎn)生非常不準確的結(jié)果。
對于大數(shù)據(jù)的實施,客戶數(shù)據(jù)平臺必須在本地處理數(shù)據(jù)湖中常見的所有源格式,包括多個NoSQL數(shù)據(jù)庫和文檔格式,如MongoDB、Avro、Parquet等跨多個大數(shù)據(jù)環(huán)境的格式??蛻魯?shù)據(jù)平臺應該能夠利用大數(shù)據(jù)分布式計算資源,而這些資源往往被忽略,當作非SQL數(shù)據(jù)庫的主要價值。
通過在大數(shù)據(jù)環(huán)境中精心設計的客戶數(shù)據(jù)平臺,組織可以處理數(shù)據(jù)湖中各個種類、速度和數(shù)量的信息,以生成準確的客戶資料用以進行客戶分析和互動。
面對數(shù)據(jù)湖中的延遲
另一個關(guān)鍵挑戰(zhàn)是克服延遲,它以三種基本方式出現(xiàn)在數(shù)據(jù)湖/分析過程中。第一種是進程啟動延遲。數(shù)據(jù)處理有意地與到達數(shù)據(jù)庫中的數(shù)據(jù)進行分離。這是數(shù)據(jù)湖設計工作的一部分,但這也可能導致更新客戶信息的延遲。
將“數(shù)據(jù)倉庫思維”引入數(shù)據(jù)湖時,信息可能會被視為半靜態(tài)數(shù)據(jù)的集合,并且更新將在預定時間(例如夜間)執(zhí)行,以便在早上生成可用于分析的信息。對于像生成報告等與時間無關(guān)的流程來說,這樣很好。但它不適合那些應與客戶的節(jié)奏相匹配的流程。
對于這些側(cè)重互動的實時過程,數(shù)據(jù)需要更有規(guī)律地進行更新。這需要進行更改(例如,數(shù)據(jù)觸發(fā)的流程)以及對架構(gòu)或模型的更改,以有效處理更新所帶來的數(shù)據(jù)更改,而不是批量構(gòu)建配置文件。
第二種延遲涉及客戶數(shù)據(jù)平臺??蛻魯?shù)據(jù)平臺或其他軟件的性能可能會直接對流程增加時間延遲。如果客戶數(shù)據(jù)平臺每小時只能處理幾千次更新,那么它不會將配置文件更改的速度提高到足以匹配客戶的節(jié)奏。
許多客戶數(shù)據(jù)平臺供應商為生成客戶記錄而引用高性能數(shù)據(jù),但在該過程中不包括復雜的匹配或更新。由于不包括匹配,他們只基于現(xiàn)有客戶對新記錄的簡單生成進行衡量。
對于大中型企業(yè)來說,性能通常需要達到每小時數(shù)百萬條記錄,并且整個過程的實際輸入到輸出時間在2-5秒范圍內(nèi)。性能需要滿足這個嚴格的標準,因為上游供給過程和下游行動過程本身會帶來額外的延遲。
第三種是分析/編排延遲。一旦客戶配置文件準備就緒,由于分析軟件或編排軟件的平庸表現(xiàn),或者由于人力資源有限,可能還會在架構(gòu)上帶來下游的延遲。
通常,這是將用例需求與測量的延遲相匹配的問題。對于許多分析任務,由于缺乏有能力的分析師,下游的延遲可能會變得更糟。對于這種延遲,可以結(jié)合更好的數(shù)據(jù)質(zhì)量自動化;更好地確定時間/性能要求;并且精心設計、測量和調(diào)整軟件和流程將確保下游流程延遲足夠小,以滿足項目要求。
數(shù)據(jù)湖被設計用于現(xiàn)代品牌所處的各種數(shù)據(jù)結(jié)構(gòu)和節(jié)奏的環(huán)境中。部署一個數(shù)據(jù)湖是第一步,但品牌商還需要明白,添加數(shù)據(jù)湖只是邁向始終與客戶互動的其中一步。他們還需要消除延遲障礙,并簡化創(chuàng)建黃金客戶記錄的過程。通過實現(xiàn)這兩個目標,品牌商才可以真正與現(xiàn)代消費者建立聯(lián)系,并提供客戶所期望的個性化體驗。