為什么大數據技術并不一定總能解決問題

責任編輯:editor007

作者:核子可樂譯

2015-08-26 17:24:54

摘自:51CTO

在如今這個“酒香也怕巷子深”的時代,企業(yè)技術領域總是充斥著無數宣傳及炒作。在軟件當中處理定性數據通常需要為其賦予數值形式,例如為特定定性響應或者評論分配一個數值等級或者分值。

定性數據能夠幫助我們更為深層地審視客戶、行為及趨勢。

在如今這個“酒香也怕巷子深”的時代,企業(yè)技術領域總是充斥著無數宣傳及炒作。具體到當下,可能很多朋友都會把“大數據”技術看作是蘊藏著自身企業(yè)所需答案的寶庫。然而 ,其并不總能踐行如此美好的承諾——至少可能與傳統(tǒng)所差別。

首先,讓我們談談到底什么叫作大數據。事實上根據IDC的調查報告顯示,那些通常被稱為大數據的信息——包括由企業(yè)資源規(guī)劃(簡稱ERP)、客戶關系管理(簡稱CRM)以及其它商務系統(tǒng)(包括目前企業(yè)常用的分析工具)等量化并捕捉到的海量數據——事實上只占企業(yè)平均數據總量的10%左右。

而其余部分則可以稱作“非結構化”或者說“質化”數據,而這部分數據在內容上相當混亂。這類信息可能來自客戶調查、響應記錄、在線論壇、社交媒體、文件、視頻、新聞報道、指向服務中心的通話以及由銷售團隊收集到的趨勢性論據等等。這類內容通常以文本而非數字的形式存在,這就意味著其很難被“量化”,或者說轉化成數值形式。

這就產生了新的問題。雖然大部分分析工具都能夠實現信息量化——換言之,也就是數字處理——但非結構化數據當中通常包含大量背景信息,這意味著企業(yè)需要找到適合的理解角度才能讓這些信息產生價值。

“數據帶來的問題往往要比結論更多,而我們總是需要就定性數據趨勢背后的‘為什么’作出一番證明。”Forrester調查公司分析師Anjali Lai指出。“如果在架空背景之下進行數據分析,那我們往往無法把握事情的全貌。而定性數據則能夠提供這一必要的背景視角。”

想象一下,大家所在的公司希望理解為什么在線銷售額度一直無法達到預期。要解決這個問題,大家可以斥資購置昂貴的營銷分析工具,從而獲得用戶在各頁面上的平均瀏覽時間或者用戶取消購物車內容的比例等基于行為的重要數據。不過即使擁有大量此類數據,我們仍然未必能夠在“為什么”這道方程題中得出正確的答案。

“大家可能很清楚,自己的網站每天擁有一萬名訪問者——這就是定性數據,”YouEye公司首席產品官Collin Sebastian指出,這是一家專門針對定性數據設計軟件與服務產品的企業(yè)。“定性數據能夠告訴我們,其中有四千名訪客對于特定產品類型很感興趣,他們希望了解什么、哪些內容屬于意外情況,他們又會選擇哪些產品作為替代選項等。”

定性數據的重要意義絕不僅限于確定數據點之間的關聯性,例如告訴我們哪些訪客在網站上停留的時間更長、購物的意愿更強烈。除此之外,定性數據還可以識別出因果關系,從而回答那些難以捉摸的“為什么”問題。訪客為什么會在我們的網站上耗費更長時間——這到底是因為網站內容足夠精彩,還是單純因為我們設計的購物過程太過繁瑣?

“當前,每位CMO需要管理的信息儀表板平均達14套之多,”Sebastian表示。“這就是最為典型的分析癱瘓案例:我擁有1000萬個數據點,從17種不同的角度對我的問題作出審視——但我還是不具備能夠真正理解其涵義的必要背景信息。”

從歷史角度講,對定性數據的分析往往需要以手動方式進行——也就是屬于人力密集型工作。“我們根本不可能單純在收集到數據之后向文件數據庫提交查詢,并指望著其返回一項可視化結果,”Booz Allen Hamilton公司首席數據科學家Kirk Borne解釋道。

定性數據分析的結果一般會被限制在特定范圍當中,但這種狀況目前已經開始扭轉。除了市面上開始出現更多專門針對定性工具設計的工具及軟件包之外,我們還擁有了“越來越多理想的定性數據向量化數據轉換的途徑,并能夠借此讓定性分析在定性數據當中充分發(fā)揮潛能,”Borne指出。

YouEye是一款利用視頻與音頻記錄用戶同客戶網站內容、廣告或其它素材交互流程的在線工具。一般來講,每次調查所選取的用戶數量會在50位到300位之間,具體取決于客戶要求。視頻利用人工編碼、自然語言處理及機器學習等機制進行轉錄與編碼。在處理接近尾聲時,客戶能夠得到一份包含強調部分的調查結果。

舉例來說,如果客戶是一家咖啡供應商,“我們會通過產品互動情況匯總出一套包含強調部分的調查報告,其中突出體現了每一次客戶提到其它競爭對手的情況,”Sebastian表示。“這樣大家就能立即對客戶流失狀況作出因果分析——而這顯然并不是定性數據能夠實現的效果。”

QSR International是另一家利用定制化軟件專門處理定性數據的企業(yè),其NVivo產品已經為Gallup所采用。除了廣為人知的全國民調服務之外,Gallup也以咨詢方的身份幫助企業(yè)了解客戶關系當中的情感狀況,而這自然會涉及到大量定性數據。

“一部分關鍵性研究問題需要單獨通過定性方式處理,其中包括客戶為什么會主動疏離或者對供應商的服務表現出冷漠態(tài)度,乃至其在體驗客戶服務過程當中表現出的動機與思維過程,”Gallup研究與策略顧問Ilana Ron-Levey指出。“當我們與企業(yè)建立合作關系之后,定性數據能夠幫助我們了解到特定觀點的廣泛性,同時也是我們了解其背后特定規(guī)律及分布含義的關鍵所在,”她解釋道。

Gallup方面還利用一系列技術手段評估客戶心態(tài)。舉例來說,在最近一個B2B項目當中,Gallup方面就面對面采訪了100多位高級客戶,并以客戶參與度為核心 收集到了大量定性與量化數據,Ron-Levey表示。該團隊還利用NVivo以及微軟Excel手動編碼的方式對定性數據進行分析。

有了這些分析結果,Gallup利用定性響應以統(tǒng)計方式解釋了影響客戶參與度的諸多因素。其利用定性數據描述了這些因素如果驅動客戶的所見內容及感受。以此為基礎,“我們收集到了多種能夠切實提高不同類型客戶參與度的執(zhí)行策略,”她表示。

在軟件當中處理定性數據通常需要為其賦予數值形式,例如為特定定性響應或者評論分配一個數值等級或者分值。比如在情緒分析當中,研究人員通常會利用一個正值或者負值來表示定性數據,而后再分配另一個數值來描述這種情緒的具體強度,Born指出。

文本分析包括以定性方式——例如議題模型及熱圖——對文本信息的內容進行總結,而自然語言與語義處理技術則能夠從語音當中提取出真實含義——包括書面與口頭兩類。

將定性數據轉化成量化形式可能會涉及到一些主觀決策。“這是一大挑戰(zhàn),但其中同時也充滿了機遇,”Borne指出。“語言當中包含著大量微妙且復雜的內容,我們可以將其提取出來進行深度理解,從而更加準確地把握其含義。”

QSR的NVivo產品中已經采用了一系列算法,能夠通過常用詞匯或者句型對數據進行分析。有了大量可視化工具,我們能夠更加輕松地解讀數據內容——包括關鍵字云與樹狀圖。

“這讓我們能夠以強大且可靠的可視化角度獲取觀點及其深層原因,”QSR公司CEO John Owen表示。

定性數據收集工作往往相當費時,需要研究人員擁有高超的技巧并建立起和諧的關系,從而降低對受訪者意見的理解偏差,效力于Gallup的Ron-Levey指出。

“作為一項長期被低估甚至忽視的重要技能,定性數據研究人員需要擁有移情能力,”Forrester公司的Lai表示贊同。“而目前的狀況是,定性研究人員往往單純依靠編程而非深入考量背景信息或者潛臺詞的方式進行數據分析。”

處理數據并確保研究模型切實生效同樣不是件簡單的事。大家可能需要從無到有對一整套量化數據集進行規(guī)范化處理,但這項任務在面對定性數據時會變得非常艱難,Borne指出。

“標準統(tǒng)計測試往往會對假設甲與假設乙進行比對,但對于同時包含多種理解方式的定性數據來說,這樣的直接假設根本無法生效,”他進一步解釋稱。

而從分析的角度出發(fā),理解方式在推廣過程中往往會超出樣本數據集的涵蓋范圍,Ron-Levey提醒道。

不過值得肯定的是,妥善打理定性數據確實能夠帶來令人欣慰的回報。

“在大數據時代之下,我們開始不斷探索數字背后所隱藏的真正意義,”Ron-Levey表示。“通過這種方式了解人們的感受、動機以及觀點將幫助企業(yè)建立起創(chuàng)新成果與新的運營戰(zhàn)略,從而吸引到更多客戶的關注。”

Forrester公司的Lai亦表示,“定性與量化觀點可以說是客戶情緒認知工作中的‘陰與陽’兩面,只有將二者結合起來,才能真正得到與消費者行為相關的完整結論。”

鏈接已復制,快去分享吧

企業(yè)網版權所有?2010-2024 京ICP備09108050號-6京公網安備 11010502049343號