早在20世紀90年代的美國沃爾瑪超市中,就有“啤酒與尿布“的故事表現(xiàn)了大數(shù)據(jù)分析給企業(yè)帶來的利益體現(xiàn)。這些年來大數(shù)據(jù)分析正在為企業(yè)帶來巨大的變化。雖然越來越普遍,但數(shù)據(jù)分析中有些“YES”和“NO”卻是必須遵循的。
YES!立體式分析
立體式分析即維度分析。產(chǎn)品數(shù)據(jù)挖掘應該在產(chǎn)品環(huán)境下從產(chǎn)品性能、市場需求、用戶體驗等方面切入分析。數(shù)據(jù)分析是帶有商業(yè)性的,因此要立體性對于數(shù)據(jù)進行深層次整理分析,才能將各方面有價值的信息提煉出來對產(chǎn)品優(yōu)化帶來幫助。
YES!明確適用性
要注意每種統(tǒng)計分析方法的適用范圍。許多分析方法對數(shù)據(jù)的要求很高,如果樣本分布不符合要求,樣本量數(shù)量不足,或存在大量偽樣本,都將影響最后結果的正確性。譬如,我們經(jīng)常要使用的因子分析、聚類分析,若樣本量不足通過SPSS獲得分析結果是沒有任何意義的。
YES!正確整理數(shù)據(jù)庫
在選擇好分析方法分析數(shù)據(jù)時的同要按照要求整理數(shù)據(jù)庫。錯誤的數(shù)據(jù)庫格式對研究的弊處是顯而易見的。在使用研究模型前,要考慮數(shù)據(jù)的適用性。同時,數(shù)據(jù)的合理轉換也很重要。如在訪問時經(jīng)常提問出生年份而非年齡,這樣可以避免誤差。這樣將收集到的數(shù)據(jù)進行轉換也得到一樣的結果。在計算時,我們還常整合幾個變量成為一個或者另幾個變量。
YES!分析數(shù)據(jù)可視化
大數(shù)據(jù)的體現(xiàn)往往是以海量的形式,而數(shù)據(jù)分析首先要整理,其次要分析。大數(shù)據(jù)的分析將能將普通的數(shù)字變成珍貴的信息,體現(xiàn)未來的趨勢和相應的結果。一號店等企業(yè)使用大數(shù)據(jù)魔鏡,將大數(shù)據(jù)可視化分析作為基礎,建立起一體性的業(yè)務模型和產(chǎn)品,明確了顧客關系,提高了運營效率,運用數(shù)據(jù)規(guī)?;瘞椭髽I(yè)規(guī)劃。漢堡王通過Tableau系統(tǒng)讓了解每天的業(yè)績更便捷,為企業(yè)帶來更大利潤。
NO!輕視精準
數(shù)據(jù)中的每一個小數(shù)點都可能帶來巨大的影響。因此數(shù)據(jù)分析不能有“不準確可以再改”的想法。做數(shù)據(jù)分析最基礎的是要有嚴謹?shù)膽B(tài)度和科學的方法。
NO!分析方式不當
數(shù)據(jù)分析是一項專業(yè)性技能,需要使用專業(yè)工具進行分析。一般分析數(shù)據(jù)的工具有Excel、報表工具、BI等,還有最新型的可視化數(shù)據(jù)分析產(chǎn)品魔鏡。應當使用專業(yè)工具進行數(shù)據(jù)分析,可利用圖表表達分析結果。而不能粗略地計算數(shù)據(jù),以此保證其有效性。
NO!忽略數(shù)據(jù)源
足夠多的數(shù)據(jù)的確是實現(xiàn)技術的前提,但數(shù)據(jù)越多并不是結果越準確。一旦不能保證數(shù)據(jù)來源的準確度,大量的數(shù)據(jù)反而會使數(shù)據(jù)分析難度加大,從而使最后作出不準確決策。因此不能盲目追求數(shù)據(jù)量的大,而要同時對數(shù)據(jù)源的準確性有保證。