認(rèn)識大數(shù)據(jù)錯誤實踐 避免走彎路

責(zé)任編輯:editor004

2014-01-10 10:57:45

摘自:IT168

最近一段時間以來,圍繞數(shù)據(jù)可視化所展開的討論可謂層出不窮——其話題之豐富、交鋒之激烈甚至不亞于大數(shù)據(jù)技術(shù)本身。在大家回答了上述問題之后,就可以開始著手設(shè)計并利用正確的數(shù)據(jù)來實施理想的可視化方案了。

最近一段時間以來,圍繞數(shù)據(jù)可視化所展開的討論可謂層出不窮——其話題之豐富、交鋒之激烈甚至不亞于大數(shù)據(jù)技術(shù)本身。目前業(yè)界普遍認(rèn)為可視化是最優(yōu)秀的(或者說是惟一一種)數(shù)據(jù)內(nèi)容表達(dá)方式,甚至如果不對數(shù)據(jù)進(jìn)行可視化處理,我們將錯失大量寶貴信息。

可視化是獲取并分享觀點的絕佳途徑,但很多大數(shù)據(jù)團(tuán)隊卻沒能選對正確的方式??梢暬趺磿霈F(xiàn)問題?原因很簡單,因為存在多種可能破壞數(shù)據(jù)可視化效果的實施方式。下面我們就一同來探討最為常見的三種錯誤實踐。

錯誤一:顯示所有數(shù)據(jù)

盡管我們在學(xué)校里被告知表達(dá)意見應(yīng)當(dāng)盡全面,但事實上大多數(shù)人根本不在乎我們實際做過多少工作,他們不關(guān)心我們每天處理了多少數(shù)據(jù)或者Hadoop集群的規(guī)模到底有多大??蛻襞c內(nèi)部用戶需要的是具體且緊緊圍繞核心問題的答案,而且最好能讓他們盡早得到這些答案。我們的答案與他們的需求關(guān)聯(lián)越是緊密,他們在尋找答案方面所投入的精力也就越少。請千萬記住,頁面上顯示的無關(guān)數(shù)據(jù)越多、找出正確結(jié)論與相關(guān)信息就變得越困難;無論出于什么樣的理由,無關(guān)數(shù)據(jù)就是分散注意力、浪費時間資源的干擾因素。

這類干擾因素在信息面板當(dāng)中顯得特別普遍,因為這類面板的指導(dǎo)理念往往是“顯示所有狀態(tài)”。但事實上其中大部分狀態(tài)都是正常、乏味、甚至不值一提的,因此把這些沒問題的內(nèi)容顯示出來很可能導(dǎo)致相關(guān)人員因為視覺疲勞而忽略了真正異常的狀況。

出色的信息面板方案應(yīng)該只顯示那些值得關(guān)注或者重要性較高的內(nèi)容。優(yōu)先顯示重要信息、而后是意外信息、接下來是可操作性信息,其它內(nèi)容則都應(yīng)該盡可能淡化。深入挖掘數(shù)據(jù)信息當(dāng)然也很重要,不過信息面板并不是處理這項工作的舞臺。對于信息挖掘工作,報告等包含廣泛非可操作性數(shù)據(jù)的表達(dá)載體更為適合。

錯誤二:信息關(guān)聯(lián)性不好、復(fù)雜性過高

這種錯誤的危險性絕不遜于第一條。顯示全部信息子集當(dāng)然不錯,但前提是數(shù)據(jù)的關(guān)聯(lián)性必須得到保證。舉例來說,如果大家關(guān)注銷售情況,那么同時也可能希望了解各個地區(qū)的銷售走勢或者其隨時間推移而發(fā)生的變化。首先考慮到用戶對數(shù)據(jù)的使用方式,而后才能作出正確決策。

將所有信息都塞進(jìn)同一套圖表當(dāng)中很可能不足以概括整體情況,相比之下制作多份緊密關(guān)聯(lián)的圖表才是最理想的處理方式。一般來說,多份簡潔而清晰的圖表在實際表現(xiàn)方面要優(yōu)于單一且高度復(fù)雜的數(shù)據(jù)可視化成果。

錯誤三:糟糕的數(shù)據(jù)表現(xiàn)形式

即使我們在繪制圖形時使用的數(shù)據(jù)完全正確,得到的結(jié)果也仍然無法保證有效。結(jié)合實際體驗,大家會發(fā)現(xiàn)日常工作中很少見到某些奇特的圖形設(shè)計——這是因為它們的效果并不好。在滿足可視化需求方面,絕大部分優(yōu)秀的案例都會相對保守地使用樣形圖、折線圖、散點圖以及餅狀圖(其中餅狀圖的制作難度更大一些)。

我們需要思考不同數(shù)據(jù)字段之間的核心關(guān)聯(lián),并想辦法將這些字段鋪設(shè)在坐標(biāo)軸之上。接下來,按照類型進(jìn)行分組,并以時間、幅度或者重要性為依據(jù)對數(shù)據(jù)加以排序。(如果這些排序方式都不合適,按照首字母或者拼音排序也是可行的。)另外,請務(wù)必用顏色來標(biāo)記不同類別(而不要用大小);大家可以利用不同亮度或者色彩飽和程度來說明大小。再有,請使用標(biāo)簽及其它標(biāo)記有選擇地引導(dǎo)閱讀者的注意力,同時又不至于擾亂正常查看。

良好的設(shè)計

思考與規(guī)劃優(yōu)先要規(guī)避上述錯誤,最好的辦法就是首先專注于我們想要表達(dá)的核心目標(biāo)。在考慮可視化方案的直觀效果之前,請大家依次回答以下幾個問題:

1.我們需要采取哪些行動(或者我們關(guān)注什么樣的重點)?

2.我們需要傳達(dá)怎樣的決定(我們又將如何將其付諸實施)?

3.我們需要提出怎樣的問題?

4.我們需要看到哪些數(shù)據(jù)?

5.我們要選擇什么樣的最佳結(jié)構(gòu)來準(zhǔn)確提示數(shù)據(jù)內(nèi)容之間的重要關(guān)系?

6.我們需要突出顯示哪些數(shù)據(jù)信息?

在大家回答了上述問題之后,就可以開始著手設(shè)計并利用正確的數(shù)據(jù)來實施理想的可視化方案了。當(dāng)然,在處理過程中我們可能還需要作出各種調(diào)整。調(diào)整并不是壞事,我們可以利用迭代、測試、測試不同的實現(xiàn)方法而后再次迭代的方式來找到最佳選項。只有經(jīng)過深思熟慮且堅持面向用戶的設(shè)計方案才能打造出切實有效且更富效率的數(shù)據(jù)可視化成果。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號