《企業(yè)網(wǎng)D1Net》1月11日訊
當(dāng)前,隨著大數(shù)據(jù)熱度走高,圍繞大數(shù)據(jù)的討論一直不覺于耳,其中關(guān)于大數(shù)據(jù)可視化的討論也層出不窮——其話題之豐富、交鋒之激烈甚至不亞于大數(shù)據(jù)技術(shù)本身。目前業(yè)界普遍認(rèn)為可視化是最優(yōu)秀的(或者說是惟一一種)數(shù)據(jù)內(nèi)容表達(dá)方式,甚至如果不對數(shù)據(jù)進(jìn)行可視化處理,我們將錯(cuò)失大量寶貴信息。
可視化是獲取并分享觀點(diǎn)的絕佳途徑,但很多大數(shù)據(jù)團(tuán)隊(duì)卻沒能選對正確的方式??梢暬趺磿?huì)出現(xiàn)問題?原因很簡單,因?yàn)榇嬖诙喾N可能破壞數(shù)據(jù)可視化效果的實(shí)施方式。下面我們就一同來探討最為常見的三種錯(cuò)誤實(shí)踐。
錯(cuò)誤一:顯示所有數(shù)據(jù)
盡管我們在學(xué)校里被告知表達(dá)意見應(yīng)當(dāng)盡全面,但事實(shí)上大多數(shù)人根本不在乎我們實(shí)際做過多少工作,他們不關(guān)心我們每天處理了多少數(shù)據(jù)或者Hadoop集群的規(guī)模到底有多大??蛻襞c內(nèi)部用戶需要的是具體且緊緊圍繞核心問題的答案,而且最好能讓他們盡早得到這些答案。我們的答案與他們的需求關(guān)聯(lián)越是緊密,他們在尋找答案方面所投入的精力也就越少。請千萬記住,頁面上顯示的無關(guān)數(shù)據(jù)越多、找出正確結(jié)論與相關(guān)信息就變得越困難;無論出于什么樣的理由,無關(guān)數(shù)據(jù)就是分散注意力、浪費(fèi)時(shí)間資源的干擾因素。
這類干擾因素在信息面板當(dāng)中顯得特別普遍,因?yàn)檫@類面板的指導(dǎo)理念往往是“顯示所有狀態(tài)”。但事實(shí)上其中大部分狀態(tài)都是正常、乏味、甚至不值一提的,因此把這些沒問題的內(nèi)容顯示出來很可能導(dǎo)致相關(guān)人員因?yàn)橐曈X疲勞而忽略了真正異常的狀況。
出色的信息面板方案應(yīng)該只顯示那些值得關(guān)注或者重要性較高的內(nèi)容。優(yōu)先顯示重要信息、而后是意外信息、接下來是可操作性信息,其它內(nèi)容則都應(yīng)該盡可能淡化。深入挖掘數(shù)據(jù)信息當(dāng)然也很重要,不過信息面板并不是處理這項(xiàng)工作的舞臺(tái)。對于信息挖掘工作,報(bào)告等包含廣泛非可操作性數(shù)據(jù)的表達(dá)載體更為適合。
錯(cuò)誤二:信息關(guān)聯(lián)性不好、復(fù)雜性過高
這種錯(cuò)誤的危險(xiǎn)性絕不遜于第一條。顯示全部信息子集當(dāng)然不錯(cuò),但前提是數(shù)據(jù)的關(guān)聯(lián)性必須得到保證。舉例來說,如果大家關(guān)注銷售情況,那么同時(shí)也可能希望了解各個(gè)地區(qū)的銷售走勢或者其隨時(shí)間推移而發(fā)生的變化。首先考慮到用戶對數(shù)據(jù)的使用方式,而后才能作出正確決策。
將所有信息都塞進(jìn)同一套圖表當(dāng)中很可能不足以概括整體情況,相比之下制作多份緊密關(guān)聯(lián)的圖表才是最理想的處理方式。一般來說,多份簡潔而清晰的圖表在實(shí)際表現(xiàn)方面要優(yōu)于單一且高度復(fù)雜的數(shù)據(jù)可視化成果。
錯(cuò)誤三:糟糕的數(shù)據(jù)表現(xiàn)形式
即使我們在繪制圖形時(shí)使用的數(shù)據(jù)完全正確,得到的結(jié)果也仍然無法保證有效。結(jié)合實(shí)際體驗(yàn),大家會(huì)發(fā)現(xiàn)日常工作中很少見到某些奇特的圖形設(shè)計(jì)——這是因?yàn)樗鼈兊男Ч⒉缓谩T跐M足可視化需求方面,絕大部分優(yōu)秀的案例都會(huì)相對保守地使用樣形圖、折線圖、散點(diǎn)圖以及餅狀圖(其中餅狀圖的制作難度更大一些)。
我們需要思考不同數(shù)據(jù)字段之間的核心關(guān)聯(lián),并想辦法將這些字段鋪設(shè)在坐標(biāo)軸之上。接下來,按照類型進(jìn)行分組,并以時(shí)間、幅度或者重要性為依據(jù)對數(shù)據(jù)加以排序。(如果這些排序方式都不合適,按照首字母或者拼音排序也是可行的。)另外,請務(wù)必用顏色來標(biāo)記不同類別(而不要用大小);大家可以利用不同亮度或者色彩飽和程度來說明大小。再有,請使用標(biāo)簽及其它標(biāo)記有選擇地引導(dǎo)閱讀者的注意力,同時(shí)又不至于擾亂正常查看。
良好的設(shè)計(jì)
思考與規(guī)劃優(yōu)先要規(guī)避上述錯(cuò)誤,最好的辦法就是首先專注于我們想要表達(dá)的核心目標(biāo)。在考慮可視化方案的直觀效果之前,請大家依次回答以下幾個(gè)問題:
1.我們需要采取哪些行動(dòng)(或者我們關(guān)注什么樣的重點(diǎn))?
2.我們需要傳達(dá)怎樣的決定(我們又將如何將其付諸實(shí)施)?
3.我們需要提出怎樣的問題?
4.我們需要看到哪些數(shù)據(jù)?
5.我們要選擇什么樣的最佳結(jié)構(gòu)來準(zhǔn)確提示數(shù)據(jù)內(nèi)容之間的重要關(guān)系?
6.我們需要突出顯示哪些數(shù)據(jù)信息?
在大家回答了上述問題之后,就可以開始著手設(shè)計(jì)并利用正確的數(shù)據(jù)來實(shí)施理想的可視化方案了。當(dāng)然,在處理過程中我們可能還需要作出各種調(diào)整。調(diào)整并不是壞事,我們可以利用迭代、測試、測試不同的實(shí)現(xiàn)方法而后再次迭代的方式來找到最佳選項(xiàng)。只有經(jīng)過深思熟慮且堅(jiān)持面向用戶的設(shè)計(jì)方案才能打造出切實(shí)有效且更富效率的數(shù)據(jù)可視化成果。
D1Net評論:
大數(shù)據(jù)可視化離不開良好的設(shè)計(jì)方案,如何選擇良好的設(shè)計(jì)方案,需要先回答上述幾個(gè)問題,當(dāng)你弄清楚上面幾個(gè)問題的答案之后,就知道自己真正想要什么,良好的設(shè)計(jì)方案選擇也就更加得心應(yīng)手,大數(shù)據(jù)可視化也就水到渠成了。