大數(shù)據(jù)最重要的一個(gè)“V”是什么?

責(zé)任編輯:editor004

2017-05-10 11:46:57

摘自:億歐網(wǎng)

這一現(xiàn)象表明數(shù)據(jù)科學(xué)不僅僅在于“數(shù)值”和“變量”的分析,它本質(zhì)上是一門將違反直覺的內(nèi)容轉(zhuǎn)化為直觀內(nèi)容的科學(xué)??梢暬髌肥呛臅r(shí)費(fèi)力的數(shù)據(jù)工作的結(jié)晶,因此,它在數(shù)據(jù)科學(xué)中的重要性不言而喻。

摘要:在全民談?wù)摯髷?shù)據(jù)的當(dāng)下,不少人只是在盲目地跟風(fēng),他們并不了解大數(shù)據(jù):大數(shù)據(jù)是什么?誰在使用大數(shù)據(jù)?我們?yōu)槭裁匆P(guān)注大數(shù)據(jù)?

關(guān)鍵詞: 大數(shù)據(jù)

 

\

 

以前,處理“大數(shù)據(jù)”僅限于那些本身具備昂貴的高性能計(jì)算集群的用戶,現(xiàn)在,硬件發(fā)展日新月異,可以勝任大量實(shí)時(shí)分析計(jì)算的消費(fèi)級(jí)硬件比比皆是,并且有大量的開放數(shù)據(jù)庫供公眾使用,因此“數(shù)據(jù)分析”以前所未有的速度進(jìn)步著。但大數(shù)據(jù)的快速發(fā)展也帶來一個(gè)全民思考的問題:如何理解大數(shù)據(jù)?如何將大數(shù)據(jù)用于解決現(xiàn)實(shí)世界的問題?

IBM提出的大數(shù)據(jù)的“4V”特征得到了業(yè)界的廣泛認(rèn)可。

第一,數(shù)量(Volume),即數(shù)據(jù)巨大,從TB級(jí)別躍升到PB級(jí)別;

第二,多樣性(Variety),即數(shù)據(jù)類型繁多,不僅包括傳統(tǒng)的格式化數(shù)據(jù),還包括來自互聯(lián)網(wǎng)的網(wǎng)絡(luò)日志、視頻、圖片、地理位置信息等;

第三,速度(Velocity),即處理速度快;

第四,真實(shí)性(Veracity),即追求高質(zhì)量的數(shù)據(jù)。

除了上述4個(gè)“V”,還有另外一個(gè)“V”更重要:

可視化(Visualization)

即使我們能獲取的數(shù)據(jù)量以爆炸式的速度增長(zhǎng),即使我們?cè)谟?jì)算能力方面有著令人難以置信的指數(shù)級(jí)增長(zhǎng),但我們想從大數(shù)據(jù)中獲取的東西遠(yuǎn)遠(yuǎn)超過如今我們從數(shù)據(jù)中挖掘的東西。對(duì)技術(shù)的追求永無止境,但將當(dāng)前的技術(shù)轉(zhuǎn)化成最大的價(jià)值才是最重要的。此外,數(shù)據(jù)科學(xué)并不只是一門技術(shù),它更多地是一種實(shí)踐的藝術(shù)。

可視化在數(shù)據(jù)科學(xué)中發(fā)揮著至關(guān)重要的作用,它能幫助數(shù)據(jù)工作者更好地理解數(shù)據(jù)中可能存在的結(jié)構(gòu)和規(guī)律。以下是為什么說可視化是大數(shù)據(jù)最重要的一個(gè)“V”的3個(gè)原因:

可視化讓大數(shù)據(jù)成為決策利器

誠(chéng)然,大數(shù)據(jù)背后的真正功勞可能是那些需要花費(fèi)大量時(shí)間和精力的挖掘、建模、算法、分析等工作創(chuàng)造的,但實(shí)際情況是:當(dāng)管理者需要基于數(shù)據(jù)做出決策時(shí),讓數(shù)據(jù)以對(duì)的形式,在對(duì)的時(shí)間出現(xiàn)在對(duì)的地方才是重點(diǎn),這樣數(shù)據(jù)分析的結(jié)果才能最終起到作用。在大多數(shù)情況下,決策者根本沒有時(shí)間去組織會(huì)議,看著表格分析數(shù)據(jù)然后做決定,可視化是讓管理者對(duì)海量數(shù)據(jù)有感覺的唯一方法。隨著企業(yè)的數(shù)據(jù)量和業(yè)務(wù)需求不斷增加,可視化將變得越來越重要。

可視化是讓大數(shù)據(jù)接地氣的唯一方法

數(shù)據(jù)能夠“觸動(dòng)”的人越多,其所產(chǎn)生的真正的價(jià)值越大。因此,通過講述“數(shù)字故事”來表達(dá)數(shù)據(jù)反映的內(nèi)容成為一種新興的流行趨勢(shì)。這一現(xiàn)象表明數(shù)據(jù)科學(xué)不僅僅在于“數(shù)值”和“變量”的分析,它本質(zhì)上是一門將違反直覺的內(nèi)容轉(zhuǎn)化為直觀內(nèi)容的科學(xué)。

可視化能最大化大數(shù)據(jù)的價(jià)值

即使在傳統(tǒng)的數(shù)據(jù)分析中,人們也在不斷嘗試和探索數(shù)據(jù)的視覺表現(xiàn)形式,以便能更好地了解數(shù)據(jù)中的真理:這是什么數(shù)據(jù)?這些數(shù)據(jù)能說明什么?如今數(shù)據(jù)的量越來越大,數(shù)據(jù)的復(fù)雜性也越來越強(qiáng),但追求視覺表達(dá)形式的趨勢(shì)不會(huì)變,即使數(shù)據(jù)科學(xué)和大數(shù)據(jù)分析技術(shù)不斷發(fā)展,新的分析方法和分析應(yīng)用不斷涌現(xiàn),也都始終無法撼動(dòng)可視化的重要地位。

可視化作品是耗時(shí)費(fèi)力的數(shù)據(jù)工作的結(jié)晶,因此,它在數(shù)據(jù)科學(xué)中的重要性不言而喻。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)