反思現(xiàn)實(shí):反映2018年的數(shù)據(jù)世界的復(fù)雜性

責(zé)任編輯:cres

作者:Dan Adams

2018-07-17 11:17:21

來(lái)源:企業(yè)網(wǎng)D1Net

原創(chuàng)

如今,企業(yè)比以往任何時(shí)候都更加認(rèn)識(shí)到數(shù)據(jù)采樣和可視化是購(gòu)買精確和相關(guān)的第三方數(shù)據(jù)的關(guān)鍵組成部分。在我職業(yè)生涯中檢查過(guò)的數(shù)千個(gè)數(shù)據(jù)集中,有很多都包含了最初并不明顯的重大差距或差錯(cuò)。但是,審查這些數(shù)據(jù)集只是組織目前面臨的難題之一。

雖然人們普遍認(rèn)為高質(zhì)量的數(shù)據(jù)隨時(shí)可用且唾手可得,但情況并非總是如此。然而,這在具有三個(gè)共同屬性的地區(qū)中更常見(jiàn)。
 
如今,企業(yè)比以往任何時(shí)候都更加認(rèn)識(shí)到數(shù)據(jù)采樣和可視化是購(gòu)買精確和相關(guān)的第三方數(shù)據(jù)的關(guān)鍵組成部分。在我職業(yè)生涯中檢查過(guò)的數(shù)千個(gè)數(shù)據(jù)集中,有很多都包含了最初并不明顯的重大差距或差錯(cuò)。但是,審查這些數(shù)據(jù)集只是組織目前面臨的難題之一。
 
如果數(shù)據(jù)連買都不能買怎么辦?如果在你欲知詳情的地區(qū)沒(méi)有可信的信息該怎么辦?
 
隨著實(shí)體、數(shù)字、移動(dòng)和交易數(shù)據(jù)呈指數(shù)級(jí)上升,很多人認(rèn)為,關(guān)于所有人,所有事物或所有地方的完整的,最新的以及可靠的數(shù)據(jù)是唾手可得的。好吧,我想說(shuō)的是他們錯(cuò)了。這些信息根本不像他們想象的那么容易獲得。
 
探索對(duì)數(shù)據(jù)的需求
 
在你研究當(dāng)今企業(yè)收集的數(shù)據(jù)的來(lái)源時(shí),你會(huì)發(fā)現(xiàn)這是由人員,聯(lián)網(wǎng)的設(shè)備和活動(dòng)生成的。人們采集它并使其變得有用,因?yàn)樗麄冃枰纱松傻臄?shù)據(jù)。反過(guò)來(lái),一旦能以合理的價(jià)格向買家提供這樣的數(shù)據(jù),數(shù)據(jù)就會(huì)遍地開花。
 
當(dāng)我們檢查那些具有最多可用數(shù)據(jù)的地區(qū)時(shí),通常會(huì)發(fā)現(xiàn)三個(gè)共同的屬性。這些飽含數(shù)據(jù)的區(qū)域具有下列屬性:
 
1. 人口和企業(yè)都眾多
 
2. 政府?dāng)?shù)據(jù)法規(guī)較少,政府往往會(huì)參與數(shù)據(jù)的創(chuàng)建和發(fā)布
 
3. 數(shù)據(jù)采購(gòu)成本低
 
缺少一個(gè)或多個(gè)基本因素的地區(qū)可供使用的數(shù)據(jù)就比較少,這是可以理解的。
 
比較全球的數(shù)據(jù)收集
 
我們以美國(guó)為例。美國(guó)的絕大多數(shù)州人口眾多,擁有很多工業(yè)化和數(shù)據(jù)驅(qū)動(dòng)的組織,數(shù)據(jù)法規(guī)寥寥,由于《信息自由法案(Freedom of Information Act)》,這些州有大量由政府創(chuàng)建的可作為商業(yè)用途的基礎(chǔ)的數(shù)據(jù)。這一系列因素是商業(yè)數(shù)據(jù)相對(duì)于世界其它地區(qū)較能以較低的價(jià)格提供的原因。因此,關(guān)于美國(guó)人口的數(shù)據(jù)不計(jì)其數(shù)。
 
相比之下,非洲農(nóng)村人口集中度很低,缺乏正規(guī)的現(xiàn)代化勞動(dòng)力。如今,對(duì)于以美國(guó)為中心的數(shù)據(jù)用戶所期望的很多商業(yè)應(yīng)用程序而言,關(guān)于非洲的數(shù)據(jù)很少(或者應(yīng)該說(shuō)可靠的數(shù)據(jù)很少)。
 
如果我們看看世界上人口最多,有著最為復(fù)雜的現(xiàn)代勞動(dòng)力的國(guó)家中國(guó),人們會(huì)認(rèn)為中國(guó)的數(shù)據(jù)量肯定很驚人,而且對(duì)這些數(shù)據(jù)的商業(yè)需求也很強(qiáng)勁。但是,中國(guó)擁有世界上最為嚴(yán)格的一些數(shù)據(jù)法規(guī),這些法規(guī)使得國(guó)外組織從中國(guó)獲取和輸出數(shù)據(jù)變得非法。
 
雖然世界上一些最大的數(shù)據(jù)驅(qū)動(dòng)型組織,以及一些最新、最完整、視覺(jué)上最美觀的數(shù)據(jù)都在英國(guó),但享有皇家著作權(quán)的數(shù)據(jù)要收取很高的費(fèi)用,使大多數(shù)以美國(guó)價(jià)格為參考的人望而卻步。
 
因?yàn)槿杂泻芏嘟M織仍在為哪些數(shù)據(jù)可以共享以及以何種量級(jí)共享尋求共識(shí),GDPR的新法規(guī)增加了使用的復(fù)雜性。
 
對(duì)今天數(shù)據(jù)的期望
 
我們發(fā)現(xiàn)自己處在數(shù)據(jù)收集的關(guān)鍵時(shí)刻,隨著分析和機(jī)器學(xué)習(xí)推動(dòng)了越來(lái)越多的業(yè)務(wù)決策,這種情況尤甚。雖然我們的期望是整個(gè)世界在同一水平上得到反映、計(jì)算和描述,但事實(shí)并非如此。用數(shù)據(jù)描述世界會(huì)受到很多因素的影響,由于GDPR和引進(jìn)和最近的公共數(shù)據(jù)安全漏洞的出現(xiàn),人員和企業(yè)在共享信息方面變得比以往任何時(shí)候都更加保守。
 
雖然數(shù)據(jù)無(wú)形中重塑了我們構(gòu)想世界的方式,但我們最大的優(yōu)勢(shì)仍然領(lǐng)先于我們。由于組織漸漸融入了數(shù)據(jù)使用和GDPR合規(guī)性的節(jié)奏,我們可視化數(shù)據(jù)的方式肯定會(huì)發(fā)生變化。與此同時(shí),消費(fèi)者對(duì)新法規(guī)的理解也會(huì)有所不同。在我們還沒(méi)有完全對(duì)世界形成一個(gè)整體觀時(shí),就數(shù)據(jù)共享而言,更高一級(jí)的舒適度是必須的。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)