雖然Open Data是英美等國(guó)政府倡導(dǎo)的大數(shù)據(jù)發(fā)展理念,但是創(chuàng)業(yè)公司的行動(dòng)更加迅猛,Data.world近日融資1870萬(wàn)美元,向數(shù)據(jù)民主化的方向繼續(xù)挺進(jìn)。
這是一個(gè)數(shù)據(jù)爆炸的年代,同時(shí)又是一個(gè)數(shù)據(jù)饑荒的年代,這就好比在大數(shù)據(jù)的海洋上生產(chǎn)淡水一樣困難。大數(shù)據(jù)的體量不斷膨脹,但利用效率越來(lái)越低,應(yīng)用門檻卻不斷加高,大數(shù)據(jù)已經(jīng)成了互聯(lián)網(wǎng)巨頭和大型企業(yè)的昂貴玩具,與創(chuàng)業(yè)公司、中小企業(yè)和個(gè)人的距離越來(lái)越遠(yuǎn)。
為了實(shí)現(xiàn)Open Data大數(shù)據(jù)民主化的夢(mèng)想,創(chuàng)立于2015年的大數(shù)據(jù)社交分享網(wǎng)站Data.world搭建了一個(gè)大數(shù)據(jù)分享平臺(tái),方便不同專業(yè)領(lǐng)域的用戶分享不同類型的數(shù)據(jù),其產(chǎn)品理念有些類似Github,使用Semantic語(yǔ)意web技術(shù)作為基礎(chǔ)框架。
Data.world的首席執(zhí)行官Brett Hurt指出:Google創(chuàng)立以來(lái),全球的互聯(lián)網(wǎng)(站)開(kāi)放數(shù)據(jù)集已經(jīng)增長(zhǎng)了至少7倍,從1998年的240萬(wàn)個(gè)站點(diǎn)增長(zhǎng)到2016年的1800萬(wàn)個(gè)。
用戶目前可以免費(fèi)在Data.world網(wǎng)站注冊(cè)賬戶,導(dǎo)入各種數(shù)據(jù)源,包括文檔、腳本、圖表等。Data.world自己開(kāi)發(fā)了一種查詢語(yǔ)言——dwSQL,代替更加復(fù)雜的語(yǔ)意web查詢語(yǔ)言SPARQL,方便用戶訪問(wèn)Data.World的語(yǔ)意圖譜數(shù)據(jù)庫(kù)。
用戶導(dǎo)讀的數(shù)據(jù)經(jīng)過(guò)可視化處理和過(guò)濾后,就可以在Data.World的賬戶中與其他用戶分享,并收獲點(diǎn)評(píng)和建議。
Hurt指出,原始數(shù)據(jù)就像原油,需要精煉才能驅(qū)動(dòng)世界,目前大數(shù)據(jù)處理80%的工作都用于數(shù)據(jù)清洗、格式化等方面,真正的數(shù)據(jù)分析不到20%。Data.world的商業(yè)模式與Github也類似,只有當(dāng)用戶選擇將數(shù)據(jù)存儲(chǔ)于私有空間時(shí)才會(huì)收費(fèi)。
Data.world上分享的數(shù)據(jù)集完全采用流行的社會(huì)化分享模式,由用戶社區(qū)自己來(lái)決定數(shù)據(jù)的價(jià)值和質(zhì)量。