政府使用大數(shù)據(jù)是為了提升和改善公共服務(wù),這與企業(yè)利用其追求利潤異曲同工。
大數(shù)據(jù)是從各種各樣來源中搜集得到的海量數(shù)據(jù)信息的總稱。對于傳統(tǒng)的關(guān)系型數(shù)據(jù)分析技術(shù)來說,其數(shù)據(jù)量太大,未經(jīng)處理,同時也是非結(jié)構(gòu)化的。據(jù)統(tǒng)計,現(xiàn)在每天產(chǎn)生2.5艾字節(jié)(quintillion bytes)的數(shù)據(jù)信息,全球?qū)⒔?0%的數(shù)據(jù)是過去兩年創(chuàng)造出來的。
此外,從大數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)看,大約90%的數(shù)據(jù)是非結(jié)構(gòu)化的。來源于網(wǎng)絡(luò)和云的海量數(shù)據(jù),為發(fā)現(xiàn)、創(chuàng)造價值,以及豐富商業(yè)智能支撐機構(gòu)決策提供了新的機遇。不過,大數(shù)據(jù)也面臨復(fù)雜性、安全和隱私風(fēng)險等新挑戰(zhàn)。同時,對于新技術(shù)和人類技能的開發(fā)來說,大數(shù)據(jù)是一種需要。
大數(shù)據(jù)重新定義了數(shù)據(jù)管理的范圍,由數(shù)據(jù)提取、轉(zhuǎn)換、加載,或稱為ETL(Extraction-Transformation-Loading),演變?yōu)樵诖髷?shù)據(jù)應(yīng)用中凈化和組織非結(jié)構(gòu)化數(shù)據(jù)的新技術(shù)(如分布式架構(gòu)技術(shù))。
盡管企業(yè)部門正引導(dǎo)大數(shù)據(jù)應(yīng)用的發(fā)展,公共部門也開始對迅速增長的大數(shù)據(jù)具有洞察力,為實時決策提供幫助和支持。
大數(shù)據(jù)有多個來源,包括互聯(lián)網(wǎng)、生物和產(chǎn)業(yè)部門、視頻、電子郵件和社交媒體。許多白皮書、期刊論文和商業(yè)報告已經(jīng)提出了政府利用大數(shù)據(jù),幫助其服務(wù)公眾和應(yīng)對傳統(tǒng)挑戰(zhàn)(如醫(yī)療成本上升、創(chuàng)造就業(yè)、自然災(zāi)害和恐怖主義等)的路徑。
也有一些觀點,就大數(shù)據(jù)是否真能改進政府運作效率提出質(zhì)疑,因為政府必須發(fā)展新的能力,并采用新技術(shù)(比如分布式和非結(jié)構(gòu)化查詢語言),通過數(shù)據(jù)組織和分析,將大數(shù)據(jù)轉(zhuǎn)變?yōu)橛杏玫男畔ⅰ?/p>
本文就政府是否能與企業(yè)一樣,將大數(shù)據(jù)應(yīng)用于公共服務(wù)部門進行了研究。我們首先比較了政府和企業(yè)在目標、任務(wù)、決策制定過程、決策者、組織架構(gòu)和戰(zhàn)略的差異,接著考察了部分技術(shù)領(lǐng)先的國家當(dāng)前大數(shù)據(jù)應(yīng)用的狀況,這些國家包括澳大利亞、日本、新加坡、韓國、英國和美國等。
本文也分析了一些企業(yè)的大數(shù)據(jù)應(yīng)用,這些技術(shù)也能應(yīng)用在政府事務(wù)中。最后,我們提出了國家和政府部門未來建設(shè)大數(shù)據(jù)戰(zhàn)略應(yīng)用項目的建議。
文章主要觀點
企業(yè)、政府和研究機構(gòu)都能夠從他們搜集的海量大數(shù)據(jù)中獲取價值;
大數(shù)據(jù)應(yīng)用領(lǐng)先的國家已實施大數(shù)據(jù)應(yīng)用項目,以提高國家運行效率、透明度、民眾福利和公共事務(wù)參與度,確保經(jīng)濟增長和國家安全;
分析政府部門采用的大數(shù)據(jù)應(yīng)用項目,為其他國家提供未來大數(shù)據(jù)行動的引導(dǎo)。
編譯:工業(yè)和信息化部國際經(jīng)濟技術(shù)合作中心 高常水 江道輝