大數(shù)據(jù)有可能從根本上改善所有美國人的生活。為了從資源豐富的大數(shù)據(jù)中獲得最大的效益,奧巴馬政府于2012年3月29日推出了“大數(shù)據(jù)研究與開發(fā)計劃”。在此基礎(chǔ)上,美國又于2016年5月發(fā)布了《聯(lián)邦大數(shù)據(jù)研究與開發(fā)戰(zhàn)略計劃》(以下簡稱“計劃”),其目標(biāo)是對聯(lián)邦機構(gòu)的大數(shù)據(jù)相關(guān)項目和投資進(jìn)行指導(dǎo)。該“計劃”主要圍繞代表大數(shù)據(jù)研發(fā)關(guān)鍵領(lǐng)域的七個戰(zhàn)略進(jìn)行,包括促進(jìn)人類對科學(xué)、醫(yī)學(xué)和安全所有分支的認(rèn)識;確保美國在研發(fā)領(lǐng)域繼續(xù)發(fā)揮領(lǐng)導(dǎo)作用;通過研發(fā)來提高美國和世界解決緊迫社會和環(huán)境問題的能力。
戰(zhàn)略1:
利用新興的大數(shù)據(jù)基礎(chǔ)、技巧和技術(shù)來創(chuàng)造下一代能力。計算和數(shù)據(jù)分析的進(jìn)步將提供新的抽象概念來處理復(fù)雜的數(shù)據(jù),并能夠簡化可擴展性和并行系統(tǒng)的編程,與此同時還可以實現(xiàn)最大的性能。計算機科學(xué)、機器學(xué)習(xí)和統(tǒng)計領(lǐng)域的根本性進(jìn)步將促進(jìn)靈活、迅速響應(yīng)和預(yù)測性的數(shù)據(jù)分析系統(tǒng)的發(fā)展。深入研究眾包、公民科學(xué)和集體分布式任務(wù)等社會計算將有助于發(fā)展可以使人類進(jìn)行可能超出計算機能力范圍的任務(wù)。與數(shù)據(jù)交互和數(shù)據(jù)可視化的新技術(shù)和方法將強化“人類—數(shù)據(jù)”的聯(lián)系(接口)。
戰(zhàn)略2:
支持研發(fā),以更好地探索和理解數(shù)據(jù)和知識的可信度,實現(xiàn)更佳決策,促進(jìn)突破性發(fā)現(xiàn)并采取有信心的行動。在數(shù)據(jù)驅(qū)動型決策中提高透明度需要提供技術(shù)和工具支持,包括可以在決策過程中顯示詳細(xì)審計信息的工具。另外,還需要對元數(shù)據(jù)框架進(jìn)行研究以保證數(shù)據(jù)的可信性,包括記錄上下文和語義數(shù)據(jù)。在使用機器學(xué)習(xí)的數(shù)據(jù)驅(qū)動型決策和發(fā)現(xiàn)系統(tǒng)時,跨學(xué)科研究是必要的,這樣才能研究清楚如何才能最有效地使用數(shù)據(jù)來支持和提高人類的判斷力。
戰(zhàn)略3:
建立和加強對網(wǎng)絡(luò)基礎(chǔ)設(shè)施的研究,使大數(shù)據(jù)創(chuàng)新可以為機構(gòu)使命提供支持。共同的基準(zhǔn)、標(biāo)準(zhǔn)和指標(biāo)對于一個運作良好的網(wǎng)絡(luò)基礎(chǔ)設(shè)施生態(tài)系統(tǒng)來說是必不可少的。參與式設(shè)計也是不可或缺的,它可以被用于優(yōu)化基礎(chǔ)設(shè)施的實用性并能將其影響降到最低。教育和培訓(xùn)對于個人能力的構(gòu)建來說也是至關(guān)重要的:用戶必須得到正確的教育和培訓(xùn),這樣才能充分利用提供給他們的工具。
戰(zhàn)略4:
通過促進(jìn)數(shù)據(jù)共享和管理政策來提高數(shù)據(jù)的價值。大數(shù)據(jù)的規(guī)模和異質(zhì)性為數(shù)據(jù)共享帶來了巨大挑戰(zhàn),因此需要鼓勵共享源數(shù)據(jù)、接口、元數(shù)據(jù)和標(biāo)準(zhǔn),鼓勵相關(guān)基礎(chǔ)設(shè)施提高互操作性,提高現(xiàn)有數(shù)據(jù)的可訪問性和價值,并增強結(jié)合數(shù)據(jù)集進(jìn)行新的分析的能力。研究“人類—數(shù)據(jù)”的聯(lián)系(接口)來說是必要的,研究可以支持靈活、高效和可用的數(shù)據(jù)接口的發(fā)展,適應(yīng)不同的用戶群體的特定需求。
戰(zhàn)略5:
了解大數(shù)據(jù)的收集、共享和使用方面的隱私、安全和道德問題。隱私、安全和道德問題是大數(shù)據(jù)創(chuàng)新生態(tài)系統(tǒng)中的關(guān)鍵因素。對于保護隱私和澄清數(shù)據(jù)所有權(quán)來說,新的政策解決方案可能也是必要的。當(dāng)高度分布式的網(wǎng)絡(luò)在大數(shù)據(jù)的應(yīng)用場景變得越來越普遍時,技術(shù)和工具也需要被用于輔助評估數(shù)據(jù)的安全性和數(shù)據(jù)保護。國家必須在大數(shù)據(jù)中提倡道德觀念,確保技術(shù)不會傳播錯誤或?qū)δ承┤后w造成不利(無論是明示或暗示)。探索道德問題的大數(shù)據(jù)研究,將使各方利益相關(guān)者在關(guān)注大數(shù)據(jù)創(chuàng)新的效用、風(fēng)險和成本的同時,更好地考慮價值和社會倫理。
戰(zhàn)略6:
改善全國的大數(shù)據(jù)教育和培訓(xùn)局面,以滿足對更廣泛勞動力深層分析型人才和分析能力日益增長的需求。制定一個全面的教育戰(zhàn)略是必要的,這可以滿足大數(shù)據(jù)領(lǐng)域?qū)趧恿Σ粩嘣鲩L的需求,還能確保美國保持經(jīng)濟競爭力。隨著科學(xué)研究領(lǐng)域的數(shù)據(jù)越來越豐富,科學(xué)家需得到機會進(jìn)一步完善自身的數(shù)據(jù)科學(xué)技能。所有部門的員工和管理人員都需要參加各種培訓(xùn),包括“新兵訓(xùn)練營”、專業(yè)研討會和證書課程,以學(xué)習(xí)與工作相關(guān)的大數(shù)據(jù)知識。還需要開設(shè)更多的基礎(chǔ)性大學(xué)課程和其他短期培訓(xùn)來幫助將更多民眾改造成為具備數(shù)據(jù)能力的公民。數(shù)據(jù)科學(xué)訓(xùn)練應(yīng)該通過在線課程、公民科學(xué)項目與中小學(xué)教育覆蓋到所有人。
戰(zhàn)略7:
創(chuàng)建和加強國家大數(shù)據(jù)創(chuàng)新生態(tài)系統(tǒng)的聯(lián)系。應(yīng)該建立持續(xù)的機制來提高聯(lián)邦機構(gòu)在大數(shù)據(jù)領(lǐng)域進(jìn)行合作的能力。第一種可能的機制是建立跨機構(gòu)“開發(fā)沙盒”或測試平臺,它們可以幫助聯(lián)邦機構(gòu)合作開發(fā)新技術(shù),并實現(xiàn)研發(fā)成果的產(chǎn)業(yè)化。第二種機制是制定政策,允許數(shù)據(jù)進(jìn)行跨部門邊界的快速和動態(tài)共享,以應(yīng)對緊急優(yōu)先事項,如國家災(zāi)害。第三種機制是建立大數(shù)據(jù)“基準(zhǔn)中心”,專注于重大挑戰(zhàn)的應(yīng)用,并幫助確定必要的數(shù)據(jù)集、分析工具和互操作性要求,以此來實現(xiàn)關(guān)鍵的國家優(yōu)先目標(biāo)。第四,需要建立一個由各聯(lián)邦機構(gòu)從業(yè)者組成的強有力團體,以此來促進(jìn)快速創(chuàng)新,為研究投資帶來最大的回報。
美國:大數(shù)據(jù)國家戰(zhàn)略
“數(shù)據(jù)是一項有價值的國家資本,應(yīng)對公眾開放,而不是把其禁錮在政府體制內(nèi)。”
——美國聯(lián)邦政府
作為大數(shù)據(jù)的策源地和創(chuàng)新引領(lǐng)者,美國大數(shù)據(jù)發(fā)展一直走在全球最前面。
此中關(guān)鍵:
1、動力
首先是多年的技術(shù)沉淀和創(chuàng)新積累,包括從計算機革命開始以來的硅谷創(chuàng)新力和影響力,以及一大批的領(lǐng)軍企業(yè),包括谷歌、微軟、EMC、SAP、微軟這樣的巨頭,也包括像Facebook、Splunk、Teradata這些創(chuàng)新的公司,硅谷精神和創(chuàng)新力量在美國大數(shù)據(jù)發(fā)展方面的作用,是任何其他國家短期都無法復(fù)制和匹敵的巨大力量。
而且,自上世紀(jì)以來美國國會、政府先后出臺一系列法規(guī),對數(shù)據(jù)的收集、發(fā)布、使用和管理等諸環(huán)節(jié)都做出了具體的規(guī)定。經(jīng)過幾十年的修改完善,如今美國數(shù)據(jù)、信用和隱私已形成較為成熟的法律框架和道德規(guī)范。2010年,美國國會通過更新法案,進(jìn)一步提高了數(shù)據(jù)采集精度和上報頻度,使得美國數(shù)據(jù)采集和匯聚體系更加成熟。
美國企業(yè)也擁有對于數(shù)據(jù)重視和應(yīng)用的歷史傳統(tǒng),IT基礎(chǔ)設(shè)施的完善,以及各種精準(zhǔn)營銷理論和實踐美國都是走在世界前列,比如基于消費數(shù)據(jù)、信用卡數(shù)據(jù)挖掘的精準(zhǔn)營銷等,還有電話、DM印刷品和郵件營銷在美國都很興盛,隨著互聯(lián)網(wǎng)興起,谷歌、IBM、YAHOO等美國企業(yè)對基于網(wǎng)絡(luò)的精準(zhǔn)營銷又是走在全球的前列。因而大數(shù)據(jù)最典型案例中,就包括傳統(tǒng)企業(yè)沃爾瑪“啤酒+尿布”案例,以及谷歌公司通過大數(shù)據(jù)分析成功地預(yù)測流感爆發(fā)等。
更加重要的是美國政府?dāng)?shù)據(jù)開放和支持力量。美國政府的數(shù)據(jù)開放一直是走在全球前列的,尤其是在奧巴馬政府簽署《透明和開放的政府》文件之后。2012年5月美國數(shù)字政府戰(zhàn)略發(fā)布,更是提出要通過協(xié)調(diào)化的方式,以信息和客戶為中心,改變聯(lián)邦政府工作方式,為美國民眾提供更優(yōu)公共服務(wù)。其中關(guān)鍵,就是政府必須保證美國民眾可以隨時隨地通過任何平臺或設(shè)備獲取政府信息和公共服務(wù)。
2、數(shù)據(jù)開放
美國最重要的數(shù)據(jù)開放平臺就是奧巴馬政府在2009年推出的Data.gov,Data.gov 也是美國“開放政府”承諾的關(guān)鍵部分。依照原始、地理數(shù)據(jù)和數(shù)據(jù)工具三個門類,截至2012年11月,Data.gov共開放出了388529項原始數(shù)據(jù)和地理數(shù)據(jù),涵蓋了農(nóng)業(yè)、 氣象、金融、就業(yè)、人口統(tǒng)計、教育、醫(yī)療、交通、能源等大約50個門類,匯集了“從家庭和企業(yè)能耗趨勢分析到全球?qū)崟r地震通知等,甚至還可以查詢從好奇號火星漫步者發(fā)回來的數(shù)據(jù)中得知火星的天氣情況”。為方便公眾使用和分析,Data.gov平臺還加入了數(shù)據(jù)的分級評定、高級搜索、用戶交流以及和社會交網(wǎng)站互動等新功能,比如在Data.gov上提供的白宮訪客搜索工具,不僅能夠搜索到訪客信息,并可以將白宮訪客與其他微博、社交網(wǎng)站等進(jìn)行關(guān)聯(lián),進(jìn)一步增加了訪客的透明度。
為了更方便民眾使用,方便應(yīng)用領(lǐng)域的開發(fā)者可以利用這些數(shù)據(jù)開發(fā)應(yīng)用滿足公共需求或者進(jìn)行創(chuàng)業(yè),Data.gov還匯集了1264個應(yīng)用程序和軟件工具、103個手機應(yīng)用插件。另外,Data.gov還發(fā)布了政府API索引,使得這些資源可以更易找到和便于使用。通過開放API接口,Data.gov讓政府的信息和服務(wù)交付更加便捷,也讓公眾和企業(yè)家在構(gòu)建更佳政府、提升服務(wù)的過程中成為合作伙伴。美國政府也希望并鼓勵公眾(開發(fā)者、創(chuàng)業(yè)者和企業(yè)家)能夠積極加入進(jìn)來,成為這一進(jìn)程中的一部分。據(jù)報道有很多的公司已經(jīng)利用data.gov上提供的氣象信息來提供服務(wù),另外一些公司則基于data.gov上的地理位置信息,提供基于位置的服務(wù)來盈利。
今年起美國還和印度一道,對data.gov實行了開源,把代碼托管到GitHub上以供各國的開發(fā)者使用或者根據(jù)需要修改。通過構(gòu)建OGPL平臺,提供開源的政府平臺代碼并允許任何城市、組織或者政府機構(gòu)創(chuàng)建開放站點,美國政府可以進(jìn)一步推動數(shù)據(jù)開放運動進(jìn)程。美國政府還成立了“數(shù)字服務(wù)創(chuàng)新中心”,開發(fā)了Sites.USA.Gov網(wǎng)站來幫助各機構(gòu)建設(shè)即插即用型網(wǎng)站,同時政府出臺移動應(yīng)用程序開發(fā)項目,幫助各機構(gòu)對移動應(yīng)用程序進(jìn)行規(guī)劃、測試、開發(fā)和發(fā)布,確保更加安全和高效。
美國政府提出,數(shù)據(jù)是一項有價值的國家資本,應(yīng)對公眾開放,而不是把其禁錮在政府體制內(nèi)。例如在美國www.fedspending.org網(wǎng)站上,公眾能夠逐條跟蹤、記錄、分析聯(lián)邦政府每一筆財政支出。另外,美國政府?dāng)?shù)據(jù)開放也跟美國民眾對于個人隱私和自由的重視和立法分不開的,正如涂子沛在《大數(shù)據(jù)》一書中所指出的,和美國人“用納稅人的錢收集的數(shù)據(jù)應(yīng)該免費提供給納稅人使用”觀念也密切相關(guān)。
3、數(shù)據(jù)服務(wù)
為了確保美國民眾能方便快捷地找到政府服務(wù)欄目,美國在各聯(lián)邦政府層面實施了“數(shù)字分析項目”。“這是政府IT部門第一次摸清公眾都在網(wǎng)站上尋找什么信息、在哪里尋找這些信息,以及他們是否能夠順利找到信息等情況。”政府IT部門還對聯(lián)邦政府網(wǎng)站在移動設(shè)備上的使用進(jìn)行了優(yōu)化,并開發(fā)了移動應(yīng)用程序,確保美國公民隨時、隨地、通過任何設(shè)備都能獲取政府信息。例如,美國人力管理辦公室開發(fā)的USA Jobs應(yīng)用程序,可以方便求職者通過移動設(shè)備查找和申請職位;交通部開發(fā)的Safer Bus應(yīng)用程序,可以讓老百姓查詢到公交公司的安全行駛記錄,也可通過手機提交投訴建議。
佛羅里達(dá)州邁阿密戴德縣將數(shù)十種關(guān)鍵縣政工作和邁阿密市緊密聯(lián)系起來,幫助政府在制定治理水資源、減少交通擁堵和提升公共安全等方面決策時提供了更好的信息支撐;美國中央情報局的首席技術(shù)官格斯·漢特在舊金山舉行的一次討論會上解釋的大數(shù)據(jù)技術(shù)對追蹤恐怖分子和監(jiān)控社會情緒的作用。漢特認(rèn)為,就像可口可樂等消費公司借助數(shù)據(jù)分析掌握消費者習(xí)慣一樣,中情局也通過大數(shù)據(jù)技術(shù)來尋找恐怖分子的蹤跡。西雅圖兒童醫(yī)院通過應(yīng)用可視化數(shù)據(jù)分析技術(shù),有效減少了醫(yī)療事故,幫助醫(yī)院節(jié)省了300萬美元的供應(yīng)鏈成本。華爾街“德溫特資本市場”公司則通過分析3.4億微博賬戶的留言,判斷民眾情緒,并依據(jù)人們高興時買股票、焦慮時拋售股票的規(guī)律,決定公司買賣股票的時機,從而獲取盈利。這些都是美國大數(shù)據(jù)各個領(lǐng)域應(yīng)用的典型案例。
4、推進(jìn)
開放數(shù)據(jù)、創(chuàng)新驅(qū)動以及技術(shù)研發(fā)支持下,美國大數(shù)據(jù)的研究和應(yīng)用已是走在全球前列。2013年5月,奧巴馬政府更是宣布了“大數(shù)據(jù)的研究和發(fā)展計劃。”提出“通過提高我們從大型復(fù)雜的數(shù)字?jǐn)?shù)據(jù)集中提取知識和觀點的能力,承諾幫助加快在科學(xué)與工程中的步伐,加強國家安全,并改變教學(xué)研究”。根據(jù)這一計劃,美國希望利用大數(shù)據(jù)技術(shù)在多個領(lǐng)域?qū)崿F(xiàn)突破,包括科研教學(xué)、環(huán)境保護、工程技術(shù)、國土安全、生物醫(yī)藥等,具體的研發(fā)計劃涉及了美國國家科學(xué)基金會、國家衛(wèi)生研究院、國防部、能源部、國防部高級研究局、地質(zhì)勘探局等6個聯(lián)邦部門和機構(gòu)。在斯坦福這樣的大學(xué)里也開始開設(shè)諸如機器學(xué)習(xí)這樣全新的課程,培養(yǎng)下一代的“數(shù)據(jù)科學(xué)家”。伯克利加州大學(xué)、迪肯大學(xué)等大學(xué)也專門開設(shè)了研究大數(shù)據(jù)的相關(guān)課程。如今,美國不僅是全球首個將大數(shù)據(jù)從商業(yè)行為上升到國家意志和國家戰(zhàn)略的國家,也是數(shù)據(jù)科學(xué)家和面向未來的大數(shù)據(jù)人才儲備啟動最早的國家。
2013年2月27日,由 TechAmerica Foundation 發(fā)布的一項新研究顯示,87%的聯(lián)邦政府 IT官員以及75%的州政府IT官員均認(rèn)為,大數(shù)據(jù)對政府工作發(fā)揮著立竿見影的實際作用。而由民意調(diào)查機構(gòu)Penn Schoen Berland進(jìn)行的調(diào)查顯示,在受訪的近200位聯(lián)邦I(lǐng)T官員中,有83%的聯(lián)邦政府IT官員表示“大數(shù)據(jù)解決方案可幫助政府削減至少10%的聯(lián)邦預(yù)算”,這些受訪官員還相信,“大數(shù)據(jù)還能通過改善醫(yī)療服務(wù),創(chuàng)造挽救生命的奇跡,并可以降低犯罪率并提高生活品質(zhì)”。
美國商務(wù)部CIO Simon Szykman表示:“(在美國)我們不存在挑戰(zhàn)的領(lǐng)域之一就是我們生成數(shù)據(jù)的能力。我們生成數(shù)據(jù)的基本能力提升很大,從很大程度上講,這一能力已超越了我們處理數(shù)據(jù)、管理數(shù)據(jù)和轉(zhuǎn)移數(shù)據(jù)的能力。” 他認(rèn)為如何管理數(shù)據(jù),并將數(shù)據(jù)從一點轉(zhuǎn)移到另一點,將是美國政府面臨的一大挑戰(zhàn)。而對全球來說,如何加工數(shù)據(jù),從數(shù)據(jù)中提煉出知識,將數(shù)據(jù)轉(zhuǎn)化生產(chǎn)力都是最大的挑戰(zhàn)。