汪洋:大數(shù)據(jù)是競爭的一個(gè)新的制高點(diǎn)

責(zé)任編輯:一三

2014-01-17 09:04:22

摘自:長江商業(yè)評論

所以,如何收集、保存、維護(hù)、管理、分析、共享正在成指數(shù)級增長的數(shù)據(jù),是我們必須面對的挑戰(zhàn)。

作者:汪洋,男,漢族,1955年3月生,安徽宿州人,1972年6月參加工作,1975年8月加入中國共產(chǎn)黨,中央黨校大學(xué)學(xué)歷,工學(xué)碩士學(xué)位?,F(xiàn)任中央政治局委員、國務(wù)院副總理。

休息這幾天,我看了兩本書,其中有一本是廣西師范大學(xué)出版社出版的,一個(gè)美籍的華人涂子沛寫的《大數(shù)據(jù)》,看以后非常有啟發(fā)。我推薦你們?nèi)珡d干部都看一下這本書,研究一下大數(shù)據(jù)時(shí)代。他這書里邊講,數(shù)據(jù)是對信息數(shù)字進(jìn)行解釋,賦予意義。進(jìn)入信息時(shí)代后,人們趨向把所有存儲在計(jì)算機(jī)上的信息,無論是數(shù)字還是音樂、視頻,都統(tǒng)稱為數(shù)據(jù)。2010年,美國總統(tǒng)科學(xué)技術(shù)委員會給總統(tǒng)和國會的報(bào)告寫了這么幾句話:數(shù)據(jù)正在呈指數(shù)級增長,聯(lián)邦政府的每個(gè)機(jī)構(gòu)和部門,都需要制定一個(gè)應(yīng)對“大數(shù)據(jù)”的戰(zhàn)略?,F(xiàn)在大數(shù)據(jù)戰(zhàn)略被認(rèn)為是世界下一個(gè)創(chuàng)新、競爭和生產(chǎn)力提高的前沿,是爭奪全世界的下一個(gè)前沿。你看,重要不重要。

書里面分析了政府?dāng)?shù)據(jù)有哪些來源和收集方式。他說了有三種來源,當(dāng)然有不同的收集方式。第一種來源,業(yè)務(wù)數(shù)據(jù)。包括你們要做的,就是業(yè)務(wù)數(shù)據(jù)。來源是下級部門和社會組織,是以基層上報(bào)、被動(dòng)接受為主。第二種數(shù)據(jù)是民意數(shù)據(jù),是單個(gè)公民或組織需要投入人力,財(cái)力去主動(dòng)收集,這樣的數(shù)據(jù)收集也是將來財(cái)政要?jiǎng)?chuàng)造環(huán)境的,要支付的。第三類數(shù)據(jù)是環(huán)境數(shù)據(jù)。這個(gè)環(huán)境不僅僅是我們說的大氣這些東西,他包括自然環(huán)境、動(dòng)植物以及物體,以傳感器自動(dòng)釆集為主。物體包括汽車,包括運(yùn)輸物、動(dòng)植物。

所以,如何收集、保存、維護(hù)、管理、分析、共享正在成指數(shù)級增長的數(shù)據(jù),是我們必須面對的挑戰(zhàn)。剛才我問了你們國庫處,動(dòng)態(tài)監(jiān)控?cái)?shù)據(jù)能有多少字節(jié),能不能有多少G,你們說達(dá)不到,還是K級的。大數(shù)據(jù)是什么概念呢,就是至少是太字節(jié)的,從字節(jié)來講是2的40次方字節(jié),是相當(dāng)大的數(shù)量。大數(shù)據(jù)時(shí)代來了,我們要搞這些數(shù)據(jù),對我們政府有什么意義呢。將來引導(dǎo)我們政府前進(jìn)的是基于實(shí)證的事實(shí),不是意識形態(tài),也不是利益集團(tuán)在政府決策過程中施加的影響。我們基于這些數(shù)據(jù)說話,將使政府更有效率、更加開放、更加透明。

這個(gè)書里舉了很多例子,我看了之后非常有啟發(fā)。比如講美國的交通史。1966年,美國有9400萬輛汽車時(shí),交通事故死了5萬人,這是他的最高峰;但是到了2009年,他是2億4000萬輛汽車,但是只死了3萬人。汽車大幅度增加,死亡人數(shù)卻大幅度減少。我不知道我們現(xiàn)在多少輛車,反正一年死十幾萬人是有的。為什么下降了,就是他們通過對數(shù)據(jù)的分析。分析以后發(fā)現(xiàn),一年12個(gè)月,5、6、7、8月事故率是最高的;每一周,禮拜六、禮拜天事故率最高;一天里邊,下午6點(diǎn)到晚上9點(diǎn)事故率最高;什么天氣是事故率最高的,當(dāng)然跟你們想的都不一樣,不是下雨天、雨雪天,正常天氣事故率是最高的。然后什么年齡段事故率最高,就是24歲—35歲,44歲—55歲,這兩個(gè)年齡段最高。這個(gè)分析過以后,然后有針對性的措施。當(dāng)然有些數(shù)據(jù),他分析的更具體。為什么有的州高,有的州低,發(fā)現(xiàn)事故率高的州高速公路彎比較大,事故都是右側(cè)的事故,就是因?yàn)閺澅容^大。有的事故率低,就是發(fā)現(xiàn)這個(gè)地方警察經(jīng)常查系安全帶,所以事故率低,那個(gè)事故率高的地區(qū)是沒查安全帶所以一系列數(shù)據(jù)收集分析,改進(jìn)以后結(jié)果事故率就下降了。車子從不到1個(gè)億,增加到2億4600萬,但是死亡率下降。這個(gè)非常有用啊。

另外,美國人現(xiàn)在開始在數(shù)據(jù)上打假,美國人的福利比較好,所以把所有的數(shù)據(jù)都輸進(jìn)去,然后通過計(jì)算機(jī)設(shè)計(jì)軟件,一旦發(fā)現(xiàn),馬上就去查福利濫用的情況。社會治安也是利用數(shù)據(jù)去分析,包括911之后的情況?,F(xiàn)在美國已在有專門的機(jī)構(gòu),來負(fù)責(zé)收集、研究、使用數(shù)據(jù),商業(yè)也好,政府也好,來研究這個(gè)數(shù)據(jù)的發(fā)展。

比如沃爾瑪,沃爾瑪通過他的銷售數(shù)據(jù),分析過以后發(fā)現(xiàn),每到禮拜六、禮拜天,有兩樣?xùn)|西是成比例的增長,啤酒和尿布。關(guān)于這個(gè),你知道為什么呢,后來就發(fā)現(xiàn),禮拜六、禮拜天常常就是女人在家做事,男人到購物店買東西,買東西就買尿布,買尿布的時(shí)候男人就想,挺辛苦的買點(diǎn)啤酒犒勞自已。所以啤酒和尿布就一塊增加了。你很多是想不到的。數(shù)據(jù)你注意使用它。

馬云最近來找我聊了一次。他當(dāng)時(shí)就跟我說,你08、09年到杭州去,讓我到廣州來賣貨,我跟你說說這幾年賣廣貨的效果。08年一年,他在淘寶網(wǎng)賣了177億廣貨,今年可以賣到1700億,就是四年是十倍。另外聊一聊他就講,他現(xiàn)在他覺得數(shù)據(jù)是他的競爭力。他當(dāng)然講了個(gè)例子。他說你想不到,全中國比基尼賣的最好的是哪幾個(gè)省。然后就說,你絕對想不到。一般人認(rèn)為,肯定賣的好的是廣東,海南島,他說賣的最好的從淘寶上看,是新疆和內(nèi)蒙。他說,估計(jì)每一個(gè)男人,都要給他的夫人、情人和對象有一個(gè)美好的憧憬,有一天我?guī)闳ハ潞?。?dāng)然這是他的一種解釋,但是能反映什么呢,就是這些數(shù)據(jù)和你想象的不是一個(gè)概念。如果商家掌握了這個(gè)東西,其實(shí)你比基尼廣告的重點(diǎn)不要放在廣東做,你放到新疆、內(nèi)蒙去做啊,這效果可能就不大一樣了。

對于政府工作來講,同樣如此。我看這個(gè)書里寫,流感對于美國人是一個(gè)非常大的事情。美國人對于的流行病學(xué)的各種調(diào)查就是掌握不了流感的規(guī)律。后來想到從2萬多家藥店的銷售記錄中間,把這個(gè)數(shù)據(jù)拿來、分析,分析后發(fā)現(xiàn),一般在全國流行性感冒的前兩周,藥店的感冒藥增加的比較快。也就是增加的比較快兩周以后,全國的流行性感冒來了,政府就需要增加對流行性感冒預(yù)防的措施。他們就分析為什么呢,因?yàn)榇蟛糠秩碎_始有感冒癥狀的時(shí)候,沒有意識是個(gè)問題,就到藥店買點(diǎn)藥吃。一旦增加了,藥店的藥增加了,估計(jì)下兩個(gè)星期后,醫(yī)院的人就要增加了,這個(gè)時(shí)候預(yù)防措施就要開始了。

所以這個(gè)數(shù)據(jù)是非常重要的問題,我們將正式進(jìn)入一個(gè)數(shù)據(jù)為王的時(shí)代。李嘉誠也是有這樣的看法,他前不久給我寫了一封信,說人工智能和大數(shù)據(jù)技術(shù)的普及化,勢必令不同行業(yè)和教育系統(tǒng)的范式轉(zhuǎn)變。他說這個(gè)范式我估計(jì)是香港說法,就是模式。不同行業(yè)都是這樣的,你比如講他這個(gè)書里講的,政府掌握數(shù)據(jù)往往關(guān)系到行業(yè)標(biāo)準(zhǔn),比如單位牛奶中的蛋白質(zhì)含量,菌落群數(shù)應(yīng)該是多少,飲用水里面能混雜多少含量的微量元素,新鮮蔬菜能帶多少指標(biāo)的殺蟲劑殘留,每個(gè)指標(biāo)的變化,即使只有零點(diǎn)幾,都會影響到一個(gè)行業(yè)的競爭,改變一個(gè)產(chǎn)業(yè)。這個(gè)數(shù)據(jù)非常重要。而這個(gè)數(shù)據(jù)最后實(shí)際上都涉及到利益,所以你政府掌握不掌握這些數(shù)據(jù),在制定政策的時(shí)候,特別是個(gè)各個(gè)行業(yè)、企業(yè)利益博弈的時(shí)候,你可能就會陷入被動(dòng)。你們看這本書里也有這樣的例子。在美國,存在一個(gè)龐大的說客集團(tuán)。華盛頓最大的產(chǎn)業(yè),第一是旅游,第二就是說客。他們代表企業(yè)和行業(yè)的利益,游說政府的政策制定,這里面都涉及到利益。政府不掌握這些數(shù)據(jù),就有可能被掌握這些數(shù)據(jù)的行業(yè)集團(tuán)所影響操控,政府的決策就不可能科學(xué),特別像財(cái)政,更是如此。

而起我想說,政府的數(shù)據(jù)是要公開的,當(dāng)然公開也是一種博弈。剛才我已經(jīng)講過,我們掌握的一些數(shù)據(jù),比如“三公”經(jīng)費(fèi)信息,公開之后,它的好處是什么呢,實(shí)際上是創(chuàng)造一個(gè)社會幫助我們改進(jìn)工作的機(jī)會。最近我看了些書,有個(gè)一觀點(diǎn),下一步的改革,實(shí)際上就是政府要調(diào)動(dòng)民間的力量對利益格局進(jìn)行調(diào)整。因?yàn)槟銌慰空呀?jīng)搞不動(dòng)了,那怎么辦呢,就是要讓社會、民間參與其中。其實(shí)我們公開“三公”經(jīng)費(fèi)信息,就是調(diào)動(dòng)社會力量促進(jìn)我們改進(jìn)工作。

這個(gè)東西你們可以去看那本書,書中就有這樣的例子。比如說奧巴馬上任后就搞了個(gè)信息公開化的承諾,故事你們可以在書中找,過程很有意思。最后在120天內(nèi)搞了個(gè)規(guī)劃,吵得一塌糊涂,跟我們搞放權(quán)一樣,大家在公開的場合都贊成,一到具體要公開本部門的信息的時(shí)候都說,我這個(gè)部門的數(shù)據(jù)不能公開。但是美國的聯(lián)邦政府的首席信息官維偉克·昆德拉,一個(gè)年輕的印度裔移民,他很有辦法,他先從一些沒有爭議的數(shù)據(jù)開始,并快刀斬亂麻,推出了一個(gè)技術(shù)平臺并不斷完善。一旦數(shù)據(jù)公開走上軌道了,群眾就會監(jiān)督,向更多部門和領(lǐng)域提出數(shù)據(jù)公開的要求。美國有個(gè)信息自由法,只要人家向部門提出信息公開的要求,相關(guān)部門就要回復(fù),部門不愿意公開要說明理由,人家接受就可以不公開,人家不接受可以去起訴部門。所以現(xiàn)在政府公布的信息越來越多。

公開的好處是什么呢?以美國的民航業(yè)為例,美國民航的正點(diǎn)率比我要高很多了,它是如何做到的呢?現(xiàn)在美國交通部開放了全美航班起飛、到達(dá)、延誤的數(shù)據(jù),那當(dāng)然也是海量的。公布之后,有人就利用這些數(shù)據(jù)開發(fā)了一個(gè)航班延誤時(shí)間的分析系統(tǒng),并向全社會免費(fèi)開放。通過這個(gè)可視化的軟件,任何人都清楚的看到:晚點(diǎn)最少是哪個(gè)航空公司,晚點(diǎn)最多的是哪個(gè)航空公司,一般晚點(diǎn)多少時(shí)間;在各個(gè)航線上,哪個(gè)晚點(diǎn)最多,哪個(gè)晚點(diǎn)最少,哪個(gè)正點(diǎn)率最高,它把這些排列出來,一目了然。這個(gè)是民間開發(fā)的軟件,不是政府開發(fā)的,政府只是把基礎(chǔ)數(shù)據(jù)公開了。這樣做的結(jié)果呢,就是美國民航的誤點(diǎn)率逐步減少,滿意率不斷提高,而且政府也沒有承擔(dān)軟件開發(fā)的費(fèi)用,只是把這個(gè)信息公開了,卻達(dá)到了三贏的目的。這里面能看出個(gè)規(guī)律,部門公開數(shù)據(jù),公眾提出意見,部門根據(jù)意見再改進(jìn)工作,當(dāng)然了,這里面也有很多博弈。

這本書中還寫到,萬維網(wǎng)之父,蒂姆·蕭伯納·李在2009年的一次演講中說過一句話,“原始數(shù)據(jù),現(xiàn)在就要!”我看到這里,很受啟發(fā),我們中國人,包括在各個(gè)領(lǐng)域,對數(shù)據(jù)的概念和作用的重視,還是很不夠,從某種意義上來說是我們做這個(gè)工作的重要契機(jī)。就像改革開放初期,我們的農(nóng)民對土地的重要性認(rèn)識不足一樣,我們那時(shí)有意識地把土地拿在手里。歐廣源當(dāng)縣委書記的時(shí)候,搞了幾千畝地,到現(xiàn)在都覺得當(dāng)時(shí)很有遠(yuǎn)見,那時(shí)候征地費(fèi)用沒那么高,大家也沒覺得地會像現(xiàn)在這么值錢,結(jié)果你意識到了,你把這些地拿到手了,就成為后來競爭的重要資源?,F(xiàn)在我們?nèi)鐣矝]有意識到這些數(shù)據(jù)的重要,你們的工作對象也沒有意識到這一點(diǎn),這個(gè)時(shí)候,是收集數(shù)據(jù)最好的時(shí)候。

作者在書的最后,提出希望我們國家重視數(shù)據(jù)。他寫到中國人數(shù)據(jù)意識的淡薄由來已久,甚至可以稱之為國民性的一部分。胡適曾經(jīng)寫過,我們中國人是“差不多”先生,什么事情都“差不多”就行,不注意數(shù)據(jù)的收集、整理和使用。他舉了個(gè)例子,麥肯錫公司以2010年度各國新增的存儲器為基準(zhǔn),對全世界的大數(shù)據(jù)的分布做了一個(gè)研究和統(tǒng)計(jì),中國2010年度新增的數(shù)據(jù)量為250拍(PB,1PB=1204TB=250字節(jié)),不及日本的400拍、歐洲的2000拍,和美國的3500拍相比,更是連十分之一都不到。但是我們中國卻是全世界第一手機(jī)大國,第一互聯(lián)網(wǎng)用戶大國,實(shí)際上我們只是把這些數(shù)據(jù)收集起來,就能發(fā)現(xiàn)很多問題。我說過,上次分析經(jīng)濟(jì)形勢的時(shí)候,讓移動(dòng)和聯(lián)通把相關(guān)數(shù)據(jù)拿來,就可以看出許多問題。

所以我就想,如果我們能像三十年前政府可以輕易的擁有土地一樣,現(xiàn)在抓緊時(shí)間搜集數(shù)據(jù)、使用數(shù)據(jù),這是競爭的一個(gè)新的制高點(diǎn)。因?yàn)樵傧乱徊剑紤]到隱私權(quán)的問題,將來再收集個(gè)人數(shù)據(jù)就沒有那么容易了,另外單位里面的數(shù)據(jù)也可能會存在越來越多的保護(hù)舉措。所以我覺得,現(xiàn)在財(cái)政的數(shù)據(jù)收集、分析、使用以及公布會極大的促進(jìn)收入、改進(jìn)支出、提高財(cái)政工作水平。

所以我希望大家能認(rèn)真讀一讀這本書,帶著問題讀、帶著想法讀,怎么樣促進(jìn)財(cái)政數(shù)據(jù)的收集,怎么樣加強(qiáng)財(cái)政數(shù)據(jù)的分析,怎么樣挖掘數(shù)據(jù)背后有利于我們增加收入、改進(jìn)支出的有用因素,然后逐步推進(jìn)財(cái)政數(shù)據(jù)的公布,調(diào)動(dòng)全社會監(jiān)督的力量,使我們的工作水平不斷提高。將來這個(gè)社會是個(gè)開放的社會,有興趣的人他會提出意見。

我相信,你們拿這本書去看一看,如果能帶著問題去想,帶著問題去做,會比我今天講的所有內(nèi)容都會對財(cái)政工作有更大的益處,而且不是一天,將會發(fā)揮長期的作用。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號