《大數(shù)據(jù)》和《數(shù)據(jù)之巔》兩本書的作者涂子沛先生,不久前從美國硅谷回國,到阿里巴巴集團(tuán)擔(dān)任了副總裁。他在很短的時(shí)間內(nèi),又寫了多篇關(guān)于大數(shù)據(jù)的文章。在接受采訪回答為什么回國的問題時(shí),他再次強(qiáng)調(diào)了在《數(shù)據(jù)之巔》一書中的觀點(diǎn),即“我國信息產(chǎn)業(yè)與工業(yè)、農(nóng)業(yè)相比,與世界的差距是非常小的。在信息技術(shù)領(lǐng)域的應(yīng)用創(chuàng)新,我們中國有能力有機(jī)遇和一流的發(fā)達(dá)國家比肩齊驅(qū)”。
他的這個(gè)觀點(diǎn),早在2012年12月與多位美籍華裔專家學(xué)者、企業(yè)家、官員做客國家統(tǒng)計(jì)局時(shí)就有過表達(dá)。他與同行者還期待中國的統(tǒng)計(jì)工作能夠在應(yīng)用大數(shù)據(jù)方面走在世界前列。兩年過去了,看來,他的看法沒有變。實(shí)際情況也確實(shí)如此。在去年10月底在北京召開的大數(shù)據(jù)國際會(huì)議上,當(dāng)一個(gè)發(fā)言者介紹利用手機(jī)掌握旅游人數(shù)時(shí),就有參會(huì)者提醒這樣的數(shù)據(jù)并不符合抽樣調(diào)查的代表性;當(dāng)有人提出谷歌后來預(yù)測流感誤差很大時(shí),也有人表示并不能因此否定其此前所做的努力。大家不僅在用相同的語言談?wù)撓嗤膯栴},而且許多人在許多問題上真的心有靈犀。大會(huì)的發(fā)言與討論都表明,中國統(tǒng)計(jì)在應(yīng)用大數(shù)據(jù)方面依然與世界同步前行。那么,再過兩年、三年、四年,這種局面是否依然如是,或是中國統(tǒng)計(jì)已經(jīng)創(chuàng)造出領(lǐng)先世界的成功經(jīng)驗(yàn)?關(guān)鍵在于我們能否盡早突破大數(shù)據(jù)應(yīng)用中的“瓶頸”。
研究表明,大數(shù)據(jù)有多種來源、多種類型。而大數(shù)據(jù)在政府統(tǒng)計(jì)中的應(yīng)用,大致涉及兩個(gè)方面,即大數(shù)據(jù)信息本身以及獲取這些信息所需要的技術(shù),且后者顯然要以前者為前提。只有清晰地知道我們要搜集什么信息、從哪里搜集、搜集信息要達(dá)到什么目的,才能提出明確的技術(shù)需求。而在利用大數(shù)據(jù)信息方面,最主要、最重要的內(nèi)容,就是不斷取得越來越多的企業(yè)在生產(chǎn)經(jīng)營過程中產(chǎn)生的越來越多的大數(shù)據(jù)信息。第一,是直接利用企業(yè)的大數(shù)據(jù)產(chǎn)品。如阿里巴巴的全網(wǎng)網(wǎng)購價(jià)格指數(shù)、百度搜索指數(shù)及中小企業(yè)景氣指數(shù)、卓創(chuàng)大宗商品出廠價(jià)格指數(shù)等,都已經(jīng)納入統(tǒng)計(jì)部門的大數(shù)據(jù)旬報(bào)。第二,是與大數(shù)據(jù)企業(yè)共同開發(fā)新的大數(shù)據(jù)產(chǎn)品。如泛亞有色金屬交易所在統(tǒng)計(jì)專家的指導(dǎo)下,研發(fā)出泛亞有色金屬交易指數(shù);1號(hào)店在上海統(tǒng)計(jì)部門的指導(dǎo)下,開發(fā)了1號(hào)店快速消費(fèi)品價(jià)格指數(shù)。在以上兩個(gè)方面,都已經(jīng)有多項(xiàng)大數(shù)據(jù)產(chǎn)品成為了統(tǒng)計(jì)部門分析判斷經(jīng)濟(jì)形勢的參考。不是要替代現(xiàn)有的統(tǒng)計(jì)指標(biāo),而是多了一個(gè)參照系。特別是在諸多專業(yè)統(tǒng)計(jì)只有月報(bào)數(shù)據(jù)、且要經(jīng)過若干環(huán)節(jié)才能出數(shù)的時(shí)候,一些以周報(bào)、旬報(bào)反映、乃至可以時(shí)時(shí)反映的大數(shù)據(jù)產(chǎn)品,就補(bǔ)充了現(xiàn)行統(tǒng)計(jì)制度及指標(biāo)的不足,且可以成為我們?cè)u(píng)估數(shù)據(jù)質(zhì)量時(shí)的一種依據(jù)。第三,也是最最主要和最最重要的一點(diǎn)是,獲取大數(shù)據(jù)基礎(chǔ)數(shù)據(jù),使其真正成為政府統(tǒng)計(jì)數(shù)據(jù)源的第二軌。在這方面,諸多專業(yè)都在努力探索,但尚未取得實(shí)質(zhì)性的突破。而在人們的衣食住行都已越來越多地融入浩瀚的大數(shù)據(jù)洪流、成為其中一朵朵浪花的大勢下,打造第二軌的時(shí)間、內(nèi)容、形式和規(guī)模,都決定了中國政府統(tǒng)計(jì)在應(yīng)用大數(shù)據(jù)方面能否繼續(xù)與世界并駕齊驅(qū)、乃至走在世界前列。
毫無疑問,相關(guān)的法律法規(guī)的完善是必需且急迫的。只有健全且強(qiáng)有力的法制保障,才能使政府統(tǒng)計(jì)在保護(hù)個(gè)人隱私和企業(yè)秘密的前提下,及時(shí)獲得所需的涉及第三方的大數(shù)據(jù)信息。統(tǒng)計(jì)指標(biāo)、統(tǒng)計(jì)標(biāo)準(zhǔn)、各種分類、產(chǎn)品編碼的對(duì)應(yīng)與轉(zhuǎn)換也是應(yīng)該并可以著手去做的,且數(shù)據(jù)處理技術(shù)的研發(fā)也可以與制度方法的研究同步跟進(jìn)。而最可以做、最有意義、最可以取得成果和突破的是,借鑒張保羅先生曾介紹過的新加坡經(jīng)驗(yàn),在部分城市進(jìn)行試點(diǎn),建立起企業(yè)向政府統(tǒng)計(jì)部門提供電子交易記錄的制度。可以在不同區(qū)域選擇有關(guān)行業(yè)規(guī)上企業(yè)和采價(jià)點(diǎn)作為試點(diǎn)單位,要求其提供全部電子交易記錄。在此基礎(chǔ)上,進(jìn)行專業(yè)指標(biāo)特別是代表規(guī)格品的抽取和測算,總結(jié)經(jīng)驗(yàn),逐步推廣。如果新加坡在全國可以這樣做,至少在我們大中城市中的商場和超市也可以逐步做到。屆時(shí),大數(shù)據(jù)的應(yīng)用就又會(huì)取得新的實(shí)質(zhì)性進(jìn)展。