近年來(lái),以海量數(shù)據(jù)為基礎(chǔ),以網(wǎng)絡(luò)信息技術(shù)為支撐,以數(shù)據(jù)挖掘和分析為途徑,以提高生產(chǎn)力為目標(biāo)的大數(shù)據(jù)浪潮席卷全球。面對(duì)“大數(shù)據(jù)熱”,作為重要民生指標(biāo)之一的居民消費(fèi)價(jià)格指數(shù)——CPI應(yīng)積極成為參與者,而不是旁觀者。CPI調(diào)查如何利用大數(shù)據(jù)?其中既有挑戰(zhàn),也有啟示。
三要素挑戰(zhàn)傳統(tǒng)
《大數(shù)據(jù)時(shí)代》作者舍恩伯格認(rèn)為,大數(shù)據(jù)思維區(qū)別于傳統(tǒng)數(shù)據(jù)思維主要有三個(gè)轉(zhuǎn)變:一是要全體不要抽樣;二是要效率不要絕對(duì)精確;三是要相關(guān)不要因果。這種大數(shù)據(jù)思維對(duì)以抽樣調(diào)查為基礎(chǔ)、以“三定一直”為手段,以同質(zhì)可比為原則、以原因分析為目標(biāo)的CPI調(diào)查帶來(lái)了挑戰(zhàn)。
抽樣調(diào)查和“樣本=總體”。傳統(tǒng)CPI調(diào)查在進(jìn)行制度與方案設(shè)計(jì)后,通過(guò)抽樣調(diào)查,實(shí)現(xiàn)對(duì)總體情況的描述和推測(cè)。按目前CPI調(diào)查制度,全部262個(gè)基本分類中,除了鮮菜、鮮瓜果等少數(shù)類代表規(guī)格品數(shù)量較多外,絕大多數(shù)基本分類所需的最低代表規(guī)格品數(shù)量?jī)H為1-3個(gè)。實(shí)踐中,受人力、物力、財(cái)力限制,除少數(shù)大城市規(guī)格品數(shù)量較多外,多數(shù)市縣只達(dá)到制度要求的最低水平或略多一點(diǎn)。但從消費(fèi)市場(chǎng)看,改革開(kāi)放以來(lái),消費(fèi)品和服務(wù)的種類呈現(xiàn)了爆炸式的增加,以與居民生活密切相關(guān)的食用植物油為例,食用植物油按照原材料不同可以分為花生油、大豆油、玉米油、菜籽油、葵花籽油、棕櫚油、茶油、橄欖油、芝麻油、亞麻籽油等,如果算上不同品牌,衍生出來(lái)的具體規(guī)格品數(shù)量可能有數(shù)百種甚至更多,而現(xiàn)行方法制度規(guī)定最低規(guī)格品數(shù)量為3個(gè)。盡管傳統(tǒng)CPI抽樣調(diào)查具有成本優(yōu)勢(shì),能較好保證樣本數(shù)據(jù)的精確度和可靠性,但也存在前期準(zhǔn)備要求高、信息量有限、難以擴(kuò)大規(guī)模等缺陷。隨著互聯(lián)網(wǎng)的高速發(fā)展,現(xiàn)代信息技術(shù)不斷進(jìn)步,大數(shù)據(jù)使CPI有機(jī)會(huì)和條件獲得和使用全面數(shù)據(jù),實(shí)現(xiàn)“樣本=總體”。
同質(zhì)可比和效率優(yōu)先。同質(zhì)可比是傳統(tǒng)CPI編制遵循的一個(gè)基本原則,在價(jià)格調(diào)查中如不注意同質(zhì)可比,會(huì)造成價(jià)格指數(shù)的非正常變化。相對(duì)于準(zhǔn)確性,大數(shù)據(jù)更青睞數(shù)據(jù)的完整性和效率,如果這一思維引入CPI調(diào)查,在有人力、物力、財(cái)力和時(shí)間限制的條件下,忽略同質(zhì)可比,接受大數(shù)據(jù)效率優(yōu)先是可行的,也是必須的。面對(duì)數(shù)以十萬(wàn)計(jì)的海量數(shù)據(jù),按照傳統(tǒng)的數(shù)據(jù)審核模式進(jìn)行逐筆審核、比較,檢查是否同質(zhì)可比是難以想象的。但忽略同質(zhì)可比這一傳統(tǒng)原則,對(duì)現(xiàn)行CPI調(diào)查是一個(gè)顛覆。
為什么和是什么。目前的CPI調(diào)查遵循傳統(tǒng)的統(tǒng)計(jì)分析模式,是一種因果關(guān)系的分析思路,重點(diǎn)要知道“為什么”。而大數(shù)據(jù)通過(guò)搜集海量數(shù)據(jù),觀察數(shù)據(jù)與數(shù)據(jù)之間的相關(guān)關(guān)系,重點(diǎn)搞清楚“是什么”。如果CPI分析引入大數(shù)據(jù)相關(guān)關(guān)系的分析思路,雖然能更好地發(fā)現(xiàn)一些以前難以發(fā)現(xiàn)或不曾注意的聯(lián)系,但可能無(wú)法知道為什么會(huì)有這種聯(lián)系。
數(shù)據(jù)采集方式、分析服務(wù)水平有待改善
改進(jìn)數(shù)據(jù)采集方式。隨著大數(shù)據(jù)時(shí)代來(lái)臨,傳統(tǒng)CPI采價(jià)方式存在的缺陷有望得到改善和彌補(bǔ)。比如,在超市收銀管理系統(tǒng)中增加一個(gè)價(jià)格采集模塊,可以查詢、篩選、導(dǎo)入所需的規(guī)格品價(jià)格和信息,并傳送到統(tǒng)計(jì)數(shù)據(jù)平臺(tái)。如能實(shí)現(xiàn),不僅采價(jià)頻率可以實(shí)現(xiàn)全年365天無(wú)休,選擇的規(guī)格品也可以是這家超市的所有商品,并且采集的是實(shí)際成交價(jià),幾乎不會(huì)出現(xiàn)價(jià)格錯(cuò)誤。
完善權(quán)數(shù)編制。在大數(shù)據(jù)背景下,如果能有效獲取商務(wù)、醫(yī)療等相關(guān)部門(mén)數(shù)據(jù)資料,以及大型超市、商場(chǎng)、電商歷史銷售明細(xì),將為CPI調(diào)查的小類、基本分類權(quán)重分配提供更具說(shuō)服力的參考依據(jù)。
提高分析服務(wù)水平。在大數(shù)據(jù)時(shí)代,政府價(jià)格調(diào)控不僅需要事后分析,更需要事前預(yù)測(cè),并且預(yù)測(cè)的準(zhǔn)確度越高,對(duì)決策的幫助越大。如果能及時(shí)獲取價(jià)格行政記錄、商超價(jià)格數(shù)據(jù)、電商價(jià)格資料,并把這些龐雜無(wú)序的數(shù)據(jù)進(jìn)行整理、分析、歸納,變成有用的信息,不僅有利于佐證和評(píng)估官方CPI數(shù)據(jù),還有利于由事后總結(jié)研究向事前分析預(yù)警轉(zhuǎn)變。
對(duì)接系統(tǒng)、審核數(shù)據(jù)有難度
調(diào)查對(duì)象配合意愿低,數(shù)據(jù)獲取難。大數(shù)據(jù)應(yīng)用面臨的首要問(wèn)題就是數(shù)據(jù)如何及時(shí)全面獲取,目前主要存在兩大難點(diǎn)。一是企業(yè)普遍配合度不高,基本不愿意提供相關(guān)數(shù)據(jù)。究其原因,除顧慮信息安全、商業(yè)秘密外,企業(yè)并不能從中得到實(shí)惠是最大制約因素。二是企業(yè)管理系統(tǒng)各不相同,也不愿意直接開(kāi)放服務(wù)器。由于商業(yè)形態(tài)復(fù)雜,既有跨國(guó)連鎖企業(yè)、國(guó)內(nèi)大型連鎖超市,也有地區(qū)性百貨公司、區(qū)域內(nèi)便利店等。各企業(yè)所用管理系統(tǒng)各不相同,開(kāi)發(fā)語(yǔ)言有差異,數(shù)據(jù)存儲(chǔ)格式有差別,要開(kāi)發(fā)通用的軟件系統(tǒng)直接讀取系統(tǒng)數(shù)據(jù)或制定通用的數(shù)據(jù)使用辦法存在困難,這也給利用大數(shù)據(jù)帶來(lái)技術(shù)障礙。
與現(xiàn)行CPI系統(tǒng)對(duì)接非易事。大數(shù)據(jù)應(yīng)用與消價(jià)調(diào)查工作相結(jié)合,一大關(guān)鍵點(diǎn)就是海量數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化加工與CPI系統(tǒng)能不能有效對(duì)接。一是海量數(shù)據(jù)如何進(jìn)入CPI系統(tǒng),依靠人工錄入是完全不可能的。二是規(guī)格品計(jì)量單位如何對(duì)接,比如,很多食品以千克為單位,而企業(yè)的銷售單位往往是袋、瓶或件。如果折算為千克,需要大量細(xì)致而繁瑣的工作,并且還需要根據(jù)企業(yè)變化而變化,進(jìn)行動(dòng)態(tài)調(diào)整。
數(shù)據(jù)量激增,審核難度大。大數(shù)據(jù)是超大量數(shù)據(jù),再加上混雜性和多樣性,其誤差很難防范和控制。在大數(shù)據(jù)應(yīng)用過(guò)程中,數(shù)據(jù)量會(huì)急劇增加,如果只是采集部分價(jià)格,難以達(dá)到大數(shù)據(jù)應(yīng)用目的;如果采集全體價(jià)格,僅一個(gè)企業(yè)的數(shù)據(jù)量就會(huì)超過(guò)現(xiàn)有的調(diào)查數(shù)據(jù)總量。隨著數(shù)據(jù)獲取方式發(fā)生變化,數(shù)據(jù)質(zhì)量控制成為難點(diǎn)。直接調(diào)用企業(yè)內(nèi)部數(shù)據(jù)減少了中間環(huán)節(jié),但如果僅有價(jià)格數(shù)據(jù),缺少其他對(duì)應(yīng)信息,將給數(shù)據(jù)質(zhì)量控制帶來(lái)困難。實(shí)際工作中,工作人員可能需要進(jìn)行人工甄別,避免出現(xiàn)異常價(jià)格數(shù)據(jù)。
缺乏大數(shù)據(jù)應(yīng)用、開(kāi)發(fā)、分析能力。大數(shù)據(jù)獲取是大數(shù)據(jù)在CPI調(diào)查應(yīng)用中的一大難點(diǎn),但不是最大難題。獲取數(shù)據(jù)后的審核、分析、評(píng)估、挖掘才是大數(shù)據(jù)應(yīng)用的關(guān)鍵。比如,大數(shù)據(jù)分析的方法研究就超過(guò)了單一學(xué)科領(lǐng)域,需多學(xué)科聯(lián)合。但現(xiàn)階段CPI調(diào)查既缺乏相應(yīng)的技術(shù)支持,更缺乏相關(guān)人才,對(duì)大數(shù)據(jù)挖掘工具以及相關(guān)建模還多有空白區(qū)。
謹(jǐn)慎推廣,加強(qiáng)人才儲(chǔ)備
做好頂層設(shè)計(jì),建立健全相關(guān)制度。要將大數(shù)據(jù)引入CPI調(diào)查需要做好頂層設(shè)計(jì),要解決兩個(gè)問(wèn)題。一是修改完善目前的調(diào)查制度,使之適用于大數(shù)據(jù)應(yīng)用,形成制度保障。二是設(shè)計(jì)好科學(xué)、合理、可操作的CPI應(yīng)用大數(shù)據(jù)的實(shí)施方案。
積極研究,謹(jǐn)慎推廣。大數(shù)據(jù)在CPI中的應(yīng)用即使在發(fā)達(dá)國(guó)家也是新事物,缺乏借鑒,需要摸著石頭過(guò)河。為避免試錯(cuò)成本過(guò)高,應(yīng)先做好相關(guān)理論研究,發(fā)現(xiàn)問(wèn)題,解決問(wèn)題,在取得階段性成果的基礎(chǔ)上選擇具備條件的地方開(kāi)展大數(shù)據(jù)應(yīng)用試點(diǎn),最終根據(jù)試行結(jié)果決定是否擴(kuò)大推廣。
加強(qiáng)相關(guān)人才培養(yǎng)和儲(chǔ)備?,F(xiàn)階段系統(tǒng)上下缺乏相應(yīng)的技術(shù)支持,更缺乏相關(guān)人才。雖然短期可以通過(guò)服務(wù)外包、聘用專家的方式應(yīng)急,但從滿足長(zhǎng)期調(diào)查需要看,需要建立大數(shù)據(jù)應(yīng)用的人才培養(yǎng)體系,培養(yǎng)、儲(chǔ)備一批能夠整理和分析大數(shù)據(jù)的人才。
提高企業(yè)參與熱情。目前企業(yè)普遍配合度不高,除法律制度規(guī)定、技術(shù)手段保障其信息安全和商業(yè)秘密外,還應(yīng)為其提供有用的服務(wù),與調(diào)查對(duì)象共享成果。比如,對(duì)數(shù)據(jù)的深度挖掘分析,幫助企業(yè)提高效率和收益等,只有實(shí)現(xiàn)互惠互利,企業(yè)有良好預(yù)期,才可能積極配合,提供支持。