近幾年,大數(shù)據(jù)已廣泛應(yīng)用到互聯(lián)網(wǎng)輿情、互聯(lián)網(wǎng)營銷、內(nèi)容分發(fā)、互聯(lián)網(wǎng)金融、人工智能、智慧城市建設(shè)等領(lǐng)域。然而,在大數(shù)據(jù)高速發(fā)展的同時(shí),也出現(xiàn)魚龍混雜、忽悠盛行的不良現(xiàn)象:有些機(jī)構(gòu)和企業(yè)根本沒有大數(shù)據(jù)能力、但也為趕時(shí)髦而自我標(biāo)榜為大數(shù)據(jù)公司;有人神話大數(shù)據(jù),認(rèn)為其無所不能;有人認(rèn)為大數(shù)據(jù)只研究相關(guān)關(guān)系而不研究因果關(guān)系;還有人認(rèn)為只要有數(shù)據(jù),就萬事大吉。下面就讓我們來逐個(gè)討論,反駁上述的片面認(rèn)識(shí)。
真正的大數(shù)據(jù)公司并不多??v觀世界大數(shù)據(jù)發(fā)展實(shí)踐,目前的大數(shù)據(jù)公司主要分為兩類:一類是自身就擁有大數(shù)據(jù)的公司,如阿里巴巴、京東、騰訊、今日頭條、新浪微博、北京一卡通公司等,其中絕大多數(shù)為互聯(lián)網(wǎng)公司;另一類則是為大數(shù)據(jù)挖掘和分析提供工具和能力的公司,如拓爾思、百分點(diǎn)等等。事實(shí)上,在業(yè)界的實(shí)踐中,不少公司既沒有數(shù)據(jù),也沒有數(shù)據(jù)解決能力,僅僅是為了更好的估值和自身的品牌塑造,紛紛給自身披上大數(shù)據(jù)的外衣,給行業(yè)和用戶造成混亂和困惑,這從根本上不利于大數(shù)據(jù)產(chǎn)業(yè)和大數(shù)據(jù)公司的健康發(fā)展。
大數(shù)據(jù)仍處于初級(jí)階段。雖然大數(shù)據(jù)必將成為整個(gè)社會(huì)的底層架構(gòu)和標(biāo)配,社會(huì)和經(jīng)濟(jì)的方方面面必將被大數(shù)據(jù)所重構(gòu),且大數(shù)據(jù)在各行各業(yè)的應(yīng)用正得到深化,但上述活動(dòng)仍處于進(jìn)行時(shí)或?qū)頃r(shí),并非既成事實(shí)。在這一爬坡過坎的階段,尤其需要大數(shù)據(jù)從業(yè)人員求真務(wù)實(shí)、腳踏實(shí)地地推進(jìn)大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展,不能拔苗助長、飲鴆止渴,否則只能給大數(shù)據(jù)產(chǎn)業(yè)的短期發(fā)展注入太多泡沫。一旦泡沫破裂,必將會(huì)給大數(shù)據(jù)產(chǎn)業(yè)帶來很大的破壞作用。
大數(shù)據(jù)既研究相關(guān)關(guān)系,也研究因果關(guān)系。在大數(shù)據(jù)領(lǐng)域流行的說法是“大數(shù)據(jù)只研究相關(guān)關(guān)系而不研究因果關(guān)系”,無疑這是很大的認(rèn)識(shí)誤區(qū)。從本質(zhì)上講,大數(shù)據(jù)從全新的哲學(xué)視角給我們提供了更多認(rèn)識(shí)世界的方法,使我們從之前只能研究因果關(guān)系而不能研究相關(guān)關(guān)系,擴(kuò)大到既能研究因果關(guān)系也能研究相關(guān)關(guān)系。
不過,如果單純從相關(guān)關(guān)系出發(fā),就可能導(dǎo)致謬誤百出。例如,一些研究人員希望通過分析北京市中小學(xué)生的交通數(shù)據(jù)與其所在學(xué)校的相關(guān)性,計(jì)算學(xué)生家庭住址與學(xué)校距離的合理區(qū)間。如果僅研究因果關(guān)系,就會(huì)得出“北京市的學(xué)校布局很合理而不需要優(yōu)化調(diào)整”的結(jié)論,這無疑與北京市優(yōu)質(zhì)教育資源分布不均衡的現(xiàn)狀相悖。為什么會(huì)出現(xiàn)這樣的悖論呢?原因在于,北京市很多家長為讓孩子接受更好的教育,紛紛選擇在教學(xué)質(zhì)量好的學(xué)校周邊買小戶型房屋或租房居住,而正是這種教育資源的不均衡導(dǎo)致“天價(jià)學(xué)區(qū)房”的頻頻出現(xiàn)。
大數(shù)據(jù)尚需要算法和專家觀點(diǎn)的支撐。很多人認(rèn)為,只要有數(shù)據(jù)就可以解決一切問題,其實(shí)如果僅有數(shù)據(jù)而沒有好的算法和專家觀點(diǎn),數(shù)據(jù)只能成為無用的廢料。
在大數(shù)據(jù)的運(yùn)用過程中,海量的數(shù)據(jù)是基礎(chǔ)和前提,但算法、模型以及專家觀點(diǎn)一樣都不能少。否則,即便輸入同樣的數(shù)據(jù),出來的也會(huì)是大相徑庭的觀點(diǎn)。例如,雖然很多“樓市專家”都占有大致相同的數(shù)據(jù)庫,但對(duì)房地產(chǎn)市場(chǎng)走勢(shì)的判斷卻大為不同。如果一味聽信某些“平民經(jīng)濟(jì)學(xué)家”的理論,很多人可能正在四處漂泊,租房居住。反之,若能預(yù)見房價(jià)上漲的趨勢(shì),您不僅可解決居住問題,還有機(jī)會(huì)實(shí)現(xiàn)財(cái)務(wù)自由。
總之,大數(shù)據(jù)的威力將遠(yuǎn)超我們的想象,但是也需要給它一段時(shí)間來完善,更需要警惕一些似是而非的錯(cuò)誤觀點(diǎn)!(作者是國家行政學(xué)院社會(huì)和文化教研部高級(jí)經(jīng)濟(jì)師、管理學(xué)博士)