美國NASA如何能提前預(yù)知各種天文奇觀?風(fēng)力發(fā)電機(jī)和創(chuàng)業(yè)者開店如何選址?如何才能準(zhǔn)確預(yù)測(cè)并對(duì)氣象災(zāi)害進(jìn)行預(yù)警?包括在未來的城鎮(zhèn)化建設(shè)過程中,如何打造智能城市?等等,這一系列問題的背后,其實(shí)都隱藏著大數(shù)據(jù)的身影——不僅彰顯著大數(shù)據(jù)的巨大價(jià)值,更直觀地體現(xiàn)出大數(shù)據(jù)在各個(gè)行業(yè)的廣闊應(yīng)用。這些行業(yè)應(yīng)用也都更直白地告訴人們,什么是大數(shù)據(jù)……
其實(shí),大數(shù)據(jù)不是突然出現(xiàn)的,在過去的幾十年間,數(shù)學(xué)分析就已經(jīng)涉獵金融行業(yè)了,諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者哈里.馬克維茨、威廉.夏普、羅伯特.恩格爾就是利用計(jì)量經(jīng)濟(jì)學(xué)知識(shí)和金融市場(chǎng)數(shù)據(jù)來建立數(shù)學(xué)模型,預(yù)測(cè)金融市場(chǎng)產(chǎn)品收益同風(fēng)險(xiǎn)波動(dòng)的關(guān)系。
大數(shù)據(jù)時(shí)代的出現(xiàn)簡(jiǎn)單的講是海量數(shù)據(jù)同完美計(jì)算能力結(jié)合的結(jié)果,確切的說是移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)產(chǎn)生了海量的數(shù)據(jù),大數(shù)據(jù)計(jì)算技術(shù)完美地解決了海量數(shù)據(jù)的收集、存儲(chǔ)、計(jì)算、分析的問題。
當(dāng)我們最初談大數(shù)據(jù)的時(shí)候,談的最多的可能是用戶行為分析,即通過各種用戶行為,包括瀏覽記錄,消費(fèi)記錄,交往和購物娛樂,行動(dòng)軌跡等各種用戶行為產(chǎn)生的數(shù)據(jù)。由于這些數(shù)據(jù)本身符合海量,異構(gòu)的特征,同時(shí)通過分析這些數(shù)據(jù)之間的關(guān)聯(lián)性容易匹配某些結(jié)果現(xiàn)象。即有一堆的行為因子x,同時(shí)又有一堆的結(jié)果構(gòu)成y,我們找尋到了某種相關(guān)性,有利于我們調(diào)整后續(xù)的各種策略。
為何Google能夠做大數(shù)據(jù)?你思考過嗎?因?yàn)樗阉鞅旧硗怯脩粜袨榈囊粋€(gè)重要入口,即搜索引擎具備了實(shí)時(shí)采集多個(gè)用戶行為的x因子的能力。而這個(gè)能力往往是單個(gè)電商門戶網(wǎng)站無法做到的。但是搜索引擎做大數(shù)據(jù)的弱勢(shì)在哪里?即前面談到的用戶和用戶之間的關(guān)系較難建立,而更多是本身行為之間的相關(guān)性。從這個(gè)差異上也可以看到搜索引擎更加容易做交通,疾病,氣象等方面的大數(shù)據(jù)分析和預(yù)測(cè);而類似電商平臺(tái)或類似騰訊更加容易做消費(fèi)和娛樂類的大數(shù)據(jù)分析和預(yù)測(cè)。
對(duì)于大數(shù)據(jù)的應(yīng)用場(chǎng)景,包括各行各業(yè)對(duì)大數(shù)據(jù)處理和分析的應(yīng)用,最核心的還是用戶需求。接下來,本文通過梳理各個(gè)行業(yè)在大數(shù)據(jù)應(yīng)用領(lǐng)域面臨的挑戰(zhàn)、如何尋找突破口來展示其潛在存在的大數(shù)據(jù)應(yīng)用場(chǎng)景。
一、醫(yī)療大數(shù)據(jù) 看病更高效
除了較早前就開始利用大數(shù)據(jù)的互聯(lián)網(wǎng)公司,醫(yī)療行業(yè)是讓大數(shù)據(jù)分析最先發(fā)揚(yáng)光大的傳統(tǒng)行業(yè)之一。醫(yī)療行業(yè)擁有大量的病例,病理報(bào)告,治愈方案,藥物報(bào)告等等。如果這些數(shù)據(jù)可以被整理和應(yīng)用將會(huì)極大地幫助醫(yī)生和病人。我們面對(duì)的數(shù)目及種類眾多的病菌、病毒,以及腫瘤細(xì)胞,其都處于不斷的進(jìn)化的過程中。在發(fā)現(xiàn)診斷疾病時(shí),疾病的確診和治療方案的確定是最困難的。
在未來,借助于大數(shù)據(jù)平臺(tái)我們可以收集不同病例和治療方案,以及病人的基本特征,可以建立針對(duì)疾病特點(diǎn)的數(shù)據(jù)庫。如果未來基因技術(shù)發(fā)展成熟,可以根據(jù)病人的基因序列特點(diǎn)進(jìn)行分類,建立醫(yī)療行業(yè)的病人分類數(shù)據(jù)庫。在醫(yī)生診斷病人時(shí)可以參考病人的疾病特征、化驗(yàn)報(bào)告和檢測(cè)報(bào)告,參考疾病數(shù)據(jù)庫來快速幫助病人確診,明確定位疾病。在制定治療方案時(shí),醫(yī)生可以依據(jù)病人的基因特點(diǎn),調(diào)取相似基因、年齡、人種、身體情況相同的有效治療方案,制定出適合病人的治療方案,幫助更多人及時(shí)進(jìn)行治療。同時(shí)這些數(shù)據(jù)也有利于醫(yī)藥行業(yè)開發(fā)出更加有效的藥物和醫(yī)療器械。
醫(yī)療行業(yè)的數(shù)據(jù)應(yīng)用一直在進(jìn)行,但是數(shù)據(jù)沒有打通,都是孤島數(shù)據(jù),沒有辦法進(jìn)行大規(guī)模應(yīng)用。未來需要將這些數(shù)據(jù)統(tǒng)一收集起來,納入統(tǒng)一的大數(shù)據(jù)平臺(tái),為人類健康造福。政府和醫(yī)療行業(yè)是推動(dòng)這一趨勢(shì)的重要?jiǎng)恿Α?/p>
二、生物大數(shù)據(jù) 改良基因
自人類基因組計(jì)劃完成以來,以美國為代表,世界主要發(fā)達(dá)國家紛紛啟動(dòng)了生命科學(xué)基礎(chǔ)研究計(jì)劃,如國際千人基因組計(jì)劃、DNA百科全書計(jì)劃、英國十萬人基因組計(jì)劃等。這些計(jì)劃引領(lǐng)生物數(shù)據(jù)呈爆炸式增長(zhǎng),目前每年全球產(chǎn)生的生物數(shù)據(jù)總量已達(dá)EB級(jí),生命科學(xué)領(lǐng)域正在爆發(fā)一次數(shù)據(jù)革命,生命科學(xué)某種程度上已經(jīng)成為大數(shù)據(jù)科學(xué)。
我們來看看今天的準(zhǔn)媽媽們,除了要準(zhǔn)備尿布、奶瓶和嬰兒裝,她們還會(huì)把基因測(cè)試列入計(jì)劃單?;驕y(cè)試能讓未來的父母對(duì)于他們未出生的baby的健康有更多的了解。對(duì)基因攜帶者篩查和胚胎植入前診斷,使一個(gè)家庭孕育小孩的過程產(chǎn)生了巨大改變。
當(dāng)下,我們所說的生物大數(shù)據(jù)技術(shù)主要是指大數(shù)據(jù)技術(shù)在基因分析上的應(yīng)用,通過大數(shù)據(jù)平臺(tái)人類可以將自身和生物體基因分析的結(jié)果進(jìn)行記錄和存儲(chǔ),利用建立基于大數(shù)據(jù)技術(shù)的基因數(shù)據(jù)庫。大數(shù)據(jù)技術(shù)將會(huì)加速基因技術(shù)的研究,快速幫助科學(xué)家進(jìn)行模型的建立和基因組合模擬計(jì)算?;蚣夹g(shù)是人類未來戰(zhàn)勝疾病的重要武器,借助于大數(shù)據(jù)技術(shù)的應(yīng)用,人們將會(huì)加快自身基因和其它他生物的基因的研究進(jìn)程。未來利用生物基因技術(shù)來改良農(nóng)作物,利用基因技術(shù)來培養(yǎng)人類器官,利用基因技術(shù)來消滅害蟲都即將實(shí)現(xiàn)。
與全球蒸蒸日上的生物大數(shù)據(jù)創(chuàng)新發(fā)展熱潮相比,中國的研發(fā)及應(yīng)用才拉開帷幕。我國有四大方面非常欠缺:其一,國內(nèi)現(xiàn)有的生物大數(shù)據(jù)分析能力雖然與歐美相差不大,但是在數(shù)據(jù)分析構(gòu)架、軟件系統(tǒng)與先進(jìn)的IT技術(shù)接軌上有待提升。其二,國外在生物大數(shù)據(jù)領(lǐng)域的領(lǐng)先人才多,盡管我們也有國際頂級(jí)刊物上發(fā)表的論文和成果,總體而言,國內(nèi)高水準(zhǔn)團(tuán)隊(duì)還是少。其三,歐美講求成果應(yīng)用,層出不窮的分析軟件可被實(shí)驗(yàn)室、臨床、產(chǎn)業(yè)多方應(yīng)用。其四,在生物大數(shù)據(jù)理論研究、標(biāo)準(zhǔn)制定和廣泛應(yīng)用上,中國都亟待全面跟進(jìn)。
三、金融大數(shù)據(jù) 理財(cái)利器
金融行業(yè)的大數(shù)據(jù)面臨的往往是同樣的問題,但是情況可能要好點(diǎn),類似企業(yè)和個(gè)人的一些信用記錄現(xiàn)在有全國性質(zhì)的統(tǒng)一數(shù)據(jù)庫能夠拿到部分?jǐn)?shù)據(jù)。但是對(duì)于單個(gè)銀行來說,同樣是無法拿到用戶在其他銀行的行為記錄數(shù)據(jù)的,其二銀行本身在做很多信貸風(fēng)險(xiǎn)分析的時(shí)候,確實(shí)需要大量數(shù)據(jù)做相關(guān)性分析,但是很多數(shù)據(jù)來源于政府各個(gè)職能部門,包括工商稅務(wù),質(zhì)量監(jiān)督,檢察院法院等,這些數(shù)據(jù)短期仍然是無法拿到。還有就是企業(yè)或個(gè)人本事日常產(chǎn)生的各種行為數(shù)據(jù)更難拿到,那么對(duì)客戶的風(fēng)險(xiǎn)性評(píng)估還是得借用原來的老方法而已。
大數(shù)據(jù)在金融行業(yè)應(yīng)用范圍較廣,典型的案例有花旗銀行利用IBM沃森電腦為財(cái)富管理客戶推薦產(chǎn)品;美國銀行利用客戶點(diǎn)擊數(shù)據(jù)集為客戶提供特色服務(wù),如有競(jìng)爭(zhēng)的信用額度;招商銀行利用客戶刷卡、存取款、電子銀行轉(zhuǎn)帳、微信評(píng)論等行為數(shù)據(jù)進(jìn)行分析,每周給客戶發(fā)送針對(duì)性廣告信息,里面有顧客可能感興趣的產(chǎn)品和優(yōu)惠信息。
可見,大數(shù)據(jù)在金融行業(yè)的應(yīng)用可以總結(jié)為以下五個(gè)方面:
精準(zhǔn)營銷:依據(jù)客戶消費(fèi)習(xí)慣、地理位置、消費(fèi)時(shí)間進(jìn)行推薦
風(fēng)險(xiǎn)管控:依據(jù)客戶消費(fèi)和現(xiàn)金流提供信用評(píng)級(jí)或融資支持,利用客戶社交行為記錄實(shí)施信用卡反欺詐
決策支持:利用抉策樹技術(shù)進(jìn)抵押貸款管理,利用數(shù)據(jù)分析報(bào)告實(shí)施產(chǎn)業(yè)信貸風(fēng)險(xiǎn)控制
效率提升:利用金融行業(yè)全局?jǐn)?shù)據(jù)了解業(yè)務(wù)運(yùn)營薄弱點(diǎn),利用大數(shù)據(jù)技術(shù)加快內(nèi)部數(shù)據(jù)處理速度
產(chǎn)品設(shè)計(jì):利用大數(shù)據(jù)計(jì)算技術(shù)為財(cái)富客戶推薦產(chǎn)品,利用客戶行為數(shù)據(jù)設(shè)計(jì)滿足客戶需求的金融產(chǎn)品
四、零售大數(shù)據(jù) 最懂消費(fèi)者
零售行業(yè)大數(shù)據(jù)應(yīng)用有兩個(gè)層面,一個(gè)層面是零售行業(yè)可以了解客戶消費(fèi)喜好和趨勢(shì),進(jìn)行商品的精準(zhǔn)營銷,降低營銷成本。另一層面是依據(jù)客戶購買產(chǎn)品,為客戶提供可能購買的其它產(chǎn)品,擴(kuò)大銷售額,也屬于精準(zhǔn)營銷范疇。另外零售行業(yè)可以通過大數(shù)據(jù)掌握未來消費(fèi)趨勢(shì),有利于熱銷商品的進(jìn)貨管理和過季商品的處理。零售行業(yè)的數(shù)據(jù)對(duì)于產(chǎn)品生產(chǎn)廠家是非常寶貴的,零售商的數(shù)據(jù)信息將會(huì)有助于資源的有效利用,降低產(chǎn)能過剩,廠商依據(jù)零售商的信息按實(shí)際需求進(jìn)行生產(chǎn),減少不必要的生產(chǎn)浪費(fèi)。
未來考驗(yàn)零售企業(yè)的不再只是零供關(guān)系的好壞,而是要看挖掘消費(fèi)者需求,以及高效整合供應(yīng)鏈滿足其需求的能力,因此信息科技技術(shù)水平的高低成為獲得競(jìng)爭(zhēng)優(yōu)勢(shì)的關(guān)鍵要素。不論是國際零售巨頭,還是本土零售品牌,要想頂住日漸微薄的利潤率帶來的壓力,在這片紅海中立于不敗之地,就必須思考如何擁抱新科技,并為顧客們帶來更好的消費(fèi)體驗(yàn)。
想象一下這樣的場(chǎng)景,當(dāng)顧客在地鐵候車時(shí),墻上有某一零售商的巨幅數(shù)字屏幕廣告,可以自由瀏覽產(chǎn)品信息,對(duì)感興趣的或需要購買的商品用手機(jī)掃描下單,約定在晚些時(shí)候送到家中。而在顧客瀏覽商品并最終選購商品后,商家已經(jīng)了解顧客的喜好及個(gè)人詳細(xì)信息,按要求配貨并送達(dá)顧客家中。未來,甚至顧客都不需要有任何購買動(dòng)作,利用之前購買行為產(chǎn)生的大數(shù)據(jù),當(dāng)你的沐浴露剩下最后一滴時(shí),你中意的沐浴露就已送到你的手上,而雖然顧客和商家從未謀面,但已如朋友般熟識(shí)。
五、電商大數(shù)據(jù) 精準(zhǔn)營銷法寶
電商是最早利用大數(shù)據(jù)進(jìn)行精準(zhǔn)營銷的行業(yè),除了精準(zhǔn)營銷,電商可以依據(jù)客戶消費(fèi)習(xí)慣來提前為客戶備貨,并利用便利店作為貨物中轉(zhuǎn)點(diǎn),在客戶下單15分鐘內(nèi)將貨物送上門,提高客戶體驗(yàn)。馬云的菜鳥網(wǎng)絡(luò)宣稱的24小時(shí)完成在中國境內(nèi)的送貨,以及京的劉強(qiáng)東宣傳未來京東將在15分鐘完成送貨上門都是基于客戶消費(fèi)習(xí)慣的大數(shù)據(jù)分析和預(yù)測(cè)。
電商可以利用其交易數(shù)據(jù)和現(xiàn)金流數(shù)據(jù),為其生態(tài)圈內(nèi)的商戶提供基于現(xiàn)金流的小額貸款,電商業(yè)也可以將此數(shù)據(jù)提供給銀行,同銀行合作為中小企業(yè)提供信貸支持。由于電商的數(shù)據(jù)較為集中,數(shù)據(jù)量足夠大,數(shù)據(jù)種類較多,因此未來電商數(shù)據(jù)應(yīng)用將會(huì)有更多的想象空間,包括預(yù)測(cè)流行趨勢(shì),消費(fèi)趨勢(shì)、地域消費(fèi)特點(diǎn)、客戶消費(fèi)習(xí)慣、各種消費(fèi)行為的相關(guān)度、消費(fèi)熱點(diǎn)、影響消費(fèi)的重要因素等。依托大數(shù)據(jù)分析,電商的消費(fèi)報(bào)告將有利于品牌公司產(chǎn)品設(shè)計(jì),生產(chǎn)企業(yè)的庫存管理和計(jì)劃生產(chǎn),物流企業(yè)的資源配制,生產(chǎn)資料提供方產(chǎn)能安排等等,有利于精細(xì)化社會(huì)化大生產(chǎn),有利于精細(xì)化社會(huì)的出現(xiàn)。
六、農(nóng)牧大數(shù)據(jù) 量化生產(chǎn)
大數(shù)據(jù)在農(nóng)業(yè)應(yīng)用主要是指依據(jù)未來商業(yè)需求的預(yù)測(cè)來進(jìn)行農(nóng)牧產(chǎn)品生產(chǎn),降低菜賤傷農(nóng)的概率。同時(shí)大數(shù)據(jù)的分析將會(huì)更見精確預(yù)測(cè)未來的天氣氣候,幫助農(nóng)牧民做好自然災(zāi)害的預(yù)防工作。大數(shù)據(jù)同時(shí)也會(huì)幫助農(nóng)民依據(jù)消費(fèi)者消費(fèi)習(xí)慣決定來增加哪些品種的種植,減少哪些品種農(nóng)作物的生產(chǎn),提高單位種植面積的產(chǎn)值,同時(shí)有助于快速銷售農(nóng)產(chǎn)品,完成資金回流。牧民可以通過大數(shù)據(jù)分析來安排放牧范圍,有效利用牧場(chǎng)。漁民可以利用大數(shù)據(jù)安排休漁期、定位捕魚范圍等。
由于農(nóng)產(chǎn)品不容易保存,因此合理種植和養(yǎng)殖農(nóng)產(chǎn)品對(duì)十分重要。如果沒有規(guī)劃好,容易產(chǎn)生菜賤傷農(nóng)的悲劇。過去出現(xiàn)的豬肉過剩、卷心菜過剩、香蕉過剩的原因就是農(nóng)牧業(yè)沒有規(guī)劃好。借助于大數(shù)據(jù)提供的消費(fèi)趨勢(shì)報(bào)告和消費(fèi)習(xí)慣報(bào)告,政府將為農(nóng)牧業(yè)生產(chǎn)提供合理引導(dǎo),建議依據(jù)需求進(jìn)行生產(chǎn),避免產(chǎn)能過剩,造成不必要的資源和社會(huì)財(cái)富浪費(fèi)。農(nóng)業(yè)關(guān)乎到國計(jì)民生,科學(xué)的規(guī)劃將有助于社會(huì)整體效率提升。大數(shù)據(jù)技術(shù)可以幫助政府實(shí)現(xiàn)農(nóng)業(yè)的精細(xì)化管理,實(shí)現(xiàn)科學(xué)決策。在數(shù)據(jù)驅(qū)動(dòng)下,結(jié)合無人機(jī)技術(shù),農(nóng)民可以采集農(nóng)產(chǎn)品生長(zhǎng)信息,病蟲害信息。相對(duì)于過去雇傭飛機(jī)成本將大大降低,同時(shí)精度也將大大提高。
七、交通大數(shù)據(jù) 暢通出行
交通作為人類行為的重要組成和重要條件之一,對(duì)于大數(shù)據(jù)的感知也是最急迫的。近年來,我國的智能交通已實(shí)現(xiàn)了快速發(fā)展,許多技術(shù)手段都達(dá)到了國際領(lǐng)先水平。但是,問題和困境也非常突出,從各個(gè)城市的發(fā)展?fàn)顩r來看,智能交通的潛在價(jià)值還沒有得到有效挖掘:對(duì)交通信息的感知和收集有限,對(duì)存在于各個(gè)管理系統(tǒng)中的海量的數(shù)據(jù)無法共享運(yùn)用、有效分析,對(duì)交通態(tài)勢(shì)的研判預(yù)測(cè)乏力,對(duì)公眾的交通信息服務(wù)很難滿足需求。這雖然有各地在建設(shè)理念、投入上的差異,但是整體上智能交通的現(xiàn)狀是效率不高,智能化程度不夠,使得很多先進(jìn)技術(shù)設(shè)備發(fā)揮不了應(yīng)有的作用,也造成了大量投入上的資金浪費(fèi)。這其中很重要的問題是小數(shù)據(jù)時(shí)代帶來的硬傷:從模擬時(shí)代帶來的管理思想和技術(shù)設(shè)備只能進(jìn)行一定范圍的分析,而管理系統(tǒng)的那些關(guān)系型數(shù)據(jù)庫只能刻板的分析特定的關(guān)系,對(duì)于海量數(shù)據(jù)尤其是半結(jié)構(gòu)、非結(jié)構(gòu)數(shù)據(jù)無能為力。
盡管現(xiàn)在已經(jīng)基本實(shí)現(xiàn)了數(shù)字化,但是數(shù)字化和數(shù)據(jù)化還根本不是一回事,只是局部的提高了采集、存儲(chǔ)和應(yīng)用的效率,本質(zhì)上并沒有太大的改變。而大數(shù)據(jù)時(shí)代的到來必然帶來破解難題的重大機(jī)遇。大數(shù)據(jù)必然要求我們改變小數(shù)據(jù)條件下一味的精確計(jì)算,而是更好的面對(duì)混雜,把握宏觀態(tài)勢(shì);大數(shù)據(jù)必然要求我們不再熱衷因果關(guān)系而是相關(guān)關(guān)系,使得處理海量非結(jié)構(gòu)化數(shù)據(jù)成為可能,也必然促使我們努力把一切事物數(shù)據(jù)化,最終實(shí)現(xiàn)管理的便捷高效。
目前,交通的大數(shù)據(jù)應(yīng)用主要在兩個(gè)方面,一方面可以利用大數(shù)據(jù)傳感器數(shù)據(jù)來了解車輛通行密度,合理進(jìn)行道路規(guī)劃包括單行線路規(guī)劃。另一方面可以利用大活數(shù)據(jù)來實(shí)現(xiàn)即時(shí)信號(hào)燈調(diào)度,提高已有線路運(yùn)行能力。科學(xué)的安排信號(hào)燈是一個(gè)復(fù)雜的系統(tǒng)工程,必須利用大數(shù)據(jù)計(jì)算平臺(tái)才能計(jì)算出一個(gè)較為合理的方案??茖W(xué)的信號(hào)燈安排將會(huì)提高30%左右已有道路的通行能力。在美國,政府依據(jù)某一路段的交通事故信息來增設(shè)信號(hào)燈,降低了50%以上的交通事故率。機(jī)場(chǎng)的航班起降依靠大數(shù)據(jù)將會(huì)提高航班管理的效率,航空公司利用大數(shù)據(jù)可以提高上座率,降低運(yùn)行成本。鐵路利用大數(shù)據(jù)可以有效安排客運(yùn)和貨運(yùn)列車,提高效率、降低成本。
八、教育大數(shù)據(jù) 因材施教
隨著技術(shù)的發(fā)展,信息技術(shù)已在教育領(lǐng)域有了越來越廣泛的應(yīng)用??荚嚒⒄n堂、師生互動(dòng)、校園設(shè)備使用、家校關(guān)系……只要技術(shù)達(dá)到的地方,各個(gè)環(huán)節(jié)都被數(shù)據(jù)包裹。
在課堂上,數(shù)據(jù)不僅可以幫助改善教育教學(xué),在重大教育決策制定和教育改革方面,大數(shù)據(jù)更有用武之地。美國利用數(shù)據(jù)來診斷處在輟學(xué)危險(xiǎn)期的學(xué)生、探索教育開支與學(xué)生學(xué)習(xí)成績(jī)提升的關(guān)系、探索學(xué)生缺課與成績(jī)的關(guān)系。舉一個(gè)比較有趣的例子,教師的高考成績(jī)和所教學(xué)生的成績(jī)有關(guān)嗎?究竟如何,不妨借助數(shù)據(jù)來看。比如美國某州公立中小學(xué)的數(shù)據(jù)分析顯示,在語文成績(jī)上,教師高考分?jǐn)?shù)和學(xué)生成績(jī)呈現(xiàn)顯著的正相關(guān)。也就是說,教師的高考成績(jī)與他們現(xiàn)在所教語文課上的學(xué)生學(xué)習(xí)成績(jī)有很明顯的關(guān)系,教師的高考成績(jī)?cè)胶?,學(xué)生的語文成績(jī)也越好。這個(gè)關(guān)系讓我們進(jìn)一步探討其背后真正的原因。其實(shí),教師高考成績(jī)高低某種程度上是教師的某個(gè)特點(diǎn)在起作用,而正是這個(gè)特點(diǎn)對(duì)教好學(xué)生起著至關(guān)重要的作用,教師的高考分?jǐn)?shù)可以作為挑選教師的一個(gè)指標(biāo)。如果有了充分的數(shù)據(jù),便可以發(fā)掘更多的教師特征和學(xué)生成績(jī)之間的關(guān)系,從而為挑選教師提供更好的參考。
大數(shù)據(jù)還可以幫助家長(zhǎng)和教師甄別出孩子的學(xué)習(xí)差距和有效的學(xué)習(xí)方法。比如,美國的麥格勞-希爾教育出版集團(tuán)就開發(fā)出了一種預(yù)測(cè)評(píng)估工具,幫助學(xué)生評(píng)估他們已有的知識(shí)和達(dá)標(biāo)測(cè)驗(yàn)所需程度的差距,進(jìn)而指出學(xué)生有待提高的地方。評(píng)估工具可以讓教師跟蹤學(xué)生學(xué)習(xí)情況,從而找到學(xué)生的學(xué)習(xí)特點(diǎn)和方法。有些學(xué)生適合按部就班,有些則更適合圖式信息和整合信息的非線性學(xué)習(xí)。這些都可以通過大數(shù)據(jù)搜集和分析很快識(shí)別出來,從而為教育教學(xué)提供堅(jiān)實(shí)的依據(jù)。
在國內(nèi)尤其是北京、上海、廣東等城市,大數(shù)據(jù)在教育領(lǐng)域就已有了非常多的應(yīng)用,譬如像慕課、在線課程、翻轉(zhuǎn)課堂等,其中就應(yīng)用了大量的大數(shù)據(jù)工具。
毫無疑問,在不遠(yuǎn)的將來,無論是針對(duì)教育管理部門,還是校長(zhǎng)、教師,以及學(xué)生和家長(zhǎng),都可以得到針對(duì)不同應(yīng)用的個(gè)性化分析報(bào)告。通過大數(shù)據(jù)的分析來優(yōu)化教育機(jī)制,也可以做出更科學(xué)的決策,這將帶來潛在的教育革命。不久的將來個(gè)性化學(xué)習(xí)終端,將會(huì)更多的融入學(xué)習(xí)資源云平臺(tái),根據(jù)每個(gè)學(xué)生的不同興趣愛好和特長(zhǎng),推送相關(guān)領(lǐng)域的前沿技術(shù)、資訊、資源乃至未來職業(yè)發(fā)展方向,等等,并貫穿每個(gè)人終身學(xué)習(xí)的全過程。
九、體育大數(shù)據(jù) 奪冠精靈
從《點(diǎn)球成金》這部電影開始,體育界的有識(shí)之士們終于找到了向往已久的道路,那就是如何利用大數(shù)據(jù)來讓團(tuán)隊(duì)發(fā)揮最佳水平。從足球到籃球,數(shù)據(jù)似乎成為贏得比賽甚至是獎(jiǎng)杯的金鑰匙。
大數(shù)據(jù)對(duì)于體育的改變可以說是方方面面,從運(yùn)動(dòng)員本身來講,可穿戴設(shè)備收集的數(shù)據(jù)可以讓自己更了解身體狀況。媒體評(píng)論員,通過大數(shù)據(jù)提供的數(shù)據(jù)更好的解說比賽,分析比賽。數(shù)據(jù)已經(jīng)通過大數(shù)據(jù)分析轉(zhuǎn)化成了洞察力,為體育競(jìng)技中的勝利增加籌碼,也為身處世界各地的體育愛好者隨時(shí)隨地觀賞比賽提供了個(gè)性化的體驗(yàn)。
盡管鮮有職業(yè)網(wǎng)球選手愿意公開承認(rèn)自己利用大數(shù)據(jù)來制定比賽策劃和戰(zhàn)術(shù),但幾乎每一個(gè)球員都會(huì)在比賽前后使用大數(shù)據(jù)服務(wù)。有教練表示:“在球場(chǎng)上,比賽的輸贏取決于比賽策略和戰(zhàn)術(shù),以及賽場(chǎng)上連續(xù)對(duì)打期間的快速反應(yīng)和決策,但這些細(xì)節(jié)轉(zhuǎn)瞬即逝,所以數(shù)據(jù)分析成為一場(chǎng)比賽最關(guān)鍵的部分。對(duì)于那些擁護(hù)并利用大數(shù)據(jù)進(jìn)行決策的選手而言,他們毋庸置疑地將贏得足夠競(jìng)爭(zhēng)優(yōu)勢(shì)。”
十、環(huán)保大數(shù)據(jù) 對(duì)抗PM2.5
前年7月21日北京遭遇特大暴雨,在一天之內(nèi),平均降雨量達(dá)164毫米,也是北京市61年以來最大規(guī)模暴雨。此次暴雨因來勢(shì)兇猛而給廣大市民生活帶來巨大影響。其實(shí),攤上這種事兒,最主要的還是需要?dú)庀蟛块T及時(shí)、準(zhǔn)確地做出預(yù)警,并協(xié)同其他運(yùn)營商部門,將這種預(yù)警信息第一時(shí)間下發(fā)到北京市民(包括在京旅行的人士)。也正是如此,前年的那場(chǎng)暴雨不僅暴露出了管理工作上的漏洞,也引起了業(yè)內(nèi)人士關(guān)于一場(chǎng)“大數(shù)據(jù)”的探討。
氣象對(duì)社會(huì)的影響涉及到方方面面。傳統(tǒng)上依賴氣象的主要是農(nóng)業(yè)、林業(yè)和水運(yùn)等行業(yè)部門,而如今,氣象儼然成為了二十一世紀(jì)社會(huì)發(fā)展的資源,并支持定制化服務(wù)滿足各行各業(yè)用戶需要。借助于大數(shù)據(jù)技術(shù),天氣預(yù)報(bào)的準(zhǔn)確性和實(shí)效性將會(huì)大大提高,預(yù)報(bào)的及時(shí)性將會(huì)大大提升,同時(shí)對(duì)于重大自然災(zāi)害,例如龍卷風(fēng),通過大數(shù)據(jù)計(jì)算平臺(tái),人們將會(huì)更加精確地了解其運(yùn)動(dòng)軌跡和危害的等級(jí),有利于幫助人們提高應(yīng)對(duì)自然災(zāi)害的能力。天氣預(yù)報(bào)的準(zhǔn)確度的提升和預(yù)測(cè)周期的延長(zhǎng)將會(huì)有利于農(nóng)業(yè)生產(chǎn)的安排。
尤其是進(jìn)入秋冬季以來,我國多個(gè)城市爆發(fā)霧霾天氣,空氣污染嚴(yán)重。隨著PM2.5對(duì)于人體健康的危害日益被公眾熟知,人們對(duì)于“霧霾假”的呼聲也越來越高。有人調(diào)侃,重度污染天走在上班路上就是一臺(tái)“人肉吸塵器”。
由此看來,依靠大數(shù)據(jù)分析北京或其他城市空氣污染的形成及對(duì)策,任重道遠(yuǎn)。一是數(shù)據(jù)的來源。高耗能企業(yè)的生產(chǎn)規(guī)模、排放量這些數(shù)據(jù)是否層層上報(bào),準(zhǔn)確統(tǒng)計(jì)?掌握此數(shù)據(jù)的部門是否能向社會(huì)公開?北京500萬輛汽車所加汽油到底有哪些成分,產(chǎn)生的尾氣對(duì)空氣污染指數(shù)的“貢獻(xiàn)”率到底多大?二是要沖破數(shù)據(jù)挖掘分析應(yīng)用的技術(shù)壁壘,當(dāng)然前提就是數(shù)據(jù)公開。
在美國NOAA(國家海洋暨大氣總署)其實(shí)早就在使用大數(shù)據(jù)業(yè)務(wù)。每天通過衛(wèi)星、船只、飛機(jī)、浮標(biāo)、傳感器等收集超過35億份觀察數(shù)據(jù)。收集完畢后,NOAA會(huì)匯總大氣數(shù)據(jù),海洋數(shù)據(jù),以及地質(zhì)數(shù)據(jù),進(jìn)行直接測(cè)定,繪制出復(fù)雜的高保真預(yù)測(cè)模型,將其提供給NWS(國家氣象局)做出氣象預(yù)報(bào)的參考數(shù)據(jù)。目前,NOAA每年新增管理的數(shù)據(jù)量就高達(dá)30PB(1PB=1024TB)。由NWS生成的最終分析結(jié)果,就呈現(xiàn)在日常的天氣預(yù)報(bào)和預(yù)警報(bào)道上。
十一、食品大數(shù)據(jù) 舌尖上的安全
民以食為天,食品安全問題直是國家的重點(diǎn)關(guān)注問題,關(guān)系著人們的身體健康和國家安全。近幾年,毒膠囊、鎘大米、瘦肉精、洋奶粉等食品安全事件不斷考驗(yàn)著消費(fèi)者的承受力,讓消費(fèi)者對(duì)食品安全產(chǎn)生了擔(dān)憂。
近幾年外國旅游者減少了到中國旅游,進(jìn)口食品大幅度增加,這其中一個(gè)主要原因就是食品安全問題。隨著科學(xué)技術(shù)和生活水平的不斷提高,食品添加劑及食品品種越來越多,傳統(tǒng)手段難以滿足當(dāng)前復(fù)雜的食品監(jiān)管需求,從不斷出現(xiàn)的食品安全問題來看,食品監(jiān)管成了食品安全的棘手問題。此刻,通過大數(shù)據(jù)管理將海量數(shù)據(jù)聚合在一起,將離散的數(shù)據(jù)需求聚合能形成數(shù)據(jù)長(zhǎng)尾,從而滿足傳統(tǒng)中難以實(shí)現(xiàn)的需求。在數(shù)據(jù)驅(qū)動(dòng)下,采集人們?cè)诨ヂ?lián)網(wǎng)上提供的舉報(bào)信息,國家可以掌握部分鄉(xiāng)村和城市的死角信息,挖出不法加工點(diǎn),提高執(zhí)法透明度,降低執(zhí)法成本。國家可以參考醫(yī)院提供的就診信息,分析出涉及食品安全的信息,及時(shí)進(jìn)行監(jiān)督檢查,第一時(shí)間進(jìn)行處理,降低已有不安全食品的危害。參考個(gè)體在互聯(lián)網(wǎng)的搜索信息,掌握流行疾病在某些區(qū)域和季節(jié)的爆發(fā)趨勢(shì),及時(shí)進(jìn)行干預(yù),降低其流行危害。政府可以提供不安全食品廠商信息,不安全食品信息,幫助人們提高食品安全意識(shí)。
當(dāng)然,有專業(yè)人士認(rèn)為食品安全涉及到從田頭到餐桌的每一個(gè)環(huán)節(jié),需要覆蓋全過程的動(dòng)態(tài)監(jiān)測(cè)才能保障食品安全,以稻米生產(chǎn)為例,產(chǎn)地、品種、土壤、水質(zhì)、病蟲害發(fā)生、農(nóng)藥種類與數(shù)量、化肥、收獲、儲(chǔ)藏、加工、運(yùn)輸、銷售等環(huán)節(jié),無一不影響稻米安全狀況,通過收集、分析各環(huán)節(jié)的數(shù)據(jù),可以預(yù)測(cè)某產(chǎn)地將收獲的稻谷或生產(chǎn)的稻米是否存在安全隱患。
大數(shù)據(jù)不僅能帶來商業(yè)價(jià)值,亦能產(chǎn)生社會(huì)價(jià)值。隨著信息技術(shù)的發(fā)展,食品監(jiān)管也面臨著眾多的各種類型的海量數(shù)據(jù),如何從中提取有效數(shù)據(jù)成為關(guān)鍵所在??梢?,大數(shù)據(jù)管理是一項(xiàng)巨大挑戰(zhàn),一方面要及時(shí)提取數(shù)據(jù)以滿足食品安全監(jiān)管需求;另一方面需在數(shù)據(jù)的潛在價(jià)值與個(gè)人隱私之間進(jìn)行平衡。相信大數(shù)據(jù)管理在食品監(jiān)管方面的應(yīng)用,可以為食品安全撐起一把有力的保護(hù)傘。
十二、政府調(diào)控和財(cái)政支出 大數(shù)據(jù)令其有條不紊
政府利用大數(shù)據(jù)技術(shù)可以了解各地區(qū)的經(jīng)濟(jì)發(fā)展情況,各產(chǎn)業(yè)發(fā)展情況,消費(fèi)支出和產(chǎn)品銷售情況,依據(jù)數(shù)據(jù)分析結(jié)果,科學(xué)地制定宏觀政策,平衡各產(chǎn)業(yè)發(fā)展,避免產(chǎn)能過剩,有效利用自然資源和社會(huì)資源,提高社會(huì)生產(chǎn)效率。大數(shù)據(jù)還還可以幫助政府進(jìn)行監(jiān)控自然資源的管理,無論是國土資源、水資源、礦產(chǎn)資源、能源等,大數(shù)據(jù)通過各種傳感器來提高其管理的精準(zhǔn)度。同時(shí)大數(shù)據(jù)技術(shù)也能幫助政府進(jìn)行支出管理,透明合理的財(cái)政支出將有利于提高公信力和監(jiān)督財(cái)政支出。
大數(shù)據(jù)及大數(shù)據(jù)技術(shù)帶給政府的不僅僅是效率提升、科學(xué)決策、精細(xì)管理,更重要的是數(shù)據(jù)治國、科學(xué)管理的意識(shí)改變,未來大數(shù)據(jù)將會(huì)從各個(gè)方面來幫助政府實(shí)施高效和精細(xì)化管理。政府運(yùn)作效率的提升,決策的科學(xué)客觀,財(cái)政支出合理透明都將大大提升國家整體實(shí)力,成為國家競(jìng)爭(zhēng)優(yōu)勢(shì)。大數(shù)據(jù)帶個(gè)國家和社會(huì)的益處將會(huì)具有極大的想象空間。
十三、輿情監(jiān)控大數(shù)據(jù) 名探柯南
《黑貓警長(zhǎng)》大家都很熟悉,它講述的是“黑貓警長(zhǎng)”如何精明能干、對(duì)壞人窮追不舍、跌宕起伏的故事情節(jié)。拿到大數(shù)據(jù)時(shí)代背景下的話,雖然它也能體現(xiàn)“黑貓警長(zhǎng)”的盡職盡責(zé)、聰明能干,但更多的會(huì)歸結(jié)到一個(gè)問題:為何還是如此的被動(dòng)、低效?疾病可以預(yù)防,難道犯罪不能預(yù)防么?
答案是肯定的。美國密歇根大學(xué)研究人員就設(shè)計(jì)出一種利用“超級(jí)計(jì)算機(jī)以及大量數(shù)據(jù)”來幫助警方定位那些最易受到不法份子侵?jǐn)_片區(qū)的方法。具體做法是,研究人員通過大量的多類型數(shù)據(jù)(從人口統(tǒng)計(jì)數(shù)據(jù)到毒品犯罪數(shù)據(jù)到各區(qū)域所出售酒的種類、治安狀況、流動(dòng)人口數(shù)據(jù)等等),創(chuàng)建一張波士頓犯罪高發(fā)地區(qū)熱點(diǎn)圖。同時(shí),還將相鄰片區(qū)等各種因素加入到數(shù)據(jù)模型中,并根據(jù)歷史犯罪記錄和地點(diǎn)統(tǒng)計(jì)并不斷修正所得出的預(yù)測(cè)數(shù)據(jù)。
國家正在將大數(shù)據(jù)技術(shù)用于輿情監(jiān)控,其收集到的數(shù)據(jù)除了解民眾訴求,降低群體事件之外,還可以用于犯罪管理。大量的社會(huì)行為正逐步走向互聯(lián)網(wǎng),人們更愿意借助于互聯(lián)網(wǎng)平臺(tái)來表述自己的想法和宣泄情緒。社交媒體和朋友圈正成為追蹤人們社會(huì)行為的平臺(tái),正能量的東西有,負(fù)能量的東西也不少。一些好心人通過微博來幫助別人尋找走失的親人或提供可能被拐賣人口的信息,這些都是社會(huì)群體互助的例子。國家可以利用社交媒體分享的圖片和交流信息,來收集個(gè)體情緒信息,預(yù)防個(gè)體犯罪行為和反社會(huì)行為。最近警方通過微搏信息抓獲了聚眾吸毒的人,處罰了虐待小孩的家長(zhǎng)。
大數(shù)據(jù)技術(shù)的發(fā)展帶來企業(yè)經(jīng)營決策模式的轉(zhuǎn)變,驅(qū)動(dòng)著行業(yè)變革,衍生出新的商機(jī)和發(fā)展契機(jī)。駕馭大數(shù)據(jù)的能力已被證實(shí)為領(lǐng)軍企業(yè)的核心競(jìng)爭(zhēng)力,這種能力能夠幫助企業(yè)打破數(shù)據(jù)邊界,繪制企業(yè)運(yùn)營全景視圖,做出最優(yōu)的商業(yè)決策和發(fā)展戰(zhàn)略。其實(shí),不論是哪個(gè)行業(yè)的大數(shù)據(jù)分析和應(yīng)用場(chǎng)景,可以看到一個(gè)典型的特點(diǎn)還是無法離開以人為中心所產(chǎn)生的各種用戶行為數(shù)據(jù),用戶業(yè)務(wù)活動(dòng)和交易記錄,用戶社交數(shù)據(jù),這些核心數(shù)據(jù)的相關(guān)性再加上可感知設(shè)備的智能數(shù)據(jù)采集就構(gòu)成一個(gè)完整的大數(shù)據(jù)生態(tài)環(huán)境。