彭蘭特:大數(shù)據(jù)不再紙上談兵

責(zé)任編輯:editor006

2014-09-02 19:14:34

摘自:百度百家

阿萊克斯彭蘭特在演講中便展示了許多實(shí)驗(yàn):通過(guò)大數(shù)據(jù)分析可以了解人群的信用卡還款習(xí)慣、可以了解特定人群的著裝愛(ài)好

在“可穿戴設(shè)備之父”和“全球七大大數(shù)據(jù)專家之一”的阿萊克斯-彭蘭特在BIG TALK演講開(kāi)始之前,有人提出問(wèn)題 “大數(shù)據(jù)與可穿戴的關(guān)系究竟是什么”“大數(shù)據(jù)與統(tǒng)計(jì)學(xué)區(qū)別是什么”?這兩個(gè)問(wèn)題百度都可以給出一個(gè)很好的答案:大數(shù)據(jù)與可穿戴沒(méi)有直接關(guān)系,同時(shí)它與統(tǒng)計(jì)學(xué)有聯(lián)系但卻完全不是一回事兒。

如果說(shuō)智能手環(huán)和智能手表是可穿戴的冰山一角,那么可穿戴的大數(shù)據(jù)應(yīng)用又是整個(gè)大數(shù)據(jù)世界的冰山一角。可穿戴設(shè)備通過(guò)遍布世界的傳感器連續(xù)不間斷地采集、上傳數(shù)據(jù)到云端,并基于此進(jìn)行數(shù)據(jù)分析,給用戶提供健康服務(wù)、提醒服務(wù)或者疾病預(yù)測(cè)等等?;诖丝梢哉J(rèn)為,可穿戴與大數(shù)據(jù)確實(shí)有一定程度的聯(lián)系:大數(shù)據(jù)可以讓可穿戴設(shè)備發(fā)揮出來(lái)威力,同時(shí)如果將穿戴在物體上或者嵌入在環(huán)境中能夠感知用戶的設(shè)備都當(dāng)作“可穿戴”,那么它們確實(shí)是未來(lái)十分重要的大數(shù)據(jù)的收集手段。不過(guò),在可穿戴之外還有更多大數(shù)據(jù)的應(yīng)用。

阿萊克斯彭蘭特在演講中便展示了許多實(shí)驗(yàn):通過(guò)大數(shù)據(jù)分析可以了解人群的信用卡還款習(xí)慣、可以了解特定人群的著裝愛(ài)好,可以了解特定人群的出行作息習(xí)慣,進(jìn)而給企業(yè)帶來(lái)營(yíng)銷(xiāo)層面的商業(yè)價(jià)值。

通過(guò)個(gè)體行為變化幾乎可以判定這個(gè)人會(huì)患有流感或者某種傳染病,當(dāng)這樣的樣本夠多并且同時(shí)掌握他們不同時(shí)段出現(xiàn)在不同地段的數(shù)據(jù)時(shí),就可以判斷其他人患有流感的幾率,就是說(shuō)通過(guò)大數(shù)據(jù)了解流感的傳播路徑和接觸網(wǎng)絡(luò),衛(wèi)生部門(mén)可以進(jìn)行更好的流感防治,為此彭蘭特的團(tuán)隊(duì)曾繪制特別的地圖幫助科特迪瓦改進(jìn)公共衛(wèi)生系統(tǒng),以此來(lái)減少20%的感染性疾病的發(fā)病,且不增加他的成本。

在交通領(lǐng)域,通過(guò)追蹤一個(gè)司機(jī)的駕駛習(xí)慣,是否喜歡違規(guī)、是否疲勞駕駛、踩剎車(chē)動(dòng)作是否嫻熟,是否喜歡駕車(chē)打電話甚至是醉駕,等等,可以了解其駕車(chē)風(fēng)險(xiǎn)系數(shù),如果再結(jié)合汽車(chē)所探測(cè)的路況數(shù)據(jù)以及云端所掌握的更多汽車(chē)司機(jī)的數(shù)據(jù),譬如進(jìn)入某個(gè)危險(xiǎn)路段同時(shí)又遇到另外一個(gè)更加危險(xiǎn)的司機(jī),顯而易見(jiàn)可以預(yù)測(cè)到接下來(lái)三到四秒這個(gè)司機(jī)發(fā)生事故的幾率會(huì)加倍。當(dāng)然,除了預(yù)測(cè)個(gè)體司機(jī)駕駛風(fēng)險(xiǎn)之外,大數(shù)據(jù)還可以掌握通過(guò)車(chē)聯(lián)網(wǎng)和路網(wǎng)數(shù)據(jù)去分析交通資源的使用情況,進(jìn)而指導(dǎo)交通部門(mén)整體規(guī)劃和汽車(chē)司機(jī)出行路徑的選擇,最終讓整個(gè)交通網(wǎng)絡(luò)運(yùn)轉(zhuǎn)效率最高負(fù)擔(dān)最小。

上述例子均是阿歷克斯-彭蘭特所列舉,正如其在BIG TALK后接受專訪所指出的那樣:百度已經(jīng)逐漸找到了如何把紙上談兵的數(shù)據(jù)轉(zhuǎn)化為具有實(shí)際運(yùn)用價(jià)值的產(chǎn)品的有效方式。大家都知道百度基于深度學(xué)習(xí)對(duì)世界杯的預(yù)測(cè)表現(xiàn)比其他科技大鱷都要出彩,不過(guò)這只不過(guò)是百度給大家做了一個(gè)“玩具”,百度的大數(shù)據(jù)應(yīng)用已經(jīng)走了很遠(yuǎn)。

春節(jié)期間,百度遷徙可以圖形化地展示全國(guó)人口遷徙情況震撼了不少人,此后百度基于地圖的大數(shù)據(jù)應(yīng)用繼續(xù)復(fù)制到流感地圖、商圈熱力圖、旅游預(yù)測(cè)。未來(lái)商家可以根據(jù)熱力圖選擇在哪個(gè)商圈促銷(xiāo),用戶則可以選擇去人少一點(diǎn)的地方逛街。據(jù)說(shuō)百度正在與首都機(jī)場(chǎng)合作,通過(guò)地理圍欄可以精細(xì)化地了解你在哪個(gè)點(diǎn),并且給你推送對(duì)應(yīng)的服務(wù)。在交通上百度與寶馬合作最為經(jīng)典的情景便是,可以通過(guò)攝像頭追蹤用戶的面部變化進(jìn)而發(fā)現(xiàn)此用戶是否疲勞,如果是,云端馬上提醒。在娛樂(lè)上百度可以通過(guò)用戶需求變化去預(yù)測(cè)一部電影的票房甚至幫助影視節(jié)目去選擇更受用戶親睞的演員。

正是因?yàn)榘俣仍诖髷?shù)據(jù)的成功案例在商業(yè)、醫(yī)療、交通和娛樂(lè)各個(gè)領(lǐng)域都十分豐富,中國(guó)一些政府部門(mén)均與百度開(kāi)始合作,衛(wèi)生部門(mén)與其合作基于大數(shù)據(jù)做流感預(yù)測(cè)和防治,交通部門(mén)與之合作大數(shù)據(jù)交通規(guī)劃管理,甚至聯(lián)合國(guó)都看上了百度的大數(shù)據(jù)能力并與之聯(lián)合成立大數(shù)據(jù)實(shí)驗(yàn)室。

同時(shí),百度已將大數(shù)據(jù)能力通過(guò)大數(shù)據(jù)引擎開(kāi)放出來(lái),數(shù)據(jù)工廠、開(kāi)放云和百度大腦,從基礎(chǔ)設(shè)施到能力接口到大數(shù)據(jù)挖掘和人工智能均已開(kāi)放給所有的開(kāi)發(fā)者和企業(yè)。如果企業(yè)有海量數(shù)據(jù),尤其是傳統(tǒng)企業(yè),沒(méi)有能力挖掘又不想坐視其浪費(fèi)時(shí)便可選擇百度大數(shù)據(jù)引擎。

盡管百度在可穿戴設(shè)備領(lǐng)域也布局頗多推出了Dulife智能健康設(shè)備平臺(tái)并將可穿戴開(kāi)源,但百度在大數(shù)據(jù)上的應(yīng)用已遠(yuǎn)遠(yuǎn)超過(guò)可穿戴設(shè)備的范疇。從百度在大數(shù)據(jù)領(lǐng)域取得的成功可以看出, “大數(shù)據(jù)與統(tǒng)計(jì)學(xué)”最核心的兩個(gè)差別是:

1、統(tǒng)計(jì)學(xué)處理的是結(jié)構(gòu)化數(shù)據(jù),用EXCLE表或者數(shù)據(jù)庫(kù)來(lái)統(tǒng)計(jì)分析,大數(shù)據(jù)處理的則是非結(jié)構(gòu)化數(shù)據(jù)。視頻、圖片、聲音、文字、位移、搜索行為,均是“大數(shù)據(jù)”,百度作為一款搜索引擎,一直在處理非結(jié)構(gòu)化的WEB數(shù)據(jù),移動(dòng)時(shí)代則又大力探索多媒體數(shù)據(jù)挖掘、深度學(xué)習(xí)等新型技術(shù)。

2、統(tǒng)計(jì)學(xué)是從數(shù)據(jù)尋找已有規(guī)律去支持或者證偽某個(gè)結(jié)論,大數(shù)據(jù)最重要的價(jià)值在于預(yù)測(cè)。通過(guò)統(tǒng)計(jì)人們只能知道廣州的降水量一定會(huì)超過(guò)蘭州,但無(wú)法知道接下來(lái)一個(gè)小時(shí)甚至半個(gè)小時(shí)的天氣,大數(shù)據(jù)可以做到——基于此可以認(rèn)為天氣預(yù)報(bào)是大數(shù)據(jù)應(yīng)用。要做預(yù)測(cè)就需要對(duì)海量非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行處理并且做到接近實(shí)時(shí),這需要強(qiáng)大的計(jì)算能力、算法以及讓算法自我進(jìn)化的能力——深度學(xué)習(xí),這均是百度所擅長(zhǎng)。

阿歷克斯彭蘭特則認(rèn)為,百度在大數(shù)據(jù)上取得成功主要原因在于幾點(diǎn):1、百度面向的市場(chǎng)是中國(guó),是全球人口最多、互聯(lián)網(wǎng)規(guī)模最大的市場(chǎng),人口紅利帶來(lái)數(shù)據(jù)紅利(一些小國(guó)家能夠產(chǎn)生的數(shù)據(jù)還不如中國(guó)的一個(gè)省);2、百度是中國(guó)第一大搜索引擎,搜索引擎可以給大數(shù)據(jù)提供天然的技術(shù)和市場(chǎng)支撐(技術(shù)層面看,搜索引擎做的事情就是在處理數(shù)據(jù)和信息);3、百度超越了創(chuàng)新的地域邊界,懂得如何向全球借力,百度在硅谷設(shè)立實(shí)驗(yàn)室大力招攬全球創(chuàng)新人才,便能說(shuō)明這一點(diǎn)。

阿歷克斯彭蘭特最后認(rèn)為,百度面臨的選擇非常多,需要對(duì)未來(lái)的戰(zhàn)略做出最好的選擇,從而支撐其繼續(xù)成長(zhǎng)和發(fā)展。全球大數(shù)據(jù)專家對(duì)百度的認(rèn)可說(shuō)明了百度在大數(shù)據(jù)上確實(shí)做到了“不再紙上談兵”。我想說(shuō)的是,認(rèn)為“大數(shù)據(jù)太虛”的人,可以多關(guān)注下百度在大數(shù)據(jù)領(lǐng)域所取得的成就以及接下來(lái)的動(dòng)作——不要再有偏見(jiàn)地認(rèn)為中國(guó)互聯(lián)網(wǎng)公司只會(huì)抄襲了。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)