曾創(chuàng)造了"啤酒與尿布"的經(jīng)典商業(yè)案例的沃爾瑪是最早開始投資和部署大數(shù)據(jù)應(yīng)用的傳統(tǒng)企業(yè)巨頭之一,通俗得講,大數(shù)據(jù)天然不是沃爾瑪,但沃爾瑪天然是大數(shù)據(jù)。
在大數(shù)據(jù)概念引爆流行產(chǎn)業(yè)界之前,沃爾瑪已經(jīng)開始了網(wǎng)站數(shù)據(jù)庫整合遷移和Hadoop集群擴(kuò)展工作,收購Kosmix,在此基礎(chǔ)上建立Walmart Labs,并在近年著手收購專注于數(shù)據(jù)挖掘或移動社交的初創(chuàng)公司如OneOps、Inkiru,Tasty Labs,OneRiot,進(jìn)軍互聯(lián)網(wǎng)。
沃爾瑪希望通過大數(shù)據(jù)應(yīng)用讓消費(fèi)者成為bigger spender,同時(shí)在電子商務(wù)領(lǐng)域奮起直追領(lǐng)導(dǎo)者亞馬遜。
通過自身數(shù)據(jù)積累整合及并購研發(fā),沃爾瑪已然擁有一個(gè)涵蓋消費(fèi)者線下交易數(shù)據(jù)、沃爾瑪網(wǎng)絡(luò)商城電子數(shù)據(jù)與社交媒體應(yīng)用數(shù)據(jù)為一體的實(shí)時(shí)更新積累的大數(shù)據(jù)庫,為沃爾瑪在做出決策前,將執(zhí)行成本降到最低,并且創(chuàng)造新的消費(fèi)機(jī)會。
可以虛擬一個(gè)場景來講沃爾瑪?shù)臄?shù)據(jù)操作:
Sam,是沃爾瑪?shù)馁Y深會員,其近五年來購買商品的品種、數(shù)量、型號、時(shí)間信息,支付方式信息,商品配送信息,會員卡信息,住址、聯(lián)系方式,甚至包括Sam在沃爾瑪?shù)馁徫锪鞒瘫O(jiān)控視頻、門禁數(shù)據(jù)等線下消費(fèi)信息都已被沃爾瑪?shù)男畔⑾到y(tǒng)詳細(xì)記錄。
當(dāng)Sam近日再一次驅(qū)車來到最近的沃爾瑪大賣場時(shí),剛進(jìn)入停車場,Sam的手機(jī)或者iPad等移動終端的沃爾瑪App可能已經(jīng)收到購物清單上百分之八十以上商品的推薦信息和電子優(yōu)惠券信息,App上還按商場流程標(biāo)注了每件商品的具體位置、型號信息,沃爾瑪測試中的“Scan and Go”的系統(tǒng)未來允許Sam用手機(jī)掃描商品,然后收銀臺手機(jī)掃描支付。而移動支付完成的瞬間,沃爾瑪已經(jīng)在數(shù)據(jù)端開始更新Sam的相關(guān)消費(fèi)信息,并開始預(yù)判Sam下一次購買比如牛奶和啤酒等商品的時(shí)間和數(shù)量,并提交數(shù)據(jù)給APP推薦業(yè)務(wù)。
另外,Sam很喜歡一款899美金威爾遜網(wǎng)球拍但沒有加入掃描清單,球拍旁邊的塑膠運(yùn)動模特腦袋里邊的攝像頭記錄下了他的一舉一動,包括Sam的停留時(shí)間,拿起網(wǎng)球拍的次數(shù)及觀察端詳球拍的視角,甚至他是左手握拍還是右手握拍等等,而第二個(gè)月,Sam的手機(jī)推送信息中已經(jīng)有了沃爾瑪推薦的性價(jià)比更高的一款Babolat輕碳球拍。
在Sam案例風(fēng)光的背后,是沃爾瑪實(shí)驗(yàn)室及相關(guān)團(tuán)隊(duì)在維持其大數(shù)據(jù)工作。Walmart Labs著手整合了沃爾瑪旗下網(wǎng)站,將試點(diǎn)Hadoop數(shù)據(jù)節(jié)點(diǎn)正式集群擴(kuò)展,把分散存放在Oracle、Neteeza、Greenplum等數(shù)據(jù)庫中資源統(tǒng)一存入Hadoop數(shù)據(jù)倉庫,并嘗試進(jìn)行內(nèi)部數(shù)據(jù)共享分析。通過開發(fā)大數(shù)據(jù)工具加載交易數(shù)據(jù),體量相對較小但結(jié)構(gòu)化程度較高的線下零售數(shù)據(jù)結(jié)合電子商務(wù)網(wǎng)站數(shù)據(jù)為前向購物選擇預(yù)測提供了基本支撐。
2000年網(wǎng)上商店作為應(yīng)景產(chǎn)品上線,但ebay和亞馬遜讓沃爾瑪認(rèn)識到電子商務(wù)的可怕,便在隨后幾年開始發(fā)力線上。Walmart Labs 推出的 The Social Genome 能夠讓沃爾瑪將消費(fèi)者線下購物數(shù)據(jù)、網(wǎng)絡(luò)瀏覽點(diǎn)擊數(shù)據(jù)、社交網(wǎng)絡(luò)關(guān)系數(shù)據(jù)及消費(fèi)者個(gè)人數(shù)據(jù)等組合成實(shí)時(shí)更新擴(kuò)展且具有定向預(yù)測功能的強(qiáng)大數(shù)據(jù)庫,逐步解決線上環(huán)節(jié)與線下渠道數(shù)據(jù)匹配上的難點(diǎn),并借助于消費(fèi)者在社交網(wǎng)絡(luò)上展現(xiàn)的興趣,預(yù)測他們可能在Walmart下一個(gè)購買的產(chǎn)品。
通過對社交網(wǎng)絡(luò)進(jìn)行深度的數(shù)據(jù)挖掘,實(shí)現(xiàn)網(wǎng)站主頁、商品搜索個(gè)性化,依據(jù)消費(fèi)者的興趣來排列頁面上的結(jié)果。數(shù)據(jù)顯示,截止到13年1月31日,沃爾瑪全球互聯(lián)網(wǎng)銷售額增長30 %增幅十年來第一次超越亞馬遜。
接著講Sam的沃爾瑪購物故事:
月末Sam車被借走了,所以選擇去沃爾瑪?shù)木W(wǎng)上商城,cookie自動登錄后顯示自己上一次登陸沃爾瑪網(wǎng)店是在六個(gè)月前。Sam的首頁推薦上有會員八折的罐裝威爾遜網(wǎng)球,還有新款特價(jià)的全鋼西門子榨汁機(jī),Sam會心一笑:鄰居Peter在twitter上抱怨自家的榨汁機(jī)真垃圾,自己前天點(diǎn)了贊,沃爾瑪竟然知道了!隨后Sam發(fā)現(xiàn)自己的facebook上的唯一關(guān)注音樂人Robbie Williams的新專輯就在眼前。
另外,自家附近的一家健身房年卡正在打折出售,Sam摸摸肚子上的贅肉一咬牙把年卡加入了購物車,心里還抱怨沃爾瑪你TM怎么都知道這么多。
實(shí)際上,沃爾瑪電子商城的消費(fèi)者線上數(shù)據(jù)如瀏覽商品種類時(shí)間,購物車狀態(tài)及支付方式,搜索記錄等都將結(jié)構(gòu)化然后匯入全球統(tǒng)一的Hadoop數(shù)據(jù)倉庫,半年前Sam通過Polaris搜索引擎尋找網(wǎng)球拍的數(shù)據(jù)已經(jīng)為沃爾瑪實(shí)體店通過APP給Sam推Babolat輕碳球拍做好了準(zhǔn)備。沃爾瑪?shù)木€上大數(shù)據(jù)已經(jīng)能夠?yàn)槠渚€下營收帶來銷售增量。
收編Kosmix團(tuán)隊(duì),沃爾瑪看重的是Kosmix對社交媒體的語義分析功能,利用Facebook和Twitter的數(shù)據(jù),工程師從每天熱門消息中,推出與社會時(shí)事呼應(yīng)的商品,創(chuàng)造消費(fèi)需求,同時(shí),針對社交網(wǎng)絡(luò)快消息流的性質(zhì),沃爾瑪內(nèi)部的大數(shù)據(jù)實(shí)驗(yàn)室專門發(fā)展出一套追蹤系統(tǒng),結(jié)合手機(jī)上網(wǎng),專門管理追蹤龐大的社交動態(tài),每天能處理的資訊量超過10億筆。
沃爾瑪資訊中心副總經(jīng)理特瑞爾指出,“沃爾瑪本身就是一個(gè)海量資料系統(tǒng),適用各種商業(yè)上的分析行為”。媒體稱沃爾瑪擁有將近七成美國人的相關(guān)消費(fèi)數(shù)據(jù),八成以上的境內(nèi)郵箱信息。通過其強(qiáng)大數(shù)據(jù)庫的算法推薦和預(yù)測方案,個(gè)人消費(fèi)數(shù)據(jù)能夠預(yù)測一系列的高敏感個(gè)人信息,沃爾瑪將清楚地知道你是誰,你要買什么,甚至你下一步要干什么。
由于缺乏個(gè)人信息保護(hù)意識,很多有色,低收入,邊緣化社區(qū)人群個(gè)人數(shù)據(jù)信息受到大數(shù)據(jù)商業(yè)計(jì)劃侵犯,而弱勢人群在沃爾瑪?shù)臄?shù)據(jù)標(biāo)簽化分類中很容易被識別區(qū)分出來,遭受弱歧視化待遇。
大數(shù)據(jù)會隨著數(shù)據(jù)的結(jié)構(gòu)化和規(guī)?;瘽L動雪球,越來越“大”,越來越“快”,這個(gè)世界上最大的零售商在利用數(shù)據(jù)技術(shù)追逐利潤的同時(shí)也逐漸引起人們的擔(dān)憂:
科技在帶來商業(yè)大發(fā)展的同時(shí)會不會催生出類似《一九八四》中的Big Brother 2.0。