Intetix Foundation(英明泰思基金會(huì))由從事數(shù)據(jù)科學(xué)、非營(yíng)利組織和公共政策研究的中國(guó)學(xué)者發(fā)起成立,致力于通過(guò)數(shù)據(jù)科學(xué)改善人類社會(huì)和自然環(huán)境。通過(guò)聯(lián)絡(luò)、動(dòng)員中美最頂尖的數(shù)據(jù)科學(xué)家和社會(huì)科學(xué)家,以及分布在全球的志愿者,我們創(chuàng)造性地踐行著我們的使命:為美好生活洞見(jiàn)數(shù)據(jù)價(jià)值。
“對(duì)沃爾瑪最重要的是它的規(guī)模。消費(fèi)群的規(guī)模、產(chǎn)品的規(guī)模、以及技術(shù)的規(guī)模。”“我們渴望洞見(jiàn)世界上每一個(gè)產(chǎn)品,我們渴望了解世界上每一個(gè)人。我們希望能夠通過(guò)交易將產(chǎn)品與用戶連接。”
沃爾瑪?shù)?013年全球電子商務(wù)公司首席執(zhí)行官?gòu)氖杖敕矫嬷v,2014年沃爾瑪是世界上最大的零售商。沃爾瑪每天從美國(guó)4300家分店獲得將近3600萬(wàn)美元營(yíng)業(yè)額,同時(shí)雇員近200萬(wàn)人。沃爾瑪在大數(shù)據(jù)還未在行業(yè)流行前就開(kāi)始利用大數(shù)據(jù)分析。2012年,沃爾瑪采取行動(dòng)將實(shí)驗(yàn)性的10個(gè)節(jié)點(diǎn)Hadoop集群擴(kuò)展到250節(jié)點(diǎn)組成的Hadoop集群。Hadoop集群遷移的主要目的是把10個(gè)不同的網(wǎng)站整合到一個(gè)網(wǎng)站,這樣所有生成的非結(jié)構(gòu)化數(shù)據(jù)將被收集到一個(gè)新的Hadoop集群。自那時(shí)以來(lái),沃爾瑪為了能夠提供卓越用戶體驗(yàn),而在提供一流電子商務(wù)技術(shù)和在大數(shù)據(jù)分析路上加速向前。沃爾瑪收購(gòu)了一個(gè)新創(chuàng)辦的小公司Inkiru來(lái)提高其大數(shù)據(jù)性能,Inkiru的總部位于加州的帕洛奧圖。Inkiru在有針對(duì)性的市場(chǎng)營(yíng)銷、銷售和反欺詐等方面崗位沃爾瑪提供幫助。Inkiru的預(yù)測(cè)技術(shù)平臺(tái)從不同來(lái)源獲取數(shù)據(jù),并通過(guò)數(shù)據(jù)分析幫助沃爾瑪提高個(gè)性化。Inkiru的預(yù)測(cè)分析平臺(tái)整合機(jī)器學(xué)習(xí)技術(shù)從而自動(dòng)提高算法的準(zhǔn)確性并且可以與各種外部和內(nèi)部集成的數(shù)據(jù)源整合。沃爾瑪如何利用大數(shù)據(jù)?
沃爾瑪有一個(gè)龐大的大數(shù)據(jù)的生態(tài)系統(tǒng)。沃爾瑪?shù)拇髷?shù)據(jù)的生態(tài)系統(tǒng)每天處理數(shù)TB級(jí)的新數(shù)據(jù)和PB級(jí)的歷史數(shù)據(jù)。其分析涵蓋了數(shù)以百萬(wàn)計(jì)的產(chǎn)品數(shù)據(jù)和從不同的來(lái)源的的數(shù)億客戶。沃爾瑪?shù)姆治鱿到y(tǒng)每天分析接近1億關(guān)鍵詞從而優(yōu)化每個(gè)關(guān)鍵字的對(duì)應(yīng)搜索結(jié)果。
沃爾瑪改變了導(dǎo)致重復(fù)銷售的決策,這帶來(lái)了10%至15%在線銷售的明顯漲幅,增加收入為10億美元。大數(shù)據(jù)分析人員通過(guò)分析運(yùn)用大數(shù)據(jù)改變這個(gè)零售巨頭的點(diǎn)在上午策略前后的銷售量,可以看出這些改變的價(jià)值。沃爾瑪?shù)谝粋€(gè)利用Hadoop數(shù)據(jù)的應(yīng)用節(jié)省捕手——只要周邊競(jìng)爭(zhēng)對(duì)手降低了客戶已經(jīng)購(gòu)買的產(chǎn)品的價(jià)格,該應(yīng)用程序就會(huì)提醒客戶。然后這個(gè)應(yīng)用程序會(huì)向客戶發(fā)送一個(gè)禮券補(bǔ)償差價(jià)。
eReceipts應(yīng)用程序?yàn)榭蛻籼峁┵?gòu)買的電子副本。
Hadoop一個(gè)在沃爾瑪?shù)牡貓D應(yīng)用程序利用Hadoop來(lái)維護(hù)全球1000多家沃爾瑪商店的最新地圖。這些地圖能夠給出沃爾瑪商店里一小塊肥皂的精確位置。沃爾瑪如何追蹤用戶?
“我們整合數(shù)據(jù)的能力是無(wú)可媲美的。”沃爾瑪使用數(shù)據(jù)挖掘來(lái)發(fā)現(xiàn)銷售數(shù)據(jù)的模式。數(shù)據(jù)挖掘可以幫助沃爾瑪找到模式,該模式基于哪些產(chǎn)品需要一起購(gòu)買或者購(gòu)買特殊商品前需要購(gòu)買某一產(chǎn)品的信息,向用戶提供商品推薦。在沃爾瑪,有效的數(shù)據(jù)挖掘增加了客戶的轉(zhuǎn)化率。
下面是一個(gè)有效的數(shù)據(jù)挖掘技術(shù)的典型案例:沃爾瑪通過(guò)關(guān)聯(lián)規(guī)則學(xué)習(xí),發(fā)現(xiàn)草莓果的銷售量在颶風(fēng)之前增長(zhǎng)了7倍。沃爾瑪通過(guò)數(shù)據(jù)挖掘確認(rèn)颶風(fēng)和草莓果之間的聯(lián)系,使得它所有的草莓果在颶風(fēng)前簽出。 沃爾瑪單獨(dú)地跟蹤每個(gè)消費(fèi)者。沃爾瑪擁有詳盡的將近1.45億美國(guó)客戶數(shù)據(jù),大約是美國(guó)成年人的60%數(shù)據(jù)。沃爾瑪通過(guò)店內(nèi)WiFi收集關(guān)于客戶購(gòu)買的物品、他們住的地方,他們喜歡的產(chǎn)品等信息。沃爾瑪實(shí)驗(yàn)室的大數(shù)據(jù)團(tuán)隊(duì)分析用戶在Walmart.com的點(diǎn)擊行為,消費(fèi)者在店內(nèi)和線上購(gòu)買的物品,推特上的趨勢(shì),當(dāng)?shù)氐幕顒?dòng)(如舊金山巨人隊(duì)贏得世界大賽),當(dāng)?shù)靥鞖馄钊绾斡绊戀?gòu)買模式,等等。所有的活動(dòng)都是在由大數(shù)據(jù)算法捕獲和分析從而識(shí)別有意義的大數(shù)據(jù)洞察力,而這可幫助數(shù)百萬(wàn)客戶享受個(gè)性化的購(gòu)物體驗(yàn)。
沃爾瑪如何真正提高銷售量?
1推出新產(chǎn)品沃爾瑪正利用社交媒體數(shù)據(jù)來(lái)發(fā)現(xiàn)熱門產(chǎn)品,如此這些熱門產(chǎn)品就可被引入到世界各地的沃爾瑪商店。例如,沃爾瑪通過(guò)分析社交媒體數(shù)據(jù)發(fā)現(xiàn)了熱搜詞“蛋糕棒棒糖”。沃爾瑪迅速反應(yīng),于是蛋糕棒棒糖在各個(gè)商店上架。2更佳預(yù)測(cè)分析技術(shù)基于數(shù)據(jù)分析, 沃爾瑪最近修改了其產(chǎn)品送貨政策。沃爾瑪利用預(yù)測(cè)分析,提高了在線訂單免費(fèi)送貨的最低金額。最新的沃爾瑪送貨政策將面運(yùn)費(fèi)的最低金額從45美元調(diào)高到50美元,但同時(shí)增加了幾個(gè)新產(chǎn)品以提高顧客購(gòu)物體驗(yàn)。
3個(gè)性化定制建議 該行為與谷歌相似,只是谷歌通過(guò)跟蹤用戶瀏覽行為來(lái)量身定制廣告,而沃爾瑪基于用戶購(gòu)買歷史,通過(guò)大數(shù)據(jù)算法分析用戶信用卡購(gòu)買行為從而向其客戶提供專業(yè)建議。沃爾瑪?shù)拇髷?shù)據(jù)分析解決方案
社交媒體大數(shù)據(jù)解決方案
社交媒體的數(shù)據(jù)是非結(jié)構(gòu)化的,非正式的,一般不符合語(yǔ)法的。分析和挖掘數(shù)PB的社交媒體數(shù)據(jù)從而找到重要因素,然后將其映射到有意義的沃爾瑪產(chǎn)品是一個(gè)艱巨的任務(wù)。社交媒體數(shù)據(jù)驅(qū)動(dòng)的決策和技術(shù)比在沃爾瑪異常更加常規(guī)。大部分驅(qū)動(dòng)決策的沃爾瑪?shù)臄?shù)據(jù)是基于社交媒體——Facebook、Pinterest、Twitter、LinkedIn等等。沃爾瑪實(shí)驗(yàn)室利用社交媒體分析從而產(chǎn)生零售相關(guān)的大數(shù)據(jù)見(jiàn)解。 沃爾瑪推出社交媒體眾包競(jìng)賽,該比賽幫助企業(yè)家的產(chǎn)品上架。該比賽吸引了超過(guò)5000個(gè)條目并在美國(guó)獲得100萬(wàn)多張選票。任何人都能參與并幫助他們的產(chǎn)品與數(shù)百萬(wàn)客戶相遇。最好的產(chǎn)品被宣布為贏家并且可以在沃爾瑪商店賣給數(shù)百萬(wàn)客戶。
阿倫 普拉塞斯WalmartLabs首席工程師“社交媒體分析都是從社交渠道挖掘零售相關(guān)的隱藏信息,對(duì)我們來(lái)說(shuō)是非常驚險(xiǎn)和興奮的任務(wù)。當(dāng)我們的團(tuán)隊(duì)在黑色星期五(11月22日)花了一天狂熱追隨社交零售熱潮時(shí),我們知道世界上沒(méi)有一定規(guī)律可言。”
社交基因組(Kosmix的語(yǔ)音網(wǎng)頁(yè)平臺(tái))
“只有征服多倍挑戰(zhàn)后,我們才能得到有意義的推薦...。我們的社交媒體分析項(xiàng)目運(yùn)營(yíng)在600億個(gè)社交文檔上的可查找索引,幫助沃爾瑪?shù)纳碳覍?shí)時(shí)監(jiān)控情緒和流行熱點(diǎn),或調(diào)查過(guò)去的趨勢(shì)。該項(xiàng)目還可以看到社會(huì)情緒和社會(huì)熱點(diǎn)水平的地理差異。項(xiàng)目也有一些工具能幫助產(chǎn)生關(guān)聯(lián)性,如在walmart.com上的婚姻搜索趨勢(shì),在我們的實(shí)體店銷售趨勢(shì)和一個(gè)地方的社會(huì)熱點(diǎn)趨勢(shì)。將這些分析結(jié)果結(jié)合那么這些工具就提供了強(qiáng)有力的社會(huì)洞察力。”
沃爾瑪?shù)腟hopycat-Gift推薦引擎
沃爾瑪利用預(yù)測(cè)分析技術(shù)的庫(kù)存管理
德勤的調(diào)查發(fā)現(xiàn),受移動(dòng)端影響的線下銷售額預(yù)計(jì)在2016年底達(dá)到7000億美元。為得到它的移動(dòng)端戰(zhàn)略,沃爾瑪利用大數(shù)據(jù)的力量驅(qū)動(dòng)工具和服務(wù)的發(fā)展。超過(guò)一半的沃爾瑪?shù)目蛻羰褂弥悄苁謾C(jī),其中35%的消費(fèi)者是成人,接近3/4的總體客戶基礎(chǔ)是成人。移動(dòng)電話客戶對(duì)沃爾瑪是極其重要的,因?yàn)橹悄苁謾C(jī)消費(fèi)者大多出行且出行移動(dòng)消費(fèi)比店內(nèi)消費(fèi)多77%。因此,手機(jī)用戶購(gòu)買量每年占沃爾瑪銷售量的1/3,在節(jié)假日的時(shí)候大約占40%。
沃爾瑪移動(dòng)和數(shù)碼高級(jí)副總裁托馬斯“電子商務(wù)與移動(dòng)購(gòu)買密切相關(guān)。全球最大的零售商將使用大數(shù)據(jù)來(lái)提升消費(fèi)者購(gòu)物體驗(yàn)。”他還補(bǔ)充說(shuō):“我們的移動(dòng)戰(zhàn)略既簡(jiǎn)單又大膽。我們希望移動(dòng)工具成為不可或缺的幫手,當(dāng)他們?cè)谖覀兊陜?nèi)或者線上購(gòu)物時(shí)。這種方式零售為應(yīng)對(duì)未來(lái)競(jìng)爭(zhēng)將提高用戶個(gè)性化體驗(yàn),這一切會(huì)發(fā)生在手中的小屏幕上。”沃爾瑪利用大數(shù)據(jù)分析技術(shù)提高它們移動(dòng)應(yīng)用的預(yù)測(cè)能力。通過(guò)分析客戶和其他客戶每周購(gòu)買數(shù)據(jù),手機(jī)應(yīng)用程序生成一個(gè)購(gòu)物清單。沃爾瑪?shù)囊苿?dòng)應(yīng)用程序由可告訴用戶想購(gòu)買商品的位置的購(gòu)物清單組成,并且該應(yīng)用可通過(guò),幫助他們通過(guò)提供Walmart.com上類似產(chǎn)品的折扣推動(dòng)用戶購(gòu)買。沃爾瑪?shù)牧硪环N利用大數(shù)據(jù)分析力量的方式是實(shí)時(shí)分析——當(dāng)客戶進(jìn)入沃爾瑪商店。沃爾瑪移動(dòng)應(yīng)用的地理圍欄功能無(wú)論何時(shí)都能感知用戶是否進(jìn)入美國(guó)沃爾瑪商店。這個(gè)應(yīng)用程序要求用戶進(jìn)入“商店模式”。移動(dòng)應(yīng)用商店模式幫助用戶掃描特別折扣的量化寬松政策法規(guī)和提供他們想買的產(chǎn)品。沃爾瑪如何應(yīng)對(duì)大數(shù)據(jù)技術(shù)危機(jī)?
沃爾瑪大數(shù)據(jù)每天以驚人速度增長(zhǎng)而大數(shù)據(jù)人才的缺乏成為沃爾瑪數(shù)據(jù)分析的主要障礙。在有限具有大數(shù)據(jù)技術(shù)的人員情況下,沃爾瑪正在采取所有必要的措施來(lái)克服這一挑戰(zhàn)使得它沒(méi)有落后于其競(jìng)爭(zhēng)對(duì)手。每當(dāng)一個(gè)新團(tuán)隊(duì)成員加入沃爾瑪實(shí)驗(yàn)室的分析團(tuán)隊(duì),他/她必須參加分析旋轉(zhuǎn)程序。該項(xiàng)目的候選人必須與各個(gè)部門人員進(jìn)行溝通從而了解整個(gè)公司如何利用大數(shù)據(jù)分析技術(shù)。
沃爾瑪正處于一個(gè)艱難時(shí)刻,難于找到有分析前沿應(yīng)用程序經(jīng)驗(yàn)的專業(yè)人士和能夠利用像Python和R編程語(yǔ)言構(gòu)建機(jī)器學(xué)習(xí)模型的數(shù)據(jù)科學(xué)家。沃爾瑪為其招聘活動(dòng)使用# lovedata標(biāo)簽來(lái)提高不斷壯大的阿肯色州本頓維爾數(shù)據(jù)科學(xué)界知名度。沃爾瑪技術(shù)部門高級(jí)招聘人員 曼達(dá)·塞克爾“人力資源供給和需求之間的鴻溝總是存在,特別是在新興技術(shù)方面。“在每天有超過(guò)40PB數(shù)據(jù)可供分析的沃爾瑪,他認(rèn)為對(duì)于數(shù)據(jù)科學(xué)及數(shù)據(jù)分析人才需求前所未有。沃爾瑪零售業(yè)的成功是天時(shí),地利,人和。在大數(shù)據(jù)分析的顯著幫助下,沃爾瑪將繼續(xù)攀爬零售業(yè)高峰。沃爾瑪努力解決大數(shù)據(jù)技術(shù)人才短缺的問(wèn)題。2014年,沃爾瑪舉辦了一場(chǎng)Kaggle競(jìng)賽,將特定商店的歷史銷售數(shù)據(jù)和相關(guān)的促銷活動(dòng)等信息提供給參加的專業(yè)人士,讓他們建造模型來(lái)顯示這些促銷對(duì)超市各區(qū)域的影響。競(jìng)賽結(jié)果幫助沃爾瑪找到了技術(shù)能力卓越的分析人才。