王欣磊發(fā)現(xiàn),最近,網(wǎng)上超市“1號(hào)店”在線購(gòu)物車(chē)的轉(zhuǎn)化率下降了。身為1號(hào)店副總裁的他,試圖找出其中的原因:缺貨,也許是一個(gè)直接因素,但除了缺貨,其他細(xì)節(jié)也可能導(dǎo)致購(gòu)物車(chē)轉(zhuǎn)化率的下降。他知道,這些看起來(lái)似乎并不起眼的細(xì)節(jié),統(tǒng)統(tǒng)增加了問(wèn)題解決的復(fù)雜性。
作為電商產(chǎn)品設(shè)計(jì)領(lǐng)域的資深人士,王欣磊向來(lái)喜歡用數(shù)據(jù)分析問(wèn)題。但越來(lái)越豐富的數(shù)據(jù),也給他帶來(lái)了新困惑:當(dāng)一個(gè)數(shù)字在下降,另一個(gè)數(shù)字在上升時(shí),如何證明這兩者間具有相關(guān)性?購(gòu)物車(chē)轉(zhuǎn)化率下降的問(wèn)題,便是一個(gè)典型的案例。
在最近興起的“大數(shù)據(jù)”研究中,王欣磊嘗試為自己的疑問(wèn)找到答案,但結(jié)果卻并不令人滿意。“《大數(shù)據(jù)時(shí)代》那本書(shū)中提到,人們不再需要探究數(shù)據(jù)間的因果關(guān)系,而只需要知道相關(guān)關(guān)系。但在實(shí)際操作中,我們?cè)鯓优袛噙@種相關(guān)關(guān)系是一段時(shí)間內(nèi)的偶然現(xiàn)象,還是必然的趨勢(shì)?這是個(gè)很大的問(wèn)題。”
但即便面對(duì)種種困惑,“大數(shù)據(jù)”,對(duì)1號(hào)店來(lái)說(shuō)依然是一座金礦,并已經(jīng)開(kāi)始從中有所收獲。比如,1號(hào)店已經(jīng)在幫商家分析商品之間的關(guān)聯(lián)度,并以之為依據(jù)制定營(yíng)銷(xiāo)策略。比如,1號(hào)店發(fā)現(xiàn),當(dāng)可口可樂(lè)和奧利奧餅干的關(guān)聯(lián)度特別高時(shí),就可以推薦商家做聯(lián)合營(yíng)銷(xiāo)。
1號(hào)店稱,其每天的流量(獨(dú)立IP)已高達(dá)400多萬(wàn),而每一個(gè)訪客又會(huì)看近10個(gè)頁(yè)面。用1號(hào)店董事長(zhǎng)于剛的話說(shuō),除了用戶買(mǎi)什么或不買(mǎi)什么,“用戶的瀏覽路徑,先看哪個(gè)頁(yè)面,后看哪個(gè),通過(guò)哪個(gè)鏈接切換,用搜索還是類(lèi)目瀏覽等,1號(hào)店統(tǒng)統(tǒng)都能掌握”,“基于這些數(shù)據(jù),能做的事情太多了”。
挖掘每個(gè)用戶
準(zhǔn)確地說(shuō),1號(hào)店的“數(shù)據(jù)挖掘”起步于3年多前。彼時(shí),公司購(gòu)買(mǎi)了數(shù)據(jù)倉(cāng)庫(kù),并建立了自己的BI(商業(yè)智能)團(tuán)隊(duì),試圖通過(guò)建立顧客的行為模型,來(lái)提供更精準(zhǔn)化的服務(wù)。
不過(guò)那時(shí),1號(hào)店的關(guān)注點(diǎn)還僅僅停留在用戶的購(gòu)買(mǎi)記錄和收藏行為上。相比之下,它目前對(duì)數(shù)據(jù)的捕捉,顯然更加“精細(xì)化”。無(wú)論是購(gòu)買(mǎi)頻次,還是用戶的性別、年齡、習(xí)慣等,都能幫助它分析和跟蹤消費(fèi)模式的微妙變化,進(jìn)而“投其所好”地實(shí)現(xiàn)最大化的銷(xiāo)售。
譬如,當(dāng)一個(gè)用戶瀏覽了商品后沒(méi)有購(gòu)買(mǎi),1號(hào)店緊接著便會(huì)分析整個(gè)購(gòu)物過(guò)程“卡”在哪個(gè)環(huán)節(jié)上。假如商品已經(jīng)加入了購(gòu)物車(chē),那么導(dǎo)致用戶沒(méi)有購(gòu)買(mǎi)的很可能是高運(yùn)費(fèi),1號(hào)店很可能會(huì)調(diào)整運(yùn)費(fèi);倘若用戶沒(méi)有購(gòu)買(mǎi)是因?yàn)閹?kù)存缺貨,那么下次庫(kù)存到貨后公司就會(huì)提醒用戶購(gòu)買(mǎi);如果用戶瀏覽了許多類(lèi)似的商品卻最終沒(méi)有購(gòu)買(mǎi),那么可以推測(cè)用戶對(duì)這一品類(lèi)的商品感興趣,只是沒(méi)有找到自己想要的品牌。這種情況下,只要有新品上架,1號(hào)店就會(huì)第一時(shí)間推薦用戶購(gòu)買(mǎi)。
還有一種可能是,商品的價(jià)格太高嚇退了顧客,那么一旦有關(guān)于該商品的促銷(xiāo),1號(hào)店就會(huì)提醒顧客購(gòu)買(mǎi)。假如顧客依然沒(méi)有購(gòu)買(mǎi),1號(hào)店就假設(shè)用戶并不想要這個(gè)商品,而是想要類(lèi)似商品,于是只要有類(lèi)似的新品推出,公司就會(huì)作出推薦。
在此基礎(chǔ)上,公司觀察到許多用戶的購(gòu)買(mǎi)頻次有其規(guī)律性,假如一個(gè)用戶上1號(hào)店只購(gòu)買(mǎi)洗發(fā)水,且每三周購(gòu)買(mǎi)一次,那么一旦用戶哪一次沒(méi)有購(gòu)買(mǎi),1號(hào)店就會(huì)想方設(shè)法地“提醒”他。
除了最終購(gòu)買(mǎi)的商品外,用戶的瀏覽路徑同樣受到了重視。在于剛看來(lái),這些看似不經(jīng)意的行為里蘊(yùn)含了大量信息。“一個(gè)簡(jiǎn)單例子是,用戶進(jìn)入1號(hào)店頁(yè)面后第一個(gè)瀏覽的商品,就是他的目標(biāo)商品。假如用戶首先瀏覽了牛奶,那么你就應(yīng)該推薦他不同品牌的牛奶。”他說(shuō)道。當(dāng)然,這里頭還有許多推薦的“技巧”——如果用戶對(duì)某一品牌的牛奶比較忠誠(chéng),那么1號(hào)店就不應(yīng)推薦其他品牌的牛奶,而應(yīng)推薦與牛奶搭配的面包、餅干或早餐谷物等。
那些購(gòu)買(mǎi)目的性很強(qiáng)的用戶,常常會(huì)使用搜索的方式進(jìn)入所需商品的頁(yè)面。對(duì)于這一類(lèi)用戶,1號(hào)店同樣也會(huì)“直截了當(dāng)”地推薦他們的目標(biāo)商品;另一些用戶喜歡“逛”,他們往往通過(guò)類(lèi)目來(lái)選擇商品,“比如先買(mǎi)吃的,再買(mǎi)喝的,最后買(mǎi)用的”。對(duì)于這類(lèi)客戶,1號(hào)店傾向于同時(shí)向他展示很多商品,特別是新品,滿足其獵奇、“閑逛”的心理;而對(duì)于那些被促銷(xiāo)頁(yè)面吸引的用戶,公司則會(huì)向他們展示熱推或促銷(xiāo)的商品,以推動(dòng)其購(gòu)買(mǎi)。
在1號(hào)店上購(gòu)物的顧客,可能并不知道,自己每一次的購(gòu)物行為,正幫助這家電商公司逐步了解自己,并為自己描摹出一幅大概的生活圖景。據(jù)王欣磊稱,1號(hào)店首先會(huì)根據(jù)用戶的購(gòu)買(mǎi)金額和頻次將其分為四個(gè)大群,在用戶大群的基礎(chǔ)上,公司根據(jù)用戶的瀏覽習(xí)慣,為其打上更為細(xì)致的“標(biāo)簽”。這種描繪用戶個(gè)人信息及購(gòu)買(mǎi)偏好的標(biāo)簽,多達(dá)成百上千個(gè),“比如,他是傾向于購(gòu)買(mǎi)哪一類(lèi)商品的?他的瀏覽行為是什么,是喜歡搜索還是用類(lèi)目瀏覽?他喜歡在上班時(shí)間購(gòu)物,還是在周末購(gòu)物?購(gòu)買(mǎi)的周期和收貨的習(xí)慣又是什么?”王欣磊說(shuō)道,在將客戶抽象為一個(gè)個(gè)具體的標(biāo)簽后,1號(hào)店便能有的放矢地進(jìn)行營(yíng)銷(xiāo)。
他同時(shí)坦言,1號(hào)店并沒(méi)有辦法直接獲得用戶的性別、家庭狀況、收入狀況等信息,但可以通過(guò)幾種方式去推測(cè)。一個(gè)明顯例子是,公司可以根據(jù)用戶的姓名,并結(jié)合一些購(gòu)買(mǎi)行為,來(lái)推測(cè)用戶的性別。
從今年起,中科院的一個(gè)研究小組也加入了1號(hào)店的客戶數(shù)據(jù)研究中。雙方研究的重點(diǎn)便聚焦在顧客的分群。“他們會(huì)將顧客分為忠實(shí)顧客、風(fēng)險(xiǎn)顧客(較易流失的顧客)和需要提升的顧客,并對(duì)不同顧客的行為做進(jìn)一步的分析。”王欣磊稱。
“大數(shù)據(jù)”噪音
除了對(duì)消費(fèi)行為的分析研究,如何借助數(shù)據(jù)讓產(chǎn)品價(jià)格更具競(jìng)爭(zhēng)力同樣重要。眼下,1號(hào)店后臺(tái)的PIS(價(jià)格智能系統(tǒng))每天實(shí)時(shí)在線搜索60多個(gè)網(wǎng)站和1700多萬(wàn)種商品的庫(kù)存信息和價(jià)格信息,并根據(jù)競(jìng)爭(zhēng)對(duì)手的商品價(jià)格實(shí)時(shí)調(diào)整自己的商品價(jià)格。
具體說(shuō)來(lái),在公司設(shè)置的價(jià)格模型中,不同的品類(lèi)都有相應(yīng)的市場(chǎng)價(jià)格策略。“譬如,有些品類(lèi)的價(jià)格要做到業(yè)界領(lǐng)先,有些品類(lèi)只要不高于競(jìng)爭(zhēng)對(duì)手就行了。有些是我的利潤(rùn)品類(lèi),有些是流量品類(lèi)。”于剛稱,“我們?cè)趦r(jià)格模型中設(shè)置底價(jià)后,系統(tǒng)就會(huì)根據(jù)對(duì)手的動(dòng)態(tài)價(jià)格自動(dòng)調(diào)整商品的價(jià)格。你知道,1號(hào)店有幾百萬(wàn)種商品,完全沒(méi)有辦法用手工設(shè)置價(jià)格。”
于剛稱,在1號(hào)店較為擅長(zhǎng)的食品飲料領(lǐng)域,公司試圖做到價(jià)格領(lǐng)先,“尤其是進(jìn)口牛奶品類(lèi),60%的線上銷(xiāo)售都是通過(guò)1號(hào)店走的”;而在服裝等領(lǐng)域,公司追求的則是毛利。
盡管這些做法看起來(lái)無(wú)懈可擊,但隨著1號(hào)店的數(shù)據(jù)量越積越多,它也開(kāi)始面臨新的煩惱:比如,應(yīng)該怎樣將海量的數(shù)據(jù)進(jìn)行過(guò)濾,去蕪存菁?王欣磊并不諱言,“數(shù)據(jù)的純潔性是一個(gè)很大的問(wèn)題。”
不難理解,當(dāng)公司由于促銷(xiāo)而使得銷(xiāo)量大增時(shí),消費(fèi)者在那一特定階段的行為與未來(lái)的趨勢(shì)無(wú)關(guān);此外,一些季節(jié)性、節(jié)假日的數(shù)據(jù)也要過(guò)濾,而那些因?yàn)楦?jìng)爭(zhēng)對(duì)手的促銷(xiāo)導(dǎo)致銷(xiāo)量突然下滑的數(shù)據(jù)也要剔除在外。
除了外部干擾,消費(fèi)者的個(gè)人操作中也包含著不少無(wú)效行為,這同樣被視為一種“數(shù)據(jù)噪音”。于剛發(fā)現(xiàn),有的用戶上1號(hào)店并不是為了購(gòu)物,而純粹是為了測(cè)試網(wǎng)站,“他注冊(cè)之后,往往下一個(gè)訂單后取消,再下一個(gè)訂單再取消,這些用戶肯定不在我們的研究范圍”。
相比之下,更大的難題在于,線下批發(fā)商對(duì)線上數(shù)據(jù)的干擾。據(jù)王欣磊稱,一些地區(qū)的線下批發(fā)商可能是因?yàn)榫€上渠道的價(jià)格更便宜,于是通過(guò)各種渠道拿到優(yōu)惠券在線上購(gòu)買(mǎi),再將貨品轉(zhuǎn)移到線下去賣(mài)。“批發(fā)用戶擁有很多的注冊(cè)賬號(hào),這對(duì)我們很不利,也給數(shù)據(jù)帶來(lái)很大的干擾。”他指出,“我們會(huì)通過(guò)技術(shù)的手段去防批發(fā),并不斷地清理數(shù)據(jù)。但如何去驗(yàn)證真正的消費(fèi)者數(shù)據(jù),目前依舊是個(gè)很大的挑戰(zhàn)。”
收集數(shù)據(jù)的下一步,是對(duì)數(shù)據(jù)進(jìn)行分析和解答。事實(shí)上,面對(duì)同一組數(shù)據(jù),不同的人從不同的角度分析,會(huì)得出全然不同的結(jié)論。也有人認(rèn)為,隨著數(shù)據(jù)量的增大,研究的準(zhǔn)確性一開(kāi)始會(huì)隨之上升,但很快就會(huì)趨平。眼下,業(yè)界亦并沒(méi)有形成放之四海而皆準(zhǔn)的解讀方法。從這個(gè)角度看,如何正確地解讀數(shù)據(jù),讓數(shù)據(jù)模型越來(lái)越準(zhǔn)確,是擺在所有電商企業(yè)面前的難題。
在復(fù)雜的模型之上,算法同樣重要。1號(hào)店需要在極短的時(shí)間內(nèi),通過(guò)算法解讀用戶的行為,并在得到結(jié)論后做出實(shí)時(shí)的推薦。用于剛的話說(shuō),“當(dāng)一個(gè)顧客用搜索來(lái)挑選商品時(shí),我們的后臺(tái)需要為這一搜索做支持,算法得非??觳判?mdash;—否則用戶等待的時(shí)間一長(zhǎng),就會(huì)不耐煩。”
不難發(fā)現(xiàn),1號(hào)店對(duì)大數(shù)據(jù)的研究和運(yùn)用,仍處于摸索階段,而在全球范圍內(nèi),這依然是一個(gè)新鮮的應(yīng)用。很多時(shí)候,于剛會(huì)對(duì)新的數(shù)據(jù)應(yīng)用感到興奮,但有時(shí),他也會(huì)顯得力不從心——在他眼里,學(xué)術(shù)界如今已做了很多關(guān)于大數(shù)據(jù)的前瞻性研究,企業(yè)界則嘗試著大量的應(yīng)用,但兩者間的關(guān)聯(lián)并不大,甚至朝著截然不同的方向前行。換言之,在學(xué)術(shù)研究與實(shí)際應(yīng)用中,尚有很大的鴻溝。
“我們需要把這兩者有機(jī)地結(jié)合起來(lái),把研究的結(jié)果放到實(shí)踐中去,我覺(jué)得,這是最難的一點(diǎn),也是最需要花力氣的。”于剛說(shuō)。