在過(guò)去幾年,全球零售商一直試圖利用大數(shù)據(jù)創(chuàng)造價(jià)值。由于其大數(shù)據(jù)分析基礎(chǔ)架構(gòu)的限制,許多工作被一再推遲。Hadoop為這些零售商打開(kāi)了新的大門(mén),它可以解決他們?cè)谶^(guò)去幾年在大數(shù)據(jù)領(lǐng)域面臨的許多問(wèn)題和挑戰(zhàn)。
Hadoop:跨多門(mén)編程語(yǔ)言的大數(shù)據(jù)解決方案
Hadoop背后的技術(shù)最初是由Google大約在10年前開(kāi)發(fā)的。核心代碼主要是用Java編寫(xiě)的,但有一些是用C編寫(xiě)的。然而,它運(yùn)行在一個(gè)稱(chēng)為MapReduce的編程模型中,這允許開(kāi)發(fā)人員用其他語(yǔ)言創(chuàng)建新的Hadoop代碼。
由于MapReduce環(huán)境可以接受不同的編程語(yǔ)言代碼,因此它非常通用。它可以提取,分析和操作許多不同來(lái)源的大數(shù)據(jù)。它使用各種算法來(lái)進(jìn)行關(guān)聯(lián)規(guī)則學(xué)習(xí),聚類(lèi),分類(lèi)和回歸。這些算法依賴(lài)于各種函數(shù),包括貝葉斯,期望最大化和FP-Grown算法。
Cloudera的首席執(zhí)行官M(fèi)ike Olson表示,Hadoop目前仍處于起步階段,但它已經(jīng)在塑造零售和金融領(lǐng)域廠商使用大數(shù)據(jù)的方式了。
“Hadoop平臺(tái)旨在解決大量數(shù)據(jù)(可能是復(fù)雜的和結(jié)構(gòu)化的,并且不能很好地融入表中的數(shù)據(jù))的混合問(wèn)題。它適用于深度和計(jì)算量大的分析,例如聚類(lèi)和定位...在在線零售中,如果想為客戶(hù)提供更好的搜索答案,以提高用戶(hù)的購(gòu)買(mǎi)欲望,Hadoop可以很好地解決這一問(wèn)題。
Sears控股公司分部副總裁Aashish Chandra表示,Hadoop已經(jīng)幫助公司降低了運(yùn)營(yíng)成本,提高了銷(xiāo)售額。Chandra說(shuō),以前的大數(shù)據(jù)提取工具缺乏他們所需要的功能。
使用Hadoop挖掘銷(xiāo)售點(diǎn)大數(shù)據(jù)
銷(xiāo)售點(diǎn)數(shù)據(jù)在零售業(yè)中起著非常重要的作用。公司依靠銷(xiāo)售點(diǎn)大數(shù)據(jù)來(lái)預(yù)測(cè)未來(lái)銷(xiāo)售,管理庫(kù)存和項(xiàng)目人員需求。
有許多銷(xiāo)售點(diǎn)工具可以聚合銷(xiāo)售信息并將其存儲(chǔ)在大數(shù)據(jù)集中。然而,零售商難以用常規(guī)工具從PoS中挖掘大數(shù)據(jù),即使它就存儲(chǔ)在SQL數(shù)據(jù)庫(kù)中。Hadoop使零售商更容易從客戶(hù)數(shù)據(jù)庫(kù)訪問(wèn)信息,此數(shù)據(jù)可以轉(zhuǎn)換為其他格式,并與其他文件中的數(shù)據(jù)集合并。
New Horizons CLC的John Soto聲稱(chēng)Hadoop是零售業(yè)主要的改變者。
“大型零售商永遠(yuǎn)不可能利用其傳統(tǒng)的大數(shù)據(jù)基礎(chǔ)設(shè)施進(jìn)行這種分析。存儲(chǔ)如此多的歷史數(shù)據(jù)是十分昂貴的,并且數(shù)據(jù)類(lèi)型復(fù)雜,并且需要相當(dāng)多的準(zhǔn)備以允許它與PoS事務(wù)組合。Hadoop解決了這兩個(gè)問(wèn)題,并且可以運(yùn)行比舊系統(tǒng)更復(fù)雜的分析。”
Hadoop可以讓零售商預(yù)測(cè)分析挑戰(zhàn)
Hadoop消除了零售商在利用大數(shù)據(jù)方面的一些障礙。這里有一些該技術(shù)帶來(lái)的好處:
1、數(shù)據(jù)挖掘能力強(qiáng)。許多零售商都存儲(chǔ)了TB級(jí)別的數(shù)據(jù)。這些數(shù)據(jù)集往往難以提取,因?yàn)樗鼈冇泻苌畹那短住adoop有非常復(fù)雜的索引算法,因此它可以提取以前無(wú)法為大數(shù)據(jù)應(yīng)用程序使用的數(shù)據(jù)。
2、與不同的數(shù)據(jù)格式兼容。零售商以許多不同的格式存儲(chǔ)數(shù)據(jù)。內(nèi)部財(cái)務(wù)數(shù)據(jù)通常存儲(chǔ)在.csv文件中。零售商一直在努力進(jìn)行審計(jì),因?yàn)樗麄儫o(wú)法比較結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)集的數(shù)據(jù)。Hadoop可以提取多種格式的數(shù)據(jù),進(jìn)行分析并以更具凝聚力的形式呈現(xiàn),它使大數(shù)據(jù)分析專(zhuān)家能夠從多個(gè)來(lái)源的數(shù)據(jù)集之間尋找相關(guān)性。
零售商已經(jīng)發(fā)現(xiàn)了使用Hadoop的好處:
1、Staples使用Hadoop分析大數(shù)據(jù)和預(yù)測(cè)未來(lái)的銷(xiāo)售,這有助于他們更有效地分配資源給人員和庫(kù)存。 據(jù)報(bào)道,自使用Hadoop以來(lái),Staples的促銷(xiāo)成本降低了25%。
2、亞馬遜使用Hadoop來(lái)改進(jìn)欺詐檢測(cè)模型。據(jù)報(bào)告,他們將信用卡欺詐減少了50%,因?yàn)樗麄兛梢愿菀椎刈R(shí)別出信用不佳的人。
3、相比之前,Brands可以得到更詳細(xì)的客戶(hù)信息,這有助于他們改進(jìn)營(yíng)銷(xiāo)策略。使用Hadoop和預(yù)測(cè)分析的零售商的銷(xiāo)售額增長(zhǎng)了73%。
零售商只是開(kāi)始認(rèn)識(shí)到Hadoop和大數(shù)據(jù)的潛力。根據(jù)DeZyre所說(shuō),Hadoop最大的優(yōu)勢(shì)之一是它可以幫助零售商實(shí)時(shí)識(shí)別和應(yīng)對(duì)挑戰(zhàn)。這對(duì)防止欺詐尤其重要,因?yàn)樽锓缚偸窃诳紤]新的騙局。
“操縱者總是在發(fā)明新的欺詐工具和技術(shù),零售商必須使用零售分析來(lái)識(shí)別欺詐活動(dòng),防止它們?cè)俅伟l(fā)生。使用大數(shù)據(jù)技術(shù)(如Hadoop,MapReduce和Spark),可以對(duì)超過(guò)50 PB的數(shù)據(jù)執(zhí)行分析,以準(zhǔn)確預(yù)測(cè)潛在風(fēng)險(xiǎn)。”