證明大數(shù)據(jù)應(yīng)用和平臺業(yè)務(wù)價值的需求在主流組織中占據(jù)了重要地位,對于IT和分析經(jīng)理們來說,獲取數(shù)據(jù)價值并非易事。
例如:對于密歇根的Blue Cross Blue Shield公司來說,大數(shù)據(jù)部署并不是一時沖動的決定。
Beata Puncevic是這家醫(yī)療保險公司分析總監(jiān),負(fù)責(zé)數(shù)據(jù)工程和數(shù)據(jù)管理,她說:“對于很多像我們這樣的組織,大數(shù)據(jù)還沒有成為運(yùn)營業(yè)務(wù)的核心基礎(chǔ)。如果你去對很多人(主管)講,讓他們在大數(shù)據(jù)平臺上投資,你是很難與他們產(chǎn)生共鳴的,這是很大的挑戰(zhàn)。”
Puncevic認(rèn)為,對于Blue Cross公司和其它醫(yī)療保健企業(yè),這些挑戰(zhàn)包括低利潤率、資源和技能儲備問題,還有相對保守的文化問題。低利潤使得很難為技術(shù)創(chuàng)新留出錢來。她和她的同事們不得不做很多額外的努力來獲得Hadoop數(shù)據(jù)湖的審批和資金。
Puncevic組建了團(tuán)隊針對數(shù)據(jù)湖項目開發(fā)了投資回報率框架,評估大數(shù)據(jù)項目的益處。在構(gòu)建業(yè)務(wù)案例的過程中,她還關(guān)注了三類與IT有關(guān)的改善,包括:降低數(shù)據(jù)處理和管理成本,建立更深刻的分析,創(chuàng)建更靈活和適應(yīng)性的技術(shù)架構(gòu)。
此外,Puncevic說她在爭取獲得公司資金支持,用于本階段項目和后續(xù)項目階段。“因此,我們不必?fù)?dān)心為了大數(shù)據(jù)策略的各種方面從個別業(yè)務(wù)單元獲取資金的問題”。
這種策略很有效,這家底特律的保險公司已經(jīng)啟動了未來三到五年的大數(shù)據(jù)平臺建設(shè)規(guī)劃。Puncevic上周在美國加州San Jose舉辦的2016 Hadoop峰會上說,大數(shù)據(jù)的好處對于整個醫(yī)療行業(yè)來說是“潛力巨大的”。除了節(jié)省IT開支,她還提到了降低醫(yī)療成本的益處,同時可以改善患者就醫(yī)體驗,促進(jìn)醫(yī)學(xué)預(yù)防工作。所有這些都是通過更好的分析獲得的。
利用大數(shù)據(jù)獲益之路大數(shù)據(jù)的價值為Progressive Casualty保險公司及其車險客戶也帶來了絕對真實的價值。Brian Durkin是該公司企業(yè)架構(gòu)組的創(chuàng)新戰(zhàn)略師,他說Progressive公司使用Hadoop集群增強(qiáng)了Snapshot項目,基于從車輛收集到的運(yùn)行數(shù)據(jù)獎勵安全未出險駕駛員購險折扣。Durkin在另一場分會上表示,自從2008年該項目啟動以來,該保險公司已經(jīng)發(fā)放了價值超過5.6億美元的折扣優(yōu)惠。
他說:“這不是科學(xué)實驗,而是已經(jīng)在真實發(fā)生的事。我們在這方面全身心投入,這對我們的客戶也很重要。”
為了跟蹤參保駕駛員并計算折扣,該集群環(huán)境需要收集大量數(shù)據(jù)進(jìn)行處理和分析,他們的集群環(huán)境與Blue Cross公司的是類似的,都是基于Hortonworks Hadoop分布式框架的。Progressive公司已經(jīng)收集了24億數(shù)據(jù),集群留存了所有信息。為了分析駕駛模式,識別壞習(xí)慣駕駛的司機(jī)并警示他們,Durkin認(rèn)為:“越舊的數(shù)據(jù)越有價值。所以他們留存了所有數(shù)據(jù)并對所有歷史數(shù)據(jù)進(jìn)行分析。”
處理數(shù)據(jù)需要大量處理資源,Progressive公司部署了許多高級分析工具供公司數(shù)據(jù)科學(xué)家使用,包括SAS、R編程語言和H2O。Pawan Divakarla是該保險公司在美國俄亥俄州Mayfield Village分部的數(shù)據(jù)和分析業(yè)務(wù)負(fù)責(zé)人,他表示許多業(yè)務(wù)主管們都樂意為此買單。
他說:“我們公司完全是數(shù)據(jù)驅(qū)動的公司,我們希望人們有主觀動機(jī)和想法,但是他們需要用數(shù)據(jù)證明他們的想法。”
Hadoop的高價值應(yīng)用零售商Macy公司運(yùn)行了BI和分析應(yīng)用,也是基于Hortonworks的Hadoop系統(tǒng),他們?yōu)榇酥С譅I銷、銷售計劃、產(chǎn)品管理和其它業(yè)務(wù)運(yùn)營。每天都有成千上萬的商業(yè)用戶訪問數(shù)以百計的BI儀表盤,這是他們做決策需要使用的關(guān)鍵功能。
Chakrapany說:“你不會只想看到Hadoop用作廉價存儲解決方案的,它的價值原不止于此。”
Hadoop仍然在逐漸走向成熟,目前還有一些功能比較粗糙。他提醒說,使用Hadoop的新用戶應(yīng)該了解到它有一些不穩(wěn)定性,有些IT管理功能也不太完善。“如果你認(rèn)為它是絕對可靠的,那么這種想法是不正確的”。他說,盡管如此他還是認(rèn)為Hadoop可以真正成為企業(yè)級的數(shù)據(jù)分析平臺供Macy公司使用。
但是,Chakrapany并不認(rèn)為從大數(shù)據(jù)分析和基于Hadoop的BI應(yīng)用獲益是理所當(dāng)然的事。去年,他組建了團(tuán)隊在內(nèi)部宣講大數(shù)據(jù)環(huán)境的優(yōu)點(diǎn),希望游說更多業(yè)務(wù)單元使用它。他的團(tuán)隊還跟蹤Hadoop平臺產(chǎn)生的業(yè)務(wù)價值,包括定性和定量兩方面。
Chakrapany說:“我們不想只是統(tǒng)計用戶數(shù)量和查詢數(shù)量,統(tǒng)計分析了多少數(shù)據(jù),那些只是數(shù)字。關(guān)鍵部分在于,這些數(shù)據(jù)給企業(yè)帶來了哪些幫助。”