破除十二個(gè)數(shù)據(jù)分析的誤區(qū)

責(zé)任編輯:cres

作者:Bob Violino

2017-12-01 11:38:14

來(lái)源:企業(yè)網(wǎng)D1Net

原創(chuàng)

在IT界,炒作越大,誤解就越大,數(shù)據(jù)分析也不例外。分析是當(dāng)今信息技術(shù)最熱門的方面之一,它可以帶來(lái)顯著的業(yè)務(wù)收益,但是誤解可能會(huì)妨礙分析功能的順利和及時(shí)的交付,而這些功能這可能會(huì)使業(yè)務(wù)用戶和最終客戶受益。

從數(shù)據(jù)關(guān)注到人員需求再到技術(shù)組合,數(shù)據(jù)分析的錯(cuò)誤概念比比皆是。下面讓我們以真誠(chéng)的目光看看如何利用數(shù)據(jù)科學(xué)來(lái)提供真正的業(yè)務(wù)成果。
 
在IT界,炒作越大,誤解就越大,數(shù)據(jù)分析也不例外。分析是當(dāng)今信息技術(shù)最熱門的方面之一,它可以帶來(lái)顯著的業(yè)務(wù)收益,但是誤解可能會(huì)妨礙分析功能的順利和及時(shí)的交付,而這些功能這可能會(huì)使業(yè)務(wù)用戶和最終客戶受益。
 
隨著組織創(chuàng)建或擴(kuò)展其分析策略,下面來(lái)看看十幾個(gè)他們可能要避免的誤區(qū)。
 
誤區(qū)一:數(shù)據(jù)分析需要大量投資
 
現(xiàn)在看來(lái),每一項(xiàng)技術(shù)努力都必須通過(guò)一個(gè)確保經(jīng)濟(jì)穩(wěn)健性的過(guò)濾器。IT和業(yè)務(wù)經(jīng)理們提出啟動(dòng)項(xiàng)目或部署新工具時(shí),首先會(huì)提出的問題之一是“這要花費(fèi)多少錢”?
 
有些人認(rèn)為數(shù)據(jù)分析本質(zhì)上是一項(xiàng)昂貴的工作,因此它僅限于預(yù)算較大或內(nèi)部資源較多的組織。但并非所有的數(shù)據(jù)分析工作都需要大量的投資,移動(dòng)和在線房地產(chǎn)服務(wù)提供商Trulia的工程副總裁Deep Varma這樣說(shuō)道。
 
Varma說(shuō):“現(xiàn)在市場(chǎng)上有這么多的開源以及其它工具可以幫助你開始展示數(shù)據(jù)分析的價(jià)值。你需要對(duì)內(nèi)部數(shù)據(jù)存儲(chǔ)以及你要解決的問題有一個(gè)很好的理解。在嘗試用分析解決業(yè)務(wù)問題時(shí),云使之變得更簡(jiǎn)單。”
 
現(xiàn)代分析“是基于云系統(tǒng)和大數(shù)據(jù)架構(gòu)的,從定義上來(lái)說(shuō)它們比傳統(tǒng)的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)要便宜得多”,安永咨詢公司的全球分析領(lǐng)導(dǎo)者Beatriz SanzSaiz補(bǔ)充道。
 
Saiz說(shuō):“另外,通常用數(shù)據(jù)和分析實(shí)現(xiàn)三個(gè)結(jié)果:提高流程效率、收入增長(zhǎng)和主動(dòng)風(fēng)險(xiǎn)管理??偠灾瑪?shù)據(jù)和分析的應(yīng)用為所有公司帶來(lái)重大的成本收益。”
 
誤區(qū)二:你需要大數(shù)據(jù)來(lái)執(zhí)行分析
 
對(duì)于很多人來(lái)說(shuō),大數(shù)據(jù)和分析的概念是齊頭并進(jìn)的。這個(gè)想法是,組織需要在執(zhí)行分析之前收集大量數(shù)據(jù),以便產(chǎn)生業(yè)務(wù)洞察,改進(jìn)決策制定等。
 
當(dāng)然,大數(shù)據(jù)分析的好處已為大家所接受,擁有這些資源的公司確實(shí)可以通過(guò)利用其數(shù)據(jù)存儲(chǔ)作為分析工作的一部分來(lái)獲得顯著的競(jìng)爭(zhēng)優(yōu)勢(shì)。但是,大數(shù)據(jù)是分析必不可少的想法是不正確的。
 
人力資源公司Allegis Global Solutions的商業(yè)智能執(zhí)行總監(jiān)Tim Johnson說(shuō):“人們經(jīng)常試圖采集盡可能多的數(shù)據(jù);他們一聽到‘大數(shù)據(jù)’就興奮不已。這個(gè)誤解就是數(shù)據(jù)越多越好,機(jī)器會(huì)分門別類。”
 
但是,與其說(shuō)分析師需要更多的數(shù)據(jù),不如說(shuō)他們需要具體的數(shù)據(jù)。Johnson說(shuō):“95%的用戶正在尋找與他們的工作相關(guān)的信息,并支持決策和提高性能。企業(yè)與其關(guān)注更多的數(shù)據(jù),不如多為業(yè)務(wù)用戶著想,不僅要確定他們需要訪問哪些數(shù)據(jù),而且還要確定如何展示數(shù)據(jù)。
 
Johnson說(shuō):“提供對(duì)各種信息和多種格式的訪問可能是巨大的挑戰(zhàn),并且實(shí)際上阻礙了采用。相反,找出對(duì)它們來(lái)說(shuō)很重要的事情,以及如何以最簡(jiǎn)單的形式向他們展示這些信息。”
 
誤區(qū)三:分析可以消除人為偏差
 
自動(dòng)化系統(tǒng)執(zhí)行的方式是不應(yīng)該帶有偏差的。但技術(shù)是由人類建立的,所以消除所有的偏差幾乎是不可能的。有人認(rèn)為分析和機(jī)器學(xué)習(xí)可以消除人為偏差。
 
全球技術(shù)咨詢公司ThoughtWorks的技術(shù)負(fù)責(zé)人Mike Mason說(shuō):“不幸的是,這根本不是真的。算法和分析使用‘訓(xùn)練數(shù)據(jù)’進(jìn)行調(diào)整,并將重現(xiàn)訓(xùn)練數(shù)據(jù)的任何特征。”
 
Mason說(shuō)在某些情況下,這會(huì)給分析結(jié)果帶來(lái)偏見;在其它情況下,結(jié)果可能會(huì)更糟,他說(shuō):“‘僅僅因?yàn)樗惴ㄟ@么說(shuō)’并不意味著答案是公平的或有用的。”
 
誤區(qū)四:最好的算法總是能贏
 
事實(shí)上,有了足夠的數(shù)據(jù),“有時(shí)候算法并不重要,”Mason如是說(shuō)。他在IEEE的一篇文章中引用了“數(shù)據(jù)的不合理有效性”,谷歌的工程師認(rèn)為,簡(jiǎn)單的統(tǒng)計(jì)模型,加上大量的數(shù)據(jù),比包含很多特性和摘要的“智能優(yōu)越”模型取得更好的結(jié)果。
 
Mason說(shuō):“在某些情況下,僅僅處理大量的數(shù)據(jù)就能取得最好的結(jié)果。”
 
誤區(qū)五:算法能確保安全
 
Johnson說(shuō),人們固有的信任統(tǒng)計(jì)模型和算法在很大程度上是隨著組織建立他們的分析程序而逐漸依賴復(fù)雜的模型來(lái)支持決策。
 
Johnson說(shuō):“因?yàn)槿藗儾涣私饽P?、算法和其它先進(jìn)的數(shù)據(jù)科學(xué)實(shí)踐,所以他們信任它們。用戶不覺得自己具備可以挑戰(zhàn)模型的知識(shí),相反,他們必須相信建造它們的“聰明人”。
 
Johnson說(shuō):“在過(guò)去的50到60年里,我們聽說(shuō)過(guò)人工智能將在20年內(nèi)接管人類的工作,而且我們將繼續(xù)聽到人們這樣說(shuō)。在我們能夠公然地相信機(jī)器學(xué)習(xí)和結(jié)果之前,還有很多事情要做。在那之前,我們需要挑戰(zhàn)構(gòu)建算法和模型的人,以解釋如何得出答案。我們不是不能依賴結(jié)果,而是需要透明度,以便我們可以信任和驗(yàn)證分析。”
 
誤區(qū)六:數(shù)據(jù)科學(xué)是一種神秘的“魔法”
 
數(shù)據(jù)科學(xué)近年來(lái)受到了很多關(guān)注,關(guān)于它究竟是什么有時(shí)會(huì)產(chǎn)生混淆。它主要涉及使用算法來(lái)查找數(shù)據(jù)中的模式。
 
數(shù)據(jù)存儲(chǔ)公司Micron的首席技術(shù)官 Trevor Schulze說(shuō):“數(shù)據(jù)科學(xué)似乎很神秘,因?yàn)檫@些算法能夠分析更多人腦更所無(wú)法理解的變量和數(shù)據(jù)集。”
 
Schulze說(shuō):“近年來(lái),隨著計(jì)算能力和內(nèi)存的增大,我們現(xiàn)在能夠快速解決十年前用任何技術(shù)解決不了的問題。數(shù)據(jù)科學(xué)是統(tǒng)計(jì)推斷技術(shù)的自然演變,數(shù)十年來(lái)已經(jīng)得到很好的理解。一旦你理解了數(shù)學(xué),數(shù)據(jù)科學(xué)就沒有那么神秘了。”
 
誤區(qū)七:為了做更多的數(shù)據(jù)科學(xué),你需要更多的數(shù)據(jù)科學(xué)家
 
數(shù)據(jù)科學(xué)家是當(dāng)今所有技術(shù)專業(yè)人員中最緊俏的。如果他們把精力轉(zhuǎn)移到應(yīng)該做的事情上,也許組織就不需要這么多這樣的專業(yè)人士。
 
Mason說(shuō):“很多數(shù)據(jù)科學(xué)家的時(shí)間花在了非增值活動(dòng)上,比如尋找數(shù)據(jù)集、把數(shù)據(jù)放到可以處理它們的地方、以及轉(zhuǎn)換和清理數(shù)據(jù)”。鑒于聘請(qǐng)數(shù)據(jù)科學(xué)家是這么地困難,那些低價(jià)值的任務(wù)并不是你想要的。
 
Mason說(shuō):“優(yōu)步的米開朗琪羅平臺(tái)(Michelangelo platform)使數(shù)據(jù)科學(xué)家能夠?qū)W⒂谔匦怨こ?、提取和分析,而不是將?shù)據(jù)搬來(lái)搬去,因此使他們可以大大提高生產(chǎn)力。”
 
誤區(qū)八:分析太耗時(shí)
 
現(xiàn)在快速完成工作——無(wú)論是將產(chǎn)品或服務(wù)推向市場(chǎng),還是近乎實(shí)時(shí)地響應(yīng)客戶詢問——對(duì)于公司來(lái)說(shuō)都是一個(gè)巨大的競(jìng)爭(zhēng)考慮因素。分析聽起來(lái)像是需要很長(zhǎng)時(shí)間來(lái)執(zhí)行的事情,與達(dá)到速度和靈活性的目標(biāo)背道而馳。
 
Saiz說(shuō):“這種類型的項(xiàng)目耗時(shí)太長(zhǎng),而且相當(dāng)復(fù)雜,這個(gè)迷思依然存在。在一天結(jié)束的時(shí)候,這都是關(guān)于人才的。通過(guò)恰當(dāng)?shù)募寄芙M合和敏捷方法的應(yīng)用,大問題可以在幾天或幾周內(nèi)得到解決,而不是幾個(gè)月。”
 
誤區(qū)九:技術(shù)是最難的部分
 
咨詢公司ISG的IT采購(gòu)和數(shù)字咨詢服務(wù)總監(jiān)James Burke說(shuō),隨著當(dāng)今可用的技術(shù)的數(shù)量不斷增加,選擇合適的工具組合來(lái)部署和集成以從分析團(tuán)隊(duì)獲得預(yù)期的結(jié)果并非易事。
 
但是,Burke說(shuō)真正困難的部分是“把組織結(jié)構(gòu)和運(yùn)營(yíng)模式放在一起,把人員、流程和技術(shù)視角所需要的所有東西放在一起。另外,你如何在現(xiàn)有的組織內(nèi)部或者‘附近’這樣做,這對(duì)組織來(lái)說(shuō)似乎是最難的。”
 
不要以為分析工具會(huì)完成所有的工作。咨詢公司W(wǎng)est Monroe的技術(shù)實(shí)踐高級(jí)總監(jiān)Greg Layok說(shuō):“技術(shù)本身決不會(huì)解決任何業(yè)務(wù)問題。在急于創(chuàng)建數(shù)據(jù)湖的過(guò)程中,組織最終卻陷入了沼澤,或者是一個(gè)難以讓任何人弄明白的信息困境。”
 
Layok說(shuō)技術(shù)并不解決分析問題。他說(shuō):“首先,發(fā)現(xiàn)一個(gè)業(yè)務(wù)問題,然后問,'我需要哪些數(shù)據(jù)來(lái)解決這個(gè)問題?'這將幫助你發(fā)現(xiàn)組織內(nèi)的數(shù)據(jù)缺口。”
 
誤區(qū)十:數(shù)據(jù)分析應(yīng)該是一個(gè)獨(dú)立的部門
 
在一些組織中,數(shù)據(jù)分析本身是作為一個(gè)部門運(yùn)作的,而在另一些組織中則深深嵌入到一個(gè)跨職能團(tuán)隊(duì)中,咨詢和數(shù)據(jù)收集公司Delvinia的總裁兼首席創(chuàng)新官Steven Mast這樣說(shuō)道。
 
Mast說(shuō):“但是,隨著所有業(yè)務(wù)領(lǐng)域的數(shù)據(jù)大量涌現(xiàn)和變革發(fā)生的速度,部門模式不起作用了。隨著企業(yè)變得更加以客戶為中心,數(shù)據(jù)驅(qū)動(dòng)的分析專家應(yīng)該成為業(yè)務(wù)部門的核心,而不是作為一個(gè)呼叫支持的部門來(lái)運(yùn)行。”
 
Mast說(shuō)當(dāng)今很多組織面臨的復(fù)雜問題都在業(yè)務(wù)部門內(nèi)部,而且這些問題的很多解決方案都隱藏在數(shù)據(jù)中。他說(shuō):“數(shù)據(jù)科學(xué)家和專家與這些業(yè)務(wù)部門密切合作,使用大量數(shù)據(jù)集和人工智能將是培育下一代產(chǎn)品,服務(wù)和客戶體驗(yàn)的關(guān)鍵。”
 
誤區(qū)十一:分析是博士干的事情
 
在分析團(tuán)隊(duì)中有很多受過(guò)良好教育的人是很棒的,但這不是成功的要求。
 
Saiz說(shuō):“公司往往認(rèn)為,沒有博士學(xué)位,他們將無(wú)法進(jìn)行最佳的分析?,F(xiàn)代分析需要一系列技能——那些在新興技術(shù)和開源軟件方面精明的人。建立各懷絕技的職能,包括大數(shù)據(jù)架構(gòu)師、數(shù)據(jù)工程師、數(shù)據(jù)科學(xué)家、數(shù)據(jù)可視化專家等等,才是最重要的。”
 
誤區(qū)十二:人工智能會(huì)破壞就業(yè)和經(jīng)濟(jì)
 
歷史上新技術(shù)的引入已經(jīng)顛覆了很多工作和行業(yè),人們擔(dān)心人工智能會(huì)消除人們執(zhí)行某些任務(wù)的需要。
 
Schulze說(shuō):“人工智能解決方案比人們?cè)诮鉀Q某些問題方面要好得多。“人工智能可以讀得更快,記住更多,計(jì)算復(fù)雜的數(shù)學(xué)關(guān)系比任何人都好。然而,人工智能不能處理真正新穎的情況,而這是人類擅長(zhǎng)的地方。”
 
誠(chéng)然,Schulze說(shuō),某些工作已經(jīng)消失或者因人工智能的增長(zhǎng)而減少,其它的工作也隨之而來(lái)。他說(shuō):“盡管如此,我們理解和解決完全無(wú)法預(yù)料的環(huán)境的能力也不會(huì)被目前所知的人工智能技術(shù)所取代。在可預(yù)見的未來(lái),最有效的人工智能方法將是通過(guò)人工智能系統(tǒng)來(lái)增強(qiáng)人的能力,這些人工智能系統(tǒng)執(zhí)行一些‘繁重的工作’,在這些工作中算法的表現(xiàn)優(yōu)于人。盡管很多工作會(huì)因人工智能而發(fā)生變革,但人仍將是這個(gè)商業(yè)生態(tài)系統(tǒng)的重要組成部分。”
 
版權(quán)聲明:本文為企業(yè)網(wǎng)D1Net編譯,轉(zhuǎn)載需注明出處為:企業(yè)網(wǎng)D1Net,如果不注明出處,企業(yè)網(wǎng)D1Net將保留追究其法律責(zé)任的權(quán)利。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)