如今可以確定的是,組織對大數(shù)據(jù)解決方案需求量很大。組織的管理者知道他們的大數(shù)據(jù)是不可忽視的最寶貴的資源之一。因此,他們正在尋找可幫助存儲、管理和分析其大數(shù)據(jù)的硬件和軟件。
根據(jù)調(diào)研機構(gòu)IDC公司的調(diào)查,2017年組織在大數(shù)據(jù)和數(shù)據(jù)分析方面的支出為1508億美元,比去年增長12.4%。到2020年,這一支出可能會以每年11.9%的速度增長,2020年的收入可能高達2100億美元。
大部分收入都用于大數(shù)據(jù)應(yīng)用。據(jù)IDC公司預(yù)測,到2020年,僅軟件開支就可能超過700億美元。非關(guān)系分析數(shù)據(jù)存儲(如NoSQL數(shù)據(jù)庫)的支出增長尤其迅速,每年可能增長38.6%,認知軟件平臺(如人工智能和機器學習能力的分析工具)每年可能增長23.3%。
為了充分利用大量的數(shù)據(jù)支出,供應(yīng)商在各種不同的產(chǎn)品和服務(wù)上打上了“大數(shù)據(jù)”標簽。這種產(chǎn)品的擴散會使組織很難找到合適的大數(shù)據(jù)應(yīng)用程序來滿足他們的需求。專家建議,企業(yè)開始選擇大數(shù)據(jù)應(yīng)用程序的一個好方法是精確地確定自己所需要什么類型的應(yīng)用程序。
大數(shù)據(jù)應(yīng)用的類型
企業(yè)軟件供應(yīng)商提供了大量不同類型的大數(shù)據(jù)應(yīng)用程序。適合企業(yè)的大數(shù)據(jù)應(yīng)用將取決于其目標。
例如,如果企業(yè)只想更加詳細和深入地擴展現(xiàn)有的財務(wù)報告功能,那么數(shù)據(jù)倉庫和商業(yè)智能解決方案可能已足以滿足其需求;如果企業(yè)的銷售和營銷團隊希望利用其大數(shù)據(jù)的發(fā)現(xiàn)增加收入和利潤的新機會,則可以考慮創(chuàng)建數(shù)據(jù)湖和/或投資數(shù)據(jù)挖掘解決方案;如果企業(yè)想創(chuàng)建一個數(shù)據(jù)驅(qū)動的文化,組織中的每個人都在使用數(shù)據(jù)來指導他們的決策,那么企業(yè)可能需要數(shù)據(jù)湖和預(yù)測分析,內(nèi)存數(shù)據(jù)庫,也可能是流分析。
這樣的事情將會變得更復(fù)雜,因為不同類型的工具之間的界限可能會有些模糊。一些商業(yè)智能工具具有數(shù)據(jù)挖掘和預(yù)測分析功能。一些預(yù)測分析工具包括流媒體功能。
最好的辦法是組織一開始就清楚地確定自己的目標,然后去尋找能夠幫助其實現(xiàn)這些目標的產(chǎn)品。
選擇大數(shù)據(jù)應(yīng)用程序時的關(guān)鍵決策
無論企業(yè)選擇哪種類型的大數(shù)據(jù)應(yīng)用程序,都需要做出一些關(guān)鍵決策,以幫助企業(yè)縮小選擇范圍。以下是一些最重要的考慮事項:
(1)內(nèi)部部署數(shù)據(jù)中心與基于云計算的大數(shù)據(jù)應(yīng)用程序
企業(yè)需要做出的第一個重大決策是要在自己的數(shù)據(jù)中心托管大數(shù)據(jù)軟件,還是希望采用基于云計算的解決方案。
目前,更多的組織似乎正在選擇云計算。分析機構(gòu)Forrester公司副總裁兼首席分析師Brian Hopkins在2017年8月的一篇博客文章中寫道:“通過云訂閱在大數(shù)據(jù)解決方案上的全球支出將增長快近7.5倍。此外,根據(jù)數(shù)據(jù)分析專業(yè)人員的2016和2017調(diào)查,公有云是大數(shù)據(jù)的頭號技術(shù)優(yōu)先事項。”
基于云計算的大數(shù)據(jù)應(yīng)用受到歡迎有多種原因,其中包括可擴展性和易管理性。主要的云計算供應(yīng)商也在人工智能和機器學習研究方面處于領(lǐng)先地位,這使得他們可以在解決方案中添加高級功能。
但是,云計算對于組織來說并不總是最好的選擇。對合規(guī)性或安全性要求較高的組織有時會發(fā)現(xiàn)他們需要將敏感數(shù)據(jù)保留在內(nèi)部部署的數(shù)據(jù)中心。此外,一些組織已經(jīng)在現(xiàn)有的本地數(shù)據(jù)解決方案上進行投資,并且他們發(fā)現(xiàn)繼續(xù)在本地部署數(shù)據(jù)中心運行大數(shù)據(jù)應(yīng)用程序或使用混合方法會更具成本效益。
(2)私有vs開源的大數(shù)據(jù)應(yīng)用程序
一些最流行的大數(shù)據(jù)工具(包括Hadoop生態(tài)系統(tǒng))可以在開源許可下獲得。 Forrester公司指出,“2017年,企業(yè)將在Hadoop軟件和相關(guān)服務(wù)上投入8億美元。”
Hadoop和其他開源軟件最大的吸引力之一是降低總體擁有成本。盡管專有解決方案需要支付高昂的許可費,并且可能需要昂貴的專用硬件,但Hadoop沒有許可費,并且可以在標準的硬件上運行。
然而,企業(yè)有時發(fā)現(xiàn)很難獲得開源的解決方案,以滿足他們的需要。他們可能需要購買支持或咨詢服務(wù),組織在計算總擁有成本時需要考慮這些費用。
(3)批處理vs流式傳輸大數(shù)據(jù)應(yīng)用程序
最早的大數(shù)據(jù)解決方案(如Hadoop)只是處理批量數(shù)據(jù),但企業(yè)越來越多地發(fā)現(xiàn)他們希望實時分析數(shù)據(jù)。這引發(fā)了對Spark、Storm、Samza等流媒體解決方案的更多興趣。
許多分析師表示,即使組織認為他們現(xiàn)在不需要處理流式數(shù)據(jù),流媒體功能也可能在不久的將來成為標準操作流程。出于這個原因,許多組織正在向Lambda體系結(jié)構(gòu)邁進,這是一種既能處理實時數(shù)據(jù)又能批處理數(shù)據(jù)的數(shù)據(jù)處理體系結(jié)構(gòu)。
在大數(shù)據(jù)應(yīng)用中尋找特性
一旦企業(yè)縮小了選項范圍,就需要評估其正在考慮的大數(shù)據(jù)應(yīng)用程序。以下包括一些最重要的需要考察的因素。
•與傳統(tǒng)技術(shù)集成 - 大多數(shù)組織已經(jīng)在數(shù)據(jù)管理和分析技術(shù)方面進行現(xiàn)有投資。完全替代該技術(shù)可能代價高昂并且具有破壞性,因此組織通常會選擇尋找可以與現(xiàn)有工具一起使用的解決方案,或者可以增加現(xiàn)有軟件。
•績效 - 2017年Talend研究發(fā)現(xiàn),實時分析功能是商業(yè)領(lǐng)袖的首要IT優(yōu)先事項之一。如果要從這些洞察中獲益,管理人員和工作人員需要能夠及時獲取見解。這意味著投資可以提供他們所需速度的技術(shù)。
•可擴展性 - 大數(shù)據(jù)存儲的規(guī)模每天都會變得更大。組織需要快速執(zhí)行的大數(shù)據(jù)應(yīng)用程序,隨著數(shù)據(jù)存儲量以指數(shù)級增長,這些應(yīng)用程序可以繼續(xù)快速執(zhí)行。這種對可擴展性的需求是基于云計算的大數(shù)據(jù)應(yīng)用變得非常流行的主要原因之一。
•可用性 - 組織還應(yīng)該考慮他們打算購買的任何大數(shù)據(jù)應(yīng)用程序的“學習曲線”。易于部署、易于配置、界面直觀和/或與組織已經(jīng)使用的工具相似或集成的工具可以提供巨大的價值。
•可視化 - BI-Survey.com表示,“針對商業(yè)用戶的可視化和探索性數(shù)據(jù)分析(稱為數(shù)據(jù)發(fā)現(xiàn))已經(jīng)演變成當今市場上最熱門的商業(yè)智能和分析主題。”在圖表中呈現(xiàn)數(shù)據(jù)可以使人類的大腦更容易發(fā)現(xiàn)趨勢和異常值,加快識別可操作見解的過程。
•靈活性 – 企業(yè)如今所需要的大數(shù)據(jù)可能與其在一兩年前的需求大不相同。這就是為什么許多企業(yè)選擇尋找能夠滿足各種不同目標的工具,而不是很好地執(zhí)行單一功能的原因。
•安全性 - 這些大數(shù)據(jù)存儲中包含的大部分數(shù)據(jù)都是敏感信息,這對于競爭對手、國家機構(gòu)或黑客都是非常有價值的。組織需要確保他們的大數(shù)據(jù)具有足夠的保護,以防止成為頭條新聞報道的大量數(shù)據(jù)泄露事件。這意味著組織需要尋找具有內(nèi)置安全功能(如加密和強身份驗證)的工具,或者尋找與現(xiàn)有安全解決方案集成的工具。
•支持 - 即使有經(jīng)驗的IT專業(yè)人員有時也會發(fā)現(xiàn)難以部署、維護和使用復(fù)雜的大數(shù)據(jù)應(yīng)用程序。不要忘記考慮各供應(yīng)商提供的支持的質(zhì)量和成本。
•生態(tài)系統(tǒng) - 大多數(shù)組織需要多種不同的應(yīng)用程序來滿足他們所有的大數(shù)據(jù)需求。這意味著要尋找一個大數(shù)據(jù)平臺,與其他許多流行工具以及與其他提供商有強大合作關(guān)系的供應(yīng)商進行整合。
•自助服務(wù)能力 - 2017年畢馬威公司針對組織的CIO調(diào)查發(fā)現(xiàn),60%的CIO持續(xù)報告指出數(shù)據(jù)分析人才短缺,而大數(shù)據(jù)和分析是最需要的技能組合。由于沒有足夠的數(shù)據(jù)科學家去解決,組織正在尋找其他商業(yè)專業(yè)人士可以獨立使用的工具。調(diào)研機構(gòu)Gartner公司最近的博客文章指出,通常在一個組織中,大約32%的員工正在使用商業(yè)智能和分析。
•總體擁有成本 - 大數(shù)據(jù)應(yīng)用的前期成本只是其中的一小部分。組織需要確保他們考慮相關(guān)硬件成本,正在采用的許可或訂購費用、員工時間、支持成本,以及與本地部署應(yīng)用程序的物理空間相關(guān)的任何費用。不要忘記要考慮到云計算成本隨著時間的推移普遍下降的事實。
•預(yù)計價值的時間 - 另一個重要的財務(wù)考慮因素是企業(yè)能夠以多快的速度啟動并運行特定的解決方案。大多數(shù)公司都希望在幾天或幾周內(nèi),而不是幾個月或幾年內(nèi)從他們的大數(shù)據(jù)項目中受益。
•人工智能和機器學習 - 最后,考慮各種大數(shù)據(jù)應(yīng)用供應(yīng)商的創(chuàng)新。人工智能和機器學習的研究正在以驚人的速度發(fā)展,并成為大數(shù)據(jù)分析的主流部分。據(jù)Forrester公司預(yù)測,“企業(yè)在2017年對于人工智能的投資增加了三倍,因為企業(yè)需要將客戶數(shù)據(jù)轉(zhuǎn)換為個性化體驗。”如果企業(yè)選擇的供應(yīng)商在這項研究沒有處于行業(yè)前沿,那么可能會發(fā)現(xiàn)自己落后于競爭對手。
選擇大數(shù)據(jù)應(yīng)用程序的提示
很明顯,選擇正確的大數(shù)據(jù)應(yīng)用程序是一個復(fù)雜的過程,這涉及諸多因素。已成功部署大數(shù)據(jù)軟件的專家和組織提供以下建議:
•理解自己的目標–企業(yè)在選擇大數(shù)據(jù)應(yīng)用程序時,需要知道自己想完成什么是至關(guān)重要的。如果不確定為什么要投資某項技術(shù),那么其項目不太可能成功。
•從小規(guī)模開始-如果企業(yè)可以通過小規(guī)模的大數(shù)據(jù)分析項目取得成功,那么企業(yè)對使用該工具將會產(chǎn)生更多的興趣。
•采取整體方法-盡管小規(guī)模項目可以幫助企業(yè)獲得技術(shù)方面的經(jīng)驗和專業(yè)知識,但選擇最終可用于整個業(yè)務(wù)的應(yīng)用程序非常重要。Gartner公司建議:“為了支持無處不在的數(shù)據(jù)和分析世界,IT專業(yè)人員需要創(chuàng)建一個新的端到端體系結(jié)構(gòu),為敏捷、規(guī)模和實驗而構(gòu)建。如今,技術(shù)學科正在融合,數(shù)據(jù)和分析的方法正在變得更加整體化,涵蓋整個業(yè)務(wù)。”
•協(xié)同工作–Gartner公司的這篇博客文章還指出:“建議數(shù)據(jù)和分析領(lǐng)導者積極主動地在他們的組織中傳播分析,以便從啟用數(shù)據(jù)驅(qū)動業(yè)務(wù)操作中獲得最大的收益。”許多組織正試圖構(gòu)建數(shù)據(jù)驅(qū)動文化,這需要業(yè)務(wù)和IT領(lǐng)導者之間的大量合作。
•病毒式傳播–前面提到的自助服務(wù)功能還可以幫助創(chuàng)建數(shù)據(jù)驅(qū)動的文化。Gartner公司建議:“讓分析在企業(yè)內(nèi)部和外部真正發(fā)揮作用。通過培養(yǎng)實用的自助服務(wù)方法,并通過在交互和流程中的數(shù)據(jù)攝入點上嵌入分析功能,使更多的業(yè)務(wù)用戶能夠執(zhí)行分析。”
版權(quán)聲明:本文為企業(yè)網(wǎng)D1Net編譯,轉(zhuǎn)載需注明出處為:企業(yè)網(wǎng)D1Net,如果不注明出處,企業(yè)網(wǎng)D1Net將保留追究其法律責任的權(quán)利。