又到了年終歲尾時,業(yè)界權威市場研究和咨詢機構Ovum公司日前估計,大數據市場規(guī)模將從2016年的17億美元增長到2020年的94億美元。隨著市場的增長,企業(yè)的挑戰(zhàn)正在轉變,對人們的技能需求正在改變,而大數據服務供應商的景觀也在風云變幻。2017年將是大數據專業(yè)人士更為忙碌的時刻。以下是一些來自相關行業(yè)觀察家和技術專家對大數據在2017年的發(fā)展預測。
一、對數據科學家的需求將減弱
Ovum在大數據趨勢的報告中表示:組織對數據科學家的需求正在減弱。Ovum公司數據來自Indeed,顯示了組織在過去四年對數據科學家的需求。同時,各大學正在培養(yǎng)更多的擁有數據科學證書的大學畢業(yè)生。
誰招募這些潛在客戶?很可能,排除在線數字業(yè)務,在全球2000強以外的一些少數企業(yè)會招募他們,但卻很少有人會想到如何使用數據科學家。對于大量依賴于打包分析的組織來說,不需要數據科學家,而是需要應用數據科學的應用程序或工具,比如企業(yè)需要具有商業(yè)智能(BI)功能的CRM系統(tǒng)(例如智云通、紐帶線CRM)。
二、使數據科學成為團隊運動將成為重中之重
數據科學家和數據工程師在企業(yè)中扮演不同的角色:數據科學家關注數據形成和測試假設,而數據工程師選擇數據集,提供集群,并優(yōu)化他們的生產算法。沒有協(xié)作,數據科學家開發(fā)的模型和假設就會遇到陷入風險之中。
真正需要的是讓數據科學家和數據工程師更好地連接,以確保數據科學家在他或她的筆記本電腦上編寫和測試的模型正確地部署在集群上合適的數據集。
同時,機器學習正在嵌入企業(yè)軟件和工具,用于整合和準備數據,這也給企業(yè)帶來壓力,確保他們的數據科學家和業(yè)務分析師密切合作。如果模型仍然在數據科學家的領導下,企業(yè)將無法獲得機器學習的全部價值。重疊的趨勢將是協(xié)作環(huán)境,其中業(yè)務分析師和數據科學家可以在計劃,部署,以及執(zhí)行機器學習模型中共享工作流。
三、將會有更多的壓力來保持數據本地化
未來將加強隱私法,旨在將數據保存在各國境內。
預計將會出臺更多的數據本地化法律,在最近的發(fā)展中,如俄羅斯數據本地化法律得到了俄羅斯法院支持,中國最近也通過自己的數據本地化法律。其他國家將在未來一年內采取行動。
四、企業(yè)將努力通過數據獲利
企業(yè)必須投入更多的生產資料產生數據,但它不會是容易做到,許多企業(yè)將錯過機會。
盡管商業(yè)領袖希望企業(yè)努力成功創(chuàng)造有意義的產品和收入來源。那些取得成功的企業(yè)將以堅實的IT戰(zhàn)略和數據導向服務為基礎:數據采集;運輸,轉型和儲存;分析和儀表板;數據作為產品/服務;以及安全和訪問控制。
IT領導者建立一個由IT和業(yè)務人員組成的創(chuàng)新團隊,審查現有和未來的應用程序/系統(tǒng),以獲得可能的結果數據貨幣化。這是專業(yè)研究機構給的建設性意見。
五、數據湖將最終變得有用
許多早期采用數據湖的企業(yè)花費了大量資金,不僅購買了低成本存儲和流程,而且還收集了大量服務,以便匯總和提供大量數據相關和發(fā)現以獲得更好的見解。企業(yè)所面臨的挑戰(zhàn)一直在尋找有能力理解信息的人;使數據湖能夠向操作應用程序提供輸入,并從操作應用程序接收實時更新的數據;彌合主要數據管理和運行應用程序,分析數據倉庫和數據湖之間的差距。
據預測:現有的大數據項目意識到需要一個可靠的數據基礎,而新的項目被整合到一個整體的數據管理戰(zhàn)略中,數據湖可能會在2017年履行他們的承諾。
六、并購活動將加快進程
毫無疑問,人工智能、機器學習、深度學習等新技術得到了企業(yè)的關注。所有交易的關鍵驅動因素是對人工智能專家的需求。由于被收購的大多數初創(chuàng)公司的運營歷史很短,這些舉措是盡可能招募到數量有限的人工智能專家。在未來一年,行業(yè)廠商將會開展更加積極的并購活動。
七、對物聯網架構師的需求將飆升
據研究機構IDC公司的數據顯示,到2020年,物聯網(IoT)市場規(guī)模預計將達到1.46萬億美元。因為規(guī)模激增,因此也將需要大量熟練的物聯網專家。
物聯網架構師的作用將使數據科學家們成為人力資源部門最有價值的獨角獸。物聯網的浪潮將會讓邊緣計算和物聯網操作設計猛增。屆時,數以千計的簡歷將在一夜之間更新。此外,不到10%的企業(yè)意識到他們需要一個物聯網分析架構師,而物聯網系統(tǒng)架構師將成為一個獨特的物種。因此,能夠為物聯網設計分布式和中央分析的軟件架構師的市場價值將飆升。
八、流式分析將會獲得重生
分析運動中的數據并不是什么新鮮事,因為事件處理程序已經存在了近20年。但是有很多因素正在將實時流技術從利基技術轉變?yōu)楦邚V泛吸引力的技術。例如,開源技術使實時流更加容易訪問,也為可擴展的商品基礎設施帶來可用性。在需求方面,物聯網正在加強企業(yè)對可以實時感測,分析和響應的流應用程序的興趣。
據預測,其市場整合不會立即發(fā)生。如今,企業(yè)有越來越多的選擇,競爭新的工作負載。最終,我們預計市場會下降到三到四個流媒體平臺。鑒于市場早期狀況,我們預計2017年市場不會下跌;我們預計流式引擎將需要2-3年才能成熟,物聯網的實施將達到臨界質量。