大數(shù)據(jù)增長的速度令人難以想象。全球數(shù)十億人每天都在產(chǎn)生難以想像的數(shù)據(jù)量,研究機(jī)構(gòu)對全球數(shù)據(jù)規(guī)模的預(yù)測無疑證明了這一點(diǎn)。問題不在于人們是否會在日常工作中使用大數(shù)據(jù),而在于何時開始使用它(如果尚未使用的話)。大數(shù)據(jù)在可預(yù)見的未來將會繼續(xù)快速增長。
在過去的十年中,數(shù)據(jù)量以驚人的速度增長。隨著越來越多的組織處理大量數(shù)據(jù)并迅速采用物聯(lián)網(wǎng)技術(shù),數(shù)據(jù)量將會繼續(xù)快速增長。
為了調(diào)查市場需求并緊跟發(fā)展潮流,以下對一些大數(shù)據(jù)發(fā)展趨勢進(jìn)行簡要概述,如果人們對大數(shù)據(jù)的技術(shù)和市場感興趣,則需要密切關(guān)注2021年的這些發(fā)展趨勢。
在了解大數(shù)據(jù)市場正在不斷發(fā)展以滿足客戶需求之后,Gartner公司對2020年的預(yù)測結(jié)果仍將在2021年出現(xiàn)。
1.增強(qiáng)分析
增強(qiáng)分析功能通過人工智能和機(jī)器學(xué)習(xí)工具及框架擴(kuò)展了商業(yè)智能(BI)工具包。這是從傳統(tǒng)的商業(yè)智能(BI)中產(chǎn)生的,自助式商業(yè)智能(BI)為業(yè)務(wù)用戶提供基于視覺的分析。增強(qiáng)分析是自助式商業(yè)智能(BI)的下一個步驟。它將機(jī)器學(xué)習(xí)和人工智能元素集成到組織的數(shù)據(jù)準(zhǔn)備、分析和商業(yè)智能(BI)流程中,以提高數(shù)據(jù)管理性能。
增強(qiáng)分析可以減少與數(shù)據(jù)準(zhǔn)備和清理有關(guān)的時間,并且無需數(shù)據(jù)科學(xué)家的幫助就可以為商業(yè)人士提供見解。
2.持續(xù)智能
持續(xù)智能是將實時分析集成到當(dāng)前業(yè)務(wù)運(yùn)營中的過程。
根據(jù)Gartner公司的預(yù)測,到2022年,超過一半的主要業(yè)務(wù)系統(tǒng)將基于實時分析做出業(yè)務(wù)決策。通過將實時分析集成到業(yè)務(wù)運(yùn)營中,并處理當(dāng)前和歷史數(shù)據(jù),持續(xù)智能有助于在新數(shù)據(jù)到達(dá)時增強(qiáng)人為決策。
許多組織仍然只依靠歷史數(shù)據(jù)或過時的數(shù)據(jù)。這樣的組織可能會在快速變化的環(huán)境中落后。因此,組織應(yīng)該不斷且即時地了解其數(shù)據(jù)。這些數(shù)據(jù)將提高問題的識別和解決以及做出重要決策的速度。
3.數(shù)據(jù)操作
DataOps在發(fā)展方向上類似于DevOps的實踐,但針對不同的流程。
與DevOps不同,它通過跨組織的協(xié)作實踐來實現(xiàn)數(shù)據(jù)集成和數(shù)據(jù)質(zhì)量。DataOps專注于減少數(shù)據(jù)的端到端循環(huán),從數(shù)據(jù)攝取、準(zhǔn)備和分析開始,到創(chuàng)建圖表、報告和見解結(jié)束。
DataOps為不熟悉數(shù)據(jù)流的員工處理數(shù)據(jù)提供幫助。這使得他們可以更多地關(guān)注領(lǐng)域?qū)I(yè)知識,而不是關(guān)注數(shù)據(jù)如何在組織中運(yùn)行。
3.1無服務(wù)器的興起
隨著云計算解決方案在市場上的廣泛應(yīng)用,新的趨勢和實踐不斷出現(xiàn)。DataOps實踐旨在簡化和加速數(shù)據(jù)流。這就是為什么DataOps工具包包含所謂的“無服務(wù)器”實踐的原因。這種實施允許組織通過在基于云計算的基礎(chǔ)設(shè)施中管理數(shù)據(jù)管道來減少硬件數(shù)量,輕松快速地進(jìn)行擴(kuò)展,并加快數(shù)據(jù)流更改。
3.2更進(jìn)一步:DataOps即服務(wù)
實現(xiàn)數(shù)據(jù)的集成、可靠性和交付需要大量的精力和技能。數(shù)據(jù)工程師、數(shù)據(jù)科學(xué)家和DevOps工程師需要耗費(fèi)時間來實施所有DataOps實踐。市場上不斷推出新產(chǎn)品,而這些產(chǎn)品能夠利用組織的數(shù)據(jù)實施這些實踐。
這些產(chǎn)品提供了多種可組合和可擴(kuò)展的DataOps實踐,允許基于組織的數(shù)據(jù)開發(fā)復(fù)雜的數(shù)據(jù)流,還為組織的數(shù)據(jù)科學(xué)部門提供了API。
4.內(nèi)存中的計算
內(nèi)存中計算是加快分析速度的另一種方法。
除了實時數(shù)據(jù)處理外,它還消除了緩慢的數(shù)據(jù)訪問,并將所有處理流完全基于存儲在內(nèi)存中的數(shù)據(jù)。這使得數(shù)據(jù)的處理和查詢速度比任何其他解決方案要快100倍以上,這有助于組織制定決策并立即采取行動。
5.邊緣計算
邊緣計算是一種分布式計算框架,可以在數(shù)據(jù)源附近進(jìn)行計算。
隨著傳輸?shù)皆朴嬎惴治鼋鉀Q方案的數(shù)據(jù)量的增加,原始數(shù)據(jù)的延遲和可擴(kuò)展性以及處理速度等問題也隨之出現(xiàn)。邊緣計算方法允許減少數(shù)據(jù)生產(chǎn)者和數(shù)據(jù)處理層之間的延遲,并通過將數(shù)據(jù)處理管道的部分移近原點(diǎn)(傳感器、物聯(lián)網(wǎng)設(shè)備)來減少對云平臺的壓力。
Gartner公司估計,到2025年,將有75%的數(shù)據(jù)將在傳統(tǒng)數(shù)據(jù)中心或云平臺之外進(jìn)行處理。
6.數(shù)據(jù)治理
數(shù)據(jù)治理是確保組織內(nèi)信息有效使用的實踐和流程的集合。
安全數(shù)據(jù)泄露法規(guī)和GDPR法規(guī)的引入迫使組織更加關(guān)注數(shù)據(jù)。像首席數(shù)據(jù)官(CDO)和首席保護(hù)官(CPO)這樣的新角色已經(jīng)開始出現(xiàn),他們負(fù)責(zé)根據(jù)法規(guī)和安全策略管理數(shù)據(jù)。數(shù)據(jù)治理不僅涉及安全和法規(guī),還涉及組織使用的數(shù)據(jù)的可用性、有效性和完整性。
數(shù)據(jù)量的快速增長以及法規(guī)和合規(guī)性要求的不斷提高是全球數(shù)據(jù)治理市場大規(guī)模增長的原因。
7.數(shù)據(jù)虛擬化
數(shù)據(jù)虛擬化集成了不同系統(tǒng)的所有組織數(shù)據(jù),管理統(tǒng)一的數(shù)據(jù)以實現(xiàn)集中的安全和治理,并將其實時提供給業(yè)務(wù)用戶。
當(dāng)使用不同的數(shù)據(jù)源時,例如來自數(shù)據(jù)倉庫、云存儲或安全SQL數(shù)據(jù)庫的數(shù)據(jù),就需要組合或分析來自這些不同數(shù)據(jù)源的數(shù)據(jù),以便基于分析做出見解或業(yè)務(wù)決策。這與ETL方法不同,ETL方法主要從其他源復(fù)制數(shù)據(jù)。數(shù)據(jù)虛擬化直接尋址數(shù)據(jù)源并對其進(jìn)行分析,而無需在數(shù)據(jù)倉庫中復(fù)制數(shù)據(jù)源。這節(jié)省了數(shù)據(jù)處理存儲空間和時間。
8.Spark 將超越Hadoop
市場需求總是不斷變化,工具也是如此。在現(xiàn)代數(shù)據(jù)處理中,越來越多的工程趨勢受到大數(shù)據(jù)基礎(chǔ)設(shè)施的影響。值得關(guān)注的軟件趨勢之一是向云平臺遷移。因此,人們看到數(shù)據(jù)處理從內(nèi)部部署數(shù)據(jù)中心轉(zhuǎn)移到提供數(shù)據(jù)接收、分析和存儲等服務(wù)的云平臺。
有了這樣的轉(zhuǎn)變,并不是所有的工具都能跟上市場發(fā)展步伐。例如,大多數(shù)Hadoop提供商仍然只支持?jǐn)?shù)據(jù)中心基礎(chǔ)設(shè)施,而Spark這樣的框架在數(shù)據(jù)中心和云平臺中都感覺非常舒適。Spark正在不斷發(fā)展和快速進(jìn)步,以滿足市場需求,為組織提供了采用混合云或多云的更多選擇。
結(jié)論
根據(jù)市場預(yù)測,大數(shù)據(jù)將繼續(xù)增長。到2025年,全球大數(shù)據(jù)市場的規(guī)模將達(dá)到驚人的2500億美元。
近年來的一些發(fā)展趨勢(例如增強(qiáng)分析、內(nèi)存中計算、數(shù)據(jù)虛擬化和大數(shù)據(jù)處理框架)仍然具有現(xiàn)實意義,并將對組織的業(yè)務(wù)發(fā)展產(chǎn)生重大影響。例如,內(nèi)存中計算的速度是其他任何解決方案速度的100多倍。這有助于組織立即做出決策和采取行動。至于有助于節(jié)省數(shù)據(jù)處理存儲空間和時間的數(shù)據(jù)虛擬化,到2022年,將近三分之二的組織將采用這種方法。
新的趨勢也在出現(xiàn)。像持續(xù)智能、邊緣計算和數(shù)據(jù)操作這樣的強(qiáng)大工具可以幫助改進(jìn)業(yè)務(wù)并使事情更快地發(fā)生。例如,持續(xù)智能同時考慮了歷史數(shù)據(jù)和實時數(shù)據(jù)。這會顯著影響組織的決策方式以及決策的效率和速度。到2022年,50%以上的主要業(yè)務(wù)系統(tǒng)將基于實時分析環(huán)境做出業(yè)務(wù)決策。邊緣計算等方法允許在傳統(tǒng)數(shù)據(jù)中心或云平臺之外處理數(shù)據(jù)。據(jù)估計,到2025年,組織75%的生成數(shù)據(jù)將在邊緣進(jìn)行處理。DataOps工具包中的無服務(wù)器實踐已經(jīng)使組織減少硬件數(shù)量,并方便快捷地進(jìn)行擴(kuò)展。將近50%的組織已經(jīng)或計劃在不久的將來使用無服務(wù)器架構(gòu)。
版權(quán)聲明:本文為企業(yè)網(wǎng)D1Net編譯,轉(zhuǎn)載需注明出處為:企業(yè)網(wǎng)D1Net,如果不注明出處,企業(yè)網(wǎng)D1Net將保留追究其法律責(zé)任的權(quán)利。