云計算將如何影響數(shù)據(jù)倉庫技術(shù)?

責任編輯:cres

2020-04-26 13:07:59

摘自:機房360

基于云計算的解決方案是數(shù)據(jù)倉庫市場的未來。隨著眾多企業(yè)轉(zhuǎn)向云平臺來支持和存儲其數(shù)據(jù)倉庫解決方案,像亞馬遜和谷歌這樣的互聯(lián)網(wǎng)公司不知疲倦地致力于開發(fā)和托管創(chuàng)新的基于云計算的數(shù)據(jù)倉庫。

近年來,數(shù)據(jù)生成水平激增,其特點是工業(yè)領(lǐng)域中很多企業(yè)進行了巨大的數(shù)字化轉(zhuǎn)型。全球范圍內(nèi)生成的數(shù)據(jù)量正在快速增長。實際上,行業(yè)媒體Gigabit Magazine的研究表明,全球2020年生成的數(shù)據(jù)量將比10年前增長25倍以上。此外,據(jù)估計,到2025年,生成的累積數(shù)據(jù)將增加三倍,達到近175ZB。
 
目前,業(yè)務(wù)決策者對實時數(shù)據(jù)訪問的需求也在以前所未有的速度增長,以便于進行明智的業(yè)務(wù)決策。
 
為了使數(shù)據(jù)對他們的業(yè)務(wù)有用、可行和可擴展,企業(yè)需要一種有效且經(jīng)濟高效的方式來存儲、標記和解釋這些數(shù)據(jù)。實現(xiàn)這種目的最有利可圖的方法之一就是采用數(shù)據(jù)倉庫。
 
這一概念可以追溯到上世紀70年代,當計算機科學家Bill Inmon首次提出“數(shù)據(jù)倉庫”一詞時,就出現(xiàn)了數(shù)據(jù)倉庫市場。早期的數(shù)據(jù)倉庫創(chuàng)建為本地服務(wù)器,其構(gòu)建能力僅為千兆字節(jié)。從那時起,它們經(jīng)歷了重大的變革,現(xiàn)代化的倉庫可容納更大的容量。
 
數(shù)據(jù)倉庫,也稱為決策支持數(shù)據(jù)庫,是指一個中央存儲庫,用于保存從一個或多個數(shù)據(jù)源(例如事務(wù)系統(tǒng)和關(guān)系數(shù)據(jù)庫)衍生的信息。系統(tǒng)中收集的數(shù)據(jù)可以采用非結(jié)構(gòu)化、半結(jié)構(gòu)化或結(jié)構(gòu)化數(shù)據(jù)的形式。然后對這些數(shù)據(jù)進行處理、轉(zhuǎn)換和使用,以使用戶可以更輕松地通過SQL客戶端,電子表格和商業(yè)智能工具對其進行訪問。
 
數(shù)據(jù)倉庫還促進了更輕松的數(shù)據(jù)挖掘,這是對數(shù)據(jù)中的模式進行標識,然后可以用來推動更高的利潤和銷售量。數(shù)據(jù)倉庫行業(yè)的應(yīng)用范圍跨越了與分析乃至云計算相關(guān)的多個領(lǐng)域,在某些情況下,其中包括醫(yī)療保健、制造業(yè)、電信與IT、零售和政府等。
 
在技術(shù)領(lǐng)域,有幾家公司在推進數(shù)據(jù)倉庫技術(shù)方面取得了長足的進步。最著名的公司之一是Teradata公司,這是一家行業(yè)領(lǐng)先的數(shù)據(jù)倉庫公司,在該領(lǐng)域擁有30多年的經(jīng)驗。Teradata軟件被廣泛用于許多行業(yè)的各種數(shù)據(jù)倉庫活動,尤其是在銀行業(yè)。該公司一直致力于通過創(chuàng)新的新技術(shù)(包括基于Hadoop的服務(wù))來增強其商業(yè)智能解決方案。
 
大數(shù)據(jù)和數(shù)據(jù)倉庫
 
在現(xiàn)代時代,大數(shù)據(jù)和數(shù)據(jù)科學正在極大地顛覆企業(yè)開展業(yè)務(wù)以及決策流程的方式??缧袠I(yè)擁有如此大量的數(shù)據(jù),對高效大數(shù)據(jù)分析的需求變得至關(guān)重要。大數(shù)據(jù)最早是在上世紀90年代出現(xiàn)的,但是這個概念可以追溯到術(shù)語創(chuàng)造之前,直到計算機時代的曙光,那時企業(yè)將使用大型電子表格分析數(shù)字和研究趨勢。
 
隨著1990年代末和2000年代初出現(xiàn)新的數(shù)據(jù)源,它們開始推動了海量數(shù)據(jù)的產(chǎn)生。隨著移動設(shè)備和搜索引擎的興起,這種趨勢尤其激增,搜索引擎比以往任何時候都可以輸出更多的數(shù)據(jù)。表征大數(shù)據(jù)出現(xiàn)的另一個因素是速度。數(shù)據(jù)生成速度越快,所需的處理就越多。因此,在2005年,Gartner公司將大數(shù)據(jù)的概念描述為數(shù)據(jù)的3V,也就是數(shù)量,速度和種類。
 
隨著數(shù)據(jù)量持續(xù)快速增長,傳統(tǒng)的關(guān)系數(shù)據(jù)庫和數(shù)據(jù)倉庫無法處理這些數(shù)據(jù)。為了規(guī)避此問題并確保更高效的大數(shù)據(jù)分析系統(tǒng),雅虎等公司的工程師于2006年創(chuàng)建了Hadoop,這是一個Apache開放源項目,它具有分布式處理框架,即使在集群平臺上也可以運行大數(shù)據(jù)應(yīng)用程序。
 
人工智能,機器學習和基于云的解決方案可能會推動數(shù)據(jù)倉庫市場的未來前景
 
考慮到現(xiàn)代產(chǎn)生的數(shù)據(jù)量以及處理數(shù)據(jù)所需的高級基礎(chǔ)設(shè)施,決策支持數(shù)據(jù)庫在技術(shù)和體系結(jié)構(gòu)方面都面臨著巨大的發(fā)展壓力。除了幾種新的數(shù)據(jù)倉庫架構(gòu)方法之外,還出現(xiàn)了許多技術(shù),成為現(xiàn)代商業(yè)智能解決方案的主要貢獻者,從云計算服務(wù)到數(shù)據(jù)虛擬化再到自動化和機器學習等。
 
基于云計算的解決方案是數(shù)據(jù)倉庫市場的未來。隨著眾多企業(yè)轉(zhuǎn)向云平臺來支持和存儲其數(shù)據(jù)倉庫解決方案,像亞馬遜和谷歌這樣的互聯(lián)網(wǎng)公司不知疲倦地致力于開發(fā)和托管創(chuàng)新的基于云計算的數(shù)據(jù)倉庫。
 
未來幾年將推動數(shù)據(jù)倉庫行業(yè)前景的另一趨勢是機器學習和人工智能支持。新的數(shù)據(jù)倉庫架構(gòu)將成為人工智能數(shù)據(jù)集的基礎(chǔ),而人工智能和機器學習將改善這些商業(yè)智能解決方案的功能和運營。這種趨勢的一個例子是谷歌將機器學習整合到BigQuery數(shù)據(jù)倉庫中。

鏈接已復制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號