Hadoop處理大數(shù)據(jù)的五大優(yōu)勢

責(zé)任編輯:一三

2013-12-27 11:56:02

摘自:中關(guān)村在線

Hadoop是一個(gè)高度可擴(kuò)展的存儲平臺,因?yàn)樗梢源鎯头职l(fā)橫跨數(shù)百個(gè)并行操作的廉價(jià)的服務(wù)器數(shù)據(jù)集群。Hadoop其他的優(yōu)勢還包括:成本效益、靈活性更好、Hadoop處理更快等。

企業(yè)網(wǎng)D1Net摘錄信息要點(diǎn):

1. 作為一個(gè)全新的開源項(xiàng)目,Hadoop提供了一中新的方式用來存儲和處理器數(shù)據(jù)。

2. 大型的互聯(lián)網(wǎng)公司,如谷歌、Facebook都使用Hadoop來存儲和管理它們龐大的數(shù)據(jù)集。

3. Hadoop是一個(gè)高度可擴(kuò)展的存儲平臺,因?yàn)樗梢源鎯头职l(fā)橫跨數(shù)百個(gè)并行操作的廉價(jià)的服務(wù)器數(shù)據(jù)集群。Hadoop其他的優(yōu)勢還包括:成本效益、靈活性更好、Hadoop處理更快等。

現(xiàn)在,如果你沒有聽說過Hadoop,那么你一定落伍了。作為一個(gè)全新的開源項(xiàng)目,Hadoop提供了一中新的方式用來存儲和處理器數(shù)據(jù)。大型的互聯(lián)網(wǎng)公司,如谷歌、Facebook都使用Hadoop來存儲和管理它們龐大的數(shù)據(jù)集。Hadoop也通過在這些領(lǐng)域的應(yīng)用證明了其五大優(yōu)勢:

高可擴(kuò)展性

Hadoop是一個(gè)高度可擴(kuò)展的存儲平臺,因?yàn)樗梢源鎯头职l(fā)橫跨數(shù)百個(gè)并行操作的廉價(jià)的服務(wù)器數(shù)據(jù)集群。不同于傳統(tǒng)的關(guān)系型數(shù)據(jù)庫系統(tǒng)不能擴(kuò)展到處理大量的數(shù)據(jù),Hadoop是能給企業(yè)提供涉及成百上千TB的數(shù)據(jù)節(jié)點(diǎn)上運(yùn)行的應(yīng)用程序。

成本效益

Hadoop還為企業(yè)用戶提供了極具成本效益的存儲解決方案。傳統(tǒng)的關(guān)系型數(shù)據(jù)庫管理系統(tǒng)的問題是,他并不符合海量數(shù)據(jù)的處理器,不能夠符合企業(yè)的成本效益。許多公司過去不得不假設(shè)那些數(shù)據(jù)最優(yōu)價(jià)值,然后根據(jù)這些有價(jià)值的數(shù)據(jù)設(shè)定分類,如果保存所有的數(shù)據(jù),那么成本就會過高。雖然這種方法可以短期內(nèi)實(shí)現(xiàn)工作,但是隨著數(shù)據(jù)量的增大,這種方式并不能很好的解決問題。

Hadoop的架構(gòu)則不痛,其被設(shè)計(jì)為一個(gè)向外擴(kuò)展的架構(gòu),可以經(jīng)濟(jì)的存儲所有公司的數(shù)據(jù)供以后使用,節(jié)省的費(fèi)用是非常驚人的,Hadoop提供數(shù)百TB的存儲和計(jì)算能力,而不是幾千塊錢就能解決的問題。

靈活性更好

Hadoop能夠使企業(yè)輕松訪問到新的數(shù)據(jù)源,并可以分析不同類型的數(shù)據(jù),從這些數(shù)據(jù)中產(chǎn)生價(jià)值,這意味著企業(yè)可以利用Hadoop的靈活性從社交媒體、電子郵件或點(diǎn)擊流量等數(shù)據(jù)源獲得寶貴的商業(yè)價(jià)值。

此外,Hadoop的用途非常廣,諸如對數(shù)處理、推薦系統(tǒng)、數(shù)據(jù)倉庫、市場活動分析以及欺詐檢測。

Hadoop處理更快

Hadoop擁有獨(dú)特的存儲方式,用于數(shù)據(jù)處理的工具通常在與數(shù)據(jù)相同的服務(wù)器上,從而導(dǎo)致能夠更快的處理器數(shù)據(jù),如果你正在處理大量的非結(jié)構(gòu)化數(shù)據(jù),Hadoop能夠有效的在幾分鐘內(nèi)處理TB級的數(shù)據(jù),而不是像以前PB級數(shù)據(jù)都要以小時(shí)為單位。

容錯(cuò)能力

使用Hadoop的一個(gè)關(guān)鍵優(yōu)勢就是他的容錯(cuò)能力。當(dāng)數(shù)據(jù)被發(fā)送到一個(gè)單獨(dú)的借點(diǎn),該數(shù)據(jù)也被復(fù)制到集群的其它節(jié)點(diǎn)上,這意味著在故障情況下,存在另一個(gè)副本可供使用。

總結(jié):當(dāng)涉及到處理大量數(shù)據(jù)集以及安全和成本效益的時(shí)候,Hadoop相比關(guān)系型數(shù)據(jù)庫管理系統(tǒng)更具有優(yōu)勢。它適用于任何規(guī)模的非結(jié)構(gòu)化數(shù)據(jù)持續(xù)增長的企業(yè),將幫助企業(yè)持續(xù)發(fā)現(xiàn)商業(yè)價(jià)值。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號