大數(shù)據(jù)最核心的價(jià)值就是在于對(duì)于海量數(shù)據(jù)進(jìn)行存儲(chǔ)和分析。相比起現(xiàn)有的其他技術(shù)而言,大數(shù)據(jù)的“廉價(jià)、迅速、優(yōu)化”這三方面的綜合成本是最優(yōu)的。
當(dāng)這項(xiàng)技術(shù)在自己用的時(shí)候,自己將會(huì)非常收益,因?yàn)槌杀緯?huì)降低;當(dāng)這項(xiàng)技術(shù)作用在客戶時(shí)候,客戶同時(shí)也會(huì)受益。能夠讓客戶和自己同時(shí)受益的技術(shù),就是最有商業(yè)價(jià)值的。所以,大數(shù)據(jù)并不只是喊口號(hào)的空話,而是像其他的新興技術(shù)一樣,商業(yè)化是需要一個(gè)過程,就現(xiàn)在看來,大數(shù)據(jù)還是屬于雷聲大雨點(diǎn)小的階段,所以讓很多人會(huì)去認(rèn)為大數(shù)據(jù)炒作的嫌疑更大。
雖然大數(shù)據(jù)并不是僅僅局限在技術(shù)的顯示,但是Hadoop系統(tǒng)的技術(shù)已經(jīng)在事實(shí)上獲得認(rèn)可了,因此,在討論大數(shù)據(jù)最核心的價(jià)值同時(shí),也不能脫離Hadoop系統(tǒng)的技術(shù)。
一、海量
這是大數(shù)據(jù)里面最關(guān)鍵的一條,少量的數(shù)據(jù)在IT行業(yè)有許多解決方案,所以大數(shù)據(jù)技術(shù)并不占優(yōu)。
二、存儲(chǔ)
這里首先是需要很多存儲(chǔ)的技術(shù),其次數(shù)據(jù)的存儲(chǔ)設(shè)備需要有擴(kuò)展性,只要將存儲(chǔ)服務(wù)器的節(jié)點(diǎn)增加即可,將默認(rèn)的副本技術(shù)讓數(shù)據(jù)不丟失。
三、分析
海量的數(shù)據(jù)分析一定是需要進(jìn)行分布式處理的,不然時(shí)間成本太大。分布式技術(shù)很早就已經(jīng)有了,都很專業(yè)和復(fù)雜。Hadoop只需要讓分布式處理上運(yùn)行幾十條或者上百條代碼即可完成,在專業(yè)程序上只需要很短的時(shí)間就可以完成基本的數(shù)據(jù)分析。當(dāng)然最專業(yè)的大數(shù)據(jù)分析還是需要專家還完成。
四、優(yōu)秀
Hadoop系列技術(shù)是專門為海量數(shù)據(jù)處理而進(jìn)行設(shè)計(jì)的,IT行業(yè)的頂級(jí)企業(yè)參與了貢獻(xiàn)和相關(guān)技術(shù)的貢獻(xiàn),在生態(tài)圈上具有完善的一套體系,所以各種需求都能夠基本滿足。相較于其余的分布式技術(shù),Hadoop則更加優(yōu)秀。
五、快速
1.在集群的處理上的性能,會(huì)隨著運(yùn)算借點(diǎn)的增加而將線性進(jìn)行擴(kuò)展。
2.基于JAVA語言實(shí)現(xiàn),將學(xué)習(xí)的門檻大大的降低了。
3.對(duì)于集群的部署和維護(hù),變得越來越容易(有很多自動(dòng)化的集群構(gòu)建和維護(hù)工具,包括許多商業(yè)版本,都提供web界面的運(yùn)維功能)。
6、廉價(jià)
1.不需要購(gòu)買IBM、Oracle、EMC等公司昂貴的硬件、軟件和服務(wù),也無需windows授權(quán)。
2.因?yàn)闀?huì)這項(xiàng)技術(shù)的人或公司越來越多,購(gòu)買或定制開發(fā)基于相關(guān)技術(shù)的商業(yè)產(chǎn)品越來越便宜
綜上,相對(duì)于其他技術(shù)體系,大數(shù)據(jù)的綜合成本最優(yōu)。