全球虛擬化和云基礎(chǔ)架構(gòu)領(lǐng)導(dǎo)廠商VMware公司公布了最新開源項目——Serengeti,支持企業(yè)能夠在虛擬和云環(huán)境中快速部署、管理和擴(kuò)展Apache Hadoop。此外,VMware與Apache Hadoop社區(qū)共同合作研發(fā)擴(kuò)展功能,讓主要組件可以“感知虛擬化”以支持靈活擴(kuò)展,并進(jìn)一步提高Hadoop在虛擬化環(huán)境中的性能。
VMware公司云應(yīng)用服務(wù)副總裁陳志璋表示:“通過支持企業(yè)充分利用超大型數(shù)據(jù)而獲取競爭優(yōu)勢,Apache Hadoop具有帶來業(yè)務(wù)變革的潛力。它代表了應(yīng)用正在發(fā)生根本性變化的一個方面,而企業(yè)也在尋求把這些新技術(shù)融入其產(chǎn)品家族的方式。VMware與Apache Hadoop社區(qū)合作,支持企業(yè)IT部門能夠在虛擬和云環(huán)境中輕松部署和管理Hadoop。”
Apache Hadoop事實上正在成為大數(shù)據(jù)處理的標(biāo)準(zhǔn),但部署和運(yùn)營的復(fù)雜性、特定的硬件需求、安全上的顧慮和服務(wù)水平保障讓很多企業(yè)無法充分發(fā)揮Hadoop的威力。通過把Apache Hadoop節(jié)點從底層物理基礎(chǔ)架構(gòu)剝離,VMware可以將云基礎(chǔ)架構(gòu)的優(yōu)勢帶給Hadoop,包括快速部署、高可用性、最佳資源利用率、靈活和安全多租戶。
擁有Apache 2.0許可證的用戶可以免費(fèi)下載Serengeti,它是一鍵式部署工具包,支持企業(yè)能夠利用VMware vSphere®平臺在幾分鐘內(nèi)部署高度可用的Apache Hadoop集群,包括Apache Pig和Apache Hive等常見的Hadoop組件。通過使用Serengeti在VMware vSphere上運(yùn)行Hadoop,企業(yè)可以輕松享受到值得信賴、廣泛部署的全球虛擬化平臺的高可用性、容錯性和現(xiàn)場遷移能力,從而實現(xiàn)Hadoop集群的可用性和可管理性。
OVUM首席分析師Tony Baer表示:“要想成為企業(yè)IT基礎(chǔ)架構(gòu)中的佼佼者,Hadoop必須符合企業(yè)IT部門的技術(shù)和實踐需求。大數(shù)據(jù)集群的資源密集性使得Hadoop必須支持虛擬化。VMware參與Apache Hadoop項目和VMware最新Serengeti Apache項目都是非常重要的舉措,為企業(yè)提供了在Hadoop原型開發(fā)和部署時所需的靈活性。”
VMware與Cloudera、Greenplum、Hortonworks、IBM和MapR等領(lǐng)先的Apache Hadoop分銷商合作,從而進(jìn)行廣泛分銷。
虛擬化擴(kuò)展、Spring更新幫助企業(yè)構(gòu)建和運(yùn)營大數(shù)據(jù)應(yīng)用
為了簡化并加速企業(yè)使用Apache Hadoop,VMware與Apache Hadoop社區(qū)合作更新Hadoop分布式文件系統(tǒng)(HDFS)和Hadoop MapReduce項目,使其能夠感知虛擬化,從而支持?jǐn)?shù)據(jù)和計算工作在虛擬基礎(chǔ)架構(gòu)中可以進(jìn)行最佳分布。這些改變支持企業(yè)能夠?qū)崿F(xiàn)更靈活、更安全且高度可用的Hadoop集群。
VMware還發(fā)布了Spring for Apache Hadoop(2012年2月首次發(fā)布的開源項目)的更新,讓企業(yè)開發(fā)者能夠輕松利用Apache Hadoop開發(fā)分布式處理解決方案。上述更新支持Spring開發(fā)者能夠輕松開發(fā)可以與HBase數(shù)據(jù)庫、Cascading庫和Hadoop相集成的企業(yè)應(yīng)用。Spring for Apache Hadoop可以免費(fèi)下載,目前可以通過開源Apache 2.0許可證獲取。
上述項目和新功能旨在加速Hadoop使用,并支持企業(yè)充分利用Cetas等大數(shù)據(jù)分析應(yīng)用從海量數(shù)據(jù)中獲得實時的智能洞察力。VMware在2012年4月收購了Cetas,Cetas分析服務(wù)目前可以在www.cetas.net網(wǎng)站獲得。