為了再度發(fā)揮自身的固有優(yōu)勢(shì),NetApp公司已經(jīng)推出一款補(bǔ)充性連接器產(chǎn)品,旨在幫助其Data ONTAP客戶在無(wú)需將數(shù)據(jù)由WAFL復(fù)制到HDFS中的前提下對(duì)自有NFS數(shù)據(jù)進(jìn)行Hadoop分析。
這套NFS Connector for Hadoop能夠處理來(lái)自各類(lèi)數(shù)據(jù)源的大數(shù)據(jù)輸入內(nèi)容,而后將結(jié)果與結(jié)構(gòu)化數(shù)據(jù)分析相結(jié)合。從根本層面來(lái)看,這相當(dāng)于將兩類(lèi)數(shù)據(jù)匯總成統(tǒng)一化視角、從而更為透徹地掌握企業(yè)或者公共事業(yè)組織的當(dāng)前運(yùn)作狀況。
這樣的方案避免了將大規(guī)模數(shù)據(jù)由FAS陣列遷移至HDFS(即Hadoop文件系統(tǒng))集群所帶來(lái)的麻煩與不便。
這套Hadoop集群能夠以HDFS為主要運(yùn)行平臺(tái),并將ONTAP作為輔助性文件系統(tǒng)。除此之外,該集群還能夠在無(wú)需造成獨(dú)立HDFS孤島的前提下單純運(yùn)作在FAS陣列之上。
這很可能成為ONTAP用戶試水Hadoop項(xiàng)目并體驗(yàn)其實(shí)際效果的絕佳途徑。
這套連接器采取開(kāi)源機(jī)制,并由GitHub負(fù)責(zé)托管:
專(zhuān)門(mén)針對(duì)MapReduce協(xié)作需要,從而配合Apache Hadoop框架當(dāng)中的計(jì)算部分。
能夠支持Apache HBase(屬于列式數(shù)據(jù)庫(kù))。
能夠支持Apache Spark(與Hadoop相兼容的處理引擎)。
能夠與Tachyon內(nèi)存內(nèi)文件系統(tǒng)相協(xié)作,后者能夠與Apache Hadoop與Spark并行協(xié)作。
在一篇博文當(dāng)中,NetApp公司CTO辦公室的Val Bercovici表示:“NetApp計(jì)劃將相關(guān)代碼貢獻(xiàn)給Hadoop項(xiàng)目主體。”
NetApp公司還針對(duì)Cloudera制定出自己的NOSH(即面向Hadoop的NetApp開(kāi)放解決方案)計(jì)劃。