微軟正在致力于另外一項(xiàng)專注于幫助用戶應(yīng)對大數(shù)據(jù)的Azure新服務(wù)。這項(xiàng)名為Azure Data Factory的服務(wù)允許用戶整合一系列微軟Azure服務(wù),以及選定的第三方服務(wù),成為一個更易于管理的分析和數(shù)據(jù)管道,不愿透露姓名的消息來源這樣表示。
目前,微軟允許用戶跨不同帳戶在Azure以及/或者現(xiàn)有的SQL Server中遷移數(shù)據(jù)。即將公布的Azure Data Factory意在擴(kuò)大數(shù)據(jù)來源和類型,不僅僅是blob數(shù)據(jù)庫、表和數(shù)據(jù)庫,該消息來源這樣表示。
我聽說,新的Data Factory服務(wù)目前還在私人預(yù)覽狀態(tài),但是應(yīng)該會在一個月左右公開預(yù)覽。
在查找關(guān)于Azure Data Factory的信息時,我發(fā)現(xiàn)一份來自微軟軟件架構(gòu)師Chu Chen的LinkedIn資料,他稱自己是“Azure Data Factory與大數(shù)據(jù)(解決方案、Hadoop、OneSI Elementary Pipelines以及Power BI)的共同擁有者”。
我向微軟官方尋求更多關(guān)于Azure Data Factory的信息,一位新聞發(fā)言人表示微軟目前還沒有關(guān)于這項(xiàng)服務(wù)的信息可以分享。
微軟已經(jīng)提供了一系列Azure數(shù)據(jù)和分析服務(wù),包括Azure AQL數(shù)據(jù)庫(管理關(guān)系型數(shù)據(jù)庫即服務(wù));HDInsight(管理Hadoop集群);緩存、機(jī)器學(xué)習(xí)、DocementDB(最近推出的NoSQL文檔數(shù)據(jù)庫即服務(wù))以及Azure Search(新的全文本搜索即服務(wù))。
微軟最近向Azure HDInsight中增加了對Apache HBase集群支持。(HBase是Hadoop的一個NoSQL數(shù)據(jù)庫組件。)微軟目前并不支持Apache Storm,一個用于實(shí)時處理Hadoop 2.x中流式數(shù)據(jù)的系統(tǒng),但是我并沒有聽說這項(xiàng)支持很快會添加到HDInsight中。Amazon的AWS已經(jīng)支持Storm。
微軟方面同樣拒絕了對HDInsight是否以及何時戶支持Storm的回答。但在此期間,一系列會想辦法在Azure上使用Storm。