IBM在dashDB軟件上增加了大規(guī)模并行處理和R語言支持——這是數(shù)據(jù)倉庫數(shù)據(jù)庫支持分布式云計算應用的重要舉措。
IBM繼續(xù)更新dashDB關系型數(shù)據(jù)倉庫系統(tǒng),努力進一步擴大IBM云數(shù)據(jù)庫服務產品線。上周在波士頓舉行的自助風格“新兵訓練營”活動中,IBM展示了dashDB及其最新的技術改進——支持跨越集群系統(tǒng)的大規(guī)模并行處理(MPP)。
dashDB于去年秋季發(fā)布,它基于IBM旗艦產品DB2關系型數(shù)據(jù)庫的BLU Acceleration內存計算技術,但同時也將IBM的Netezza柱狀風格處理運用到云實施中。,該軟件旨在與Amazon Redshift直接競爭,而后者是Amazon Web Services (AWS)在2012年底推向市場的云數(shù)據(jù)倉庫服務。
與其他關系型數(shù)據(jù)庫供應商類似,IBM也一直面臨如何應對新型云產品的壓力——特別來自云計算巨頭AWS的產品。上個月,IBM發(fā)布了一個旨在加快查詢處理速度和提高可伸縮性的MPP版dashDB。支持越來越流行的R分析編程語言也是IBM對dashDB的另一個最新改進。
在上周的活動中,一名來自大數(shù)據(jù)主戰(zhàn)場、數(shù)字廣告與營銷行業(yè)的dashDB用戶發(fā)言表示,R語言與云數(shù)據(jù)庫的集成水平是一個很好的特性。
RSG Media是紐約一家專門為電視網絡、出版商及其其他媒體開發(fā)軟件的公司,它的解決方案架構師Shiv Sehgal說:“在我們看來,dashDB是一個柱狀數(shù)據(jù)庫,具有DB2特性,并支持R語言。”在訪談中,Sehgal指出,讓精通R語言的內部用戶和客戶能夠輕松使用這種語言,這是讓業(yè)務用戶在不需要IT幫助下就能夠提出并解決分析問題的重要一步。
大數(shù)據(jù)、大魔法
dashDB的推出一直是循序漸進,但是IBM可能在管理云數(shù)據(jù)方面寄予該技術厚望?,F(xiàn)在,有了MPP支持,dashDB可能成為DB2和Netezza數(shù)據(jù)倉庫設備的用戶通向云的道路。
IBM的dashDB產品經理John J. Park說:“MPP確實是我們的大魔法——有了它,你就可以根據(jù)數(shù)據(jù)倉庫的需要增加節(jié)點。從策略而言,這是給我們的Netezza客戶和DB2客戶提供的云產品。”
Park指出,對某些用戶來說,可能會存在這樣一個潛在問題,即dashDB與Netezza的SQL編程語言實現(xiàn)的兼容性仍然在改進中。他估計dashDB目前優(yōu)化的Netezza SQL功能比例為84%,IBM將在今年末將這個兼容性比例增加到90%以上。
在dashDB不斷改進的同時,IBM上個月收購了位于加州的Compose。該公司前身是MongoHQ,專注于數(shù)據(jù)庫即服務軟件,自動化云中數(shù)據(jù)庫的創(chuàng)建、管理和擴展。它已經支持大量的數(shù)據(jù)庫,首先是MongoDB,后來繼續(xù)增加了Elasticsearch、PostgreSQL、Redis等。
IBM收購Compose的目的之一是使開發(fā)者能夠在云中快速創(chuàng)建數(shù)據(jù)庫實例。Compose的技術與dashDB將通過IBM云平臺即服務(PaaS)產品交付給開發(fā)者。而且,它們只是IBM不斷擴大的云數(shù)據(jù)庫服務產品線的一部分。IBM的云數(shù)據(jù)管理活動證明在去年初收購Cloudant公司之后成為最賺錢的業(yè)務,而后者是一家基于Apache CouchDB項目的軟件開發(fā)商。Cloudant的NoSQL數(shù)據(jù)庫專門解決關系型數(shù)據(jù)庫在云環(huán)境中的可伸縮性和部署問題。
用戶很多、數(shù)據(jù)很多
根據(jù)Sehgal的介紹,除了使用dashDB,RSG Media還使用Cloudant軟件作為存儲分析數(shù)據(jù)的數(shù)據(jù)池。他說:“它最重要的特性是可伸縮性。它可以應付大規(guī)模的用戶。”
Sehgal及其支持的用戶有許多不同類型的數(shù)據(jù)要處理。RSG的各種系統(tǒng)都會抓取Web日志和社交媒體數(shù)據(jù),以及評分、訪問信息及來自于信息服務和廣告平臺提供商(如Nielsen, Rentrak和Operative Media)的廣告數(shù)據(jù)。
這些數(shù)據(jù)的其中一個應用是使有線電視網絡能夠預測節(jié)點決策的收益——例如,點播Billy Madison或Breaking Bad 的回報。這種節(jié)目決策以前一直由直觀猜測得出,但是Sehgal指出,現(xiàn)在情況已經改變,因為決策者知道可以合適分析工具來測量投放一個節(jié)目的成本和通過有線電視費用或廣告收益可能獲得的回報。
Sehgal指出,混合使用NoSQL數(shù)據(jù)庫和SQL數(shù)據(jù)倉庫的IBM云服務產品將所有東西整合在一起。他說:“在我們的一些應用中,我們會使用線性廣告銷售數(shù)據(jù)、社交媒體數(shù)據(jù)及其各種來源的數(shù)據(jù)。而最終要將它們關聯(lián)到一個特定節(jié)點的播放上,我們確實需要一種SQL方法,我們現(xiàn)在可以用一個產品來處理所有數(shù)據(jù)。”
根據(jù)預測公司Research and Markets在一月份發(fā)布的報告,全球基于云的數(shù)據(jù)管理服務市場預計年增長率將達到30.5%——從2014年35.1億美元增長到2019年的132.8億美元。
目前,大多數(shù)對大數(shù)據(jù)云的熱捧都聚焦在非關系型模型的創(chuàng)業(yè)公司。但是,像IBM及其他成熟的數(shù)據(jù)庫廠商,也并非坐以待斃。Oracle投入了大量的資源去開發(fā)自己的云數(shù)據(jù)庫服務平臺,其中包括云版本的NoSQL數(shù)據(jù)庫軟件;此外,最新版的Oracle Database 12c支持文檔存儲和基于SQL的JSON查詢,這是一種廣泛應用于移動、Web和云應用的格式。同時,在開發(fā)與Amazon Redshift競爭的柱狀產品時,微軟還開始推廣DocumentDB,這是在其Azure云上運行的支持JSON的NoSQL軟件。