從IBM方面了解,承諾大力推進(jìn)Apache Spark項(xiàng)目,該項(xiàng)目為以數(shù)據(jù)為主導(dǎo)的,未來十年最為重要的新的開源項(xiàng)目。這一承諾的核心是將Spark嵌入IBM業(yè)內(nèi)領(lǐng)先的分析和商務(wù)平臺(tái),并將Spark作為一項(xiàng)服務(wù)在IBM Bluemix平臺(tái)上提供給客戶。
IBM還將投入超過3500名研究和開發(fā)人員在全球十余個(gè)實(shí)驗(yàn)室開展與Spark相關(guān)的項(xiàng)目,并將為Spark開源生態(tài)系統(tǒng)無償提供突破性的機(jī)器學(xué)習(xí)技術(shù)--IBM SystemML,同時(shí),IBM還將培養(yǎng)超過100萬名Spark數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師。
據(jù)了解,Spark無疑為大規(guī)模數(shù)據(jù)處理帶來了革命性的突破。首先,它極大的提升了數(shù)據(jù)依賴型應(yīng)用程序的性能;其次,它從根本上簡化了由數(shù)據(jù)驅(qū)動(dòng)的智能應(yīng)用程序的開發(fā)流程。
為了加速Spark生態(tài)系統(tǒng)的開源創(chuàng)新進(jìn)程,IBM將采取Spark構(gòu)建在自有的分析與商務(wù)平臺(tái)的核心中,同時(shí)Spark作為沃森健康云洞察平臺(tái)的核心基礎(chǔ)之一,以便醫(yī)療服務(wù)人員和研究人員在圍繞新的人口健康數(shù)據(jù)進(jìn)行分析時(shí),更快地將數(shù)據(jù)轉(zhuǎn)化為價(jià)值。
Bluemix平臺(tái)上服務(wù)目錄
另外,對IBM突破性的IBM SystemML機(jī)器學(xué)習(xí)技術(shù)開源,并與Databricks協(xié)作提高Spark的機(jī)器學(xué)習(xí)能力。作為一項(xiàng)服務(wù)在Bluemix平臺(tái)上提供給客戶,任何開發(fā)人員都可以快速加載數(shù)據(jù)、建模,并導(dǎo)出預(yù)測性工具用于他們的應(yīng)用程序。
IBM將通過與AMPLab、DataCamp、MetiStream、Galvanize 和MOOC,等多種合作方式,培養(yǎng)至少100萬名Spark數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師。
Spark已受到開發(fā)者與數(shù)據(jù)科學(xué)家們的熱烈追捧。作為一個(gè)可以幫助企業(yè)便捷整合大數(shù)據(jù)至應(yīng)用程序中的重要平臺(tái),Spark勢頭強(qiáng)勁,充分為IBM的客戶提供業(yè)務(wù)轉(zhuǎn)型的決策。
IBM是UC Berkeley AMPLab的4家創(chuàng)始成員之一,Spark正是于2009年初創(chuàng)于此,經(jīng)過夜以繼日的研究實(shí)驗(yàn)、提供建議、結(jié)合務(wù)實(shí)的洞察,并與研究人員就共同感興趣的話題密切互動(dòng),Spark應(yīng)運(yùn)而生。UC Berkeley AMPLab的總監(jiān)Michael Franklin教授表示,“作為AMPLab的贊助者,IBM致力于發(fā)展Spark社區(qū),并為Berkeley Data Analytics Stack的持續(xù)發(fā)展與改進(jìn)提供指導(dǎo),對于該開源平臺(tái),Spark是不可或缺的關(guān)鍵組成部分。”
Spark具有敏捷快速,便于應(yīng)用的特征。良好的開源屬性使其可以在全球范圍內(nèi)持續(xù)改進(jìn)。在接下來的幾個(gè)月里,IBM的科學(xué)家和工程師將與Apache Spark開放社區(qū)合作,迅速推動(dòng)先進(jìn)機(jī)器學(xué)習(xí)技術(shù)的普及,并加快智能業(yè)務(wù)應(yīng)用開發(fā)的創(chuàng)新速度。
通過無償提供SystemML,IBM將幫助數(shù)據(jù)科學(xué)家提高迭代速度以應(yīng)對不斷變化的業(yè)務(wù)需求,并為不斷發(fā)展壯大的應(yīng)用程序開發(fā)人員生態(tài)系統(tǒng)提供支持,使智能技術(shù)在所有領(lǐng)域得到深度應(yīng)用。