分析公司IDC預(yù)計,數(shù)據(jù)總量將從2016年的16.1ZB增長到2025年的163ZB。所以根據(jù)調(diào)研公司MarketsandMarkets的預(yù)計,對管理這些數(shù)據(jù)并讓這些數(shù)據(jù)變得更有價值的大數(shù)據(jù)軟件和服務(wù)需求將以每年超過18%的速度增長。
大數(shù)據(jù)領(lǐng)域有很多專注于提供解決連接分散數(shù)據(jù)源、將數(shù)據(jù)遷移到云以便更輕松地訪問和分析等問題的解決方案。此外,在大數(shù)據(jù)軟件中將機器學(xué)習(xí)與其他人工智能技術(shù)相融合,使其比現(xiàn)在更智能,這個趨勢也越來越明顯。
下面就是2017年上半年值得我們關(guān)注的、最酷的10家大數(shù)據(jù)初創(chuàng)公司:
AtScale
CEO: Dave Mariani
在收集和管理大數(shù)據(jù)方面,Hadoop也許很流行,但是訪問這些數(shù)據(jù)、分析數(shù)據(jù)并從數(shù)據(jù)中提取價值就會遇到一些問題。
AtScale開發(fā)的軟件能夠讓Tableau和Qlik這樣受歡迎的商業(yè)智能工具來訪問保存在Hadoop集群中的數(shù)據(jù),實際上它將Hadoop變成了一臺在線分析處理服務(wù)器,可以用于多維度的分析。
AtScale公司創(chuàng)建于2013年,位于加州圣瑪特奧,它為自己的計算引擎能力申請了專利,這種引擎能夠與任何BI可視化工具相提并論。6月,該公司發(fā)布了AtScale 5.5,新增功能包括高可用性部署、預(yù)定義的聚合、支持復(fù)雜業(yè)務(wù)用例和分析模型。
DataRobot
CEO: Jeremy Achin
機器學(xué)習(xí)很熱,創(chuàng)建于2012年的DataRobot公司專門開發(fā)一種自動化機器學(xué)習(xí)平臺,獲取數(shù)據(jù)科學(xué)家的經(jīng)驗和最佳實踐,并利用這些信息構(gòu)建和部署預(yù)測模型,時間遠(yuǎn)遠(yuǎn)短于使用傳統(tǒng)工具和技術(shù)。
位于波士頓的DataRobot公司,在今年5月收購了Nutonian——另一家專注于時間序列分析模型的數(shù)據(jù)科學(xué)軟件開發(fā)商。
3月,DataRobot在C輪融資中獲得了5400萬美元,總?cè)谫Y金額超過1.2億美元。
DataScience
CEO: Ian Swanson
如今數(shù)據(jù)科學(xué)家是很搶手且短缺的,所以企業(yè)正在尋求以各種方式最大限度地利用數(shù)據(jù)科學(xué)家的時間,充分發(fā)揮他們的才能。
DataScience提供的企業(yè)級數(shù)據(jù)科學(xué)平臺將工具、庫和語言與IT基礎(chǔ)設(shè)施和業(yè)務(wù)工作流結(jié)合起來。5月發(fā)布的廣泛更新,提供了本地或者云部署選擇——后者是跨多個云服務(wù)提供商——以及安全性、定制工作流,且支持更廣泛的數(shù)據(jù)科學(xué)編程語言。
DataScience創(chuàng)建于2014年,位于加州卡爾弗市。6月,DataScience與開源人工智能系統(tǒng)開發(fā)商H2O.ai達(dá)成聯(lián)盟,此舉將讓數(shù)據(jù)科學(xué)家利用DataScience平臺部署人工智能和深度學(xué)習(xí)模型。
Endor
CEO: Doron Alter
Endor開發(fā)了一個預(yù)測分析平臺,可以讓企業(yè)用戶詢問任何問題,例如“誰有可能嘗試這種新產(chǎn)品?”以及“我們應(yīng)該在哪里開設(shè)我們的下一家商店?”,并且在幾分鐘內(nèi)得到答案。
Endor的專有技術(shù)是基于來自麻省理工學(xué)院研究的“社會物理學(xué)”。雖然機器學(xué)習(xí)很擅長預(yù)測,但是當(dāng)設(shè)備關(guān)鍵部分發(fā)生故障的時候,社會物理學(xué)就會利用大數(shù)據(jù)分析和生物學(xué)的數(shù)學(xué)模型來了解人類群體的行為。
Endor(是的,它的名字和星球大戰(zhàn)中的行星名字相同)成立于2014年,位于以色列特拉維夫。今年,Gartner將該公司評為商業(yè)智能領(lǐng)域中的“酷廠商”,“世界經(jīng)濟論壇”則將其命名為技術(shù)先驅(qū)。
Gluent
CEO: Tanel Poder
Gluent開發(fā)的數(shù)據(jù)虛擬化技術(shù)能夠?qū)崿F(xiàn)這家位于達(dá)拉斯的初創(chuàng)公司所謂的“混合數(shù)據(jù)”計算。Gluent Data Platform將數(shù)據(jù)從傳統(tǒng)關(guān)系型數(shù)據(jù)庫系統(tǒng)卸載到Hadoop,同時仍然提供對這些數(shù)據(jù)的訪問。
Gluent的系統(tǒng)讓企業(yè)能夠利用基于云或者本地Hadoop集群的靈活性和可擴展性,同時提高隊列性能,降低SAN和關(guān)系型數(shù)據(jù)庫許可成本。
Gluent被Gartner評為數(shù)據(jù)管理領(lǐng)域的“酷廠商”,并在3月Strata + Hadoop World Startup Showcase獲得第二名。
Iguazio
CEO: Asaf Somekh
Iguazio Continuous Analytics Data Platform簡化了大數(shù)據(jù)、物聯(lián)網(wǎng)和云原生應(yīng)用的業(yè)務(wù)分析流程,將不同的數(shù)據(jù)類型和工作負(fù)載進(jìn)行統(tǒng)一。
Iguazio系統(tǒng)通過多個協(xié)議和行業(yè)標(biāo)準(zhǔn)API創(chuàng)建了一個統(tǒng)一的數(shù)據(jù)模型,后者包括兼容Amazon的流和表格、對象和文件API。任何類型的數(shù)據(jù)都以歸一化和搜索優(yōu)化的形式保存一次,動態(tài)轉(zhuǎn)換,無需拷貝、ETL流程和復(fù)雜的數(shù)據(jù)管道。
Iguazio創(chuàng)建于2014年,位于以色列荷茲利亞,被Gartner評為2017年數(shù)據(jù)管理領(lǐng)域的“酷廠商”。
Maana
CEO: Babur Ozden
Maana開發(fā)它所謂的“以知識為核心的”數(shù)據(jù)搜索和發(fā)現(xiàn)軟件。Maana Knowledge Platform從多個分散的系統(tǒng)或者“孤島”收集數(shù)據(jù),并將其轉(zhuǎn)換為可被業(yè)務(wù)線應(yīng)用采用的運營洞察。
在Maana系統(tǒng)的核心,是它的Knowledge Graph專利技術(shù)及算法,提供了對業(yè)務(wù)希望優(yōu)化的資產(chǎn)或者流程的一體化視圖。Maana的關(guān)注點主要是在石油和天然氣行業(yè)的行業(yè)應(yīng)用和客戶。Maana最大的投資方是能源公司,包括殼牌、雪佛龍和沙特阿美公司。
Maana創(chuàng)建于2012年,位于加州帕洛阿爾托,最近被評為世界經(jīng)濟論壇的技術(shù)先驅(qū)之一。
Nexla
CEO: Saket Saurabh
Nexla開發(fā)的數(shù)據(jù)運營平臺利用機器學(xué)習(xí)技術(shù)監(jiān)控和調(diào)整數(shù)據(jù),并實時地在公司之間安全遷移數(shù)據(jù)。Nexla認(rèn)為,通過將這些數(shù)據(jù)操作自動化,可以更快速地從他們的數(shù)據(jù)中獲得價值。
Nexla創(chuàng)建于去年,位于加州Millbrae,剛剛在5月發(fā)布了其產(chǎn)品的公開測試版。同時,Nexla在種子融資中獲得了350萬美元。
Nexla在3月的Strata + Hadoop World大會上獲得了創(chuàng)業(yè)展示最高獎項,引起人們的關(guān)注。
Panoply.io
CEO: Yaniv Leven
Panoply.io開發(fā)的基于云的數(shù)據(jù)倉庫系統(tǒng),可以全面全自動化做復(fù)雜且耗費時間的數(shù)據(jù)準(zhǔn)備、建模和管理流程。
Panoply的系統(tǒng)與AWS Redshift服務(wù)協(xié)作,結(jié)合機器學(xué)習(xí)與自然語言處理以執(zhí)行很多通常由數(shù)據(jù)工程師、服務(wù)器開發(fā)者以及數(shù)據(jù)科學(xué)家做的工作,通過減少編碼時間和數(shù)據(jù)轉(zhuǎn)換工作節(jié)省大量時間。
Panoply.io創(chuàng)建于2015年,位于以色列特拉維夫。
Periscope Data
CEO: Harry Glaser
Periscope Data的軟件連接多個數(shù)據(jù)庫,讓用戶可以對保存在多個系統(tǒng)中的數(shù)據(jù)運行SQL查詢,并且生成可以在整個公司分享的交互式儀表板和圖表。Periscope Database Cache是一種具有柱狀存儲的分布式架構(gòu),是Periscope系統(tǒng)中的關(guān)鍵技術(shù)。
Periscope Data創(chuàng)建于2012年,位于舊金山,在2016年11月的B輪融資中獲得2500萬美元。