大數(shù)據(jù)技術(shù)市場正處于這樣一個階段:Garnter認為是從IT主導(dǎo)的、報告系統(tǒng)轉(zhuǎn)向業(yè)務(wù)主導(dǎo)、自助式服務(wù)分析的最后階段。其結(jié)果是出現(xiàn)了很多新業(yè)務(wù)智能和分析平臺可以滿足企業(yè)機構(gòu)對可訪問性、敏捷性和更深入的分析洞察力的要求。
現(xiàn)在有很多初創(chuàng)公司提供這種下一代系統(tǒng),他們開發(fā)新技術(shù)用于收集、管理和分析大數(shù)據(jù),不管這些數(shù)據(jù)是結(jié)構(gòu)化的還是非結(jié)構(gòu)化的、動態(tài)的還是靜態(tài)的、本地的還是在云中的。
下面就是2016年引起我們注意的10個很酷的大數(shù)據(jù)初創(chuàng)公司。
Anodot
CEO: David Drai
Anodot在2015年11月走出隱身模式,推出了實時異常檢測和操作智能技術(shù)——擁有機器學(xué)習(xí)專利算法的軟件,可以自動進行業(yè)務(wù)分析、查明性能問題并尋找商業(yè)機會。Anodot的目標(biāo)是從大量數(shù)據(jù)中查找異常值,并將這些結(jié)果轉(zhuǎn)化為有價值的業(yè)務(wù)洞察。
Anodot的技術(shù)旨在用于電子商務(wù)網(wǎng)站、數(shù)字廣告系統(tǒng)和物聯(lián)網(wǎng)網(wǎng)絡(luò),以提高運營效率,最大限度增加收入。
Anodot位于以色列的Ra'Anana,以及加州的桑尼維爾,在9月的B輪融資中獲得了800萬美元。
Confluent
CEO: Jay Kreps
在大數(shù)據(jù)管理和分析中,處理實時的流式數(shù)據(jù)是最大的挑戰(zhàn)之一。解決這個問題的其中一項技術(shù)就是開源的Apache Kafka通訊代理項目,提供了高吞吐、低延遲的軟件,用于處理實時數(shù)據(jù)。
Confluent是由Apache Kafka創(chuàng)始開發(fā)者創(chuàng)建的,提供了一個圍繞Kafka的完整實時數(shù)據(jù)平臺,可作為一個容錯的、高度可擴展的通訊系統(tǒng)。該軟件可用于手機來自用戶活動日志、股票行情系統(tǒng)、設(shè)備儀表的數(shù)據(jù),以及其他廣泛用例中的數(shù)據(jù)。
今年5月,這家位于加州帕洛阿爾托的公司宣布提供Confluent Platform 3.0,通過融合Kafka Streams把流處理能力添加到應(yīng)用中,還有在企業(yè)機構(gòu)上下操作Kafka的Confluent Control Center。
Koverse
CEO: Jon Matsuo
Koverse開發(fā)了一款“盒中數(shù)據(jù)湖”的平臺,并稱它可以收集大數(shù)據(jù)并更快速地運用于生產(chǎn)中,其成本要低于現(xiàn)有的技術(shù)和方法。
這家位于西雅圖的公司創(chuàng)建于2012年,最早的1.0版本是在兩年前首次公布的。Koverse Platform 2.0是在6月發(fā)布的,將Apache Accumulo“分布式鍵值庫”技術(shù)和該公司自己的Universal Indexing Engine結(jié)合到一起。
聯(lián)合創(chuàng)始人Paul Brown(首席產(chǎn)品官)和Aaron Cordova(首席技術(shù)官)曾經(jīng)是美國國家安全局的數(shù)據(jù)科學(xué)家,在那里他們幫助開發(fā)了最早的Accumulo項目,重新架構(gòu)了國家安全局的數(shù)據(jù)基礎(chǔ)架構(gòu),以更好地處理意外的數(shù)據(jù)分析情況。
Maana
CEO: Babur Ozden
Maana開發(fā)了Maana Knowledge Platform,這個數(shù)據(jù)搜索和發(fā)現(xiàn)軟件是從大量系統(tǒng)或者“孤島”中收集數(shù)據(jù),并將其轉(zhuǎn)變?yōu)榭梢员粯I(yè)務(wù)線應(yīng)用采用的業(yè)務(wù)洞察。該系統(tǒng)是構(gòu)建在Apache Spark處理引擎的。
Maana位于加州帕洛阿爾托,創(chuàng)建于2012年,在2015年5月正式發(fā)布,定位是收集和分析由物聯(lián)網(wǎng)網(wǎng)絡(luò)生成的大量數(shù)據(jù)。9月該公司首次公布了其產(chǎn)品的Winter '17版本,Knowledge Applications用于優(yōu)化像供應(yīng)鏈和呼叫中心管理這樣的業(yè)務(wù)流程,Knowledge Assistants用于創(chuàng)建新的分析模型。
Maana在2016年5月進行的B輪融資中獲得2600萬美元,氣走好難過大部分來自該公司的石油和天然氣及行業(yè)客戶,包括殼牌、雪佛龍、沙特阿美、英特爾和通用電氣等公司。
Pachyderm
CEO: Joe Doliner
掌握著當(dāng)前一代大數(shù)據(jù)技術(shù)的初創(chuàng)公司Pachyderm,已經(jīng)開發(fā)出了一種開源分析引擎,采用Docker容器做分布式計算。
這里的重點是提供了一個容器化、模塊化、可擴展的數(shù)據(jù)分析基礎(chǔ)設(shè)施,采用像Docker和Kubernetes這樣的工具作為構(gòu)建塊。該公司的Pachyderm File System和Pachyderm Pipeline System軟件幫助數(shù)據(jù)經(jīng)理和分析師構(gòu)建機器學(xué)習(xí)通道和數(shù)據(jù)ETL(提取、轉(zhuǎn)換和加載)工作流程。
Pachyderm創(chuàng)建于2014年,位于舊金山,在今年6月的種子輪融資中獲得了200萬美元。
StreamSets
CEO: Girish Pancha
StreamSets是另外一家解決管理動態(tài)數(shù)據(jù)挑戰(zhàn)的公司。更具體地說,StreamSets開發(fā)的軟件防止“數(shù)據(jù)漂移”的潛在問題——數(shù)據(jù)在源頭的時候可能會遇到這種不可預(yù)測的突變情況,并在應(yīng)用使用這些數(shù)據(jù)的時候出現(xiàn)問題。
StreamSets的StreamSets Data Collector軟件被用于在任何數(shù)據(jù)源和任何應(yīng)用之間構(gòu)建復(fù)雜的數(shù)據(jù)流。9月,StreamSets首次推出了StreamSets Dataflow Performance Manager用于管理數(shù)據(jù)流操作。
StreamSets位于舊金山,創(chuàng)建于2014年,創(chuàng)始人包括CEO Girish Pancha、前Informatica首席產(chǎn)品官、現(xiàn)首席技術(shù)官Arvind Prabhaker,以及前Cloudera的早期員工、工程負責(zé)人。
Striim
President and CEO: Ali Kutay
Striim創(chuàng)建于2012年,創(chuàng)始人包括來自Golden Gate Software、Oracle、Informatica、WebLogic以及其他知名數(shù)據(jù)管理公司的前高管。
Striim公司位于加州帕洛阿爾托,它的軟件將流數(shù)據(jù)集成與流操作智能結(jié)合到一個系統(tǒng)內(nèi),實現(xiàn)持續(xù)的查詢/處理和流式分析。11月,Striimfault了新版本軟件,可以配合Google Big Query、Kafka和MapR Technologies使用。
Striim在3月獲得了1000萬美元的額外資金,使其B輪融資的總金額得到了3000萬美元。
Stytch
CEO: Mark Cunningham
Stytch在4月首次推出了自己端到端的數(shù)據(jù)分析平臺,提供系統(tǒng)工具用于自助服務(wù)式的數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)建模、數(shù)據(jù)發(fā)現(xiàn)、報告和儀表板。Stytch得到了Dun & Bradstreet的支持,Stytch系統(tǒng)的主要賣點是它連接到了Dun & Bradstreet龐大業(yè)務(wù)數(shù)據(jù)庫。
這家位于溫哥華的公司創(chuàng)建與2015年8月。創(chuàng)始人、首席執(zhí)行官Mark Cunningham從1992年就涉足商業(yè)智能領(lǐng)域,當(dāng)時他的家族企業(yè)開始開發(fā)Crystal Reports,一款早期的、非常成功的Windows報告工具。
Talena
CEO: Nitin Donde
Talena提供了“永遠在線”的大數(shù)據(jù)管理軟件,幫助企業(yè)保護有價值的數(shù)據(jù)資產(chǎn),并基于關(guān)鍵業(yè)務(wù)應(yīng)用快速迭代。Talena的技術(shù)提供了備份和恢復(fù)、測試和開發(fā)管理、以及跨Hadoop、NoSQL數(shù)據(jù)庫(例如Cassandra和Couchbase)以及現(xiàn)代數(shù)據(jù)倉庫(例如HPE Vertica)的歸檔能力。
今年3月Talena發(fā)布了針對大數(shù)據(jù)管理任務(wù)的ActiveRx預(yù)測分析基礎(chǔ)設(shè)施。該軟件解決了如何將機器學(xué)習(xí)用于預(yù)測數(shù)據(jù)可用性、如何將備份數(shù)據(jù)轉(zhuǎn)變?yōu)閯討B(tài)數(shù)據(jù)資產(chǎn)的問題。
Waterline Data
CEO: Alex Gorelik
隨著企業(yè)機構(gòu)將基于Hadoop的數(shù)據(jù)湖聚合起來用于存儲海量數(shù)據(jù),找到如何以最佳方式利用這些信息就變成一個重大挑戰(zhàn)——更不用說隨之而來令人頭疼的數(shù)據(jù)治理問題了。
Waterline Data解決了Smart Data Catalog軟件的問題,構(gòu)建了一個完成的數(shù)據(jù)湖資產(chǎn)庫,改善了數(shù)據(jù)發(fā)現(xiàn)和數(shù)據(jù)監(jiān)管,讓企業(yè)更容易從這些資產(chǎn)中獲取價值。
Waterline Data創(chuàng)建于2013年,位于加州山景城,在1月的B輪融資中獲得1600萬美元。