大數(shù)據(jù)分為廣義和狹義兩個概念。廣義的來講,所有的互聯(lián)網(wǎng)公司都有自己的數(shù)據(jù),因?yàn)樗鼈冇泻芏嘤脩?,以及用戶沉淀下來的?shù)據(jù)。它們也有自己的數(shù)據(jù)部門,大的互聯(lián)網(wǎng)公司會拿這些數(shù)據(jù)做一些變現(xiàn)。狹義的來講,其實(shí)大數(shù)據(jù)更多的定義是第三方的公司,它幫助在市場上有需求的客戶收集以及利用數(shù)據(jù)。
今天想著重講的是狹義層面上的數(shù)據(jù)概念,就是說我想為大家介紹一下國內(nèi)外大數(shù)據(jù)創(chuàng)業(yè)領(lǐng)域的標(biāo)桿性公司,以及它們發(fā)展的情況。
大數(shù)據(jù)在企業(yè)應(yīng)用中的構(gòu)成
大數(shù)據(jù)在企業(yè)應(yīng)用中分成五個大的部分。先有底層數(shù)據(jù)基礎(chǔ),才有分析層面的東西。
2014年全球大數(shù)據(jù)創(chuàng)業(yè)公司
1.Infrastructure
第一個大的模塊叫Infrastructure(基礎(chǔ)設(shè)施),也就是說我們平時用到的云計(jì)算、存儲設(shè)備以及數(shù)據(jù)庫等,這些都是基礎(chǔ)的東西。數(shù)據(jù)源的存儲和處理需要載體,通常是硬件或是虛擬化設(shè)備。
2.Datasources
第二個是數(shù)據(jù)源,這是大數(shù)據(jù)的基本原材料,我們必須要有數(shù)據(jù)才能夠提取數(shù)據(jù)中的價(jià)值。
3.Opensources
Opensources(開源方案)包含算法、數(shù)據(jù)轉(zhuǎn)化、結(jié)構(gòu)化處理等功能,相當(dāng)于一個中間件,它是連接了數(shù)據(jù)源和基礎(chǔ)架構(gòu),再把數(shù)據(jù)做結(jié)構(gòu)化的處理。
4.Analytics
最廣泛的應(yīng)用場景就是Analytics,就是分析類,比如大家經(jīng)常提起的的BI,我們企業(yè)內(nèi)部有各種各樣的數(shù)據(jù),怎么樣通過工具或者是軟件把這些數(shù)據(jù)呈現(xiàn)出來,在這個領(lǐng)域有各種各樣的細(xì)分。比如說有專門做非結(jié)構(gòu)數(shù)據(jù)處理的,有些專門做數(shù)據(jù)可視化的,還有一些可能是針對某些垂直領(lǐng)域的。
5.Applications
最后一類是應(yīng)用類,它們?nèi)趨R了大數(shù)據(jù)與各垂直細(xì)分領(lǐng)域業(yè)務(wù)邏輯,提升價(jià)值,比如金融業(yè)、房產(chǎn)業(yè)、醫(yī)療業(yè)、汽車業(yè)、等等。
根據(jù)這五大類,相繼有一些創(chuàng)業(yè)公司。我自己調(diào)研發(fā)現(xiàn)從2008年到2014年是大數(shù)據(jù)在美國創(chuàng)業(yè)的風(fēng)口。從2012年到2014年出現(xiàn)大數(shù)據(jù)行業(yè)突破性的變化。可以看到,每一個細(xì)分領(lǐng)域的公司有非常大的量級上的增加。
國外大數(shù)據(jù)退出案例
截止到2014年底,國外在大數(shù)據(jù)創(chuàng)業(yè)公司一共有358家,但是只有16家退出。分析層面退出的案例最多,數(shù)據(jù)源、基礎(chǔ)設(shè)施方面也有幾家。
1.Analytics
KARMASPHERE:是做數(shù)據(jù)處理的公司,它給企業(yè)提供了非?;鶎拥臄?shù)據(jù)分析工具,提供給數(shù)據(jù)科學(xué)家用的。也就是說,它的用戶是具備對數(shù)據(jù)有一定的理解和處理能力的人,它提供一個工具和接口,把一些企業(yè)里面非結(jié)構(gòu)化數(shù)據(jù)搜集過來,去做一些最基本的結(jié)構(gòu)化處理,數(shù)據(jù)科學(xué)家再通過自己擅長的各種模型,去利用這些數(shù)據(jù)。
Tableau:它做更加傻瓜的數(shù)據(jù)可視化。也就是說,它直接繞開數(shù)據(jù)科學(xué)家可以直接提供給相對小白一些的用戶,有些中型企業(yè)它們沒有數(shù)據(jù)科學(xué)家的職位,他們可以直接用Tableau,免去數(shù)據(jù)采集、處理、建模的繁瑣步驟,很簡單快速的部署到企業(yè)內(nèi)部,一目了然與自身業(yè)務(wù)、經(jīng)營息息相關(guān)的實(shí)時情況,比如說:用戶的購買率、轉(zhuǎn)化率等等。
Palantir:它雖然還沒有上市,它如今卻是與Airbnb并駕齊驅(qū)的百億獨(dú)角獸之一,它是發(fā)展最迅速并且融資規(guī)模最大的大數(shù)據(jù)公司,已經(jīng)融了9億美金。它的競爭優(yōu)勢在于提供了全產(chǎn)業(yè)、并且超定制化的數(shù)據(jù)服務(wù),它不僅僅有自己第三方的數(shù)據(jù)源,同時也具備數(shù)據(jù)分析、SaaS可視化的服務(wù)。所以它是非常有核心競爭力的公司,產(chǎn)品的厚度相應(yīng)是非常堅(jiān)實(shí)的。
BlueFin:它現(xiàn)在已經(jīng)被Tiwtter收購了,它在美國是做社交數(shù)據(jù)起家的。如果大家想收集某些有關(guān)品牌、事件、人物的情報(bào),其實(shí)最直接的數(shù)據(jù)源頭就是社交平臺,因?yàn)槿藗兣c社交媒體的交互是最為頻繁的 。所以BlueFin這家公司創(chuàng)業(yè)之初就采集了主流社交平臺的數(shù)據(jù),比如利用我們常說的爬蟲技術(shù),采集對于某一些特定關(guān)鍵詞的評論,再做分析。其實(shí)有點(diǎn)像輿情檢測跟輿情分析。這個在國外是非常普遍,在早些年前已經(jīng)被很多企業(yè)重視。因?yàn)閲庾灾髌放葡鄬Ρ容^多,他們很早就開始注重營銷這方面的東西。所以這個公司起步也比較早,最后退出的也比較快。
Splunk:還有一類就是IT運(yùn)維方面的分析,這個公司在國外最成功的案例就是Splunk,這個工具是提供給內(nèi)部IT部門運(yùn)維人員的,因?yàn)檫\(yùn)維人員每天要關(guān)注系統(tǒng)運(yùn)轉(zhuǎn)的穩(wěn)定性和安全性,他們要處理很多機(jī)讀語言的非結(jié)構(gòu)化數(shù)據(jù),這個可能跟公司管理或者是跟業(yè)務(wù)沒有太大關(guān)系,但是IT數(shù)據(jù)非常重要。主要的原因是,如果IT系統(tǒng)一旦崩盤可能會影響到網(wǎng)站的運(yùn)營,對于大型企業(yè)來講,可能就是損失掉了一筆巨額的收入。
2.Applications
Rocketfuel:在應(yīng)用層面,國外在2015年新增了幾家新的退出案例,我還沒有完整的總結(jié)。2014年,只有一家叫Rocketfuel,這家有點(diǎn)像國內(nèi)的秒針,它是針對做廣告優(yōu)化精準(zhǔn)營銷的。因?yàn)榇髷?shù)據(jù)在應(yīng)用場景層面,其實(shí)最頻繁被用到的還是智能營銷,因?yàn)闋I銷是最簡單粗暴的訴求:離錢最近的,打廣告,直接找到精準(zhǔn)的客戶,直接給客戶帶來收入。這塊國內(nèi)跟國外是一樣的情況。
3.Datasources
BlueKai:剩下的幾個基礎(chǔ)方面的數(shù)據(jù)源,以及開源數(shù)據(jù),基礎(chǔ)設(shè)施,它不算是非常熱門的創(chuàng)業(yè)領(lǐng)域。所以相繼在國外退出的案例也沒有那么多,尤其是數(shù)據(jù)源這塊,國外有一家叫BlueKai,它也是偏向于營銷,主要是給企業(yè)的營銷部門提供第三方數(shù)據(jù)源,有點(diǎn)像數(shù)據(jù)集市。
4.Infrastructure
ParAccel:在基礎(chǔ)設(shè)施方面還有一家ParAccel是標(biāo)桿性的公司,它是做數(shù)據(jù)處理的,把非結(jié)構(gòu)化的數(shù)據(jù)轉(zhuǎn)化成結(jié)構(gòu)化的。很多企業(yè)不做精細(xì)化運(yùn)營,但起碼數(shù)據(jù)存儲還是要有的。
新銳大數(shù)據(jù)創(chuàng)業(yè)公司
剛才提到的都是一些退出的公司,這一頁上是我自己篩選出來的,我覺得這兩年在美國創(chuàng)業(yè)市場比較新銳的公司。
Taboola:也是做精準(zhǔn)營銷和營銷優(yōu)化,但是它不太一樣的是它集成了更多人工智能方面的東西。
Localytics:它跟傳統(tǒng)的數(shù)據(jù)分析不太一樣,比如Tableau做的主要是大型或者是中大型的客戶,中大型客戶有比較現(xiàn)成的數(shù)據(jù)庫,比較現(xiàn)成的結(jié)構(gòu)化的東西。但是Localytics更輕,主要針對很多SME,就是中小型的公司,包括創(chuàng)業(yè)公司,它自己有靈活的數(shù)據(jù)庫功能,一個新的創(chuàng)業(yè)公司即使沒有搭建數(shù)據(jù)庫,也可以很快的部署,在應(yīng)用上可以看到用戶的情況和行為表現(xiàn)。
MixPanel:跟Localytics比較類似,都是比較新銳的創(chuàng)業(yè)公司。
APP Annie:大家比較熟悉了,用于分析應(yīng)用中的用戶行為數(shù)據(jù)。
Data Hero:今年已經(jīng)成功退出了,這也是一家成長非常快的公司。
EvreString:是華人自己做的公司,是真格投的,它利用了數(shù)據(jù),幫助企業(yè)找到核心潛在客戶,算是一個銷售線索公司。但是他們非常厲害的是,他們能夠把很多數(shù)據(jù)孤島串聯(lián)起來,幫企業(yè)找到最精準(zhǔn)的用戶群體。
大數(shù)據(jù)創(chuàng)業(yè)增速緩慢
國外截止到2014年底有358家大數(shù)據(jù)方面的創(chuàng)業(yè)公司,退出的只有16家,包括并購和上市,而且并購占到了80%,上市只有20%。從比例上來看,4.5%的退出率對于一個創(chuàng)業(yè)方向來講其實(shí)是很低的,而且從速度上來看,也是相應(yīng)的比較緩慢的。
究其原因,我覺得不管是在國外或者是在國內(nèi),大數(shù)據(jù)應(yīng)用場景的不成熟,以及有能力使用大數(shù)據(jù)的人才(數(shù)據(jù)科學(xué)家)匱乏,始終是阻礙大數(shù)據(jù)發(fā)展的原因。
從現(xiàn)有統(tǒng)計(jì)看,分析工具其實(shí)是占比最高的,不管是在融資情況或者是退出方面。第二名是基礎(chǔ)設(shè)施,我剛才說了,因?yàn)樗泄径加写鎯?shù)據(jù)的需求。然后是垂直細(xì)分領(lǐng)域,排名最后的數(shù)據(jù)源,像開源數(shù)據(jù)其實(shí)是最難變現(xiàn)的。所以到現(xiàn)在都沒有很好的退出。
大數(shù)據(jù)創(chuàng)業(yè)熱門領(lǐng)域
最熱門的三大領(lǐng)域:數(shù)據(jù)分析、應(yīng)用和基礎(chǔ)設(shè)施。從2008年到2012年,數(shù)據(jù)分析工具越來越多,不管是融資金額,還是案例數(shù)上?;A(chǔ)設(shè)施機(jī)會越來越少,因?yàn)檫@塊肯定是先有一個培育的土壤,才能有后面分析的東西,所以這塊的創(chuàng)業(yè)機(jī)會越來越少。
在應(yīng)用場景這塊,可以看到中間多出來很多,后面也變少了。我們來看不管是投資人或者是創(chuàng)業(yè)公司,可能在2009年到2010年都是想象的階段,不知道這方面到底能不能好,很多人都一窩蜂的擠進(jìn)來。后面理智一點(diǎn)的發(fā)現(xiàn),應(yīng)用場景快速做起來的并不是太多,所以也就相對理性了。
大數(shù)據(jù)在垂直領(lǐng)域的應(yīng)用案例
在垂直領(lǐng)域,大數(shù)據(jù)在美國已經(jīng)有的成功案例,包括市場營銷、能源、石油、金融,企業(yè)服務(wù)里面最常用到的人力資源HR。因?yàn)楝F(xiàn)在有很多簡歷需要通過智能分析去做大數(shù)據(jù)的關(guān)聯(lián)。還有就是零售,因?yàn)榱闶坌袠I(yè)是產(chǎn)能非常高的行業(yè),所以大數(shù)據(jù)對它們來說價(jià)值非常大。還有就是供應(yīng)鏈管理、醫(yī)療、健康以及房產(chǎn)。
國內(nèi)大數(shù)據(jù)創(chuàng)業(yè)公司
1.基礎(chǔ)設(shè)施
基礎(chǔ)設(shè)施領(lǐng)域,國內(nèi)有一家新銳創(chuàng)業(yè)公司叫博睿數(shù)據(jù),他們是做數(shù)據(jù)庫的。我個人認(rèn)為,在基礎(chǔ)設(shè)施領(lǐng)域,尤其是數(shù)據(jù)庫方向,在國內(nèi)的創(chuàng)業(yè)機(jī)會很少。因?yàn)檫@個東西不太需要再引入中文版或者是中國獨(dú)特的東西。因?yàn)橛脟猬F(xiàn)成的工具就可以解決問題了。而且現(xiàn)在有很多開源,也是免費(fèi)的,這塊在中國的創(chuàng)業(yè)機(jī)會不是太多。但是也有一些新興的方向,比如說做數(shù)據(jù)壓縮、數(shù)據(jù)檢索等,這種相對比較細(xì)分,也比較新興的領(lǐng)域,這些方向可能還有機(jī)會。
2.數(shù)據(jù)源
我自己認(rèn)為數(shù)據(jù)源方面創(chuàng)業(yè)公司確實(shí)沒有什么機(jī)會了,首先數(shù)據(jù)方面創(chuàng)業(yè)公司都做的比較大了,比如說數(shù)據(jù)堂是做數(shù)據(jù)集市的,這些公司都已經(jīng)到B輪了。最大的像數(shù)據(jù)魔方,阿里媽媽等,是阿里旗下的產(chǎn)品,巨頭在這個領(lǐng)域會有優(yōu)勢很多。
3.分析類
分析類目前還處在起步的階段,目前我看到可視化的機(jī)會,阿里前幾天剛剛推出了叫數(shù)說,它們是做可視化的,以后會提供給各種各樣的客戶,包括政府或者是中小型公司,以及大型的民營企業(yè)??梢钥吹?,只要你對你的分析方面有需求,只要數(shù)據(jù)源導(dǎo)進(jìn)來,他便可以自動的做歸類和分析,并且智能化的形象展現(xiàn)。這個領(lǐng)域的創(chuàng)業(yè)公司有星圖和海云,我把數(shù)據(jù)庫導(dǎo)進(jìn)來可以看很多公司的動態(tài)。
剛才我們講的大而全的分析平臺,既具備數(shù)據(jù)處理能力,又具備可視化,現(xiàn)在行業(yè)里面非常標(biāo)桿的叫永洪數(shù)據(jù)。我覺得永洪非常強(qiáng)大,因?yàn)樗鼈兏鷩獾腡ableau直接對標(biāo),是我目前看到的做數(shù)據(jù)處理、可視化分析,并且跟客戶的業(yè)務(wù)邏輯緊密結(jié)合非常成功的公司。
后面除了分析平臺之外,精準(zhǔn)到用戶分析又有兩家公司已經(jīng)做的比較大,就是TalkingData和友盟,我們覺得做用戶層面數(shù)據(jù)分析創(chuàng)業(yè)公司機(jī)會不多了,友盟被阿里收購了,所以空間并不是特別多。
下面這一類,這是我特別關(guān)注的,我覺得在國內(nèi)數(shù)據(jù)類創(chuàng)業(yè)公司里面最有機(jī)會,就是有點(diǎn)對標(biāo)國外大數(shù)據(jù)創(chuàng)業(yè)公司,像神策網(wǎng)絡(luò)、GrowingIO、達(dá)觀數(shù)據(jù),你有數(shù)據(jù)庫可以非常靈活,你沒有數(shù)據(jù)庫我可以幫你引入一些外部的。在收費(fèi)模式上也是SaaS的模式,比較輕。但是也存在一個短板,可能它們的目標(biāo)群體,也就是中小型客戶的付費(fèi)意愿沒那么強(qiáng),客單價(jià)低。
還有像百分點(diǎn),它是做智能算法、廣告優(yōu)化的。像應(yīng)用類下的智能營銷,我自己覺得在國內(nèi)機(jī)會不多,做廣告優(yōu)化,除非你是從PC領(lǐng)域轉(zhuǎn)到移動領(lǐng)域,不然的話機(jī)會真的不多。因?yàn)楝F(xiàn)在這幾家公司都是C輪以后或者是快上市,或者是并購的結(jié)構(gòu)了。
后面還有一類我也特別關(guān)注,IT這塊像日志IT運(yùn)維分析,因?yàn)槲易约簩T方面非常感興趣,國內(nèi)比較成功的幾家Hansight、日志易、OneAPM,還有陸續(xù)針對特定類型客戶的公司,比如我正在做的一個項(xiàng)目,針對大銀行、運(yùn)營商機(jī)構(gòu)的Protoco Soft。
4.應(yīng)用類
最后一類應(yīng)用類垂直到不同細(xì)分領(lǐng)域,我覺得都有機(jī)會。尤其有機(jī)會的是市場營銷和銷售線索領(lǐng)域,因?yàn)檫@個離錢近,可以直接給企業(yè)帶來好處和利益的,我覺得這塊是最有機(jī)會。再精準(zhǔn)到細(xì)分里面,數(shù)據(jù)應(yīng)用場景最成熟的可能是電商營銷或者是社交數(shù)據(jù),或者是社交CRM,這些方面都有很多機(jī)會。還有就是安全、醫(yī)藥、金融都會有機(jī)會。雖然垂直應(yīng)用層面可能有機(jī)會,但是如果已經(jīng)有人做建議慎入,本來這個市場相對比較小,進(jìn)入之前也必須看看競爭對手已經(jīng)做到了什么程度了。
總結(jié):
追溯國外的大數(shù)據(jù)市場行情,發(fā)展還是相對緩慢的,并且這個情況也可能會發(fā)生在中國。 無論是在國外或者是在國內(nèi),大數(shù)據(jù)應(yīng)用場景的不成熟,以及有能力使用大數(shù)據(jù)的人才(數(shù)據(jù)科學(xué)家)匱乏,始終是阻礙大數(shù)據(jù)發(fā)展的原因。但是,大數(shù)據(jù)為人類提供的價(jià)值不可估量,一旦爆發(fā)會是指數(shù)性的增長。技術(shù)驅(qū)動型的創(chuàng)業(yè)也將是下一個風(fēng)口,我們還是要對這個領(lǐng)域持續(xù)保持關(guān)注,并且鼓勵專業(yè)人才投入到建設(shè)大數(shù)據(jù)創(chuàng)投生態(tài)中來。