我認(rèn)為大數(shù)據(jù)有兩個發(fā)展方向。一個是方向大家比較熟悉的“數(shù)據(jù)收集、分析”,借此了解客戶需求、明確產(chǎn)品方向等等。我還在人工智能、機器學(xué)習(xí)等領(lǐng)域做了一些研究,思考怎樣把這些先進的技術(shù)和數(shù)據(jù)技術(shù)綜合在一起,讓大數(shù)據(jù)不僅能幫人做決策,而且能夠真正自己做一些簡單決策,讓人有時間和精力去做更復(fù)雜的決定。
另外一個方向是“數(shù)據(jù)即服務(wù)”。亞馬遜的AWS云計算是“基礎(chǔ)設(shè)施即服務(wù)”,Salesforce是“軟件即服務(wù)”。Splunk是做大數(shù)據(jù)的管理平臺,我想如果能把這個平臺做得更進一步,也是一個很好的方向,把大數(shù)據(jù)變成“小數(shù)據(jù)”。
大數(shù)據(jù)概念有3v,數(shù)據(jù)量很大(volume)、數(shù)據(jù)速度很快(velocity)、數(shù)據(jù)種類多(variety)。小數(shù)據(jù)就是說,點點滴滴的數(shù)據(jù)都很重要,比如人的心跳,雖然數(shù)據(jù)不大,但對健康很重要。
大小數(shù)據(jù)的概念不重要,重要的是什么樣的數(shù)據(jù)給我們帶來最大的價值,怎么把這個價值體現(xiàn)出來。比如,本來房子是不會講話的,但屋里的人知道它的溫度是多少、氣流怎么流。在這些東西數(shù)字化之前,我們只能走進屋內(nèi)去親自感覺,但數(shù)字化可以幫我們把各項情況呈現(xiàn)出來。從這個角度講,數(shù)據(jù)的應(yīng)用讓我們看到了很多原來看不到的東西。
再舉個例子:一個客戶每天乘電梯時,會在哪個樓層停多長時間、進出多少次,這些數(shù)據(jù)放在我們的平臺分析之后,便可以預(yù)測電梯停留次數(shù)最多那層的客戶肯定會續(xù)約,而電梯停留最少的那一層不會續(xù)約。數(shù)據(jù)讓電梯“開口講話”,這是一種特別好的“新型語言”。
我們要關(guān)心小數(shù)據(jù),不是說只有建立一個大的數(shù)據(jù)中心,才能讓數(shù)據(jù)實現(xiàn)價值。其實,像電梯這樣的數(shù)據(jù)可能不是很多,但能“講”的故事非常有價值。我們生活的時代是個數(shù)據(jù)科學(xué)和物聯(lián)網(wǎng)的時代,數(shù)據(jù)是一個新的能源,怎么開發(fā)好數(shù)據(jù)是最重要的事情。