吳甘沙:大數(shù)據(jù)處于期望破滅期 但并不是壞事

責(zé)任編輯:editor007

2015-11-19 17:32:44

摘自:財(cái)經(jīng)網(wǎng)

吳甘沙表示,通過開放數(shù)據(jù),數(shù)據(jù)市場(chǎng),開放的基礎(chǔ)設(shè)施,開放的社會(huì)化的分析,再加上無數(shù)創(chuàng)意人士跨界碰撞,就能構(gòu)建數(shù)據(jù)生態(tài)。

吳甘沙表示,通過開放數(shù)據(jù),數(shù)據(jù)市場(chǎng),開放的基礎(chǔ)設(shè)施,開放的社會(huì)化的分析,再加上無數(shù)創(chuàng)意人士跨界碰撞,就能構(gòu)建數(shù)據(jù)生態(tài)。

WLY_9931

  英特爾中國研究院院長吳甘沙

財(cái)經(jīng)網(wǎng)訊 “大數(shù)據(jù)過去幾年經(jīng)歷了過熱期,現(xiàn)在是在期望的破滅期,但期望破滅期不是壞事情,它會(huì)讓市場(chǎng)幫助對(duì)這個(gè)生態(tài)環(huán)境做一次清洗,讓真正的強(qiáng)者真正起來。”11月18日,英特爾中國研究院院長吳甘沙在“《財(cái)經(jīng)》年會(huì)2016:預(yù)測(cè)與戰(zhàn)略”上如此表示。

吳甘沙指出,真正的強(qiáng)者是能夠利用數(shù)據(jù)生態(tài)進(jìn)行創(chuàng)新的人。而關(guān)于數(shù)據(jù)生態(tài),他認(rèn)為主要包括三個(gè)方面:數(shù)據(jù)源、數(shù)據(jù)創(chuàng)意者以及數(shù)據(jù)分析處理的基礎(chǔ)技術(shù)和設(shè)施。

具體來講,首先,數(shù)據(jù)源分為兩個(gè)來源,一是開放數(shù)據(jù),二是數(shù)據(jù)市場(chǎng)。開放數(shù)據(jù)來源于政府、科研機(jī)構(gòu)以及企業(yè);數(shù)據(jù)市場(chǎng)則是那些不愿開放數(shù)據(jù)的企業(yè),不開放的原因是出于安全和變現(xiàn)的考慮。

其次,數(shù)據(jù)創(chuàng)意則是指運(yùn)用跨界思維創(chuàng)造性地挖掘和運(yùn)用大數(shù)據(jù)。例如運(yùn)用大數(shù)據(jù)預(yù)測(cè)機(jī)票的價(jià)格同時(shí)提供價(jià)格保險(xiǎn)服務(wù)。

第三,數(shù)據(jù)分析處理的基礎(chǔ)技術(shù)和設(shè)施則包含開放的基礎(chǔ)設(shè)施和開放的數(shù)據(jù)分析兩個(gè)方面。開放的基礎(chǔ)設(shè)施主要指云計(jì)算,而開放的數(shù)據(jù)分析則是指社會(huì)化的數(shù)據(jù)分析平臺(tái),比如美國的Kaggle。這些社會(huì)化平臺(tái)上的普通開發(fā)者開發(fā)出來的算法有時(shí)甚至比專業(yè)機(jī)構(gòu)強(qiáng)很多。

吳甘沙最后表示,通過開放數(shù)據(jù),數(shù)據(jù)市場(chǎng),開放的基礎(chǔ)設(shè)施,開放的社會(huì)化的分析,再加上無數(shù)創(chuàng)意人士跨界碰撞,就能構(gòu)建數(shù)據(jù)生態(tài)。

以下為吳甘沙發(fā)言實(shí)錄:

吳甘沙:今天的主題是概念到現(xiàn)實(shí),中國的大數(shù)據(jù)元年就是在2012年,過去3年里面確實(shí)有一些人跑馬圈地,有一些人是創(chuàng)造概念,有一些人是高舉高打?,F(xiàn)在確實(shí)應(yīng)該要沉淀下來談?wù)劕F(xiàn)實(shí)的時(shí)候,其實(shí)大家熟悉Gartner技術(shù)成熟度曲線,又叫做炒作周期的曲線。大數(shù)據(jù)過去幾年經(jīng)歷了過熱期,現(xiàn)在是在希望的破滅期,大數(shù)據(jù)是不是過氣了?現(xiàn)在有新概念出來,人工智能,中國制造2025。這樣一個(gè)期望破滅期不是壞事情,是會(huì)讓市場(chǎng)幫助對(duì)這個(gè)生態(tài)環(huán)境做一次清洗,讓真正的強(qiáng)者真正起來。真正的強(qiáng)者是真正能夠利用數(shù)據(jù)生態(tài)進(jìn)行創(chuàng)新的強(qiáng)者。

今天可以講一講數(shù)據(jù)生態(tài),特別是數(shù)據(jù)生態(tài)這樣一種開放式的創(chuàng)新。數(shù)據(jù)生態(tài)一般包括三個(gè)方面。第一,數(shù)據(jù)源提供數(shù)據(jù);第二,數(shù)據(jù)創(chuàng)意者,以天外飛仙式,從數(shù)據(jù)當(dāng)中提取價(jià)值出來,數(shù)據(jù)創(chuàng)意者又依賴于第三個(gè)方面,也就是大數(shù)據(jù)的處理和分析的基礎(chǔ)技術(shù)和設(shè)施。大數(shù)據(jù)的開放式創(chuàng)新在生態(tài)這一塊兒是圍繞這三個(gè)方面。

首先說一下數(shù)據(jù)源。有兩個(gè)數(shù)據(jù)源。第一個(gè)開放數(shù)據(jù),第二,數(shù)據(jù)市場(chǎng)。開放數(shù)據(jù)又來自兩個(gè)方面。第一,來自于政府,以及是一些科研機(jī)構(gòu),這些數(shù)據(jù)是在納稅人的支持下收集存儲(chǔ)下來的這些數(shù)據(jù)。又不涉及到國家的機(jī)密。原則上面來說是開放出來,作為一種公共的數(shù)據(jù)資源。另外一個(gè)方面開放數(shù)據(jù)就是來自于企業(yè),這些企業(yè)希望能夠圍繞著它們的數(shù)據(jù)建立一個(gè)生態(tài)系統(tǒng)。數(shù)據(jù)開放面臨很多的問題,有數(shù)據(jù)傳輸?shù)膯栴},有數(shù)據(jù)敏感度的界定問題。還有數(shù)據(jù)脫敏的問題。在技術(shù),在法律,在商業(yè)模式,在行業(yè)自律等等方面的推動(dòng)下開放數(shù)據(jù)一定是我們大數(shù)據(jù)開放式創(chuàng)新最早的一步。在美國開放數(shù)據(jù)已經(jīng)是經(jīng)歷了很多年了,確實(shí)在開放數(shù)據(jù)上面產(chǎn)生了很多很多好的數(shù)據(jù)創(chuàng)意。我經(jīng)常在講一家公司,叫做氣侯公司。

氣侯公司在被孟山都收購以前,是10億美金,憑什么?憑著開放數(shù)據(jù)和數(shù)據(jù)思維。所依賴的開放數(shù)據(jù)就是氣象數(shù)據(jù),衛(wèi)星遙感數(shù)據(jù),美國60年的農(nóng)作物產(chǎn)量數(shù)據(jù),還有1500億土壤數(shù)據(jù),土壤的觀察數(shù)據(jù)。拿著這些數(shù)據(jù)做分析,一個(gè)可以分析出來種什么樣子的農(nóng)作物好。第二,可以對(duì)每一塊2.5英里土地進(jìn)行建模,可以預(yù)測(cè)災(zāi)害性天氣。他把氣候?qū)W、金融、保險(xiǎn)、融合在一起,基礎(chǔ)就是開放數(shù)據(jù)。開放數(shù)據(jù)就是創(chuàng)建一個(gè)開放式創(chuàng)新生態(tài)系統(tǒng)的第一步。

當(dāng)然,開放數(shù)據(jù)還不夠,還有第二個(gè)數(shù)據(jù)源:數(shù)據(jù)市場(chǎng)。現(xiàn)在大多數(shù)數(shù)據(jù)都是在企業(yè)里面。他不愿意把數(shù)據(jù)拿出來,有兩個(gè)原因。第一,對(duì)于數(shù)據(jù)安全的考量。第二,拿出來了不知道怎么來賺錢,真正來變現(xiàn)。這樣一個(gè)數(shù)據(jù)市場(chǎng)就是考慮這兩個(gè)方面,幫助大家把數(shù)據(jù)從孤島里面拿出來。現(xiàn)在有很多市場(chǎng),有的是下載數(shù)據(jù),有的原始數(shù)據(jù),有的是加工信息,有的可能是通用的綜合的數(shù)據(jù)市場(chǎng),有的是提供專業(yè)領(lǐng)域的數(shù)據(jù)服務(wù)。我覺得下面的發(fā)展可能是會(huì)改變現(xiàn)在這種數(shù)據(jù)交易的簡(jiǎn)單的模式。這個(gè)過與簡(jiǎn)單交易者是數(shù)據(jù)提供者,又是數(shù)據(jù)的請(qǐng)求者,不是一次簡(jiǎn)單的交和得,是把數(shù)據(jù)融合產(chǎn)生新的價(jià)值。一個(gè)就是數(shù)據(jù)安全需要保障。第二,數(shù)據(jù)市場(chǎng)跟云計(jì)算就可以了,沒有使用就沒有交易,因?yàn)槭菙?shù)據(jù)的價(jià)值,在沒有使用之前是沒有辦法去判斷。他的數(shù)據(jù)是在使用以后確定那個(gè)價(jià)值,數(shù)據(jù)定價(jià)跟數(shù)據(jù)市場(chǎng)跟云計(jì)算是會(huì)結(jié)合起來。這一塊未來是一塊非常大的市場(chǎng)。這個(gè)市場(chǎng)部可以簡(jiǎn)單地想象成股票市場(chǎng)那么簡(jiǎn)單的交易,要想象成為跟使用跟價(jià)值提取合一一個(gè)數(shù)據(jù)交易。

第三,又有兩個(gè)方面,開放基礎(chǔ)設(shè)施,還有就是開放的社會(huì)化分析。在美國看大數(shù)據(jù)的創(chuàng)業(yè)公司,很多公司都是特別小,就是幾個(gè)人都是PhD,他們主要是有一個(gè)數(shù)據(jù)的思維,有一個(gè)創(chuàng)意。又從開放數(shù)據(jù)拿到一些數(shù)據(jù),但是不用去解決大數(shù)據(jù)的基礎(chǔ)設(shè)施的問題。就是幾個(gè)人不會(huì)去搭那個(gè)。他們都是通過云計(jì)算來獲得這樣的基礎(chǔ)設(shè)施。所以,大數(shù)據(jù)跟云計(jì)算一定是不可以分開,未來大數(shù)據(jù)一定是生在云里面,長在云里面,產(chǎn)生價(jià)值也是在云里面。剛剛老師講到了癌癥,關(guān)于癌癥再講一下。我也特別關(guān)心癌癥,因?yàn)橐话氲哪行詴?huì)有概率患癌癥,三分之一的女性患癌癥。過去50年,治愈率提升只有7%到8%的樣子,我也是特別關(guān)心。我有一個(gè)同事,他是患腎癌23年,一直沒有辦法解決。換了腎沒有辦法解決,就是希望通過基因組學(xué)等等分析去解決,它花了三個(gè)月的時(shí)間做基因的測(cè)序,以及發(fā)現(xiàn)那個(gè)治病的基因。這些數(shù)據(jù)的產(chǎn)生就是這么多的數(shù)據(jù)。他就把它存在硬盤里面,一路顛簸,讓不同的醫(yī)生對(duì)他進(jìn)行診斷,最后形成一個(gè)個(gè)性化的治療方案。所以,這個(gè)又花了4個(gè)月。所以,他等了7個(gè)月解決了這個(gè)病癥的問題。

這個(gè)里面的問題一個(gè)是數(shù)據(jù)運(yùn)來運(yùn)去,這個(gè)可以通過云計(jì)算獲得。另外就是計(jì)算。癌癥這種基因組學(xué)的分析是典型的高性能計(jì)算,又是大數(shù)據(jù)分析,不是所有人都是有這樣的基礎(chǔ)設(shè)施。所以,他通過這樣一種開放的基礎(chǔ)設(shè)施解決了分析的問題。我們現(xiàn)在有一個(gè)愿景2020年我們一個(gè)人來到這樣一個(gè)研究所,一天之內(nèi)能夠?qū)λ幕蜃鋈康臏y(cè)序,發(fā)現(xiàn)治病基因,并且開發(fā)出個(gè)性化的治療方案。所以,這個(gè)就是大數(shù)據(jù)開放的基礎(chǔ)設(shè)施。還有就是開放社會(huì)化分析,現(xiàn)在數(shù)據(jù)科學(xué)家是21世紀(jì)最性感的職業(yè)。這些數(shù)據(jù)科學(xué)家的技能勞動(dòng)和時(shí)間也是一種資源,可以通過共享經(jīng)濟(jì)獲得。

舉幾個(gè)例子。美國有一個(gè)Kaggle平臺(tái),有一家基金公司,是做教育的,他有一些數(shù)據(jù)。學(xué)生寫了很多的文章,希望有一個(gè)算法,能夠?qū)@些文章能夠做自動(dòng)地評(píng)分,未來MOOC這樣平臺(tái)是需要自動(dòng)化平臺(tái)技術(shù)。所以,找了10幾家專業(yè)教育機(jī)構(gòu)做這個(gè)評(píng)分。做完以后不是很滿意,他就到Kaggle社會(huì)化平臺(tái)上面尋找?guī)椭?。結(jié)果出人意料,這些社會(huì)化普通開發(fā)出來的算法比專業(yè)機(jī)構(gòu)強(qiáng)很多,前三名,一個(gè)是美國的本科生,是學(xué)機(jī)械工程;第二名斯洛文尼亞學(xué)生;第三,新加坡一個(gè)中年大叔,是搞保險(xiǎn)精算的。第一名第三名剛剛在MOOC上學(xué)完數(shù)據(jù)分析進(jìn)行的學(xué)習(xí)。所以,高手在民間,如果有這樣的社會(huì)化分析的平臺(tái)是可以幫助很多無名人士成為這個(gè)世界上面真正能夠幫助別人解決問題的高手。就是靠開放式社會(huì)化的分析平臺(tái)。另外一個(gè)方面,對(duì)于企業(yè)來說也是非常有用。給大家講一個(gè)故事。美國有一個(gè)初創(chuàng)企業(yè),做旅游的應(yīng)用。缺少一個(gè)算法,希望在照片當(dāng)中找出那些用戶喜歡的照片,但是,公司只有兩個(gè)科研人員。一個(gè)是CTO,一個(gè)是開發(fā)人員。沒有辦法,所以,花了5千美金到平臺(tái)上面去征集算法,5000美金找了400多只團(tuán)隊(duì)給他做。最后是找到了一個(gè)算法,靠這個(gè)算法拿回240萬美金的風(fēng)險(xiǎn)投資。

這樣一種開放式社會(huì)化分析解決數(shù)據(jù)科學(xué)家缺乏的問題。這個(gè)是數(shù)據(jù)的處理和分析的這一塊。

第三塊,數(shù)據(jù)創(chuàng)意。數(shù)據(jù)創(chuàng)意是需要跨界這樣一種思維,剛剛就是氣候?qū)W農(nóng)藝學(xué)加那個(gè)就是跨界。還可以抽取出很多的東西出來,其實(shí)剛剛那個(gè)里面預(yù)測(cè)災(zāi)難性的氣侯。這樣一種預(yù)測(cè)分析跟保險(xiǎn)往往是可以弄在一起的。美國還有很多這樣的案例,有一家公司是做機(jī)票價(jià)格的預(yù)測(cè),提供服務(wù)的時(shí)候還順便說你可以買一個(gè)保險(xiǎn),假如說,我預(yù)測(cè)給你說,這個(gè)時(shí)候是最低價(jià),買了以后,一個(gè)禮拜以后又跌,這個(gè)保險(xiǎn)就可以索賠。所以,預(yù)測(cè)分析跟保險(xiǎn)。還有一家公司,是預(yù)測(cè)社會(huì)上很多商品的價(jià)格,什么時(shí)候買照相機(jī)最便宜,同樣也是付了一個(gè)保險(xiǎn)。所以,金融是一種跨越時(shí)空的價(jià)格交換。通過大數(shù)據(jù)的分析是可以發(fā)現(xiàn)這樣一種跨越時(shí)空的價(jià)值剪刀差。兩個(gè)一結(jié)合跨界就是產(chǎn)生了新的價(jià)值。

我想說數(shù)據(jù)生態(tài),包括這三個(gè)方面。我們可以通過開放數(shù)據(jù),數(shù)據(jù)市場(chǎng),開放的基礎(chǔ)設(shè)施,開放的社會(huì)化的分析,再加上無數(shù)創(chuàng)意人士跨界碰撞產(chǎn)生的這樣一個(gè)數(shù)據(jù)生態(tài)。我就講這些謝謝。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)