2014年12月12-14日,2014中國(guó)大數(shù)據(jù)技術(shù)大會(huì)暨第二屆CCF大數(shù)據(jù)學(xué)術(shù)會(huì)議在北京圓滿落幕。大會(huì)立足國(guó)際化的視野,分享了海內(nèi)外大數(shù)據(jù)技術(shù)的發(fā)展趨勢(shì);從技術(shù)與實(shí)踐角度探討“大數(shù)據(jù)生態(tài)系統(tǒng)”、“大數(shù)據(jù)技術(shù)”、“大數(shù)據(jù)應(yīng)用”、“大數(shù)據(jù)基礎(chǔ)設(shè)施 ”等新技術(shù)應(yīng)用和實(shí)踐經(jīng)驗(yàn);通過(guò)創(chuàng)新大賽和培訓(xùn)課程等特色活動(dòng),解密大數(shù)據(jù)創(chuàng)業(yè)熱點(diǎn),分享行業(yè)實(shí)戰(zhàn)經(jīng)驗(yàn)。
會(huì)上,記者針對(duì)大數(shù)據(jù)行業(yè)應(yīng)用落地以及大數(shù)據(jù)領(lǐng)域人才培養(yǎng)等問(wèn)題對(duì)多為專家進(jìn)行了采訪。
數(shù)據(jù)可信性及性能創(chuàng)新問(wèn)題成落地難點(diǎn)
當(dāng)前,大數(shù)據(jù)技術(shù)的發(fā)展早已不再停留于概念普及階段,更多的企業(yè)用戶密切關(guān)注起落地問(wèn)題,尤其是行業(yè)用戶,更期望大數(shù)據(jù)能夠?yàn)樾袠I(yè)發(fā)展帶來(lái)較大的助推力。但現(xiàn)實(shí)情況卻遠(yuǎn)沒(méi)有大家期望中的樂(lè)觀,大數(shù)據(jù)技術(shù)的行業(yè)落地依舊困難重重。那么大數(shù)據(jù)技術(shù)在行業(yè)落地方面,就國(guó)內(nèi)外而言到底有那些方面的難點(diǎn)和挑戰(zhàn)?
對(duì)此,Co-Founder and CEO of Conviva張暉表示,大數(shù)據(jù)與人工智能兩者有共同的特點(diǎn),即大家期望值非常高,但同時(shí)對(duì)其定義不清晰。大數(shù)據(jù)相比數(shù)學(xué),數(shù)學(xué)非常嚴(yán)禁,其重復(fù)度、可信度很高。但大數(shù)據(jù)恰恰不同,其類似黑箱難以理解,且達(dá)到的結(jié)論就是可視化、誠(chéng)信度、可信度都非常難。這是大數(shù)據(jù)要解決的問(wèn)題,也是其存在的致命問(wèn)題。大數(shù)據(jù)技術(shù)的落地既是挑戰(zhàn)一個(gè)挑戰(zhàn)也存在著機(jī)遇。
而在CCF專家委員會(huì)秘書(shū)長(zhǎng)程學(xué)旗看來(lái),張暉教授所涉及的問(wèn)題恰恰是從數(shù)據(jù)科學(xué)的范疇思考問(wèn)題,即到底數(shù)據(jù)科學(xué)的問(wèn)題性確定性以及數(shù)據(jù)的復(fù)雜性到底怎么定義?這是目前非常不確定的。但這不確定性和復(fù)雜性恰恰引發(fā)大家關(guān)注大數(shù)據(jù)的價(jià)值和魅力,而并非大家想象的利用了就能發(fā)現(xiàn)價(jià)值,這是大數(shù)據(jù)的難點(diǎn)和科學(xué)所在,也是大數(shù)據(jù)科學(xué)的價(jià)值所在。
而從技術(shù)工程角度,大數(shù)據(jù)落地難的地方實(shí)際上還是數(shù)據(jù)共享問(wèn)題,但這并非寬泛的數(shù)據(jù)共享,CCF同國(guó)家相關(guān)部門和業(yè)務(wù)部門之間并不單純是技術(shù)研究沒(méi)有數(shù)據(jù),搞公司和做產(chǎn)品沒(méi)有業(yè)務(wù)結(jié)合,恰恰是各公司業(yè)務(wù)部門之間缺乏分享。如果我們把城市相關(guān)技術(shù)能夠比較好的關(guān)聯(lián)起來(lái),在此基礎(chǔ)上進(jìn)行合理決策,城市規(guī)劃方面還是可以實(shí)現(xiàn)超前發(fā)展的。然而,因?yàn)楦魑k局的行業(yè)部門數(shù)據(jù)沒(méi)辦法整合到統(tǒng)一平臺(tái),這也構(gòu)成了是大數(shù)據(jù)落地工程上的難點(diǎn)問(wèn)題。
而第二個(gè)技術(shù)難點(diǎn)問(wèn)題就是性能問(wèn)題?,F(xiàn)如今進(jìn)行大數(shù)據(jù)分析,產(chǎn)生Hadoop之類的并非任意團(tuán)體和機(jī)構(gòu)都可開(kāi)展。要想進(jìn)行數(shù)據(jù)分析,并將數(shù)據(jù)挖掘產(chǎn)生的價(jià)值發(fā)揮出來(lái),立足性能角度,新的計(jì)算機(jī)體系結(jié)構(gòu)設(shè)計(jì)、網(wǎng)絡(luò)設(shè)計(jì)是否已經(jīng)解決還存在問(wèn)題。另外,國(guó)內(nèi)的科研機(jī)構(gòu)這著力進(jìn)行此類研究的相對(duì)比較少。這個(gè)系統(tǒng)性的創(chuàng)新也是最難的。
交叉性特征決定人才培養(yǎng)更應(yīng)高起點(diǎn)
面對(duì)洶涌的大數(shù)據(jù)浪潮,人才匱乏已成為擺在所有企業(yè)面前的迫切問(wèn)題。那么未來(lái)大數(shù)據(jù)人才培養(yǎng)到底應(yīng)該朝著那些方面發(fā)展呢?
在中國(guó)人民大學(xué)信息學(xué)院院長(zhǎng)杜小勇看來(lái),當(dāng)前業(yè)界均有較為普遍的認(rèn)知,即未來(lái)大數(shù)據(jù)人才需求量將劇增。為此,國(guó)內(nèi)相關(guān)高校也展開(kāi)了深層次的探索。但立足大數(shù)據(jù)本身,歸根到底這項(xiàng)技術(shù)更多具備一些交叉性的功能特性,需要知識(shí)面更為全面的群體才能真正發(fā)揮價(jià)值。因此,業(yè)界目前統(tǒng)一的觀點(diǎn)表示,大數(shù)據(jù)人才的培養(yǎng)還需從研究生階段開(kāi)始培養(yǎng)。
卡耐基梅隆大學(xué)教授邢波認(rèn)為,縱覽國(guó)內(nèi)或公司內(nèi)部大數(shù)據(jù)工作,展現(xiàn)在我們面前的更多現(xiàn)象是作為數(shù)據(jù)的享用者,但在方法論和工具開(kāi)發(fā)方面深入涉及的較少,究其原因,培養(yǎng)此類人才的難點(diǎn)需要人才支持,需要數(shù)據(jù)和算法上的支持。因此,大數(shù)據(jù)人才培養(yǎng)本科階段并非不好,而是該階段培養(yǎng)難度較大,且這一層面的人才積累不夠,知識(shí)面缺乏一定的豐富性。