數(shù)據(jù)成為 DT 時(shí)代的核心要素。 今年上半年互聯(lián)網(wǎng)熱出現(xiàn)一個(gè)新動(dòng)向,就是入口和應(yīng)用場(chǎng)景的爭(zhēng)奪已到了短兵相接、貼身肉搏的激烈程度。巨頭們爭(zhēng)奪的最終目標(biāo)是數(shù)據(jù)資源。數(shù)據(jù)已成為 DT(數(shù)據(jù)技術(shù))時(shí)代的核心要素。世界經(jīng)濟(jì)論壇報(bào)告曾經(jīng)預(yù)測(cè): “未來的大數(shù)據(jù) 將成為新的財(cái)富高地,其價(jià)值可能會(huì)堪比石油”,成為戰(zhàn)略性資源。
被低估的影響:大數(shù)據(jù)將指引人類走向智能社會(huì)。 一方面大數(shù)據(jù)“量”和“質(zhì)”的雙提升奠定人工智能的基礎(chǔ),另一方面數(shù)據(jù)驅(qū)動(dòng)顛覆傳統(tǒng)計(jì)算機(jī)算法,導(dǎo)致人工智能出現(xiàn)突破性進(jìn)展,而人工智能又進(jìn)一步加速了大數(shù)據(jù)價(jià)值的挖掘和應(yīng)用,使人類社會(huì)進(jìn)入了向智能社會(huì) 發(fā)展的“正循環(huán)”。
政府:推動(dòng)大數(shù)據(jù)應(yīng)用的最關(guān)鍵力量。 政府擁有最多且最具應(yīng)用價(jià)值的核心數(shù)據(jù),一方面大數(shù)據(jù)已經(jīng)上升至各國(guó)國(guó)家戰(zhàn)略,政府推進(jìn)大數(shù)據(jù)開放已經(jīng)是大勢(shì)所趨: 美國(guó)等發(fā)達(dá)國(guó)家紛紛布局大數(shù)據(jù)產(chǎn)業(yè),推出大數(shù)據(jù)相關(guān)政策。大數(shù)據(jù)對(duì)整個(gè)世界的影響力呈現(xiàn)快速增長(zhǎng)趨 勢(shì),將引發(fā)新一輪大國(guó)競(jìng)爭(zhēng)。 另一方面我國(guó)對(duì)大數(shù)據(jù)的政策支持力度上不斷提升,大數(shù)據(jù)戰(zhàn)略將上升至國(guó)家戰(zhàn)略, 國(guó)務(wù)院已經(jīng)下達(dá)各部委大數(shù)據(jù)工作任務(wù)行動(dòng)時(shí)間表,大數(shù)據(jù)發(fā)展緊迫性和必要性可見一斑,同時(shí)也意味著我國(guó)大數(shù)據(jù)發(fā)展面臨歷史性機(jī)遇。
數(shù)據(jù)價(jià)值正在被不斷發(fā)現(xiàn)。 互聯(lián)網(wǎng)早期有句名言 “在網(wǎng)上,沒有人知道你是一條狗。 ”如今有了大數(shù)據(jù),在網(wǎng)上,不僅有人知道你是一條“狗”,而且還知道你是一條什么樣的“狗”,愛吃什么、什么時(shí)候睡。大數(shù)據(jù)除了具有挖掘商機(jī)、精準(zhǔn)營(yíng)銷、 決策支持、提高效 率等發(fā)現(xiàn)價(jià)值功能,還有創(chuàng)造價(jià)值的功能:能創(chuàng)造新的消費(fèi)體驗(yàn)、創(chuàng)造新的商業(yè)模式和創(chuàng)造新的消費(fèi)需求。
大數(shù)據(jù)產(chǎn)業(yè)鏈: 一是數(shù)據(jù)收集, 其途徑:
1、自行收集。如今年 1 月工行“融e 購(gòu)”商城正式上線,其目的是希望通過發(fā)展電商來獲得大數(shù)據(jù)方面的主動(dòng)權(quán);
2、與第三方合作。如平安銀行攜手 eBay 推出“貸貸平安商務(wù)卡”;
3、“線下數(shù)據(jù)”轉(zhuǎn)變?yōu)?ldquo;線上數(shù)據(jù)”。傳統(tǒng)行業(yè)的“線下數(shù)據(jù)”轉(zhuǎn)變?yōu)?ldquo;線上數(shù)據(jù)”將是 DT 時(shí)代的血液之一。 “線下數(shù)據(jù)”就是傳統(tǒng)行業(yè)的優(yōu)勢(shì)。
二是數(shù)據(jù)處理,數(shù)據(jù)處理包括鑒別、整理、歸類以及建模分析、挖掘利用等,數(shù)據(jù)科學(xué)家可能成為未來最熱門職業(yè)。三是技術(shù)支撐,包括硬件和軟件兩部分。
大數(shù)據(jù)與產(chǎn)業(yè)的聚合效應(yīng)。 大數(shù)據(jù)與生物醫(yī)藥、農(nóng)業(yè)、電信、視頻、 互聯(lián)網(wǎng)金融、工業(yè)互聯(lián)網(wǎng)、車聯(lián)網(wǎng)、信息安全等產(chǎn)業(yè)的結(jié)合將產(chǎn)生巨大的化學(xué)反應(yīng)。
1. 大數(shù)據(jù): DT 時(shí)代的核心要素
1.1. 大數(shù)據(jù)是未來社會(huì)的核心資源
大數(shù)據(jù)是“互聯(lián)網(wǎng)+”的核心要素。 互聯(lián)網(wǎng)的未來在于連接一切,從連接人與人向連接人與服務(wù)、人與物、物與物擴(kuò)散, 使得海量數(shù)據(jù)的生產(chǎn)和連通變成現(xiàn)實(shí),成為大數(shù)據(jù)應(yīng)用的基礎(chǔ)。 尤其在傳統(tǒng)行業(yè),信息及數(shù)據(jù)是被忽視的, 缺乏有效的手段進(jìn)行充分利用, 互聯(lián) 網(wǎng)與傳統(tǒng)產(chǎn)業(yè)融合的重要目的在于將潛在信息和數(shù)據(jù)的價(jià)值進(jìn)行釋放, 因此,評(píng)價(jià)“互聯(lián)網(wǎng) +”的指標(biāo)絕非是簡(jiǎn)單的信息化,而是對(duì)企業(yè)的整體生態(tài)系統(tǒng)進(jìn)行數(shù)據(jù)化, 讓企業(yè)的一切業(yè)務(wù)都變得可以分析, 進(jìn)而更好的識(shí)別市場(chǎng)和用戶。
從某種程度上來說, 數(shù)據(jù)是現(xiàn)實(shí)世界在虛擬世界的一個(gè)“映像”, 可以通過數(shù)據(jù)挖掘?qū)?ldquo;虛擬映像”進(jìn)行分析, 進(jìn)而對(duì)工作流程、商業(yè)模式、產(chǎn)品設(shè)計(jì)產(chǎn)生巨大的影響, 服務(wù)于產(chǎn)業(yè)本身。 正如馬化騰所說,“互聯(lián)網(wǎng) +”代表的是一種“信息能源”,能夠促使互聯(lián)網(wǎng) 與傳統(tǒng)產(chǎn)業(yè)不斷融合。
數(shù)據(jù)逐漸成為整個(gè)經(jīng)濟(jì)社會(huì)的核心資源。十八世紀(jì)的農(nóng)業(yè)社會(huì),經(jīng)濟(jì)整體以農(nóng)業(yè)為主,十九世紀(jì)制造業(yè)起步, 1950 年 GDP 大部分是制造業(yè), 而未來數(shù)字經(jīng)濟(jì)占據(jù)經(jīng)濟(jì)的主體地位已經(jīng)成為必然的趨勢(shì)。全球經(jīng)濟(jì)從農(nóng)業(yè)經(jīng)濟(jì)到工業(yè)經(jīng)濟(jì)再到信息經(jīng)濟(jì)演變的驅(qū)動(dòng)力來自于 技術(shù)的突破,技術(shù)在改變生產(chǎn)力和生產(chǎn)關(guān)系。信息要素全面升級(jí),尤其是云計(jì)算正在變成基礎(chǔ)設(shè)施,數(shù)據(jù)在變成整個(gè)經(jīng)濟(jì)社會(huì)的核心資源。
1.2. 被低估的影響: 大數(shù)據(jù)將指引人類走向智能社會(huì)
1.2.1. 大數(shù)據(jù)“量”和“質(zhì)”的雙提升奠定機(jī)器智能的基礎(chǔ)
第一,萬(wàn)物互聯(lián)造就了數(shù)據(jù)“量”的階躍發(fā)展。 從人類文明出現(xiàn)到 2003 年,人類總共才產(chǎn)生了 5EB(ExaBytes)的數(shù)據(jù)。計(jì)算機(jī)出現(xiàn)后, 尤其是近年來移動(dòng)互聯(lián)網(wǎng)和物聯(lián)網(wǎng)的出現(xiàn), 數(shù)據(jù)產(chǎn)生的速度和規(guī)模開始急劇提升, 過去幾年產(chǎn)生的數(shù)據(jù)比以往 4 萬(wàn)年的數(shù)據(jù)總 量還要多。預(yù)計(jì)隨著互聯(lián)網(wǎng)與產(chǎn)業(yè)的加速融合,未來數(shù)據(jù)體量的增速將呈現(xiàn)指數(shù)上升態(tài)勢(shì)。 IDC 預(yù)計(jì) 2020 年全球數(shù)據(jù)使用量將達(dá)到 40ZB(ZettaBytes),需要約 429 億個(gè) 1TB的硬盤進(jìn)行存儲(chǔ),屆時(shí)中國(guó)產(chǎn)生的數(shù)據(jù)量將占到全球總量的 21%。
第二,數(shù)據(jù)逐步趨向與由“端”產(chǎn)生, 從“質(zhì)”上講兼具多維性與完備性。 數(shù)據(jù)的產(chǎn)生一定會(huì)在云、端、網(wǎng)這三個(gè)視角產(chǎn)生。 2014 年全球互聯(lián)網(wǎng)用戶有 30 億, Facebook 有 22億注冊(cè)用戶,月活躍用戶超過 13 億人口。我們?cè)?2014 年全球智能手機(jī)出貨量突破 13 億,連網(wǎng)設(shè)備超過 300 億個(gè)。 未來可能會(huì)有 80-90%數(shù)據(jù)基于用戶智能終端和聯(lián)網(wǎng)設(shè)備產(chǎn)生,由于這些數(shù)據(jù)連接人體、連接環(huán)境、連接物體、連接思想, 將原來看似無(wú)關(guān)的維度(時(shí)間、地域、食品、做法,成分,人的身份和收入情況等)聯(lián)系了起來, 構(gòu)成了今天的非常 生動(dòng)的數(shù)據(jù)社會(huì)的景象,這種數(shù)據(jù)連接起來才能流動(dòng)共享,真正實(shí)現(xiàn)數(shù)據(jù)的社會(huì)經(jīng)濟(jì)價(jià)值。
1.2.2. 數(shù)據(jù)驅(qū)動(dòng)顛覆傳統(tǒng)計(jì)算機(jī)算法, 導(dǎo)致人工智能出現(xiàn)突破性進(jìn)展
互聯(lián)網(wǎng)的發(fā)展為訓(xùn)練機(jī)器模型提供了足夠多的數(shù)據(jù)量,而這種數(shù)據(jù)驅(qū)動(dòng)算法以深度學(xué)習(xí)為代表,不但顛覆了傳統(tǒng)的計(jì)算機(jī)算法,也使得人工智能出現(xiàn)突破性拐 點(diǎn)。一個(gè)典型的例子是 2005 年 NIST 對(duì)全世界各家機(jī)器翻譯系統(tǒng)評(píng)測(cè)的結(jié)果中,從未做過機(jī)器翻譯的Google, 不僅一舉奪得了各項(xiàng)評(píng)比的第一名,而且將其它單位的系統(tǒng)遠(yuǎn)遠(yuǎn)拋在了后面,而 Google 系統(tǒng)和其他系統(tǒng)主要的優(yōu)勢(shì)就在于使用了其他對(duì)手近萬(wàn)倍的數(shù)據(jù)量。 而國(guó)內(nèi)人工智能代表公司科大訊飛近幾年在采用深度學(xué)習(xí)算法,利用大數(shù)據(jù)訓(xùn)練后,近幾年其語(yǔ)音識(shí)別和手寫識(shí) 別錯(cuò)誤率均保持 30%-50%的下降。
1.2.3. 大數(shù)據(jù)與人工智能相互促進(jìn),實(shí)現(xiàn)發(fā)展的正循環(huán)
人工智能是解決大數(shù)據(jù)的數(shù)量和效率之間矛盾的關(guān)鍵
傳統(tǒng)的機(jī)器學(xué)習(xí)通過標(biāo)記數(shù)據(jù)進(jìn)行有監(jiān)督學(xué)習(xí),隨著其處理數(shù)據(jù)量的增大, 需要外界的支持和幫助也就不斷增加, 且計(jì)算結(jié)果準(zhǔn)確性也會(huì)受到影響。 因此越來越多的數(shù)據(jù)將成為負(fù)擔(dān),也更容易達(dá)到極限或產(chǎn)生錯(cuò)誤結(jié)果。人工智能的突破性技術(shù)——深度學(xué)習(xí)是從未經(jīng)標(biāo) 記的數(shù)據(jù)展開學(xué)習(xí),更接近人腦的學(xué)習(xí)方式,可以通過訓(xùn)練之后自行掌握概念,且輸出結(jié)果會(huì)隨著數(shù)據(jù)處理量的增大而更加準(zhǔn)確。同時(shí),深度學(xué)習(xí)在加速回歸定律的 指引下會(huì)使得進(jìn)化過程中產(chǎn)物(輸出結(jié)果)獲得指數(shù)級(jí)增長(zhǎng),當(dāng)深度學(xué)習(xí)的效率變得更高,就會(huì)吸引更多 的資源向它聚合,使其發(fā)展更為迅速。
大數(shù)據(jù)利用人工智能實(shí)現(xiàn)大數(shù)據(jù)應(yīng)用的正循環(huán)
百度首席科學(xué)家吳恩達(dá)層提出 : 從優(yōu)秀產(chǎn)品到大量用戶,再到海量數(shù)據(jù),最后返回優(yōu)秀產(chǎn)品是一個(gè)良性循環(huán),但最后一個(gè)環(huán)節(jié)“海量數(shù)據(jù)到優(yōu)秀產(chǎn)品”會(huì)出現(xiàn)問題,因?yàn)楫?dāng)數(shù)據(jù)積累過多時(shí),就無(wú)法對(duì)這些數(shù)據(jù)進(jìn)行完整和準(zhǔn)確的處理。
以百度為例, 百度的數(shù)據(jù)處理自上而下分成開放云、數(shù)據(jù)工廠和百度大腦三個(gè)層級(jí),最底層的開放云收集數(shù)據(jù),數(shù)據(jù)工廠對(duì)數(shù)據(jù)庫(kù)進(jìn)行管理,最上層百度大腦的模擬神經(jīng)網(wǎng)絡(luò)通過 機(jī)器學(xué)習(xí)高效的輸出結(jié)果,從而實(shí)現(xiàn)行業(yè)應(yīng)用,百度大腦就是在最后一個(gè)環(huán)節(jié)體現(xiàn)出巨大價(jià) 值,帶來更好的信息處理能力,從而產(chǎn)生更加廣泛和深入的行業(yè)應(yīng)用,比如百度大數(shù)據(jù)此前在醫(yī)療、交通和金融領(lǐng)域的應(yīng)用。