華為內(nèi)部狂轉(zhuǎn)好文:有關(guān)大數(shù)據(jù),看這一篇就夠了

責(zé)任編輯:editor005

2014-10-24 14:32:41

摘自:速途網(wǎng)

大數(shù)據(jù)將重構(gòu)很多行業(yè)的商業(yè)思維和商業(yè)模式我想以對(duì)未來(lái)汽車行業(yè)的狂野想象來(lái)展開(kāi)這個(gè)題目。對(duì)于駕駛者來(lái)說(shuō),不想開(kāi)車的時(shí)候,在大數(shù)據(jù)和人工智能的支持下,車輛可以自動(dòng)駕駛,并且對(duì)于你經(jīng)常開(kāi)的線路可以自學(xué)習(xí)自優(yōu)化。

科技的進(jìn)步在很多的時(shí)候總會(huì)超出我們的想象,如果未來(lái)我們一個(gè)人擁有的電腦設(shè)備超過(guò)現(xiàn)在全球現(xiàn)在計(jì)算能力的總和,一個(gè)人產(chǎn)生的數(shù)據(jù)量超過(guò)現(xiàn)在全球數(shù)據(jù)量的總和,甚至你的寵物小狗產(chǎn)生的信息量都超過(guò)現(xiàn)在全球數(shù)據(jù)量的總和,世界會(huì)發(fā)生什么呢?閱讀本文,大數(shù)據(jù)(Big Data)會(huì)告訴你一個(gè)充滿奇幻色彩的世界。

一、詳解時(shí)髦詞匯:大數(shù)據(jù)

似乎一夜之間,大數(shù)據(jù)(Big Data)變成一個(gè)IT行業(yè)中最時(shí)髦的詞匯。首先,大數(shù)據(jù)不是什么完完全全的新生事物,Google的搜索服務(wù)就是一個(gè)典型的大數(shù)據(jù)運(yùn)用,根據(jù)客戶的需求,Google實(shí)時(shí)從全球海量的數(shù)字資產(chǎn)(或數(shù)字垃圾)中快速找出最可能的答案,呈現(xiàn)給你,就是一個(gè)最典型的大數(shù)據(jù)服務(wù)。只不過(guò)過(guò)去這樣規(guī)模的數(shù)據(jù)量處理和有商業(yè)價(jià)值的應(yīng)用太少,在IT行業(yè)沒(méi)有形成成型的概念?,F(xiàn)在隨著全球數(shù)字化、網(wǎng)絡(luò)寬帶化、互聯(lián)網(wǎng)應(yīng)用于各行各業(yè),累積的數(shù)據(jù)量越來(lái)越大,越來(lái)越多企業(yè)、行業(yè)和國(guó)家發(fā)現(xiàn),可以利用類似的技術(shù)更好地服務(wù)客戶、發(fā)現(xiàn)新商業(yè)機(jī)會(huì)、擴(kuò)大新市場(chǎng)以及提升效率,才逐步形成大數(shù)據(jù)這個(gè)概念。有一個(gè)有趣的故事是關(guān)于奢侈品營(yíng)銷的。PRADA在紐約的旗艦店中每件衣服上都有RFID碼。每當(dāng)一個(gè)顧客拿起一件PRADA進(jìn)試衣間,RFID會(huì)被自動(dòng)識(shí)別。同時(shí),數(shù)據(jù)會(huì)傳至PRADA總部。每一件衣服在哪個(gè)城市哪個(gè)旗艦店什么時(shí)間被拿進(jìn)試衣間停留多長(zhǎng)時(shí)間,數(shù)據(jù)都被存儲(chǔ)起來(lái)加以分析。如果有一件衣服銷量很低,以往的作法是直接干掉。但如果RFID傳回的數(shù)據(jù)顯示這件衣服雖然銷量低,但進(jìn)試衣間的次數(shù)多。那就能另外說(shuō)明一些問(wèn)題。也許這件衣服的下場(chǎng)就會(huì)截然不同,也許在某個(gè)細(xì)節(jié)的微小改變就會(huì)重新創(chuàng)造出一件非常流行的產(chǎn)品。

從這個(gè)案例來(lái)看,大數(shù)據(jù)并不是很神奇的事情。就如同電影《永無(wú)止境》提出的問(wèn)題:人類通常只使用了20%的大腦,如果剩余80%大腦潛能被激發(fā)出來(lái),世界會(huì)變得怎樣?在企業(yè)、行業(yè)和國(guó)家的管理中,通常只有效使用了不到20%的數(shù)據(jù)(甚至更少),如果剩余80%數(shù)據(jù)的價(jià)值激發(fā)起來(lái),世界會(huì)變得怎么樣呢?特別是隨著海量數(shù)據(jù)的新摩爾定律,數(shù)據(jù)爆發(fā)式增長(zhǎng),然后數(shù)據(jù)又得到更有效應(yīng)用,世界會(huì)怎么樣呢?單個(gè)的數(shù)據(jù)并沒(méi)有價(jià)值,但越來(lái)越多的數(shù)據(jù)累加,量變就會(huì)引起質(zhì)變,就好像一個(gè)人的意見(jiàn)并不重要,但1千人、1萬(wàn)人的意見(jiàn)就比較重要,上百萬(wàn)人就足以掀起巨大的波瀾,上億人足以改變一切。中國(guó)的航班晚點(diǎn)非常多,相比之下美國(guó)航班準(zhǔn)點(diǎn)情況好很多。這其中,美國(guó)航空管制機(jī)構(gòu)一個(gè)的好做法發(fā)揮了積極的作用,說(shuō)起來(lái)也非常簡(jiǎn)單,就是美國(guó)會(huì)公布每個(gè)航空公司、每一班航空過(guò)去一年的晚點(diǎn)率和平均晚點(diǎn)時(shí)間,這樣客戶在購(gòu)買機(jī)票的時(shí)候就很自然會(huì)選擇準(zhǔn)點(diǎn)率高的航班,從而通過(guò)市場(chǎng)手段牽引各航空公司努力提升準(zhǔn)點(diǎn)率。這個(gè)簡(jiǎn)單的方法比任何管理手段都直接和有效。沒(méi)有整合和挖掘的數(shù)據(jù),價(jià)值也呈現(xiàn)不出來(lái)。《永無(wú)止境》中的庫(kù)珀如果不能把海量信息圍繞某個(gè)公司的股價(jià)整合起來(lái)、串聯(lián)起來(lái),這些信息就沒(méi)有價(jià)值。因此,海量數(shù)據(jù)的產(chǎn)生、獲取、挖掘及整合,使之展現(xiàn)出巨大的商業(yè)價(jià)值,這就是我理解的大數(shù)據(jù)。在互聯(lián)網(wǎng)對(duì)一切重構(gòu)的今天,這些問(wèn)題都不是問(wèn)題。因?yàn)椋髷?shù)據(jù)是互聯(lián)網(wǎng)深入發(fā)展的下一波應(yīng)用,是互聯(lián)網(wǎng)發(fā)展的自然延伸。目前,可以說(shuō)大數(shù)據(jù)的發(fā)展到了一個(gè)臨界點(diǎn),因此才成為IT行業(yè)中最熱門的詞匯之一。

二、大數(shù)據(jù)將重構(gòu)很多行業(yè)的商業(yè)思維和商業(yè)模式

我想以對(duì)未來(lái)汽車行業(yè)的狂野想象來(lái)展開(kāi)這個(gè)題目。在人的一生中,汽車是一項(xiàng)巨大的投資。以一部30萬(wàn)車、7年換車周期來(lái)算,每年折舊費(fèi)4萬(wàn)多(這里還不算資金成本),加上停車、保險(xiǎn)、油、維修、保養(yǎng)等各項(xiàng)費(fèi)用,每年耗費(fèi)應(yīng)在6萬(wàn)左右。汽車產(chǎn)業(yè)也是一個(gè)很長(zhǎng)產(chǎn)業(yè)鏈的龍頭產(chǎn)業(yè),這個(gè)方面只有房地產(chǎn)可以媲美。但同時(shí),汽車產(chǎn)業(yè)鏈?zhǔn)且粋€(gè)低效率、變化慢的產(chǎn)業(yè)。汽車一直以來(lái)就是四個(gè)輪子、一個(gè)方向盤、兩排沙發(fā)(李書(shū)福語(yǔ))。這么一個(gè)昂貴的東西,圍繞車產(chǎn)生的數(shù)據(jù)卻少的可憐,行業(yè)產(chǎn)業(yè)鏈之間幾無(wú)任何數(shù)據(jù)傳遞。我們?cè)谶@里狂野地想象一番,如果將汽車全面數(shù)字化,都大數(shù)據(jù)了,會(huì)產(chǎn)生什么結(jié)果?有些人說(shuō),汽車數(shù)字化,不就是加個(gè)MBB模塊嗎?不,這太小兒科了。在我理想中,數(shù)字化意味著汽車可以隨時(shí)聯(lián)上互聯(lián)網(wǎng),意味著汽車是一個(gè)大型計(jì)算系統(tǒng)加上傳統(tǒng)的輪子、方向盤和沙發(fā),意味著可以數(shù)字化導(dǎo)航、自動(dòng)駕駛,意味著你和汽車相關(guān)的每一個(gè)行動(dòng)都數(shù)字化,包括每一次維修、每一次駕駛路線、每一次事故的錄像、每一天汽車關(guān)鍵部件的狀態(tài),甚至你的每一個(gè)駕駛習(xí)慣(如每一次的剎車和加速)都記錄在案。這樣,你的車每月甚至每周都可能產(chǎn)生T比特的數(shù)據(jù)。好了,我們假設(shè)這些數(shù)據(jù)都可以存儲(chǔ)并分享給相關(guān)的政府、行業(yè)和企業(yè)。這里不討論隱私問(wèn)題帶來(lái)的影響,假設(shè)在隱私保護(hù)的前提下,數(shù)據(jù)可以自由分享。那么,保險(xiǎn)公司會(huì)怎么做呢?保險(xiǎn)公司把你的所有數(shù)據(jù)拿過(guò)去建模分析,發(fā)現(xiàn)幾個(gè)重要的事實(shí):一是你開(kāi)車主要只是上下班,南山到坂田這條線路是非繁華路線,紅綠燈很少,這條路線過(guò)去一年統(tǒng)計(jì)的事故率很低;你的車況(車的使用年限、車型)好,此車型在全深圳也是車禍率較低;甚至統(tǒng)計(jì)你的駕駛習(xí)慣,加油平均,臨時(shí)剎車少,超車少,和周圍車保持了應(yīng)有的車距,駕駛習(xí)慣好。最后結(jié)論是你車型好,車況好,駕駛習(xí)慣好,常走的線路事故率低,過(guò)去一年也沒(méi)有出過(guò)車禍,因此可以給予更大幅度的優(yōu)惠折扣。這樣保險(xiǎn)公司就完全重構(gòu)了它的商業(yè)模式了。在沒(méi)有大數(shù)據(jù)支撐之前,保險(xiǎn)公司只把車險(xiǎn)客戶做了簡(jiǎn)單的分類,一共分為四種客戶,第一種是連續(xù)兩年沒(méi)有出車禍的,第二種過(guò)去一年沒(méi)有出車禍,第三種過(guò)去一年出了一次車禍,第四種是過(guò)去一年出了兩次及以上車禍的,就四種類型。在大數(shù)據(jù)的支持下,保險(xiǎn)公司可以真正以客戶為中心,把客戶分為成千上萬(wàn)種,每個(gè)客戶都有個(gè)性化的解決方案,這樣保險(xiǎn)公司經(jīng)營(yíng)就完全不同,對(duì)于風(fēng)險(xiǎn)低的客戶敢于大膽折扣,對(duì)于風(fēng)險(xiǎn)高的客戶報(bào)高價(jià)甚至拒絕,一般的保險(xiǎn)公司就完全難以和這樣的保險(xiǎn)公司競(jìng)爭(zhēng)了。

擁有大數(shù)據(jù)并使用大數(shù)據(jù)的保險(xiǎn)公司比傳統(tǒng)公司將擁有壓倒性的競(jìng)爭(zhēng)優(yōu)勢(shì),大數(shù)據(jù)將成為保險(xiǎn)公司最核心的競(jìng)爭(zhēng)力,因?yàn)楸kU(xiǎn)就是一個(gè)基于概率評(píng)估的生意,大數(shù)據(jù)對(duì)于準(zhǔn)確評(píng)估概率毫無(wú)疑問(wèn)是最有利的武器,而且簡(jiǎn)直是量身定做的武器。在大數(shù)據(jù)的支持下,4S店的服務(wù)也完全不同了。車況信息會(huì)定期傳遞到4S店,4S店會(huì)根據(jù)情況及時(shí)提醒車主及時(shí)保養(yǎng)和維修,特別是對(duì)于可能危及安全的問(wèn)題,在客戶同意下甚至?xí)扇∵h(yuǎn)程干預(yù)措施,同時(shí)還可以提前備貨,車主一到4S店就可以維修而不用等待。對(duì)于駕駛者來(lái)說(shuō),不想開(kāi)車的時(shí)候,在大數(shù)據(jù)和人工智能的支持下,車輛可以自動(dòng)駕駛,并且對(duì)于你經(jīng)常開(kāi)的線路可以自學(xué)習(xí)自優(yōu)化。谷歌的自動(dòng)駕駛汽車,為了對(duì)周圍環(huán)境作出預(yù)測(cè),每秒鐘要收集差不多1GB的數(shù)據(jù),沒(méi)有大數(shù)據(jù)的支持,自動(dòng)駕駛是不可想象的;在和周圍車輛過(guò)近的時(shí)候,會(huì)及時(shí)提醒車主避讓;上下班的時(shí)候,會(huì)根據(jù)實(shí)時(shí)大數(shù)據(jù)情況,對(duì)于你經(jīng)常開(kāi)車的線路予以提醒,繞開(kāi)擁堵點(diǎn),幫你選擇最合適的線路;到城市中心,尋找車位是一件很麻煩的事情,但未來(lái)你可以到了商場(chǎng)門口后,讓汽車自己去找停車位,等想要回程的時(shí)候,提前通知讓汽車自己開(kāi)過(guò)來(lái)接。車輛是城市最大最活躍的移動(dòng)物體,是擁堵的來(lái)源,也是最大的污染來(lái)源之一。數(shù)字化的車輛、大數(shù)據(jù)應(yīng)用將帶來(lái)很多的改變。紅綠燈可以自動(dòng)優(yōu)化,根據(jù)不同道路的擁堵情況自動(dòng)進(jìn)行調(diào)整,甚至在很多地方可以取消紅綠燈;城市停車場(chǎng)也可以大幅度優(yōu)化,根據(jù)大數(shù)據(jù)的情況優(yōu)化城市停車位的設(shè)計(jì),如果配合車輛的自動(dòng)駕駛功能,停車場(chǎng)可以革命性演變,可以設(shè)計(jì)專門為自動(dòng)駕駛車輛的停車樓,地下、地上樓層可以高達(dá)幾十層,停車樓層可以更矮,只要能高于車高度即可(或者把車豎起來(lái)停),這樣將對(duì)城市規(guī)劃產(chǎn)生巨大的影響;政府還可以每年公布各類車型的實(shí)際排污量、稅款、安全性等指標(biāo),鼓勵(lì)民眾買更節(jié)能、更安全的車。電子商務(wù)和快遞業(yè)也可能發(fā)生巨大的變化。運(yùn)快遞的車都可以自動(dòng)駕駛,不用趕白天的擁堵的道路,晚上半夜開(kāi),在你家門口設(shè)計(jì)自動(dòng)接收箱,通過(guò)密碼開(kāi)啟自動(dòng)投遞進(jìn)去,就好像過(guò)去報(bào)童投報(bào)一樣。

這么想象下來(lái),我認(rèn)為,汽車數(shù)字化、互聯(lián)網(wǎng)化、大數(shù)據(jù)應(yīng)用、人工智能,將對(duì)汽車業(yè)及相關(guān)的長(zhǎng)長(zhǎng)的產(chǎn)業(yè)鏈產(chǎn)生難以想象的巨大變化和產(chǎn)業(yè)革命,具有無(wú)限的想象空間,可能完全被重構(gòu)。當(dāng)然,要實(shí)現(xiàn)我所描述的場(chǎng)景,估計(jì)至少50年、100年之后的事情了,估計(jì)我這輩子是看不到的。在這個(gè)章節(jié)的最后,我想總結(jié)一下自己對(duì)大數(shù)據(jù)的看法。

第一,大數(shù)據(jù)使企業(yè)真正有能力從以自我為中心改變?yōu)橐钥蛻魹橹行摹?/strong>

企業(yè)是為客戶而生,目的是為股東獲得利潤(rùn)。只有服務(wù)好客戶,才能獲得利潤(rùn)。大數(shù)據(jù)的使用能夠使對(duì)企業(yè)的經(jīng)營(yíng)對(duì)象從客戶的粗略歸納(就是所謂提煉歸納的“客戶群”)還原成一個(gè)個(gè)活生生的客戶,這樣經(jīng)營(yíng)就有針對(duì)性,對(duì)客戶的服務(wù)就更好,投資效率就更高。

第二,大數(shù)據(jù)一定程度上將顛覆了企業(yè)的傳統(tǒng)管理方式。

現(xiàn)代企業(yè)管理方式是來(lái)源于對(duì)軍隊(duì)的模仿,依賴于層層級(jí)級(jí)的組織和嚴(yán)格的流程,依賴信息的層層匯集、收斂來(lái)制定正確的決策,再通過(guò)決策在組織的傳遞與分解,以及流程的規(guī)范,確保決策得到貫徹,確保每一次經(jīng)營(yíng)活動(dòng)都有質(zhì)量保證,也確保一定程度上對(duì)風(fēng)險(xiǎn)的規(guī)避。

第三,大數(shù)據(jù)另外一個(gè)重大的作用是改變了商業(yè)邏輯,提供了從其他視角直達(dá)答案的可能性。

現(xiàn)在人的思考或者是企業(yè)的決策,事實(shí)上都是一種邏輯的力量在主導(dǎo)起作用。大數(shù)據(jù)給了我們其他的選擇,就是利用數(shù)據(jù)的力量,直接獲得答案。就好像我們學(xué)習(xí)數(shù)學(xué),小時(shí)候?qū)W九九乘法表,中學(xué)學(xué)幾何,大學(xué)還學(xué)微積分,碰到一道難題,我們是利用了多年學(xué)習(xí)沉淀的經(jīng)驗(yàn)來(lái)努力求解,但我們還有一種方法,在網(wǎng)上直接搜索是不是有這樣的題目,如果有,直接抄答案就好了。很多人就會(huì)批評(píng)說(shuō),這是抄襲,是作弊。但我們?yōu)槭裁匆獙W(xué)習(xí)?。坎痪褪菫榱私鉀Q問(wèn)題嘛。

第四,通過(guò)大數(shù)據(jù),我們可能有全新的視角來(lái)發(fā)現(xiàn)新的商業(yè)機(jī)會(huì)和重構(gòu)新的商業(yè)模式。

我們現(xiàn)在看這個(gè)世界,比如分析家中食品腐敗,主要就是依賴于我們的眼睛再加上我們的經(jīng)驗(yàn),但如果我們有一臺(tái)顯微鏡,我們一下就看到壞細(xì)菌,那么分析起來(lái)完全就不一樣了。大數(shù)據(jù)就是我們的顯微鏡,它可以讓我們從全新視角來(lái)發(fā)現(xiàn)新的商業(yè)機(jī)會(huì),并可能重構(gòu)商業(yè)模型。我們的產(chǎn)品設(shè)計(jì)可能不一樣了,很多事情不用猜了,客戶的習(xí)慣和偏好一目了然,我們的設(shè)計(jì)就能輕易命中客戶的心窩;我們的營(yíng)銷也完全不同了,我們知道客戶喜歡什么、討厭什么,更有針對(duì)性。特別是顯微鏡再加上廣角鏡,我們就有更多全新的視野了。這個(gè)廣角鏡就是跨行業(yè)的數(shù)據(jù)流動(dòng),使我們過(guò)去看不到的東西都能看到了。

最后一點(diǎn),我想談的是大數(shù)據(jù)發(fā)展對(duì)IT本身技術(shù)架構(gòu)的革命性影響。

大數(shù)據(jù)的根基是IT系統(tǒng)。我們現(xiàn)代企業(yè)的IT系統(tǒng)基本上是建立在IOE(IBM小型機(jī)、Oracle數(shù)據(jù)庫(kù)、EMC存儲(chǔ))+Cisco模型基礎(chǔ)上的,這樣的模型是Scale-UP型的架構(gòu),在解決既定模型下一定數(shù)據(jù)量的業(yè)務(wù)流程是適配的,但如果是大數(shù)據(jù)時(shí)代,很快會(huì)面臨成本、技術(shù)和商業(yè)模式的問(wèn)題,大數(shù)據(jù)對(duì)IT的需求很快就會(huì)超越了現(xiàn)有廠商架構(gòu)的技術(shù)頂點(diǎn),超大數(shù)據(jù)增長(zhǎng)將帶來(lái)IT支出增長(zhǎng)之間的線性關(guān)系,使企業(yè)難以承受。因此,目前在行業(yè)中提出的去IOE趨勢(shì),利用Scale-out架構(gòu)+開(kāi)源軟件對(duì)Scale-up架構(gòu)+私有軟件的取代,本質(zhì)是大數(shù)據(jù)業(yè)務(wù)模型所帶來(lái)的,也就是說(shuō)大數(shù)據(jù)將驅(qū)動(dòng)IT產(chǎn)業(yè)新一輪的架構(gòu)性變革。去IOE潮流中的所謂國(guó)家安全因素,完全是次要的。所以,美國(guó)人說(shuō),大數(shù)據(jù)是資源,和大油田、大煤礦一樣,可以源源不斷挖出大財(cái)富。而且和一般資源不一樣,它是可再生的,是越挖越多、越挖越值錢的,這是反自然規(guī)律的。對(duì)企業(yè)如此,對(duì)行業(yè)、對(duì)國(guó)家也是這樣,對(duì)人同樣如此。

三、新智慧生物的誕生?

自然語(yǔ)言的機(jī)器翻譯,是長(zhǎng)期以來(lái)人工智能研究的一個(gè)重要體現(xiàn)。人工智能從過(guò)去到未來(lái)都有清晰而巨大的商業(yè)前景,是以前IT業(yè)的熱點(diǎn),其熱度一點(diǎn)不亞于現(xiàn)在的“互聯(lián)網(wǎng)”和“大數(shù)據(jù)”。但是,人類過(guò)去在推進(jìn)人工智能的研究遇到了巨大的障礙,最后幾乎絕望。當(dāng)時(shí)人工智能就是模擬人的智能思考方式來(lái)構(gòu)筑機(jī)器智能。以機(jī)器翻譯來(lái)說(shuō),語(yǔ)言學(xué)家和語(yǔ)言專家必須不辭勞苦地編撰大型詞典和與語(yǔ)法、句法、語(yǔ)義學(xué)有關(guān)的規(guī)則,數(shù)十萬(wàn)詞匯構(gòu)成詞庫(kù),語(yǔ)法規(guī)則高達(dá)數(shù)萬(wàn)條,考慮各種情景、各種語(yǔ)境,模擬人類翻譯,計(jì)算機(jī)專家再構(gòu)建復(fù)雜的程序。最后發(fā)現(xiàn)人類語(yǔ)言實(shí)在是太復(fù)雜了,窮舉式的做法根本達(dá)不到最基本的翻譯質(zhì)量。這條道路最后的結(jié)果是,1960年代后人工智能的技術(shù)研發(fā)停滯不前數(shù)年后,科學(xué)家痛苦地發(fā)現(xiàn)以“模擬人腦”、“重建人腦”的方式來(lái)定義人工智能走入一條死胡同,這導(dǎo)致后來(lái)幾乎所有的人工智能項(xiàng)目都進(jìn)入了冷宮。后來(lái)有人就想,機(jī)器為什么要向人學(xué)習(xí)邏輯呢,又難學(xué)又學(xué)不好,機(jī)器本身最強(qiáng)大的是計(jì)算能力和數(shù)據(jù)處理能力,為什么不揚(yáng)長(zhǎng)避短、另走一條道路呢?這條道路就是IBM“深藍(lán)”走過(guò)的道路。1997年5月11日,國(guó)際象棋大師卡斯帕羅夫在和IBM公司開(kāi)發(fā)的計(jì)算機(jī)“深藍(lán)”進(jìn)行對(duì)弈時(shí)宣布失敗,計(jì)算機(jī)“深藍(lán)”因此贏得了這場(chǎng)意義深遠(yuǎn)的“人機(jī)對(duì)抗”。

類似的邏輯在后續(xù)也用到了機(jī)器翻譯上。谷歌、微軟和IBM都走上了這條道路。就是主要采用匹配法,同時(shí)結(jié)合機(jī)器學(xué)習(xí),依賴于海量的數(shù)據(jù)及其相關(guān)相關(guān)統(tǒng)計(jì)信息,不管語(yǔ)法和規(guī)則,將原文與互聯(lián)網(wǎng)上的翻譯數(shù)據(jù)對(duì)比,找到最相近、引用最頻繁的翻譯結(jié)果做為輸出??偠灾眠@種技術(shù),計(jì)算機(jī)教會(huì)自己從大數(shù)據(jù)中建立模式。有了足夠大的信息量,你就能讓機(jī)器學(xué)會(huì)做看上去有智能的事情,別管是導(dǎo)航、理解話語(yǔ)、翻譯語(yǔ)言,還是識(shí)別人臉,或者模擬人類對(duì)話。假設(shè)目前剛剛興起的穿戴式計(jì)算設(shè)備取得巨大的進(jìn)展。這種進(jìn)展到什么程度呢?就是你家的寵物小狗身上也裝上了各種傳感器和穿戴式設(shè)備,比如有圖像采集,有聲音采集,有嗅覺(jué)采集,有對(duì)小狗的健康進(jìn)行監(jiān)控的小型醫(yī)療設(shè)備,甚至還有電子藥丸在小狗的胃中進(jìn)行消化情況監(jiān)控。小狗當(dāng)然也聯(lián)上網(wǎng),也一樣產(chǎn)生了巨大的數(shù)據(jù)量。這時(shí),我們假設(shè)基于這些大數(shù)據(jù)建模,能夠模擬小狗的喜怒哀樂(lè),然后還能夠通過(guò)擬人化的處理進(jìn)行語(yǔ)音表達(dá),換句話說(shuō),就是模擬小狗說(shuō)人話,比如主人回家時(shí),小狗搖尾巴,旺旺叫,那么這個(gè)附著于小狗身上的人工智能系統(tǒng)就會(huì)說(shuō),“主人,真高興看到你回家”。

不僅如此,你還可以和小狗的人工智能系統(tǒng)進(jìn)行對(duì)話,因?yàn)檫@個(gè)人工智能系統(tǒng)能基本理解你的意思,又能夠代替小狗擬人化表達(dá)。我們繼續(xù)把這個(gè)故事來(lái)做延伸,把小狗換成未來(lái)的人,人在一生中產(chǎn)生大量的數(shù)據(jù),根據(jù)這些數(shù)據(jù)建??梢灾苯油蒲莩龊芏嗟慕Y(jié)論,比如喜歡看什么樣的電影啊,喜歡什么口味的菜啊,在遇到什么問(wèn)題時(shí)會(huì)怎么采取什么行動(dòng)啊。這樣的數(shù)據(jù)一直累積下來(lái),直到這個(gè)人去世。

我們有個(gè)大膽的想象,這些巨大的數(shù)據(jù)能否讓這個(gè)人以某種方式繼續(xù)存在下去呢?后代有什么問(wèn)題需要尋求答案的時(shí)候,比如在人生的關(guān)鍵抉擇時(shí),比如大學(xué)要上什么專業(yè)、該不該和某個(gè)姑娘結(jié)婚,可不可以問(wèn)問(wèn)這個(gè)虛擬的人(祖先)有什么建議呢?答案是當(dāng)然可以。在這種情況下,數(shù)字化生存不僅在人生前存在,也可以在人死后繼續(xù)存在。人死了,可以在虛擬空間中繼續(xù)存在。一輩子、一輩子的人故去,這些虛擬的智慧都可以繼續(xù)存在,假設(shè)很多年過(guò)去了,這些虛擬智慧的祖宗們太多太多了,活著的子孫們甚至可以組建一個(gè)“祖宗聯(lián)席參謀委員會(huì)”,優(yōu)選那些考得好的(比如中過(guò)狀元),當(dāng)過(guò)國(guó)家高級(jí)公務(wù)員(比如太守)、當(dāng)過(guò)企業(yè)高管(比如CEO)、當(dāng)過(guò)教授、當(dāng)過(guò)作家的等等當(dāng)過(guò)成功人士的祖宗,專門用于后代的咨詢、解惑。讓這些祖宗死后還有競(jìng)爭(zhēng),別死了就沒(méi)有事情干了。這些說(shuō)明什么呢?就是隨著大數(shù)據(jù)和機(jī)器學(xué)習(xí)的進(jìn)一步進(jìn)展,這個(gè)世界出現(xiàn)了新的智慧生物!大數(shù)據(jù)和機(jī)器學(xué)習(xí)在改變、重構(gòu)和顛覆很多企業(yè)、行業(yè)和國(guó)家以后,終于到了改變?nèi)祟愖陨淼臅r(shí)候了!人類的演進(jìn)出現(xiàn)了新的分支!有科學(xué)家畫(huà)了下面一張圖,來(lái)描述這兩者智慧生物。

一種是基于生物性的,經(jīng)過(guò)幾百萬(wàn)年的進(jìn)化而來(lái);一種是基于IT技術(shù),基于大數(shù)據(jù)和機(jī)器學(xué)習(xí),通過(guò)自模擬、自學(xué)習(xí)而來(lái)。前者更有邏輯性,更有豐富的情感,有創(chuàng)造力,但生命有限;后者沒(méi)有很強(qiáng)的邏輯性,沒(méi)有生物上的情感,但有很強(qiáng)的計(jì)算、建模和搜索能力,理論上生命是無(wú)限的。當(dāng)然,這些事情要發(fā)生都會(huì)非常非常遙遠(yuǎn)。反正我們活著的時(shí)候是見(jiàn)不到了,死了也見(jiàn)不到,因?yàn)槲覀兯赖臅r(shí)候,我相信這種建立在大數(shù)據(jù)和機(jī)器學(xué)習(xí)之上的虛擬生命還不會(huì)存在。

四、結(jié)束語(yǔ)

我最后想說(shuō)的是,我們對(duì)未來(lái)的認(rèn)知,主要是基于常識(shí)和對(duì)未來(lái)的想象。根據(jù)統(tǒng)計(jì),現(xiàn)在《紐約時(shí)報(bào)》一周的信息量比18世紀(jì)一個(gè)人一生所收到的資訊量更大,現(xiàn)在18個(gè)月產(chǎn)生的信息比過(guò)去5000年的總和更多,現(xiàn)在我家一臺(tái)5000元電腦的計(jì)算能力比我剛?cè)氪髮W(xué)時(shí)全校的計(jì)算能力更強(qiáng)大。科技的進(jìn)步在很多的時(shí)候總會(huì)超出我們的想象,試想如果未來(lái)我們一個(gè)人擁有的電腦設(shè)備超過(guò)現(xiàn)在全球現(xiàn)在計(jì)算能力的總和,一個(gè)人產(chǎn)生的數(shù)據(jù)量超過(guò)現(xiàn)在全球數(shù)據(jù)量的總和,甚至你的寵物小狗產(chǎn)生的信息量都超過(guò)現(xiàn)在全球數(shù)據(jù)量的總和,世界會(huì)發(fā)生什么呢?那就取決于你的想象力了。對(duì)于未來(lái),你想象到什么了呢?

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)