《大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革》作者之一維克托·邁爾-舍恩伯格曾表示,如同望遠(yuǎn)鏡讓人類能夠感知宇宙,顯微鏡讓人類能夠觀測微生物一樣,大數(shù)據(jù)開啟了一次重大的時(shí)代轉(zhuǎn)型。
大數(shù)據(jù),可謂當(dāng)下IT領(lǐng)域最時(shí)髦的詞,簡單說就是從各種數(shù)據(jù)中快速獲取價(jià)值信息的能力。
美國是最早發(fā)現(xiàn)和使用大數(shù)據(jù)科學(xué)價(jià)值的國家。2012年3月,奧巴馬政府宣布投資2億美元拉動(dòng)大數(shù)據(jù)相關(guān)產(chǎn)業(yè)發(fā)展,將“大數(shù)據(jù)戰(zhàn)略”上升為國家戰(zhàn)略,奧巴馬政府甚至將大數(shù)據(jù)定義為“未來的新石油”。當(dāng)時(shí)美國政府聲明說通過提高美國從大型復(fù)雜的數(shù)據(jù)集中提取知識(shí)和管理的能力,來加強(qiáng)整個(gè)國家的競爭力,這被認(rèn)為是跟互聯(lián)網(wǎng)同一個(gè)級(jí)別的時(shí)代。顯然,大數(shù)據(jù)不止是一個(gè)詞匯,更是一門技術(shù),是一個(gè)產(chǎn)業(yè)時(shí)代。
而中國作為世界上人口最多、GDP排名第二的國家,成立大數(shù)據(jù)國家隊(duì)是非常及時(shí)的。大數(shù)據(jù)的精髓在于“大”,它不是抽樣而是全樣,它不是盲人摸到的象腿或者是象鼻子,而是整個(gè)大象本身,大數(shù)據(jù)的精妙處在于用的人越多越增持,通過這樣一個(gè)模糊的宏觀判斷,能夠完成一個(gè)精準(zhǔn)的個(gè)體推薦,從而會(huì)讓整個(gè)生產(chǎn)效率得到極大提高。
不過作為一個(gè)新生領(lǐng)域,盡管大數(shù)據(jù)意味著大機(jī)遇,擁有巨大的應(yīng)用價(jià)值,但同時(shí)也遭遇工程技術(shù)、管理政策、人才培養(yǎng)、資金投入等諸多領(lǐng)域的大挑戰(zhàn)。只有解決這些基礎(chǔ)性的挑戰(zhàn)問題,才能充分利用這個(gè)大機(jī)遇,讓大數(shù)據(jù)為企業(yè)為社會(huì)充分發(fā)揮的最大價(jià)值與貢獻(xiàn)。
挑戰(zhàn)一:數(shù)據(jù)來源錯(cuò)綜復(fù)雜
豐富的數(shù)據(jù)源是大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的前提。而我國數(shù)字化的數(shù)據(jù)資源總量遠(yuǎn)遠(yuǎn)低于美歐,每年新增數(shù)據(jù)量僅為美國的7%,歐洲的12%,其中政府和制造業(yè)的數(shù)據(jù)資源積累遠(yuǎn)遠(yuǎn)落后于國外。就已有有限的數(shù)據(jù)資源來說,還存在標(biāo)準(zhǔn)化、準(zhǔn)確性、完整性低,利用價(jià)值不高的情況,這大大降低了數(shù)據(jù)的價(jià)值。
現(xiàn)如今,幾乎任何規(guī)模企業(yè),每時(shí)每刻也都在產(chǎn)生大量的數(shù)據(jù),但這些數(shù)據(jù)如何歸集、提煉始終是一個(gè)困擾。而大數(shù)據(jù)技術(shù)的意義確實(shí)不在于掌握規(guī)模龐大的數(shù)據(jù)信息,而在于對(duì)這些數(shù)據(jù)進(jìn)行智能處理,從中分析和挖掘出有價(jià)值的信息,但前提是如何獲取大量有價(jià)值的數(shù)據(jù)。
未來,數(shù)據(jù)采集是一個(gè)很大的市場,因?yàn)榉治龅臄?shù)據(jù)模型可以根據(jù)需求和思維做,但所有的前提是你的數(shù)據(jù)采集要準(zhǔn),現(xiàn)在的問題一個(gè)是采集不到,一個(gè)是采集錯(cuò)了,還有一個(gè)是采集效率受到網(wǎng)絡(luò)帶寬限制,這幾個(gè)都做不到的話數(shù)據(jù)價(jià)值很難用起來。
大數(shù)據(jù)時(shí)代,我們需要更加全面的數(shù)據(jù)來提高分析預(yù)測的準(zhǔn)確度,因此我們就需要更多便捷、廉價(jià)、自動(dòng)的數(shù)據(jù)生產(chǎn)工具。除了我們?cè)诰W(wǎng)上使用的瀏覽器有意或者無意記載著個(gè)人的信息數(shù)據(jù)之外,手機(jī)、智能手表、智能手環(huán)等各種可穿戴設(shè)備也在無時(shí)無刻地產(chǎn)生著數(shù)據(jù);就連我們家里的路由器、電視機(jī)、空調(diào)、冰箱、飲水機(jī)、凈化器等也開始越來越智能并且具備了聯(lián)網(wǎng)功能,這些家用電器在更好地服務(wù)我們的同時(shí),也在產(chǎn)生著大量的數(shù)據(jù);甚至我們出去逛街,商戶的WIFI,運(yùn)營商的3G網(wǎng)絡(luò),無處不在的攝像頭電子眼,百貨大樓的自助屏幕,銀行的ATM,加油站以及遍布各個(gè)便利店的刷卡機(jī)等也都在產(chǎn)生著數(shù)據(jù)。
隨著移動(dòng)互聯(lián)、云計(jì)算等技術(shù)的飛速發(fā)展,無論何時(shí)何地,手機(jī)等各種網(wǎng)絡(luò)入口以及無處不在的傳感器等,都會(huì)對(duì)個(gè)人數(shù)據(jù)進(jìn)行采集、存儲(chǔ)、使用、分享,而這一切大都是在人們并不知曉的情況下發(fā)生。你的一舉一動(dòng)、地理位置、甚至一天去過哪些地方,都會(huì)被記錄下來,成為海量無序數(shù)據(jù)中的一個(gè)數(shù)列,和其他數(shù)據(jù)進(jìn)行整合分析。
比如,當(dāng)你用手機(jī)掃描二維碼,并將其用微博轉(zhuǎn)發(fā)的時(shí)候,你的消費(fèi)習(xí)慣、偏好,甚至你的社交圈子的信息,就已經(jīng)被商家的大數(shù)據(jù)分析工具捕獲。大數(shù)據(jù)平臺(tái)在提供服務(wù)的同時(shí),也在時(shí)刻收集著用戶的各種個(gè)人信息:消費(fèi)習(xí)慣、閱讀習(xí)慣甚至生活習(xí)慣。這些數(shù)據(jù),一方面給人們帶來了諸多便利,但另一方面,由于數(shù)據(jù)的管理還存在漏洞,那些發(fā)布出去或存儲(chǔ)起來的海量信息,也很容易被監(jiān)視、被竊取。
大數(shù)據(jù)散發(fā)出不可估量的商業(yè)價(jià)值。但讓人感到不安的是,信息采集手段越來越高超、便捷和隱蔽,對(duì)公民個(gè)人信息的保護(hù),無論在技術(shù)手段還是法律支撐都依然捉襟見肘。人們面臨的不僅是無休止的騷擾,更可能是各種犯罪行為的威脅。大數(shù)據(jù)時(shí)代,誰來保護(hù)公民的個(gè)人隱私?既是每個(gè)人都應(yīng)當(dāng)思考的問題,也是政府部門不可推卸的責(zé)任。
挑戰(zhàn)二:數(shù)據(jù)挖掘分析模型建立
步入大數(shù)據(jù)時(shí)代,人們紛紛在談?wù)摯髷?shù)據(jù),似乎這已經(jīng)演化為新的潮流趨勢(shì)。數(shù)據(jù)比以往任何時(shí)候都更加根植于我們生活中的每個(gè)角落。我們?cè)噲D用數(shù)據(jù)去解決問題、改善福利,并且促成新的經(jīng)濟(jì)繁榮。人們紛紛流露出去大數(shù)據(jù)的高期待以及對(duì)大數(shù)據(jù)分析技術(shù)的格外看好。然而,關(guān)于大數(shù)據(jù)分析,人們鼓吹其神奇價(jià)值的喧囂聲浪很高,卻鮮見其實(shí)際運(yùn)用得法的模式和方法。造成這種窘境的原因主要有以下兩點(diǎn):一是對(duì)于大數(shù)據(jù)分析的價(jià)值邏輯尚缺乏足夠深刻的洞察;其次便是大數(shù)據(jù)分析中的某些重大要件或技術(shù)還不成熟。大數(shù)據(jù)時(shí)代下數(shù)據(jù)的海量增長以及缺乏這種大數(shù)據(jù)分析邏輯以及大數(shù)據(jù)技術(shù)的待發(fā)展,正是大數(shù)據(jù)時(shí)代下我們面臨的挑戰(zhàn)。
大數(shù)據(jù)的大,一般人認(rèn)為指的是它數(shù)據(jù)規(guī)模的海量。隨著人類在數(shù)據(jù)記錄、獲取及傳輸方面的技術(shù)革命,造成了數(shù)據(jù)獲得的便捷與低成本,這便使原有的以高成本方式獲得的描述人類態(tài)度或行為的、數(shù)據(jù)有限的小數(shù)據(jù)已然變成了一個(gè)巨大的、海量規(guī)模的數(shù)據(jù)包。這其實(shí)是一種片面認(rèn)識(shí)。其實(shí),前大數(shù)據(jù)時(shí)代也有海量的數(shù)據(jù)集,但由于其維度的單一,以及和人或社會(huì)有機(jī)活動(dòng)狀態(tài)的剝離,而使其分析和認(rèn)識(shí)真相的價(jià)值極為有限。大數(shù)據(jù)的真正價(jià)值不在于它的大,而在于它的全面:空間維度上的多角度、多層次信息的交叉復(fù)現(xiàn);時(shí)間維度上的與人或社會(huì)有機(jī)體的活動(dòng)相關(guān)聯(lián)的信息的持續(xù)呈現(xiàn)。
另外,要以低成本和可擴(kuò)展的方式處理大數(shù)據(jù),這就需要對(duì)整個(gè)IT架構(gòu)進(jìn)行重構(gòu),開發(fā)先進(jìn)的軟件平臺(tái)和算法。這方面,國外又一次走在我們前面。特別是近年來以開源模式發(fā)展起來的Hadoop等大數(shù)據(jù)處理軟件平臺(tái),及其相關(guān)產(chǎn)業(yè)已經(jīng)在美國初步形成。而我國數(shù)據(jù)處理技術(shù)基礎(chǔ)薄弱,總體上以跟隨為主,難以滿足大數(shù)據(jù)大規(guī)模應(yīng)用的需求。如果把大數(shù)據(jù)比作石油,那數(shù)據(jù)分析工具就是勘探、鉆井、提煉、加工的技術(shù)。我國必須掌握大數(shù)據(jù)關(guān)鍵技術(shù),才能將資源轉(zhuǎn)化為價(jià)值。應(yīng)該說,要邁過這道坎,開源技術(shù)為我們提供了很好的基礎(chǔ)。
因此,現(xiàn)在已經(jīng)有很多企業(yè)開始意識(shí)到,要想真正在Hadoop平臺(tái)上做數(shù)據(jù)分析、數(shù)據(jù)挖掘的應(yīng)用,有兩種選擇,要么就是匯聚一個(gè)懂?dāng)?shù)據(jù)、懂分析、懂編程又要有技巧的技術(shù)團(tuán)隊(duì)來操作,要么就是選擇某家商業(yè)公司推出的成熟的大數(shù)據(jù)平臺(tái)。
總而言之,目前盡管計(jì)算機(jī)智能化有了很大進(jìn)步,但還只能針對(duì)小規(guī)模、有結(jié)構(gòu)或類結(jié)構(gòu)的數(shù)據(jù)進(jìn)行分析,談不上深層次的數(shù)據(jù)挖掘,現(xiàn)有的數(shù)據(jù)挖掘算法在不同行業(yè)中還難以通用。
挑戰(zhàn)三:數(shù)據(jù)開放與隱私的權(quán)衡
數(shù)據(jù)應(yīng)用的前提是數(shù)據(jù)開放,這已經(jīng)是共識(shí)。有專業(yè)人士指出,中國人口居世界首位,但2010年中國新存儲(chǔ)的數(shù)據(jù)為250PB,僅為日本的60%和北美的7%。目前我國一些部門和機(jī)構(gòu)擁有大量數(shù)據(jù)但寧愿自己不用也不愿提供給有關(guān)部門共享,導(dǎo)致信息不完整或重復(fù)投資。2012年中國的數(shù)據(jù)存儲(chǔ)量達(dá)到64EB,其中55%的數(shù)據(jù)需要一定程度的保護(hù),然而目前只有不到一半的數(shù)據(jù)得到保護(hù)。
下面,我們來看一下美國在數(shù)據(jù)開放方面的做法。美國政府提供政策和經(jīng)費(fèi)保障,使數(shù)據(jù)信息中心群成為國家信息生產(chǎn)和服務(wù)基地,保障數(shù)據(jù)信息供給不斷,利用網(wǎng)絡(luò)把數(shù)據(jù)和信息最便捷、及時(shí)地送到包括科學(xué)家、政府職員、公司職員、學(xué)校師生在內(nèi)所有公民的桌上和家庭中,把全社會(huì)帶進(jìn)了信息化時(shí)代。
縱觀國內(nèi),我國政府、企業(yè)和行業(yè)信息化系統(tǒng)建設(shè)往往缺少統(tǒng)一規(guī)劃和科學(xué)論證,系統(tǒng)之間缺乏統(tǒng)一的標(biāo)準(zhǔn),形成了眾多“信息孤島”,而且受行政壟斷和商業(yè)利益所限,數(shù)據(jù)開放程度較低,以鄰為壑、共享難,這給數(shù)據(jù)利用造成極大障礙。制約我國數(shù)據(jù)資源開放和共享的一個(gè)重要因素是政策法規(guī)不完善,大數(shù)據(jù)挖掘缺乏相應(yīng)的立法,畢竟我國還沒有國家層面的專門適合數(shù)據(jù)共享的國家法律,只有相關(guān)的條例、法規(guī)、章程、意見等。無法既保證共享又防止濫用,一方面欠缺推動(dòng)政府和公共數(shù)據(jù)的政策,另一方面數(shù)據(jù)保護(hù)和隱私保護(hù)方面的制度不完善抑制了開放的積極性。因此,建立一個(gè)良性發(fā)展的數(shù)據(jù)共享生態(tài)系統(tǒng),是我國大數(shù)據(jù)發(fā)展需要邁過去的一道砍。
開放與隱私如何平衡,亦是一大難題。任何技術(shù)都是雙刃劍,大數(shù)據(jù)也不例外。如何在推動(dòng)數(shù)據(jù)全面開放、應(yīng)用和共享的同時(shí)有效地保護(hù)公民、企業(yè)隱私,逐步加強(qiáng)隱私立法,將是大數(shù)據(jù)時(shí)代的一個(gè)重大挑戰(zhàn)。
全社會(huì)開放與共享數(shù)據(jù)還很難,這讓數(shù)據(jù)質(zhì)量大打折扣。數(shù)據(jù)增值的關(guān)鍵在于整合,但自由整合的前提是數(shù)據(jù)的開放。在大數(shù)據(jù)的時(shí)代,開放數(shù)據(jù)的意義,不僅僅是滿足公民的知情權(quán),更在于讓大數(shù)據(jù)時(shí)代最重要的生產(chǎn)資料、生活數(shù)據(jù)自由地流動(dòng)起來,準(zhǔn)確全面應(yīng)用起來,以推動(dòng)知識(shí)經(jīng)濟(jì)和網(wǎng)絡(luò)經(jīng)濟(jì)的發(fā)展,促進(jìn)中國的經(jīng)濟(jì)增長由粗放型向精細(xì)型轉(zhuǎn)型升級(jí)。然而戰(zhàn)略觀念上的缺失、政府機(jī)構(gòu)協(xié)調(diào)困難、企業(yè)對(duì)數(shù)據(jù)共享的認(rèn)識(shí)不足及投入不夠、科學(xué)家對(duì)大數(shù)據(jù)的渴望無法滿足等都是大數(shù)據(jù)在當(dāng)前我國發(fā)展應(yīng)用中不得不面對(duì)的困難。
挑戰(zhàn)四:大數(shù)據(jù)管理與決策
大數(shù)據(jù)的技術(shù)挑戰(zhàn)顯而易見,但其帶來的決策挑戰(zhàn)更為艱巨。大數(shù)據(jù)至關(guān)重要的方面,就是它會(huì)直接影響組織怎樣作決策、誰來作決策。在信息有限、獲取成本高昂且沒有被數(shù)字化的時(shí)代,組織內(nèi)作重大決策的人,都是典型的位高權(quán)重的人,要不然就是高價(jià)請(qǐng)來的擁有專業(yè)技能和顯赫履歷的外部智囊。但是,在今時(shí)今日的商業(yè)世界中,高管的決策仍然更多地依賴個(gè)人經(jīng)驗(yàn)和直覺,而不是基于數(shù)據(jù)。
大數(shù)據(jù)開發(fā)的根本目的是以數(shù)據(jù)分析為基礎(chǔ),幫助人們做出更明智的決策,優(yōu)化企業(yè)和社會(huì)運(yùn)轉(zhuǎn)。哈佛商業(yè)評(píng)論說,大數(shù)據(jù)本質(zhì)上是“一場管理革命”。大數(shù)據(jù)時(shí)代的決策不能僅憑經(jīng)驗(yàn),而真正要“拿數(shù)據(jù)說話”。因此,大數(shù)據(jù)能夠真正發(fā)揮作用,深層次看,還要改善我們的管理模式,需要管理方式和架構(gòu)的與大數(shù)據(jù)技術(shù)工具相適配。這或許是我們最難邁過的一道坎了。
大數(shù)據(jù)應(yīng)用領(lǐng)域仍窄小,應(yīng)用費(fèi)用過高,制約大數(shù)據(jù)應(yīng)用。國內(nèi)能利用大數(shù)據(jù)背后產(chǎn)業(yè)價(jià)值的行業(yè)主要集中在金融、電信、能源、證券、煙草等超大型、壟斷型企業(yè),其他行業(yè)談大數(shù)據(jù)價(jià)值為時(shí)尚早。隨著企業(yè)內(nèi)部的資料量愈來愈大,日后大數(shù)據(jù)將成為IT支出中的主要因素,特別是數(shù)據(jù)儲(chǔ)存所耗費(fèi)的成本,很可能造成企業(yè)負(fù)擔(dān),甚至望而卻步。因此有遠(yuǎn)見的CIO必須預(yù)先做好準(zhǔn)備。
挑戰(zhàn)五:大數(shù)據(jù)人才缺口
如果說,以Hadoop為代表的大數(shù)據(jù)是一頭小象,那么企業(yè)必須有能夠馴服它的馴獸師。在很多企業(yè)熱烈擁抱這類大數(shù)據(jù)技術(shù)時(shí),精通大數(shù)據(jù)技術(shù)的相關(guān)人才也成為一個(gè)大缺口。
大數(shù)據(jù)建設(shè)的每個(gè)環(huán)節(jié)都需要依靠專業(yè)人員完成,因此,必須培養(yǎng)和造就一支懂指揮、懂技術(shù)、懂管理的大數(shù)據(jù)建設(shè)專業(yè)隊(duì)伍。
可以說,真正啟動(dòng)大數(shù)據(jù)在企業(yè)和社會(huì)的全面應(yīng)用,面臨的不僅僅是技術(shù)和工具問題,更重要的是要轉(zhuǎn)變經(jīng)營思維和組織架構(gòu),才能真正地挖掘這座大數(shù)據(jù)“金礦”。那么在大數(shù)據(jù)時(shí)代,我們要做哪些應(yīng)對(duì)之策,以握戰(zhàn)略制勝之點(diǎn)?
整合與開放是基石
大數(shù)據(jù)服務(wù)創(chuàng)業(yè)公司Connotate對(duì)800多名商業(yè)和IT主管進(jìn)行了調(diào)查。結(jié)果顯示,60%受調(diào)查者稱:“目前就說這些大數(shù)據(jù)投資項(xiàng)目肯定能夠帶來良好回報(bào)尚為時(shí)過早。”之所以如此,是由于當(dāng)前大數(shù)據(jù)缺乏必需的開放性:數(shù)據(jù)掌握在不同的部門和企業(yè)手中,而這些部門和企業(yè)并不愿意分享數(shù)據(jù)。大數(shù)據(jù)是通過研究數(shù)據(jù)的相關(guān)性來發(fā)現(xiàn)客觀規(guī)律,這依賴于數(shù)據(jù)的真實(shí)性和廣泛性,數(shù)據(jù)如何做到共享和開放,這是當(dāng)前大數(shù)據(jù)發(fā)展的軟肋和需要解決的大問題。
2012年美國大選,奧巴馬因數(shù)據(jù)整合而受益。在奧巴馬的競選團(tuán)隊(duì)中有一個(gè)神秘的數(shù)據(jù)挖掘團(tuán)隊(duì),他們通過對(duì)海量數(shù)據(jù)進(jìn)行挖掘幫助奧巴馬籌集到10億美元資金;他們通過數(shù)據(jù)挖掘使競選廣告投放效率提升了14%;他們通過制作“搖擺州”選民的詳細(xì)模型,每晚實(shí)施6.6萬次模擬選舉,推算奧巴馬在“搖擺州”的勝率,并以此來指導(dǎo)資源分配。奧巴馬競選團(tuán)隊(duì)相比羅姆尼競選團(tuán)隊(duì)最有優(yōu)勢(shì)的地方:對(duì)大數(shù)據(jù)的整合。奧巴馬的數(shù)據(jù)挖掘團(tuán)隊(duì)也意識(shí)到這個(gè)全世界共同的問題:數(shù)據(jù)分散在過多的數(shù)據(jù)庫中。因此,在前18個(gè)月,奧巴馬競選團(tuán)隊(duì)就創(chuàng)建了一個(gè)單一的龐大數(shù)據(jù)系統(tǒng),可以將來自民意調(diào)查者、捐資者、現(xiàn)場工作人員、消費(fèi)者數(shù)據(jù)庫、社交媒體,以及“搖擺州”主要的民主黨投票人的信息整合在一起,不僅能告訴競選團(tuán)隊(duì)如何發(fā)現(xiàn)選民并獲得他們的注意,還幫助數(shù)據(jù)處理團(tuán)隊(duì)預(yù)測哪些類型的人有可能被某種特定的事情所說服。正如競選總指揮吉姆·梅西納所說,在整個(gè)競選活中,沒有數(shù)據(jù)做支撐的假設(shè)很少存在。
2012年3月,美國奧巴馬政府宣布投資2億美元啟動(dòng)“大數(shù)據(jù)研究和發(fā)展計(jì)劃”,將“大數(shù)據(jù)研究”上升為國家意志。一個(gè)國家擁有數(shù)據(jù)的規(guī)模和運(yùn)用數(shù)據(jù)的能力將成為綜合國力的重要組成部分。國內(nèi)智慧城市建設(shè)目標(biāo)之一就是實(shí)現(xiàn)數(shù)據(jù)的集中共享。
因此,從社會(huì)、國家領(lǐng)域而言,我國亟須在國家層面對(duì)大數(shù)據(jù)給予高度重視,特別需要從政策制定、資源投入、人才培養(yǎng)等方面給予強(qiáng)有力的支持;另一方面,建立良性的大數(shù)據(jù)生態(tài)環(huán)境是有效應(yīng)對(duì)大數(shù)據(jù)挑戰(zhàn)、用好大數(shù)據(jù)的主要出路,需要科技界、工業(yè)界以及政府部門在國家政策的引導(dǎo)下共同努力,通過消除壁壘、成立聯(lián)盟、大數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)、建立專業(yè)組織等途徑,建立和諧的大數(shù)據(jù)生態(tài)系統(tǒng)。
力推合作共贏的商業(yè)模式
隨著云計(jì)算、大數(shù)據(jù)技術(shù)和相關(guān)商業(yè)環(huán)境的不斷成熟,越來越多的“軟件開發(fā)者”正在利用跨行業(yè)的大數(shù)據(jù)平臺(tái),打造創(chuàng)新價(jià)值的大數(shù)據(jù)應(yīng)用,而且這一門檻正在不斷降低。因?yàn)槭紫龋瑪?shù)據(jù)擁有者能夠以微乎其微的成本獲取額外的收入,提高利潤水平;其次,大數(shù)據(jù)設(shè)備廠商需要應(yīng)用來吸引消費(fèi)者購買設(shè)備,發(fā)展合作共贏的伙伴關(guān)系勢(shì)必比單純銷售設(shè)備要有利可圖,一些具有遠(yuǎn)見的廠商已經(jīng)開始通過提供資金、技術(shù)支持、入股等方式來扶持這些“軟件開發(fā)者”;第三,行業(yè)細(xì)分市場的數(shù)據(jù)分析應(yīng)用需求在不斷加大,對(duì)于整個(gè)大數(shù)據(jù)產(chǎn)業(yè)鏈來說,創(chuàng)新型的行業(yè)數(shù)據(jù)應(yīng)用開發(fā)者必將是未來整個(gè)大數(shù)據(jù)產(chǎn)業(yè)鏈中最為活躍的部分。
未來,有三種企業(yè)將在”大數(shù)據(jù)產(chǎn)業(yè)鏈“中處于重要地位:掌握海量有效數(shù)據(jù)的企業(yè),有著強(qiáng)大數(shù)據(jù)分析能力的企業(yè),以及創(chuàng)新的“軟件開發(fā)者”。社交網(wǎng)絡(luò)、移動(dòng)互聯(lián)網(wǎng)、信息化企業(yè)、電信運(yùn)營商都是海量數(shù)據(jù)的制造者,F(xiàn)acebook公司手中掌握著8.5億用戶,淘寶注冊(cè)用戶超過3.7億,騰訊的微信用戶突破3億,這些龐大用戶群所提供的數(shù)據(jù),正在等待時(shí)機(jī)釋放出巨大商業(yè)能量??梢灶A(yù)測,在不久的將來,F(xiàn)acebook、騰訊、電信運(yùn)營商等海量數(shù)據(jù)持有者或者自我延伸成為數(shù)據(jù)分析提供商,或者與IBM、ZTE等企業(yè)密切對(duì)接成為上下游合作企業(yè),大數(shù)據(jù)產(chǎn)業(yè)鏈將在某個(gè)爆發(fā)時(shí)點(diǎn)到來之際,以令人驚訝的速度成長壯大。
大數(shù)據(jù)的殺傷力需防患于未然
大數(shù)據(jù)時(shí)代,傳統(tǒng)的隨機(jī)抽樣被“所有數(shù)據(jù)的匯攏”所取代,人們的思維決斷模式,已可直接根據(jù)“是什么”來下結(jié)論,由于這樣的結(jié)論剔除了個(gè)人情緒、心理動(dòng)機(jī)、抽樣精確性等因素的干擾,因此將更精確、更有預(yù)見性。不過,由于大數(shù)據(jù)過于依靠數(shù)據(jù)的匯集,一旦數(shù)據(jù)本身有問題,就很可能出現(xiàn)“災(zāi)難性大數(shù)據(jù)”,即因?yàn)閿?shù)據(jù)本身的問題,而導(dǎo)致錯(cuò)誤的預(yù)測和決策。
大數(shù)據(jù)的理論是“在稻草堆里找一根針”,而如果“所有稻草看上去都挺像那根針”呢?過多但無法辨析真?zhèn)魏蛢r(jià)值的信息和過少的信息一樣,對(duì)于需要作出瞬間判斷、一旦判斷出錯(cuò)就很可能造成嚴(yán)重后果的情況而言,同樣是一種危害。“大數(shù)據(jù)”理論是建立在“海量數(shù)據(jù)都是事實(shí)”的基礎(chǔ)上,而如果數(shù)據(jù)提供者造假呢?這在大數(shù)據(jù)時(shí)代變得更有害,因?yàn)槿藗儫o法控制數(shù)據(jù)提供者和搜集者本人的偏見。擁有最完善數(shù)據(jù)庫、最先接受“大數(shù)據(jù)”理念的華爾街投行和歐美大評(píng)級(jí)機(jī)構(gòu),卻每每在重大問題上判斷出錯(cuò),這本身就揭示了“大數(shù)據(jù)”的局限性。
不僅如此,大數(shù)據(jù)時(shí)代造就了一個(gè)數(shù)據(jù)庫無所不在的世界,數(shù)據(jù)監(jiān)管部門面臨前所未有的壓力和責(zé)任:如何避免數(shù)據(jù)泄露對(duì)國家利益、公眾利益、個(gè)人隱私造成傷害?如何避免信息不對(duì)等,對(duì)困難群體的利益構(gòu)成傷害?在有效控制風(fēng)險(xiǎn)之前,也許還是讓“大數(shù)據(jù)”繼續(xù)待在籠子里更好一些。
大數(shù)據(jù)的經(jīng)濟(jì)價(jià)值已經(jīng)被人們認(rèn)可,大數(shù)據(jù)的技術(shù)正逐漸成熟,一旦完成數(shù)據(jù)的整合和監(jiān)管,大數(shù)據(jù)爆發(fā)的時(shí)代即將到來。我們現(xiàn)在要做的,就是選好自己的方向,為迎接大數(shù)據(jù)的到來,提前做好準(zhǔn)備。
以未來的視角看,無論是政府、互聯(lián)網(wǎng)公司、IT企業(yè)還是行業(yè)用戶,只要我們以開放的心態(tài)、創(chuàng)新的勇氣擁抱“大數(shù)據(jù)”,大數(shù)據(jù)時(shí)代就一定有屬于中國的機(jī)會(huì)。
大數(shù)據(jù)人才培養(yǎng)迫在眉睫
大數(shù)據(jù)相關(guān)人才的欠缺將會(huì)成為影響大數(shù)據(jù)市場發(fā)展的一個(gè)重要因素。據(jù)Gartner預(yù)測,到2015年,全球?qū)⑿略?40萬個(gè)與大數(shù)據(jù)相關(guān)的工作崗位,且會(huì)有25%的組織設(shè)立首席數(shù)據(jù)官職位。大數(shù)據(jù)的相關(guān)職位需要的是復(fù)合型人才,能夠?qū)?shù)學(xué)、統(tǒng)計(jì)學(xué)、數(shù)據(jù)分析、機(jī)器學(xué)習(xí)和自然語言處理等多方面知識(shí)綜合掌控。未來,大數(shù)據(jù)將會(huì)出現(xiàn)約100萬的人才缺口,在各個(gè)行業(yè)和領(lǐng)域,大數(shù)據(jù)中高端人才都會(huì)成為最炙手可熱的人才,涵蓋了大數(shù)據(jù)的工程師、規(guī)劃師、分析師、架構(gòu)師、應(yīng)用師等多個(gè)細(xì)分領(lǐng)域和專業(yè)。因此需要社會(huì)、高校和企業(yè)共同努力去培養(yǎng)和挖掘。企業(yè)可以與學(xué)校聯(lián)合培養(yǎng)人才,或建立專門的數(shù)據(jù)科學(xué)家團(tuán)隊(duì),或與專業(yè)的數(shù)據(jù)處理公司合作,以解人才之急。
當(dāng)大數(shù)據(jù)被討論得熱火朝天時(shí),我們更需要冷靜地思考,如何讓技術(shù)扎實(shí)而有效地落地。雖然距離大數(shù)據(jù)時(shí)代我們還有很長的路要走,但正象孫正義昨天在烏鎮(zhèn)演講時(shí)最后說的:“我想說的是,我們要有信心,中國幾年后將成為世界最大的經(jīng)濟(jì)體,人類的未來將充滿了機(jī)遇,會(huì)充滿了很多的快樂,有很多的光明憧憬等待著我們”。