商業(yè)世界誕生的那一天起,人們就不斷意識到,運營過程中產(chǎn)生的副產(chǎn)品,往往會有其他人樂意花錢買下它,一個有利可圖的新業(yè)務產(chǎn)生了。
有數(shù)不清這樣的例子:賣豆腐腦的攤主順便售賣豆?jié){;玉米磨坊主長期賣出的“麥片”是給牲畜吃的玉米粉和玉米油后的剩余料;石油公司定期賣出提煉過程的副產(chǎn)品氫氣……正如在“大數(shù)據(jù)”這個詞出現(xiàn)之前,很多時候,數(shù)據(jù)的出現(xiàn)只是伴隨科技進步而產(chǎn)生的免費副產(chǎn)品。就像醫(yī)院為了病人就診的便利,建設了掛號系統(tǒng),從而得到了海量的醫(yī)療信息,這就是技術進步所帶來的副產(chǎn)品——數(shù)據(jù)增量。
而今天,幾乎所有行業(yè)的所有公司,都在產(chǎn)生這種極有價值的副產(chǎn)品:數(shù)據(jù)。我們可以通過數(shù)據(jù)了解一些截然不同的東西,但遺憾的是,很少有公司能真正利用數(shù)據(jù)創(chuàng)造價值。
難點何在?究其原因,是人們在大數(shù)據(jù)處理和應用方面,常常會跌入一些錯誤的邏輯中去。
貪婪:對數(shù)據(jù)無止境的收集
大數(shù)據(jù)產(chǎn)業(yè)剛剛經(jīng)歷了爆發(fā)的初期,很多公司將他們的數(shù)據(jù)當作傳世皇冠一樣捍衛(wèi),紛紛“跑馬圈地”,或憑借傳統(tǒng)優(yōu)勢搶占某一應用領域的“山頭”,或積極布局試圖壟斷某些數(shù)據(jù)資源的入口,產(chǎn)業(yè)秩序尚未建立完全。
大數(shù)據(jù)產(chǎn)業(yè)可以說是一種“資源型產(chǎn)業(yè)”。據(jù)統(tǒng)計,2016年1月至2016年10月底,中國大數(shù)據(jù)行業(yè)有184家企業(yè)獲得投融資,占有的數(shù)據(jù)資源量是資本對大數(shù)據(jù)公司估值的最重要依據(jù)之一。行業(yè)內的大數(shù)據(jù)公司,紛紛將目光集中在了如何獲取數(shù)據(jù)資源方面。
顯然,對數(shù)據(jù)源的重視,在前期數(shù)據(jù)池的擴充方面具有正面效應,但是,因此大量誕生的依托數(shù)據(jù)資源優(yōu)勢的企業(yè),也為大數(shù)據(jù)產(chǎn)業(yè)帶來了低附加值的壟斷經(jīng)濟模式,使得更多依靠技術壁壘打江山的企業(yè)不得不面對缺少“原材料”失敗的可能。
而對于那些主營業(yè)務并非數(shù)據(jù)源的公司來說,即使那些看起來可能對你的業(yè)務毫無關聯(lián)、沒有產(chǎn)出的數(shù)據(jù),也很少有公司去考慮“賣掉”它,寧可閑置不用也不去售賣,從而轉換為有利可圖的新服務項目。
售賣的關鍵在于識別那些不是競爭者的公司——在相關領域運營,但并不是正面競爭的邊際業(yè)務。如豐田就開創(chuàng)了一項新業(yè)務,就是利用它在日本賣出的車里安裝的GPS定位設備,捕捉車的速度和位置,再將其以每月2000美金的價格交通數(shù)據(jù)賣給市政規(guī)劃部門,幫助改善交通問題,并通過數(shù)據(jù)結果,整合自己公司的發(fā)貨渠道。
歸根結底,數(shù)據(jù)資源打通難是因為行業(yè)缺乏國家層面的統(tǒng)籌規(guī)劃,缺乏在生產(chǎn)環(huán)節(jié)解決數(shù)據(jù)權屬等核心問題的規(guī)則和制度。如何才能以開放的視野打破數(shù)據(jù)孤島,實現(xiàn)數(shù)據(jù)變現(xiàn)?仍需要在數(shù)據(jù)資源層面形成統(tǒng)一的行業(yè)共識和行為規(guī)范,引導產(chǎn)業(yè)走向以資源、技術、應用綜合發(fā)展為導向的良性發(fā)展模式。
麻木:非法數(shù)據(jù)交易猖獗
以國有數(shù)據(jù)資源和公共數(shù)據(jù)資源為主、看得見的數(shù)據(jù),像冰塊一樣凝結不動,而地下數(shù)據(jù)交易黑市規(guī)模坐大,針對用戶信息的非法收集、竊取、販賣和利用行為猖獗,甚至形成一條龍式的產(chǎn)業(yè)鏈形態(tài)。
在國內,數(shù)據(jù)交易流通產(chǎn)業(yè)規(guī)模逼近百億產(chǎn)值。百度、騰訊、阿里、京東等互聯(lián)網(wǎng)巨頭紛紛切入數(shù)據(jù)交易和數(shù)據(jù)服務市場,啟動了百度API、騰訊云、阿里云、京東萬象等大型數(shù)據(jù)交易和數(shù)據(jù)服務平臺,已經(jīng)匯集的數(shù)據(jù)供應商超過500 余家,數(shù)據(jù)交易流通超過每天百億次。北京、貴州、河北、上海、武漢等地方政府,建立了政府數(shù)據(jù)開放、數(shù)據(jù)資產(chǎn)管理、本地數(shù)據(jù)流通為目標的區(qū)域數(shù)據(jù)交易市場,而未納入公開市場的數(shù)據(jù)流通,更是體量巨大,整個數(shù)據(jù)流通產(chǎn)業(yè)如火如荼。
隨著數(shù)據(jù)交易平臺的大量涌現(xiàn)和數(shù)據(jù)流通交易產(chǎn)業(yè)的變現(xiàn)模式為全社會所認知,在利益誘導和監(jiān)管缺失的情況下,大數(shù)據(jù)的流通交易面臨的問題也愈發(fā)凸顯:數(shù)據(jù)侵權、數(shù)據(jù)竊取、非法數(shù)據(jù)使用、非法數(shù)據(jù)買賣已成為行業(yè)亂象,并呈現(xiàn)失控態(tài)勢。大數(shù)據(jù)的流通交易中的這些問題不僅僅嚴重損害了國家安全、企業(yè)合法利益、個人隱私、數(shù)據(jù)價值挖掘等方面,更在實質上阻礙了大數(shù)據(jù)產(chǎn)業(yè)的整體發(fā)展。2015 年以來,電信詐騙、數(shù)據(jù)泄漏、非法倒賣案件頻發(fā),個人身份信息等用戶數(shù)據(jù)的泄露,使得違法人員能夠使用大數(shù)據(jù)實現(xiàn)精準詐騙;微博數(shù)據(jù)、各類論壇數(shù)據(jù)等被非法獲取導致用戶社交關系泄露;企業(yè)積累數(shù)據(jù)被二次倒賣致使經(jīng)濟利益受損。
2016年8月,山東考生徐玉玉因為隱私泄露導致被詐騙后身亡;同年12月,“京東用戶數(shù)據(jù)泄漏”事件,包括用戶名、密碼、郵箱、QQ號、電話號碼、身份證等多個維度、數(shù)千萬條數(shù)據(jù)被倒賣,引發(fā)社會對信息安全的緊張情緒劇增。
如何對流通的數(shù)據(jù)構建監(jiān)管、追溯、標識體系,建立行業(yè)秩序和標準化行為模式,打擊非法數(shù)據(jù)流通,保護企業(yè)、個人利益,維護行業(yè)健康發(fā)展,已經(jīng)迫在眉睫。
盲從:用“巨量”掩蓋個性化
在大數(shù)據(jù)時代,個人的信息更多的是以數(shù)據(jù)為載體來進行互動的。海量的數(shù)據(jù)在為研究和分析社會現(xiàn)象帶來便利的同時,實際上也掩蓋了許多具有個性特征的數(shù)據(jù)的意義,許多本身具有個性特征的數(shù)據(jù)已經(jīng)變得無足輕重了。
大數(shù)據(jù)簡化了人們對數(shù)據(jù)差異性的認知。大數(shù)據(jù)的復雜性不僅在于其數(shù)據(jù)樣本巨量,更在于其多源異構、多實體和多空間之間的交互動態(tài)性。當前,只有少數(shù)人掌握處理這種復雜的巨量化大數(shù)據(jù)的技術,這很容易導致“數(shù)據(jù)暴力”。
所有數(shù)據(jù)說到底,都是關于個體的呈現(xiàn)。因此,其中所蘊含著各異的社會文化價值,是更加需要我們了解和掌握的內容。數(shù)據(jù)來源于社會又作用于社會。無論是可以數(shù)字化的數(shù)據(jù)還是不可數(shù)字化的數(shù)據(jù),其比較、分析和歸納,其實反映的都是人在符號層面上的一種互動。
如果脫離了人及其所在社會的價值本性,無限放大巨量大數(shù)據(jù)的效應及其影響力,而忽視人性的本質,就可能本末倒置,最終產(chǎn)生許多難以預期的后果。
分歧:在“因果性”和“相關性”中走極端
數(shù)據(jù)的本質,是快速讓大家知道發(fā)生了什么事,只有降低成本,把簡單數(shù)據(jù)簡單化或者復雜化分析,快速變成結果去變現(xiàn),大數(shù)據(jù)公司才能活下去。
在一場變革或者技術的初期,需要找到最簡單、甚至看起來很粗糙的方式發(fā)揮出它的效能。當然,這也還跟現(xiàn)在數(shù)據(jù)量、數(shù)據(jù)化和數(shù)據(jù)保存以及剖析工具等錯綜復雜的因素有關,利用這樣的相關性關系研究,把數(shù)據(jù)里面的金子挖出來,或者利用相關性,預防或促成某些結果的發(fā)生。我們需要一定的速度,應對信息社會“數(shù)據(jù)爆炸”和諸多涌現(xiàn)出來的“復雜性”很高的問題,然后才是對其過程和背后原由的探詢。
對因果性的執(zhí)著,強調更多是個體甚至人類整體的記憶,或者經(jīng)驗、規(guī)律性等條件,必須從“人”的態(tài)度才能理解的,因果是“自然的人化”。而做大數(shù)據(jù)的,最怕聽到去解釋“為什么”,因為大數(shù)據(jù)能做到最真實情況的還原,就已經(jīng)很難了,數(shù)據(jù)噪音太大,現(xiàn)實市場狀況往往是混亂的,嘗試去找出項目成敗的因果關系,實際上是沒有必要的。大數(shù)據(jù)的作用是趨勢判斷,而不是找出因果。
草率:數(shù)據(jù)共享陷阱難以跨越
當前,國內大數(shù)據(jù)行業(yè)的應用市場呈現(xiàn)政府牽頭的明顯趨勢,各級政府部門、公安、交通、鐵路、金融等各行業(yè)龍頭機構對數(shù)據(jù)開放、共享、應用的日益重視,逐漸形成了中國特色的大數(shù)據(jù)應用市場。
眾所周知,由于政府各部門各自主導的信息系統(tǒng)設計上,先天開放共享的條件就不足,加上部門管理體制原因,信息孤島、數(shù)據(jù)壁壘現(xiàn)象普遍。然而,大數(shù)據(jù)、信息化項目普遍存在涉及部門多、推進難度大、“一把手工程”現(xiàn)象,同時項目周期長、投資規(guī)模大、直接經(jīng)濟效益不顯著,使得政府部門更傾向于追求短期效果而非長期利益,使得大數(shù)據(jù)項目建設如火如荼,核心政府數(shù)據(jù)資源的匯聚卻沒有真正實現(xiàn)。
此外,在有些政府企業(yè)PPP(Public-Private Partnership)合作模式中,由于沒有約定合理的數(shù)據(jù)資產(chǎn)歸屬權和政府資本退出機制,導致政府重要數(shù)據(jù)資源過早變現(xiàn)或廉價變現(xiàn),國有資產(chǎn)流失到社會,公共數(shù)據(jù)資源沒有經(jīng)過高技術、高附加值的處理而野蠻開放。
政府及行業(yè)客戶對大數(shù)據(jù)需求不斷增長,但數(shù)據(jù)資源的封閉與過度開發(fā)現(xiàn)象并存,一方面使得部分機構陷入大數(shù)據(jù)項目沒有真正有效利用數(shù)據(jù)的“數(shù)據(jù)共享陷阱”;另一方面,為了籌措項目資金,政府高融資、高負債、高擔?,F(xiàn)象嚴重,一旦項目實際應用效果不佳,容易誘發(fā)政府債務危機等問題。
主觀:數(shù)據(jù)人才缺失嚴重
國家十三五規(guī)劃綱要中明確提出:“實施國家大數(shù)據(jù)戰(zhàn)略,推進數(shù)據(jù)資源開放共享”,在這樣的契機下,大數(shù)據(jù)領域必將迎來建設高峰和投資良機。而推動大數(shù)據(jù)發(fā)展不僅依靠國家戰(zhàn)略與相關政策的支持,更需要大數(shù)據(jù)相關人才的支撐。而當前制約大數(shù)據(jù)發(fā)展的瓶頸之一,也在于大數(shù)據(jù)人才的極度緊缺。
教育部分別于2016年2月和9月公布新增大數(shù)據(jù)本科和專科專業(yè),國內高校紛紛成立大數(shù)據(jù)研究機構或大數(shù)據(jù)學院。然而,僅僅依靠體制內是遠遠難以滿足我國大數(shù)據(jù)產(chǎn)業(yè)對人才需求的。首先,體制內培養(yǎng)人才尚屬起步和探索階段,人才培養(yǎng)需要3-4年的周期,體制內向產(chǎn)業(yè)界規(guī)模性輸送大數(shù)據(jù)人才大約在2019年到2020年;其次,體制內的招生受到名額限制,現(xiàn)有體制下的招生名額遠遠低于市場需求;最后,正如北京大數(shù)據(jù)研究院院長鄂維南院士所提到的,國內大數(shù)據(jù)學科的發(fā)展依然比較落后。“這種落后是多方面的,不僅是觀念上的落后,還包括培養(yǎng)體系上的落后。舉個例子,大數(shù)據(jù)分析涉及到的最重要的兩塊是統(tǒng)計和算法。而要讓做統(tǒng)計的老師重視算法,讓做算法的老師關注數(shù)據(jù),這需要時間和努力。”
可以說,大數(shù)據(jù)的人才培養(yǎng)是全程實踐性的,需要以數(shù)據(jù)為核心、以問題為導向開始實踐性教學,這也意味著必須在大數(shù)據(jù)人才培養(yǎng)上進行創(chuàng)新和改革,加強體制外大數(shù)據(jù)人才的培養(yǎng),把人才教育、科研創(chuàng)新和市場化、產(chǎn)業(yè)化結合在一起,否則培養(yǎng)的人才可能會和市場需求脫節(jié)。
客觀:數(shù)據(jù)價值不易標準化
2015到2016年,不少地方政府主導成立了數(shù)據(jù)交易所,一些商業(yè)化的數(shù)據(jù)交易平臺也上線運營,但目前基于數(shù)據(jù)的全新商業(yè)模式依然還處在探索的初級階段,數(shù)據(jù)的商業(yè)化仍面臨諸多挑戰(zhàn),如應用場景和價值不易標準化,從而引發(fā)數(shù)據(jù)定價及資產(chǎn)評估難的問題。
數(shù)據(jù)與工業(yè)時代的商品有截然不同的屬性,工業(yè)時代的商品是實體物品為主,基于一定成本的原料生產(chǎn)后,基于工廠相對標準化的大規(guī)模生產(chǎn)模式生產(chǎn)出來,其商品經(jīng)歷了上百年的發(fā)展之后,已經(jīng)形成了大家都認同的標準化定價模式,比如基于物權的定價模式,是由成本加上品牌定價決定。
而目前的數(shù)據(jù)應用水平和程度有限,數(shù)據(jù)標準化程度很低,無法按照傳統(tǒng)的商品銷售模式進行銷售。數(shù)據(jù)的權屬問題還是個大難題,傳統(tǒng)物權、知識產(chǎn)權等都存在不適用的部分,同時數(shù)據(jù)產(chǎn)生的邊界成本基本為零,因此,目前從數(shù)據(jù)加工的成本和基于數(shù)據(jù)加工衍生出的服務出發(fā),總體規(guī)模和盈利模式都遠不成熟。