我國高度重視大數(shù)據(jù)的戰(zhàn)略意義和數(shù)據(jù)資源對社會經(jīng)濟發(fā)展的積極作用,國務(wù)院于2015年出臺了《促進大數(shù)據(jù)發(fā)展行動綱要》,并將“實施國家大數(shù)據(jù)戰(zhàn)略,推進數(shù)據(jù)資源開放共享”納入“十三五”期間規(guī)劃和建設(shè)的重要目標。目前國內(nèi)大數(shù)據(jù)產(chǎn)業(yè)發(fā)展已初具規(guī)模,但尚未形成產(chǎn)業(yè)界定共識。本文首先就大數(shù)據(jù)產(chǎn)業(yè)的核心要素進行探討,然后從核心要素展開闡述我國大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的若干特點,最后結(jié)合發(fā)展現(xiàn)狀和問題提出相關(guān)策略建議。
一、大數(shù)據(jù)產(chǎn)業(yè)的核心要素
普遍意義上來講,大數(shù)據(jù)產(chǎn)業(yè)是以數(shù)據(jù)及數(shù)據(jù)所蘊含的信息價值為核心資源所構(gòu)成的生態(tài)環(huán)境,它包含了與大數(shù)據(jù)管理和價值實現(xiàn)相關(guān)的企業(yè)、行業(yè)機構(gòu)等社會主體的經(jīng)濟活動集合。遵照產(chǎn)業(yè)定義的通用原則,產(chǎn)業(yè)各環(huán)節(jié)的參與實體應(yīng)能夠提供可交付的產(chǎn)品和服務(wù),并形成上下游產(chǎn)業(yè)鏈供需關(guān)系。在此基礎(chǔ)上,依據(jù)數(shù)據(jù)價值的提升路徑和IT領(lǐng)域的產(chǎn)品布局,我們將大數(shù)據(jù)產(chǎn)業(yè)的核心要素歸納為數(shù)據(jù)資源、數(shù)據(jù)基礎(chǔ)能力、數(shù)據(jù)分析和展示、數(shù)據(jù)應(yīng)用幾個重要組成部分。
圖1.大數(shù)據(jù)產(chǎn)業(yè)核心要素示意圖①
其中,數(shù)據(jù)資源部分負責原始數(shù)據(jù)的供給和交換,是數(shù)據(jù)資產(chǎn)作為生產(chǎn)要素的直接表現(xiàn),根據(jù)數(shù)據(jù)來源的不同,可以細分為數(shù)據(jù)資源提供者和數(shù)據(jù)交易平臺兩種角色;數(shù)據(jù)基礎(chǔ)能力部分負責與數(shù)據(jù)生產(chǎn)加工相關(guān)的基礎(chǔ)設(shè)施和技術(shù)要素供應(yīng),為數(shù)據(jù)加工和價值提升提供生產(chǎn)工具,主要包括數(shù)據(jù)存儲、數(shù)據(jù)處理和數(shù)據(jù)庫等多個角色;數(shù)據(jù)分析和展示部分負責數(shù)據(jù)隱含價值的挖掘、數(shù)據(jù)關(guān)聯(lián)分析和可視化展現(xiàn)等,是智力要素在數(shù)據(jù)價值中的集中體現(xiàn),包括傳統(tǒng)意義上的BI、可視化和通用數(shù)據(jù)分析工具,以及面向非結(jié)構(gòu)化數(shù)據(jù)提供的語音、圖像等媒體識別服務(wù);數(shù)據(jù)應(yīng)用部分根據(jù)數(shù)據(jù)分析和加工的結(jié)果,面向電商、金融、交通等細分行業(yè)提供精準營銷、信用評估、出行引導(dǎo)等企業(yè)或公眾服務(wù)。
二、我國大數(shù)據(jù)產(chǎn)業(yè)發(fā)展現(xiàn)狀和特點
自2013年大數(shù)據(jù)的概念迅速普及,國內(nèi)大數(shù)據(jù)領(lǐng)域在電信、互聯(lián)網(wǎng)、金融、電商等信息化領(lǐng)先行業(yè)的引導(dǎo)和帶動下,聚集了BAT等龍頭企業(yè)和數(shù)百家中小及初創(chuàng)企業(yè),在大數(shù)據(jù)產(chǎn)業(yè)的主要環(huán)節(jié)完成了初步布局,產(chǎn)品和服務(wù)供應(yīng)鏈能夠滿足基本數(shù)據(jù)生產(chǎn)加工的全生命周期覆蓋。經(jīng)過兩三年的持續(xù)發(fā)展,我國的大數(shù)據(jù)產(chǎn)業(yè)呈現(xiàn)出以下幾個發(fā)展特點。
數(shù)據(jù)資源層,開放主體集中在信息化基礎(chǔ)較好行業(yè)及地區(qū),并呈現(xiàn)服務(wù)化趨勢。隨著大數(shù)據(jù)產(chǎn)業(yè)中數(shù)據(jù)資源參與主體的逐漸增多,我國的數(shù)據(jù)開放程度得到了普遍提升。一方面,數(shù)據(jù)開放的主體集中在部分信息化基礎(chǔ)較好行業(yè)及經(jīng)濟發(fā)達地區(qū),如互聯(lián)網(wǎng)、交通出行、教育科研行業(yè)等,都出現(xiàn)了相應(yīng)的數(shù)據(jù)開放企業(yè)和平臺。政府推動的公共信息資源開放網(wǎng)站也主要由信息經(jīng)濟較發(fā)達地區(qū)先行先試,并逐漸向周邊省市輻射擴散。另一方面,第三方數(shù)據(jù)交易平臺不斷涌現(xiàn),填補了居間服務(wù)的市場空白。目前全國范圍內(nèi)已建成及正在籌建的地方數(shù)據(jù)交易機構(gòu)達到十余家。一些早期的數(shù)據(jù)交易平臺逐漸從單一的居間服務(wù)商向數(shù)據(jù)資源綜合服務(wù)商轉(zhuǎn)型。
數(shù)據(jù)基礎(chǔ)能力層,參與主體基本完成云時代向數(shù)據(jù)時代的轉(zhuǎn)型升級。隨著大規(guī)模數(shù)據(jù)存儲和處理能力需求的快速增長,以BAT、華為、浪潮等為代表的云計算服務(wù)提供商,根據(jù)自身的原始積累和優(yōu)勢資源完成向數(shù)據(jù)驅(qū)動企業(yè)的戰(zhàn)略轉(zhuǎn)型。百度憑借其長期積累的用戶搜索記錄推出了百度數(shù)據(jù)開放平臺,通過百度搜索服務(wù)提供“即搜即得”的高效數(shù)據(jù)展現(xiàn)。阿里云從基礎(chǔ)的彈性資源供給逐漸擴展服務(wù)類型,研發(fā)并提供了支持PB級數(shù)據(jù)存儲的分布式關(guān)系型數(shù)據(jù)庫(PetaData)等一系列數(shù)據(jù)支撐產(chǎn)品。華為的分布式存儲管理系統(tǒng)FusionStorage為異構(gòu)海量數(shù)據(jù)的存儲管理提供了彈性可擴展的技術(shù)保障。
數(shù)據(jù)分析以及應(yīng)用層,中小和初創(chuàng)企業(yè)積極占領(lǐng)戰(zhàn)略高地。由于缺失原始數(shù)據(jù)資產(chǎn)和先期市場份額,中小企業(yè),特別是初創(chuàng)企業(yè)集中布局在數(shù)據(jù)分析和數(shù)據(jù)應(yīng)用等低基礎(chǔ)產(chǎn)業(yè)環(huán)節(jié),投融資形勢異?;鸨?。據(jù)中關(guān)村數(shù)據(jù)產(chǎn)業(yè)聯(lián)盟統(tǒng)計數(shù)據(jù)顯示,中關(guān)村從事數(shù)據(jù)分析和數(shù)據(jù)應(yīng)用的企業(yè)合計超過110家,占總數(shù)2/3以上。投融資方面,據(jù)不完全統(tǒng)計2015年在國內(nèi)融資的大數(shù)據(jù)創(chuàng)業(yè)公司超過50家,總?cè)谫Y金額超過50億人民幣,其中從事數(shù)據(jù)分析和行業(yè)數(shù)據(jù)應(yīng)用的創(chuàng)業(yè)公司近40家,占75%以上。2016年上半年,數(shù)據(jù)分析和應(yīng)用兩個領(lǐng)域的創(chuàng)業(yè)公司融資情況占據(jù)了主流,數(shù)量為17家,占比達到70%。
此外,硬件和軟件相互滲透的兩種商業(yè)模式并舉并行,為大數(shù)據(jù)產(chǎn)業(yè)帶來新機遇。為了更廣泛地覆蓋數(shù)據(jù)生產(chǎn)加工流程,延長其產(chǎn)品和服務(wù)在數(shù)據(jù)生命周期中的作用范圍,大數(shù)據(jù)產(chǎn)業(yè)的參與企業(yè)逐漸打破硬件和軟件的產(chǎn)品界限,形成了“硬件帶動軟件”和“軟件帶動硬件”兩種新型商業(yè)模式。浪潮推出的SmartRack系列整機柜服務(wù)器,針對深度學(xué)習(xí)應(yīng)用、社交數(shù)據(jù)存儲、熱數(shù)據(jù)處理等不同數(shù)據(jù)處理場景制定了多種混搭架構(gòu)方案,以一體機的方式實現(xiàn)硬件設(shè)施和軟件管理的集成交付。阿里巴巴發(fā)布的數(shù)加平臺率先探索以“軟件帶動硬件”的市場營銷模式,該平臺通過提供數(shù)據(jù)計算引擎、機器學(xué)習(xí)等開放服務(wù),將阿里云的計算、存儲等多種資源有機地組織在一起形成解決方案,有效擴展阿里云在實際生產(chǎn)環(huán)境中的部署推廣途徑。
三、我國大數(shù)據(jù)產(chǎn)業(yè)發(fā)展建議
把握源頭,強化數(shù)據(jù)質(zhì)量管理。目前數(shù)據(jù)資源開放在開放范圍、開發(fā)利用方式、數(shù)據(jù)可用性等方面仍存在局限性和不足。截止2016年5月,全國共有九個省份/直轄市開通了區(qū)域級數(shù)據(jù)開放網(wǎng)站。雖然與去年同期相比,平臺數(shù)量有所增加,但大多數(shù)地區(qū)仍面臨數(shù)據(jù)開放格式不一致、可機讀性較差,更新頻率較低等現(xiàn)實問題。部分地方或第三方數(shù)據(jù)交易平臺在流通效率、質(zhì)量管理方面良莠不齊,特別是不同行業(yè)數(shù)據(jù)維度不統(tǒng)一、語義不協(xié)同等共性問題制約了交易市場的規(guī)模化發(fā)展。為推動大數(shù)據(jù)產(chǎn)業(yè)發(fā)展,需要進一步把握好數(shù)據(jù)源頭,推動各方不斷加強自身數(shù)據(jù)能力建設(shè),做優(yōu)存量、做大增量,加快完善相關(guān)配套措施確保隱私和信息安全。同時鼓勵參與主體共同推動數(shù)據(jù)標準化進程,健全數(shù)據(jù)交易規(guī)范,探索數(shù)據(jù)資產(chǎn)定價機制,以各行業(yè)多樣化應(yīng)用需求撬動數(shù)據(jù)交易市場巨大發(fā)展?jié)摿Α?/p>
細化分工,關(guān)注數(shù)據(jù)技術(shù)過渡領(lǐng)域。與美國等數(shù)據(jù)產(chǎn)業(yè)發(fā)達國家相比,我國大數(shù)據(jù)產(chǎn)業(yè)的短板仍較明顯,數(shù)據(jù)加工處理服務(wù)、數(shù)據(jù)庫技術(shù)和通用數(shù)據(jù)分析工具等基礎(chǔ)性通用數(shù)據(jù)技術(shù)差距較大,同時市場主體數(shù)量少、自主知識產(chǎn)權(quán)把控能力低等現(xiàn)狀導(dǎo)致未來發(fā)展動力不足。傳統(tǒng)行業(yè)和企業(yè)對數(shù)據(jù)分析應(yīng)用具有巨大需求潛力,但其數(shù)據(jù)資源多以結(jié)構(gòu)化為主。原有結(jié)構(gòu)化數(shù)據(jù)和新增非結(jié)構(gòu)化數(shù)據(jù)之間的互訪問操作和融合管理成為新式共性技術(shù)要素,是搶占未來主流市場的關(guān)鍵技術(shù)機遇點。美國等技術(shù)先驅(qū)國家的產(chǎn)業(yè)版圖已完成了技術(shù)過渡領(lǐng)域的初步布局,我國產(chǎn)業(yè)參與主體也應(yīng)考慮進一步細化市場分工,形成專業(yè)性強、銜接緊密的產(chǎn)業(yè)新生態(tài),并積極加大過渡時期的技術(shù)研發(fā)力度,實現(xiàn)數(shù)據(jù)過渡期與發(fā)達國家的同步發(fā)展。
強化合作,探索新型商業(yè)模式。大數(shù)據(jù)產(chǎn)業(yè)是技術(shù)密集型產(chǎn)業(yè),同時也是業(yè)務(wù)驅(qū)動為主的實用型產(chǎn)業(yè)。就數(shù)據(jù)分析和運用過程中需解決的共性基礎(chǔ)研究問題,歐美等數(shù)據(jù)產(chǎn)業(yè)發(fā)達國家通常采用以開源社區(qū)先行的開放合作模式,采用“眾包”思想不斷完善系統(tǒng)架構(gòu)和產(chǎn)品服務(wù)功能,提供更為通用和普適的技術(shù)解決方案。經(jīng)過大量企業(yè)在生產(chǎn)實踐中的優(yōu)勝劣汰自由選擇,不斷成熟和完善的開源產(chǎn)品逐漸從免費提供向企業(yè)化盈利的商業(yè)模式進行演變。相比之下,我國數(shù)據(jù)產(chǎn)業(yè)的參與主體在開源社區(qū)中的貢獻仍然較低,企業(yè)間合作、國際間合作的參與熱情有待提高。應(yīng)借鑒國外企業(yè)的成功經(jīng)驗,以開源產(chǎn)品和服務(wù)為基礎(chǔ),提供定制化和深度支撐的新型商業(yè)模式,同時也能夠為中小企業(yè)和初創(chuàng)企業(yè)參與大數(shù)據(jù)產(chǎn)業(yè)提供新的發(fā)展思路。