如果說貨幣是金融市場流動的血液,數(shù)據(jù)就是信息社會得以運(yùn)轉(zhuǎn)的血液。“運(yùn)營商在大數(shù)據(jù)的應(yīng)用領(lǐng)域具有天然優(yōu)勢,在通信網(wǎng)絡(luò)上,承載了用戶所有的通信行為,相比互聯(lián)網(wǎng)公司,運(yùn)營商獲取的信息更準(zhǔn)確、更全面、更便捷。”在日前通信學(xué)會舉辦的“2014國際數(shù)據(jù)產(chǎn)業(yè)峰會”上,中國聯(lián)通研究院平臺與云計算研究中心主任張云勇表示。目前三大運(yùn)營商都在引入大數(shù)據(jù)的分析,希望能夠進(jìn)一步分析和挖掘數(shù)據(jù)價值。
擁有五大數(shù)據(jù)源
運(yùn)營商數(shù)據(jù)包括IT生產(chǎn)系統(tǒng)的數(shù)據(jù)、業(yè)務(wù)平臺數(shù)據(jù)、通信網(wǎng)絡(luò)數(shù)據(jù)、互聯(lián)網(wǎng)數(shù)據(jù)、外部合作伙伴數(shù)據(jù)等五類數(shù)據(jù)資源。
張云勇認(rèn)為,運(yùn)營商數(shù)據(jù)包括五大類數(shù)據(jù)源。
第一類是IT生產(chǎn)系統(tǒng)的數(shù)據(jù)。特點是核心基礎(chǔ)數(shù)據(jù),覆蓋面廣;總量達(dá)到10PB,已經(jīng)整合M/B城域數(shù)據(jù)近1PB;數(shù)據(jù)價值密度高;可信度高,但目前分散的建設(shè)模式,給數(shù)據(jù)生產(chǎn)質(zhì)量保證帶來困難。
第二類是業(yè)務(wù)平臺數(shù)據(jù)。目前正在整合VAC,是基站業(yè)務(wù)數(shù)據(jù),總量已經(jīng)達(dá)到PB級,其數(shù)據(jù)價值密度低,但包含了用戶在增值業(yè)務(wù)方面的關(guān)鍵信息,而且由于是內(nèi)部數(shù)據(jù),可信度高。
第三類是通信網(wǎng)絡(luò)數(shù)據(jù)。目前僅采集了互聯(lián)網(wǎng)流量數(shù)據(jù),總量達(dá)到100PB/年,數(shù)據(jù)價值密度低,但包含了用戶位置、事件、體驗等關(guān)鍵信息,數(shù)據(jù)的可信度高。
第四類是互聯(lián)網(wǎng)數(shù)據(jù)。目前尚未采集,互聯(lián)網(wǎng)數(shù)據(jù)總量達(dá)到1000PB/年,價值密度低,包含了互聯(lián)網(wǎng)上的各種行為/言論,由于外部數(shù)據(jù),可信度低,需要驗證。
第五類是外部合作伙伴數(shù)據(jù)。目前尚未采集,初期總量不大,數(shù)據(jù)價值密度中等,包含了第三方的用戶、企業(yè)的各方面信息。因為是外部數(shù)據(jù),可信度中等,需要與內(nèi)部可信數(shù)據(jù)相互驗證。
但同時這些數(shù)據(jù)的水平參差不齊。運(yùn)營商獲得的數(shù)據(jù)中存在的主要問題有:企業(yè)內(nèi)數(shù)據(jù)定義缺失,數(shù)據(jù)項缺失;數(shù)據(jù)屬性不完整,企業(yè)外數(shù)據(jù)無暇顧及;數(shù)據(jù)在多個系統(tǒng)中重復(fù)采集、重復(fù)存儲;系統(tǒng)數(shù)據(jù)無法關(guān)聯(lián)、共享,數(shù)據(jù)整合困難;系統(tǒng)林立,數(shù)出多門;數(shù)據(jù)時效性差,使用者無法及時獲得所需信息;數(shù)據(jù)使用不方便,方法繁瑣;手工報表多。有的數(shù)據(jù)質(zhì)量差,數(shù)據(jù)不完整,數(shù)據(jù)不一致。“沒有準(zhǔn)確的數(shù)據(jù)支撐,就難以進(jìn)行深度分析,決策缺乏可靠依據(jù)。”張云勇說。
數(shù)據(jù)如何應(yīng)用
運(yùn)營商可以在市場開拓、企業(yè)管理、業(yè)務(wù)開發(fā)、客戶服務(wù)和網(wǎng)絡(luò)優(yōu)化等方面實現(xiàn)大數(shù)據(jù)的分析應(yīng)用。
目前大數(shù)據(jù)的所有權(quán)和大數(shù)據(jù)創(chuàng)新思維在大數(shù)據(jù)價值鏈構(gòu)成中重要性在上升,而大數(shù)據(jù)技術(shù)能力的重要性在下降。運(yùn)營商的五類大數(shù)據(jù)來源不同,結(jié)構(gòu)不同,數(shù)據(jù)的整合、分析以及挖掘特點也各不相同。張云勇認(rèn)為可以在市場開拓、企業(yè)管理、業(yè)務(wù)開發(fā)、客戶服務(wù)和網(wǎng)絡(luò)優(yōu)化等方面實現(xiàn)大數(shù)據(jù)的分析應(yīng)用。
他說:“在市場開拓上,可以利用社交媒體收集用戶信息,了解客戶滿意度和消費(fèi)習(xí)慣,為用戶提供針對性的套餐;通過情感分析、語義分析等技術(shù),針對客戶的喜好、情緒,進(jìn)行個性化的業(yè)務(wù)推薦;收集用戶呼叫行為、互聯(lián)網(wǎng)行為等,為每個客戶構(gòu)建交往圈,可用于交叉營銷。”
在企業(yè)管理上,可以基于內(nèi)部和外部數(shù)據(jù)實時得到報表與分析報告,可以發(fā)現(xiàn)并降低收入的流失。在業(yè)務(wù)開發(fā)上,可以發(fā)現(xiàn)與內(nèi)容提供商共同進(jìn)行流量經(jīng)營與合作的新機(jī)制,可以獲取用戶位置情況,做時空分析,為公共部門提供數(shù)據(jù);監(jiān)測電話、即時消息、郵件、博客等信息,實現(xiàn)輿情監(jiān)控,配合安全部門采取措施。在客戶服務(wù)上可以收集各個接觸渠道的信息,了解服務(wù)投訴情況和用戶滿意情況,實時地了解用戶呼叫接通和掉話情況,為客戶滿意度和流失預(yù)測提供依據(jù)。在網(wǎng)絡(luò)優(yōu)化上,實時發(fā)現(xiàn)網(wǎng)絡(luò)瓶頸,并快速進(jìn)行解決;預(yù)測網(wǎng)絡(luò)流量峰值,預(yù)警導(dǎo)演流量,防止網(wǎng)絡(luò)堵塞和宕機(jī)。
在大數(shù)據(jù)技術(shù)選擇上,目前沒有一項技術(shù)能夠同時滿足所有的技術(shù)要求,需要選擇混搭架構(gòu)。運(yùn)營商通過選擇MPP數(shù)據(jù)庫、HADOOP、流數(shù)據(jù)處理作深度融合,形成大數(shù)據(jù)整合架構(gòu);并在特殊的場景,選擇內(nèi)存數(shù)據(jù)庫、列存數(shù)據(jù)庫作為補(bǔ)充。
建設(shè)大數(shù)據(jù)能力
三大運(yùn)營商都在建設(shè)自己的大數(shù)據(jù)能力,同時也在研究如何使通信網(wǎng)絡(luò)更適合云計算、大數(shù)據(jù)的發(fā)展需求。
三大運(yùn)營商都在建設(shè)自己的大數(shù)據(jù)能力,同時也在研究如何使通信網(wǎng)絡(luò)更適合云計算、大數(shù)據(jù)的發(fā)展需求。
目前,中國移動利用大數(shù)據(jù)做了三種嘗試。一是改善用戶體驗。中國移動增加語音搜索,通過知識庫實現(xiàn)機(jī)器人智能回答;二是利用大數(shù)據(jù)幫助進(jìn)行市場決策;三是利用大數(shù)據(jù)優(yōu)化網(wǎng)絡(luò)質(zhì)量,包括移動網(wǎng)絡(luò)、終端。目前,中國移動已經(jīng)開發(fā)了大數(shù)據(jù)批處理系統(tǒng)、大數(shù)據(jù)查詢、大數(shù)據(jù)分析挖掘系統(tǒng)。
中國移動通信研究院云計算系統(tǒng)部徐萌說:“去年年底,中國移動發(fā)布了大云2.5產(chǎn)品架構(gòu)。我們還將建設(shè)大云產(chǎn)品開源社區(qū),增強(qiáng)產(chǎn)品的研發(fā)和推廣能力,希望能夠有更多針對運(yùn)營商系統(tǒng)做的開源軟件。”
張云勇說:“中國聯(lián)通建立大數(shù)據(jù)能力的思路是以集中數(shù)據(jù)為種子,統(tǒng)一頂層架構(gòu)設(shè)計、集中數(shù)據(jù)統(tǒng)一管理、開放數(shù)據(jù)能力服務(wù);以數(shù)據(jù)集中引領(lǐng)生產(chǎn)系統(tǒng)集中,以數(shù)據(jù)模型(字典)規(guī)范化促進(jìn)生產(chǎn)系統(tǒng)邏輯集中;加速數(shù)據(jù)應(yīng)用面向生產(chǎn)系統(tǒng)的支撐,促進(jìn)生產(chǎn)應(yīng)用的流程貫穿。”
中國聯(lián)通目前正在建立大數(shù)據(jù)云化應(yīng)用體系U-Cloud-D技術(shù)架構(gòu)。數(shù)據(jù)源來自生產(chǎn)系統(tǒng)、業(yè)務(wù)平臺、通信網(wǎng)絡(luò)、互聯(lián)網(wǎng)和外部合作伙伴,在PaaS層面,形成統(tǒng)一數(shù)據(jù)服務(wù)支撐體系,包括:數(shù)據(jù)采集與交換平臺、數(shù)據(jù)服務(wù)支撐平臺、開放式應(yīng)用平臺和數(shù)據(jù)管控平臺。在應(yīng)用層上,形成大數(shù)據(jù)云化應(yīng)用體系,可以有企業(yè)內(nèi)部應(yīng)用、自助式服務(wù)、大數(shù)據(jù)擴(kuò)展應(yīng)用和大數(shù)據(jù)創(chuàng)新應(yīng)用。