對(duì)于移動(dòng)運(yùn)營(yíng)商來(lái)說(shuō),經(jīng)過(guò)多年的IT系統(tǒng)建設(shè),大量的網(wǎng)絡(luò)數(shù)據(jù)被積累下來(lái)。但是現(xiàn)有的IT系統(tǒng)和數(shù)據(jù)對(duì)于支撐網(wǎng)絡(luò)運(yùn)營(yíng)工作還存在一些障礙,主要表現(xiàn)在:面對(duì)多樣化需求,重復(fù)從底層進(jìn)行大數(shù)據(jù)處理,處理環(huán)節(jié)多、難度大;留存數(shù)據(jù)主要以網(wǎng)絡(luò)設(shè)備為中心進(jìn)行存儲(chǔ)和組織,無(wú)法反映用戶(hù)真正的感知情況,無(wú)法支撐以用戶(hù)為中心的網(wǎng)絡(luò)運(yùn)維;現(xiàn)有數(shù)據(jù)可視性和可用性較差,不能提供多樣的數(shù)據(jù)開(kāi)放手段,支撐一線(xiàn)業(yè)務(wù)人員的數(shù)據(jù)使用要求。這些障礙也是國(guó)內(nèi)運(yùn)營(yíng)商網(wǎng)絡(luò)部等業(yè)務(wù)部門(mén)普遍面對(duì)的問(wèn)題。
為解決上述問(wèn)題,同時(shí)響應(yīng)中國(guó)移動(dòng)集團(tuán)全面轉(zhuǎn)型到“以用戶(hù)為中心”的戰(zhàn)略要求,山東移動(dòng)網(wǎng)絡(luò)部與IBM全面合作,通過(guò)對(duì)既有系統(tǒng)所產(chǎn)生數(shù)據(jù)的詳細(xì)研究,以創(chuàng)新思維設(shè)計(jì)了區(qū)別于傳統(tǒng)3層系統(tǒng)應(yīng)用架構(gòu)的基于用戶(hù)網(wǎng)絡(luò)畫(huà)像的大數(shù)據(jù)開(kāi)放引擎,并基于此大數(shù)據(jù)開(kāi)發(fā)引擎利用多種大數(shù)據(jù)開(kāi)發(fā)手段設(shè)計(jì)多種數(shù)據(jù)處理算法,以用戶(hù)為中心對(duì)海量復(fù)雜的基礎(chǔ)網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行多層次的處理,使得網(wǎng)絡(luò)數(shù)據(jù)能夠圍繞用戶(hù)進(jìn)行全方位的使用,有效支撐網(wǎng)絡(luò)部支撐工作向以用戶(hù)體驗(yàn)為中心的工作流程的變革,同時(shí)有效降低了大數(shù)據(jù)使用的門(mén)檻,實(shí)現(xiàn)了加工后數(shù)據(jù)資產(chǎn)的有效利用,支撐應(yīng)用系統(tǒng)能夠快速利用數(shù)據(jù)上線(xiàn)滿(mǎn)足一線(xiàn)業(yè)務(wù)的需求,實(shí)現(xiàn)了大數(shù)據(jù)的可視、可用、易用,為網(wǎng)絡(luò)規(guī)劃、網(wǎng)絡(luò)優(yōu)化、用戶(hù)體驗(yàn)管理、業(yè)務(wù)營(yíng)銷(xiāo)等提供了有力支撐,實(shí)現(xiàn)了網(wǎng)絡(luò)部對(duì)于省公司業(yè)務(wù)精細(xì)化運(yùn)營(yíng)的有力支撐。
山東移動(dòng)基于用戶(hù)網(wǎng)絡(luò)畫(huà)像的大數(shù)據(jù)開(kāi)放引擎總體架構(gòu)主要包括采集層、共享層、大數(shù)據(jù)開(kāi)放引擎層、業(yè)務(wù)應(yīng)用層4個(gè)邏輯層。采集層的主要功能是基于FTP批處理或者異步同步模式實(shí)現(xiàn)4G/VoLTE軟采與硬采信令、家客信令等多個(gè)系統(tǒng)的海量數(shù)據(jù)的采集和預(yù)處理工作;共享層基于流計(jì)算和Spark等技術(shù),對(duì)海量網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行二次加工處理以保留有效數(shù)據(jù),控制數(shù)據(jù)規(guī)模;大數(shù)據(jù)開(kāi)放引擎層以HADOOP和關(guān)系型數(shù)據(jù)庫(kù)作為存儲(chǔ)數(shù)據(jù)的平臺(tái),同時(shí)結(jié)合網(wǎng)絡(luò)業(yè)務(wù)支撐需求,基于IBM SPSS平臺(tái)設(shè)計(jì)實(shí)現(xiàn)多種大數(shù)據(jù)挖掘算法對(duì)數(shù)據(jù)深度加工處理,形成“三階”用戶(hù)網(wǎng)絡(luò)畫(huà)像,并通過(guò)各種形式的API接口(SQL/REST API)為應(yīng)用開(kāi)發(fā)和數(shù)據(jù)探索提供開(kāi)放的數(shù)據(jù)服務(wù);業(yè)務(wù)應(yīng)用層則再次基于業(yè)務(wù)需求,借助SPSS對(duì)生成的“三階”用戶(hù)網(wǎng)絡(luò)畫(huà)像進(jìn)行業(yè)務(wù)對(duì)標(biāo)處理,同時(shí)基于IBM COGNOS和其他JAVA平臺(tái)實(shí)現(xiàn)多種業(yè)務(wù)應(yīng)用。
基于用戶(hù)網(wǎng)絡(luò)畫(huà)像的大數(shù)據(jù)開(kāi)放引擎方案的創(chuàng)新特色主要包括以下幾個(gè)方面:
——“三道工序”構(gòu)建“三階”用戶(hù)網(wǎng)絡(luò)畫(huà)像。方案從網(wǎng)絡(luò)感知、位置等六個(gè)維度通過(guò)“粗加工”“細(xì)加工”和“精研磨”三道工序生成一階、二階和三階標(biāo)簽,三類(lèi)標(biāo)簽共同構(gòu)建了“三階”用戶(hù)網(wǎng)絡(luò)畫(huà)像,從而建立了跨部門(mén)、跨專(zhuān)業(yè)都可理解的統(tǒng)一的數(shù)據(jù)語(yǔ)言。
——“API 數(shù)據(jù)可視化”實(shí)現(xiàn)能力開(kāi)放。三階用戶(hù)畫(huà)像標(biāo)簽以API方式實(shí)現(xiàn)數(shù)據(jù)共享,并對(duì)實(shí)現(xiàn)此標(biāo)簽的常用算法進(jìn)行封裝供上層應(yīng)用調(diào)用。業(yè)務(wù)人員可通過(guò)API或者數(shù)據(jù)可視化工具重復(fù)使用加工后的數(shù)據(jù),對(duì)不同標(biāo)簽組合以對(duì)標(biāo)業(yè)務(wù)實(shí)現(xiàn)靈活建模,從而快速支撐個(gè)性化應(yīng)用的實(shí)現(xiàn)。
——實(shí)現(xiàn)自主研發(fā)流程的可視化。通過(guò)統(tǒng)一的、易理解的可視化視圖呈現(xiàn)“三階”用戶(hù)網(wǎng)絡(luò)畫(huà)像,業(yè)務(wù)人員可結(jié)合自身需求,靈活組合各種標(biāo)簽,借助SPSS流程化建模工具自主建模,實(shí)現(xiàn)應(yīng)用快速落地,極大地激發(fā)了一線(xiàn)業(yè)務(wù)人員的創(chuàng)新熱情。
——多層次數(shù)據(jù)組織和多形式的數(shù)據(jù)處理。運(yùn)用多層次數(shù)據(jù)組織方式,按照數(shù)據(jù)用途、數(shù)據(jù)細(xì)分粒度、時(shí)間周期等維度對(duì)數(shù)據(jù)進(jìn)行分層歸類(lèi)處理,定義出元數(shù)據(jù)域、數(shù)據(jù)探索域、聚合整合域、深度處理域、落地域和共享域六層邏輯架構(gòu),降低了數(shù)據(jù)處理復(fù)雜度,并提供易于數(shù)據(jù)使用的多形態(tài)接口,方便業(yè)務(wù)人員使用多種工具進(jìn)行復(fù)雜數(shù)據(jù)挖掘,進(jìn)而提升大數(shù)據(jù)處理效率。
山東移動(dòng)網(wǎng)絡(luò)部通過(guò)基于用戶(hù)網(wǎng)絡(luò)畫(huà)像的大數(shù)據(jù)開(kāi)放引擎的方案設(shè)計(jì)和落地實(shí)現(xiàn),在短時(shí)間內(nèi)已自主開(kāi)發(fā)了4G流量駐留比提升、深度覆蓋不足定位、投訴溯源、投訴預(yù)測(cè)、區(qū)域畫(huà)像等10余種應(yīng)用,同時(shí)從網(wǎng)絡(luò)感知、位置、業(yè)務(wù)特征等六個(gè)維度,生成106個(gè)統(tǒng)一的、易理解的標(biāo)簽,實(shí)現(xiàn)了對(duì)用戶(hù)進(jìn)行全方位網(wǎng)絡(luò)畫(huà)像,有效支撐了山東移動(dòng)網(wǎng)絡(luò)部轉(zhuǎn)型到“以用戶(hù)為中心進(jìn)行運(yùn)營(yíng)支撐”工作模式的變革。