現(xiàn)在大數(shù)據(jù)技術(shù)這個話題火熱程度已經(jīng)逐漸開始取代云計算了,好像現(xiàn)在我們平常的任何事不與大數(shù)據(jù)扯上關(guān)系就落伍了,我們先來大致普及一下,現(xiàn)在常說的大數(shù)據(jù)技術(shù)指的是無法在一定時間內(nèi)用傳統(tǒng)數(shù)據(jù)庫軟件工具對其內(nèi)容進(jìn)行抓取、管理和處理的數(shù)據(jù)集合。
近些年,隨著數(shù)據(jù)產(chǎn)生的成本急劇下降,我們?nèi)粘J褂盟a(chǎn)生的數(shù)據(jù)量也正在呈指數(shù)倍的增長,其中80%以上都是傳統(tǒng)數(shù)據(jù)庫無法處理的非結(jié)構(gòu)化數(shù)據(jù),根據(jù)IDC的權(quán)威監(jiān)測數(shù)據(jù)顯示,全球已經(jīng)從2010年就已經(jīng)正式進(jìn)入了ZB數(shù)據(jù)量的時代,并且預(yù)計到2020年開始,全球?qū)⒖偣矒碛?5ZB的數(shù)據(jù)量,如果把35ZB的數(shù)據(jù)全部刻錄到容量為9GB的光盤上,其疊加的高度相當(dāng)于在地球與月球之間往返三次。
隨著近些年大數(shù)據(jù)在醫(yī)療服務(wù)、公共管理、政府關(guān)系以及交通、教育等等很多行業(yè)進(jìn)行了廣泛的應(yīng)用,讓我們已經(jīng)能夠切身感受到數(shù)據(jù)的巨大能力,有業(yè)內(nèi)專家曾經(jīng)表示,大數(shù)據(jù)對于未來客戶服務(wù)行業(yè)來說將會帶來一場巨大變革,也將會給客戶帶來極大的想象空間和無限的發(fā)展前景,甚至將會讓客服部門從原來的成本中心轉(zhuǎn)換為利潤中心,這其中究竟如何轉(zhuǎn)換,究竟有哪些關(guān)鍵步驟,本期我們將詳細(xì)分析。
語音客服更智能化
目前,通信運(yùn)營商在客服領(lǐng)域比較先進(jìn)的企業(yè)已經(jīng)實(shí)現(xiàn)了智能文字客服,通過文字識別技術(shù)和智能匹配算法對通過短信和網(wǎng)站文字客服提出的服務(wù)訴求進(jìn)行智能匹配答案,不需人工判斷,要實(shí)現(xiàn)智能語音客服,也要通過識別和匹配這兩關(guān)。
早在Siri之前,就已經(jīng)有很多語音識別工具問世,最早的基于電子計算機(jī)的語音識別系統(tǒng)是由AT&T貝爾實(shí)驗(yàn)室開發(fā)的Audrey語音識別系統(tǒng),它能夠識別10個英文數(shù)字,現(xiàn)在AT&T的語音系統(tǒng)Watson已經(jīng)可以實(shí)現(xiàn)在線德語和英語的實(shí)時口譯。
算法是軟件的核心,目前的語音識別算法使用的語言模型仍是一種概率模型,還未發(fā)展成以語言學(xué)為基礎(chǔ)的文法模型,算法不突破,效果無法取得突飛猛進(jìn)的進(jìn)展。算法的優(yōu)化不是一朝一夕的事情,需要慢慢不斷地進(jìn)行,尤其語音這種非結(jié)構(gòu)化數(shù)據(jù),有了大數(shù)據(jù),我們就可以對一些核心算法的特征進(jìn)行提取和分析,并且通過一些搜索等技術(shù)對算法的結(jié)果進(jìn)行更為強(qiáng)大的支撐。
由于方言、語氣、環(huán)境和音色等因素的影響,限制了語音識別算法的效果,這就需要語言識別系統(tǒng)具有一定的自適應(yīng)性,不同口音、方言的識別都需要以一個龐大的語音數(shù)據(jù)庫為基礎(chǔ),對這些非結(jié)構(gòu)化數(shù)據(jù)的管理分析就更加指望大數(shù)據(jù)技術(shù)了。
隨著數(shù)據(jù)源越來越多,大數(shù)據(jù)技術(shù)的不斷進(jìn)步,語音識別系統(tǒng)也在持續(xù)地完善之中,說到底,算法依然是核心,而數(shù)據(jù)則是基礎(chǔ),對于這類非結(jié)構(gòu)化數(shù)據(jù),也許傳統(tǒng)的數(shù)據(jù)庫技術(shù)無法滿足,但大數(shù)據(jù)技術(shù)卻可以完全勝任。
語音轉(zhuǎn)換怎樣更準(zhǔn)確?
對于任何企業(yè)的call center來說,對于工作人員的語音識別都是至關(guān)重要的,客服人員日常與客戶的電話溝通都是需要進(jìn)行錄音的,這樣一來所產(chǎn)生的數(shù)據(jù)量是十分龐大的,僅以廣東移動為例,廣東移動客服中心每年就要新增約60TB的數(shù)據(jù)存儲,這個體量對于一般的企業(yè)來說已經(jīng)是“大數(shù)據(jù)”了。
有人會質(zhì)疑這些錄音是為了便于追溯留證的,不是原始的錄音記錄,客戶不認(rèn)賬怎么辦?當(dāng)然對于企業(yè)來說,也不是所有的錄音都需要被轉(zhuǎn)換成文本文件,對于客戶投訴或辦理業(yè)務(wù)的來電,仍然保留錄音記錄,一則便于企業(yè)對客服人員的服務(wù)態(tài)度進(jìn)行監(jiān)督,二來也是為了備份留存。
企業(yè)將大量的語音數(shù)據(jù)轉(zhuǎn)換成文本信息之后進(jìn)行存儲,雖然減少了存儲的空間,但是這些文本數(shù)據(jù)還可用于后續(xù)的信息挖掘,用來改進(jìn)服務(wù)或發(fā)現(xiàn)商機(jī),畢竟文本的信息分析要比語音的容易得多。
擴(kuò)展一步:用戶資源輕松挖掘
在當(dāng)今的IT行業(yè),數(shù)據(jù)成為了我們?nèi)粘5暮诵馁Y源,對于企業(yè)來說,利用數(shù)據(jù)來對用戶信息進(jìn)行挖掘和分析已經(jīng)變成了家常便飯,比如用戶的地域分布、購買能力、使用習(xí)慣等等,都是有助于提升企業(yè)利潤的有效途徑。
而客服部門作為企業(yè)前端的客戶直接接觸窗口,每天都可以從客戶身上獲取大量的信息,甚至可以在客戶比較滿意的時候,主動獲取一些愛好、職業(yè)等信息,積少成多,某些時候,這些數(shù)據(jù)將為企業(yè)創(chuàng)造巨大的價值。
對于用戶信息的挖掘現(xiàn)在也已經(jīng)有很多企業(yè)開展這種服務(wù),比如通過數(shù)據(jù)的挖掘,可以發(fā)現(xiàn)哪些用戶是高爾夫球愛好者,進(jìn)行精準(zhǔn)營銷,避免盲目營銷導(dǎo)致的客戶反感及投訴。以及像類似通過定位系統(tǒng)讓個人位置信息成為客戶服務(wù)領(lǐng)域待被開采的金礦等等。當(dāng)然企業(yè)的這些數(shù)據(jù)收集和分析功能必須是要建立在保護(hù)和尊重用戶個人隱私前提之下的。
編輯的話
本期我們聊了大數(shù)據(jù)在客戶服務(wù)方面的大量應(yīng)用,其實(shí)不單單是客服,對于企業(yè)來說,產(chǎn)品、技術(shù)、銷售等等很多環(huán)節(jié)現(xiàn)在都開始利用大數(shù)據(jù)技術(shù)進(jìn)行更加精準(zhǔn)高效的運(yùn)營,數(shù)據(jù)在行業(yè)用戶當(dāng)中的應(yīng)用范圍也在飛速擴(kuò)張,當(dāng)然,對于我們這些個人用戶而言,大數(shù)據(jù)也同樣重要。