以下為現(xiàn)場速記。
中國移動(dòng)IT公司 聶勝
聶勝:大家好,我來自中國移動(dòng)IT公司的聶勝。剛才主持人也說了,段博士摔骨折了現(xiàn)在在醫(yī)院,他是我的直屬領(lǐng)導(dǎo),他安排我給大家做這個(gè)演講。
今天我要演講的主題是“人工智能在企業(yè)中的應(yīng)用及經(jīng)驗(yàn)”。主要是受講一下我們自己在用人工智能技術(shù)解決我們自身企業(yè)中的問題和一些AI的應(yīng)用。
前面嘉賓講的面比較廣,我今天主題只在人工智能這一塊。像中國移動(dòng)很早就開始做大數(shù)據(jù),也很早開始布局人工智能。中國移動(dòng)總部現(xiàn)在提出“5G+AICDE”,5G+A(AI),I指的是物聯(lián)網(wǎng),C指的是云計(jì)算,D是大數(shù)據(jù),E是邊緣計(jì)算。我今天主要會(huì)講到人工智能這一塊,而且特別是要講人工智能怎么在我們企業(yè)中落地應(yīng)用。
前面有個(gè)前沿,我們講現(xiàn)在隨著大數(shù)據(jù)和人工智能的崛起,云計(jì)算、物聯(lián)網(wǎng)都進(jìn)入到我們的生活,再加上現(xiàn)在5G時(shí)代,5G元年已經(jīng)開啟,中國移動(dòng)在今年年底會(huì)部署5萬個(gè)基站,在全國50個(gè)城市落地5G,2020年底會(huì)實(shí)現(xiàn)縣級以上所有城市的5G商用覆蓋。
我們現(xiàn)在正在處在信息化和智能化所交集的時(shí)代,IOT、人工智能、區(qū)塊鏈、大數(shù)據(jù)時(shí)代即將會(huì)成為開啟真正智能時(shí)代重要的動(dòng)因。
大家聽了很多人工智能、大數(shù)據(jù)、云計(jì)算、物聯(lián)網(wǎng)概念,但是我不知道大家能不能捋得清這個(gè)概念?我在這里簡單闡述他們之間的關(guān)系,讓大家更清楚人工智能到底是做什么的,因?yàn)榇蠹衣犃撕芏嘣朴?jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng),但是你很難捋清楚他們每個(gè)是干什么的,好像相似但他們之間又有區(qū)別。
我們舉了一個(gè)例子,物聯(lián)網(wǎng)是人的眼睛、耳朵、鼻子這些所有觸覺,而大數(shù)據(jù)是這些觸覺收集到的數(shù)據(jù)進(jìn)行匯集和存儲(chǔ),人工智能作為人的大腦來控制所有的這些信息,云計(jì)算是在大腦的指揮下對這個(gè)大數(shù)據(jù)進(jìn)行一個(gè)處理和運(yùn)行,并得到一些應(yīng)用。這就是指這幾個(gè)概念之間的關(guān)系。
今天主題會(huì)分三個(gè)部分:
第一,人工智能簡介。
第二,人工智能的應(yīng)用。
第三,中移信息AI實(shí)踐。
重要講第三部分,我們在AI方面的實(shí)踐和應(yīng)用。
人工智能簡介,概念大家簡單看一下就好了。我只想說人工智能是對人的意識、思維和信息處理過程的模擬,而人工智能并不是人的智能,但是它是像人一樣進(jìn)行思考的一項(xiàng)智能,它有可能會(huì)在以后超過人的智能。
人工智能有三種級別,弱人工智能擅長單個(gè)領(lǐng)域的智能,強(qiáng)人工智能級別,還有超人工智能級別,強(qiáng)人工智能級別是人類級別的人工智能,到機(jī)器人這一塊,能夠像人一樣思考的智能機(jī)器人,而超人工智能在所有領(lǐng)域能夠自學(xué)習(xí),超越人腦。我們現(xiàn)在還處在弱人工智能時(shí)代,我們用人工智能的技術(shù)去解決的都是一些單方面的、很領(lǐng)域性的問題,我們需要不斷發(fā)展,現(xiàn)在處在人工智能高速發(fā)展的時(shí)代,但是我們要認(rèn)識到我們現(xiàn)在處在弱人工智能的時(shí)代。
人工智能發(fā)展的三次熱潮,第一次熱潮是指在1956年人工智能第一次誕生的時(shí)候,第二次熱潮是出現(xiàn)專家系統(tǒng)那一塊的東西,主要是在1980年和1987年時(shí)間出現(xiàn)過第二次熱潮,之后經(jīng)歷很長時(shí)間的低估,第三次熱潮是AI爆發(fā)階段—深度運(yùn)算包括數(shù)據(jù)收集這塊都發(fā)展非??欤罹叩湫偷氖前柗ü窇?zhàn)勝了人類,全民都在探討人工智能。
人工智能三大基石是什么?人工智能為什么現(xiàn)在在崛起?最重要的是數(shù)據(jù)基礎(chǔ)。數(shù)據(jù)基礎(chǔ)是我們講到數(shù)字化轉(zhuǎn)型就要涉及到企業(yè)要收集好自己所有的數(shù)據(jù),我們談到數(shù)據(jù)是我們的寶藏,數(shù)據(jù)是我們驅(qū)動(dòng)力,所以說數(shù)據(jù)是一個(gè)基礎(chǔ)。
在數(shù)據(jù)之上,需要對我們的云平臺包括大數(shù)據(jù)平臺、云計(jì)算平臺,你需要有計(jì)算能力對這些數(shù)據(jù)包括存儲(chǔ)也好、計(jì)算也好,有了這個(gè)基礎(chǔ)之后我們才會(huì)去談到怎么去應(yīng)用這個(gè)數(shù)據(jù),怎么讓這個(gè)數(shù)據(jù)在企業(yè)里創(chuàng)造價(jià)值,我們就會(huì)引入到算法引擎這一塊,人工智能包括機(jī)器學(xué)習(xí)、機(jī)器學(xué)習(xí)再包括的是深度學(xué)習(xí)這一塊,其實(shí)我們很多人工智能的應(yīng)用都是機(jī)器學(xué)習(xí)方面的應(yīng)用。我們說的那些神經(jīng)網(wǎng)絡(luò)也是屬于機(jī)器學(xué)習(xí)的一部分,算法和引擎能讓我們快速的處理那些采用無監(jiān)督學(xué)習(xí)算法對大量特征數(shù)據(jù)集進(jìn)行訓(xùn)練,從而得到有效的規(guī)則和推理知識。
人工智能應(yīng)用,我簡單說一下。人工智能里包括了什么東西?大家都說人工智能,但其實(shí)人工智能有一個(gè)很重要的研究領(lǐng)域,人工智能到底研究些什么東西?我們不能用人工智能一個(gè)詞把所有都包括了,它其實(shí)是很大的概念,它里面有很多研究方向,它屬于計(jì)算機(jī)科學(xué)的分支,它包括了哪些?機(jī)器人是一塊,語音識別、圖像識別、自然語言處理、自動(dòng)駕駛和專家系統(tǒng)等,專家系統(tǒng)指的是我們說的很火的知識圖譜,包括特別在跟機(jī)器人做閑聊的時(shí)候,與機(jī)器人對話的時(shí)候會(huì)用到專家系統(tǒng),用知識圖譜構(gòu)建我們自己單領(lǐng)域的專業(yè)知識,我后面自己做了語音對話機(jī)器人,里面就會(huì)考慮到可以加入專家系統(tǒng)去構(gòu)建自己領(lǐng)域的知識,讓機(jī)器人在回答的時(shí)候,它就可以很有針對性回答你提出的問題
這也是人工智能的領(lǐng)域,這是指在行業(yè)和各個(gè)方向上的應(yīng)用。
AI+交通,比如自動(dòng)駕駛方面的應(yīng)用,這個(gè)我都簡單過一下。
AI+智慧城市,像在杭州他們部署了人工智能中樞,對杭州蕭山的交通做了一個(gè)AI+智慧城市,相當(dāng)于幫它做交通管制,能夠提高車輛的通行速率。
AI+金融,在交融這一塊主要是做風(fēng)險(xiǎn)防控。
AI+保險(xiǎn),淘寶里有運(yùn)費(fèi)險(xiǎn)都是幾毛錢、一塊錢,五毛錢保費(fèi)就10塊錢的保額,它在人工智能、大數(shù)據(jù)助力下發(fā)展特別快,它算出風(fēng)險(xiǎn)值,利用AI算它的風(fēng)險(xiǎn)評估,它就覺得這個(gè)是確實(shí)能夠給保險(xiǎn)公司帶來收益的。
第三部分,是今天的重點(diǎn),講一下我們在AI方面的研究實(shí)踐。
我為什么直接講到AI?在做AI研究之前,你必須得像前面說的,咱們必須得有一定的數(shù)據(jù)積累,必須要有你自己的大數(shù)據(jù)平臺、云計(jì)算平臺,我是在這個(gè)基礎(chǔ)之上,我們在大數(shù)據(jù)平臺,我們現(xiàn)在是在呼和浩特和哈爾濱有兩個(gè)大的機(jī)房中心,里面有12000臺的CPU服務(wù)器,我們是今年年底預(yù)計(jì)會(huì)達(dá)到2.5萬臺,基本上是在整個(gè)全國來講公司里都是非常大的,跟BAT不相上下。
我們機(jī)房里存在的數(shù)據(jù)是中國移動(dòng)從各個(gè)省公司收上來的數(shù)據(jù),目前平臺數(shù)據(jù)量基本每天有500個(gè)TB,目前的存儲(chǔ)量是60個(gè)PB,往上乘20到ZB級了。我們數(shù)據(jù)量非常大,我們今年已經(jīng)采購了160臺的GPU服務(wù)器,準(zhǔn)備構(gòu)建我們自己的AI開放平臺,類似于百度的開放平臺、科大訊飛的開放平臺,我們想在上面構(gòu)建我們整個(gè)中國移動(dòng)的AI開放平臺,我們主要給中國移動(dòng)各個(gè)專業(yè)公司、子公司、省市公司提供AI能力的開放能力。目前這個(gè)平臺屬于正在建設(shè)過程中。
我是來自大數(shù)據(jù)平臺部,我們大數(shù)據(jù)平臺部和應(yīng)用部主要在這上面做整個(gè)集群的運(yùn)維,應(yīng)用部和我們會(huì)在整個(gè)數(shù)據(jù)上面做業(yè)務(wù)應(yīng)用,我是專門負(fù)責(zé)AI這一塊的,我是AI工程師,我們在探索的AI研究,一個(gè)是智慧營業(yè)廳,一個(gè)是智能運(yùn)維、智慧運(yùn)維,還有智能集合,后面主要是圍繞這三個(gè)方面來講一下我們現(xiàn)在正在做的AI方面的實(shí)踐。
這個(gè)指的是AI賦能的全國流程,從數(shù)據(jù)接入、數(shù)據(jù)處理到數(shù)據(jù)分析到特定處理、模型訓(xùn)練,怎么從數(shù)據(jù)接入一直到推出AI應(yīng)用,我們會(huì)在底層做AI集群資源,在中間建設(shè)一個(gè)AI能力層,我現(xiàn)在負(fù)責(zé)的是AI能力層的建設(shè),在上面會(huì)構(gòu)建各種各樣的應(yīng)用,在應(yīng)用的時(shí)候可以去調(diào)用這些能力,通過API接口形式調(diào)用AI能力。
因?yàn)橹袊苿?dòng)下面還有研究院還有杭州、蘇州、北京總部研究院等一起合作在做這方面的東西。
這個(gè)是智慧營業(yè)廳的例子,我們現(xiàn)在智慧營業(yè)廳面臨好幾個(gè)痛點(diǎn),營銷重點(diǎn)不突出,個(gè)性化營銷指導(dǎo)不足,大家如果沒什么事兒肯定也不會(huì)去營業(yè)廳。
我們在金融街那邊做了一個(gè)智慧營業(yè)廳,準(zhǔn)備打造潮智準(zhǔn)輕,潮是指產(chǎn)品要潮流化,它要有一些智能的設(shè)備,把人臉識別還有智能導(dǎo)購、游戲互動(dòng)、商品售賣這些智能設(shè)備都加進(jìn)去,準(zhǔn)是指我們會(huì)給里面的用戶,后面會(huì)講到有一個(gè)用戶畫像,怎么去做精準(zhǔn)營銷,輕相當(dāng)于大家能智能化辦理各種流程。
這里講一個(gè)我們在參與的案例,因?yàn)槲覀冎饕菐退鋈四樧R別那一塊,我們有高清攝象頭,人臉是指你經(jīng)過營業(yè)廳時(shí)我們會(huì)有兩個(gè)模型,一個(gè)是??偷讕?,現(xiàn)在基本上N做到最大的估計(jì)也就一兩萬,我們現(xiàn)在N要做到10萬、20萬,現(xiàn)在很多公司基本做不到這一點(diǎn),我們考慮到很多方案,也是跟很多公司進(jìn)行探討,我們是有個(gè)N做成兩萬的VIP??偷讕欤€有一個(gè)是10萬的底庫,兩萬的底庫是在一個(gè)攝象頭端,10萬的底庫在云端,他訪問的時(shí)候會(huì)更慢一些。
首先用戶只要進(jìn)到營業(yè)廳,我們能先識別他的人臉,識別完之后我們會(huì)做全量的人臉庫里做匹配,如果匹配出來之后,我們再返回它的信息、名字還有他的電話號碼,我們通過手機(jī)地址做精準(zhǔn)匹配,匹配以后要在其他系統(tǒng)里返回他的電話號碼和用戶標(biāo)簽,因?yàn)槲覀兠總€(gè)用戶構(gòu)建了差不多有3000個(gè)左右的標(biāo)簽。再把最終結(jié)果給到業(yè)務(wù)人員,業(yè)務(wù)人員再做相關(guān)的業(yè)務(wù)辦理也好,會(huì)有精準(zhǔn)營銷,類似于這樣的案例。
這個(gè)是我們智能稽核產(chǎn)品,AIRITA,它能處理圖片、文本和語音,這上面就跟我們的辦公很有關(guān)系,像OCR識別,車票識別、發(fā)票識別以及證件識別主要是這幾個(gè),做OCR識別。圖像的識別會(huì)涉及到剛才前面講的人臉識別的東西。
還有語音這一塊,語音這一塊相對做的不是說特別好,但是也在做。還有聲文識別,還有做錄音,錄音之后做離線的翻譯轉(zhuǎn)譯。
另外做知識圖譜,我在4月份的時(shí)候我們做了一個(gè)醫(yī)藥的圖譜,中醫(yī)和西醫(yī)相結(jié)合,你只要問所有相關(guān)疾病方面的知識,它都能夠返回相應(yīng)結(jié)果給你。后面數(shù)據(jù)智能部分做數(shù)據(jù)分析、智能推薦。
還有一部分是做合同。我們做批量合同識別把它識別成文本,提供在線提交API時(shí)會(huì)做稽核服務(wù),如果把它去驗(yàn)證你提交的金額是否復(fù)合要求,它會(huì)做這樣的認(rèn)證,這就是在線稽核。我們后面已經(jīng)有一些合作伙伴一起在做智能語音客服那一塊的東西。這個(gè)是智能稽核的產(chǎn)品。
還有一個(gè)是我們前段時(shí)間正在做的智能運(yùn)維,主要做機(jī)房監(jiān)控。在機(jī)房監(jiān)控這一塊,我們?nèi)プ鋈藛T軌跡的跟蹤以及做物品識別還有危險(xiǎn)動(dòng)作的識別,為機(jī)房提供安全可靠的保障。人臉軌跡的跟蹤,我們這里有視頻。
我們做AI研究,我們很多時(shí)候都會(huì)去采用開源的東西來做,我們都是自主研發(fā)做開源的東西。這個(gè)是我做的,我能夠去模擬識別,因?yàn)楫?dāng)時(shí)沒找到機(jī)房里很多人的照片,就用了我們樓下監(jiān)控大廳拍的人的視頻去給他做人的識別,給他畫出他的軌跡。
我們要做成的目標(biāo)在機(jī)房里,他在走動(dòng)時(shí)我們在機(jī)房設(shè)置禁區(qū),如果沒有權(quán)限的人員是不能進(jìn)入這個(gè)區(qū)域。在進(jìn)機(jī)房之前我們要做人臉比對,你是否有權(quán)限進(jìn)機(jī)房,之后進(jìn)行人臉跟蹤,你是否能夠進(jìn)入這個(gè)區(qū)域。
算法的問題不講那么細(xì)了。
后面還有我們會(huì)做物品的識別。這里邊也是視頻,中間這個(gè)視頻會(huì)有一個(gè)人走進(jìn)機(jī)房,我們會(huì)識別他是一個(gè)人,他手里拿的是什么東西,是拿的手機(jī)還是什么設(shè)備。
第一個(gè)視頻是我們拿辦公區(qū)的識別,有椅子、植物、杯子、電腦、鮮花類似這樣的識別出來。另一個(gè)是做垂直識別,如果一個(gè)人進(jìn)入機(jī)房之后,他移落什么東西,我們會(huì)給他做一個(gè)預(yù)警提示。
還有危險(xiǎn)動(dòng)作的識別,這一塊我們要做人體關(guān)鍵點(diǎn)的檢測,我們這里也是一個(gè)視頻,一個(gè)人從這里走過來,我們就把它所有的動(dòng)作給他抽象化出來,變成就跟火柴棒一樣,抽象出形體動(dòng)作,把他的動(dòng)作識別出來,我們后面要做的是危險(xiǎn)動(dòng)作,我們要去訓(xùn)練他有沒有在機(jī)房有一些揣機(jī)房門或者出現(xiàn)摔倒或者出現(xiàn)危險(xiǎn)的動(dòng)作檢測。
接下來是自制語音閑聊對話機(jī)器人,這里有一分鐘的演示。
這個(gè)是我花了差不多3天的時(shí)間自己搭建出來的,能夠做閑聊的機(jī)器人。因?yàn)樽鲆粋€(gè)機(jī)器人,后面涉及到的東西非常得多,我剛才說了,我們都是采用開源的東西去做,比如這里語音最重要的有兩部分,比如我說的話,他要把我說的話翻譯成文字,再把我的文字輸入到語料庫,匹配我到底要給他回復(fù)什么,大家看這個(gè)機(jī)器人非常智能,語料處不是我做的,我用的是圖靈機(jī)器人開源的機(jī)器人語料庫,我又調(diào)了開源的API去幫我把我說的話翻譯成文本,把這兩個(gè)結(jié)合起來就變成我能夠?qū)崟r(shí)對話的語音機(jī)器人。
當(dāng)時(shí)段博士給了我一個(gè)課題讓我研究一下語音,我用一個(gè)禮拜的時(shí)間看了語音方面的知識,去搭建的這么一個(gè)語音機(jī)器人,差不多花了三四天的時(shí)間,有這么一個(gè)能夠?qū)崟r(shí)對話的效果。
我為什么會(huì)說到語音機(jī)器人?很多時(shí)候,我們北京、深圳、廣州三個(gè)地方辦公,我們同事做了一個(gè)文檔管理系統(tǒng),他希望到時(shí)輸入一個(gè)語音就能幫我把相關(guān)文檔查出來,這是一個(gè)場景。
另外一個(gè)場景我需要把圖靈機(jī)器人語料庫替換掉,比如換成我4月份做的醫(yī)藥方面的知識庫,我把醫(yī)藥方面的知識替換成這個(gè)機(jī)器人的語料處,我到時(shí)直接說,比如糖尿病應(yīng)該吃什么?現(xiàn)在我想通過語音,和他對話的方式實(shí)現(xiàn)出來。這個(gè)是我們自己在研究的一個(gè)小玩意兒。
最后要講一下,段博士讓我來給大家傳達(dá)一下,AI易用離我們企業(yè)來說并不遙遠(yuǎn),我們要認(rèn)識到AI可以在企業(yè)里落地。前面我們不能說AI,比如說我想落地一個(gè)OCR圖像識別,我想落地一個(gè)像機(jī)房監(jiān)控,這么一小部分、一小部分堆積起來,讓我們認(rèn)識到我們真正的能夠把AI技術(shù)能夠運(yùn)用到企業(yè)里,解決企業(yè)的實(shí)際問題。
另外,做AI之前前面要加強(qiáng)數(shù)字化建設(shè),智能時(shí)代最基礎(chǔ)的就是一個(gè)數(shù)字化建設(shè),在這個(gè)數(shù)字化建設(shè)之上你需要積累你的數(shù)據(jù),你需要構(gòu)建你的云計(jì)算平臺,你需要培養(yǎng)你的AI人才,做一個(gè)人才儲(chǔ)備。
另外我們要注重一下企業(yè)自研能力和開源工具代碼的運(yùn)用能力。開源對我們程序員來說,開源是世界上最好的東西,它能夠讓你天馬行空,讓你去實(shí)現(xiàn)你想要的東西。
另外一個(gè)在企業(yè)里要鼓勵(lì)在崗革新和創(chuàng)新,包括在中國移動(dòng)內(nèi)部我們也是非常的鼓勵(lì)在崗革新,每年會(huì)拿很多錢鼓勵(lì)在崗革新和創(chuàng)新應(yīng)用,希望通過這樣的措施,能夠讓人工智能真正的在我們的企業(yè)里落地、開花。謝謝大家!