蘇馳認(rèn)為,雖然AI在提高人工圖片審核效率、準(zhǔn)確度方面有著得天獨(dú)厚的優(yōu)勢(shì),但在內(nèi)容服務(wù)場(chǎng)景中應(yīng)用還處在行業(yè)前沿。一方面是AI廠商對(duì)企業(yè)內(nèi)容服務(wù)的需求把握不足,另一方面是AI算法在實(shí)際落地中還存在一定的技術(shù)挑戰(zhàn)。不過,金山云通過發(fā)揮在大數(shù)據(jù)和資源方面的優(yōu)勢(shì),結(jié)合AI在圖像分類和視頻理解上的關(guān)鍵技術(shù),率先推出了金山云金睛一站式內(nèi)容服務(wù)平臺(tái)。它克服了AI算法面臨的一系列難題,在有效滿足內(nèi)容服務(wù)場(chǎng)景的同時(shí),對(duì)提高監(jiān)管效率和企業(yè)運(yùn)營(yíng)效率,加速內(nèi)容服務(wù)產(chǎn)業(yè)的升級(jí)發(fā)揮重要作用。
金山云首席算法工程師蘇馳博士在infocomm會(huì)議現(xiàn)場(chǎng)演講
基于AI的“安全+理解”兩大方案 解決內(nèi)容服務(wù)核心問題
蘇馳認(rèn)為,內(nèi)容服務(wù)產(chǎn)業(yè)有兩大核心需求,一是內(nèi)容安全,二是內(nèi)容理解。前者是內(nèi)容生產(chǎn)企業(yè)的生死線,是國(guó)家監(jiān)管紅線。而內(nèi)容理解上的技術(shù)突破,則可以幫助企業(yè)更全面系統(tǒng)地了解自身和用戶產(chǎn)生的數(shù)據(jù),從而提高內(nèi)容運(yùn)營(yíng)和管理水平。
在內(nèi)容安全方面,傳統(tǒng)方式是采用人工審核,效率低下,并且不容易及時(shí)發(fā)現(xiàn)偽裝的多媒體內(nèi)容)。金山云一站式安全解決方案融合了云計(jì)算和AI能力,可對(duì)包括文本、語音、圖片和視頻等多媒體內(nèi)容進(jìn)行監(jiān)管。 比如,在文字方面,針對(duì)直播彈幕、UGC評(píng)論、網(wǎng)絡(luò)文學(xué)等多種網(wǎng)絡(luò)文字傳播場(chǎng)景,金山云金睛可以基于語義分析和深度識(shí)別引擎,進(jìn)行多重防護(hù),準(zhǔn)確識(shí)別垃圾文本;在圖片方面,金山云金睛可對(duì)超過80種低俗場(chǎng)景、1200個(gè)以上敏感人物和多達(dá)200種以上的違規(guī)場(chǎng)景進(jìn)行識(shí)別和審核,并且,基于OCR識(shí)別,金睛可以通過文字檢測(cè),再通過文字識(shí)別算法把敏感詞過濾,將違規(guī)與否的信息反饋給客戶。
此外,金山云金睛還可應(yīng)用到更廣闊的場(chǎng)景中,以直播場(chǎng)景中主播為例,除了有人臉識(shí)別外,還提供基于聲紋識(shí)別和音轉(zhuǎn)文兩種模式的音頻監(jiān)管服務(wù)。目前,這些包括標(biāo)簽、內(nèi)容識(shí)別、圖片編輯在內(nèi)的服務(wù),形成了一套從識(shí)別到送審的智慧廣電方案。 “AI很顯然提高了人工審核的效率,但是我們也會(huì)根據(jù)客戶需求,以人機(jī)協(xié)同的方式進(jìn)一步提高效率。”蘇馳表示。
如果說內(nèi)容安全解決了企業(yè)的基本安全乃至生存問題,那內(nèi)容理解則涵蓋了更廣泛的應(yīng)用場(chǎng)景,可以助力企業(yè)的進(jìn)一步發(fā)展。 目前,金山云金睛可以對(duì)直播、游戲、秀場(chǎng)、短視頻中的內(nèi)容進(jìn)行理解,判斷出關(guān)鍵事件,視頻類型、風(fēng)格、場(chǎng)景并識(shí)別視頻中的物體等,從而幫助內(nèi)容生產(chǎn)企業(yè)提升內(nèi)容分發(fā)管理效率,便于個(gè)性化推薦和精準(zhǔn)的廣告推薦。
“圖像分類+視頻理解”升級(jí)AI能力 打造內(nèi)容服務(wù)關(guān)鍵技術(shù)
眾所周知,AI可以在內(nèi)容識(shí)別、內(nèi)容理解上帶來比人工審核更高的效率。但在實(shí)際應(yīng)用過程中,AI算法常會(huì)遇到一些現(xiàn)實(shí)存在的問題影響其在內(nèi)容服務(wù)領(lǐng)域作用的發(fā)揮。比如,在圖像分類時(shí),AI算法會(huì)遇到數(shù)據(jù)非均衡、標(biāo)簽規(guī)則不統(tǒng)一、場(chǎng)景千變?nèi)f化、類型復(fù)雜多樣等難題;在視頻理解中,單模態(tài)理解會(huì)帶來相似圖像造成誤判、脫離場(chǎng)景判斷內(nèi)容、單感官認(rèn)知等問題。為此,金山云推出圖像分類和多模態(tài)信息融合的視頻理解關(guān)鍵技術(shù),幫助AI更好的應(yīng)用在內(nèi)容服務(wù)領(lǐng)域。
蘇馳介紹到,金山云圖像分類服務(wù)中,通過采用級(jí)聯(lián)模型進(jìn)行逐層過濾的方式,解決了輕網(wǎng)絡(luò)和復(fù)雜網(wǎng)絡(luò)環(huán)境下,計(jì)算速度和處理效果不一致帶來的數(shù)據(jù)非均衡問題;與此同時(shí),采用底層細(xì)粒度標(biāo)簽進(jìn)行預(yù)測(cè),上層動(dòng)態(tài)可調(diào)整標(biāo)簽映射規(guī)則的方式,解決了由于客戶對(duì)圖像的評(píng)判規(guī)則的差異及場(chǎng)景不同帶來的標(biāo)簽不統(tǒng)一問題。
“顯然,不同于靜態(tài)圖像,我們的生活是現(xiàn)實(shí)世界中一系列隨著時(shí)間變化的動(dòng)態(tài)事件組成的)。就好像一個(gè)視頻不僅是一系列孤立的靜態(tài)圖像幀組成的,它是有時(shí)序的,是有上下文信息的,還有音頻,甚至還有文字”蘇馳說道。“基于此,金山云金睛在單模態(tài)識(shí)別的基礎(chǔ)上,將視頻理解技術(shù)升級(jí)為多模態(tài)融合理解技術(shù)。
據(jù)了解,多模態(tài)融合理解技術(shù)是金睛AI算法團(tuán)隊(duì)通過訓(xùn)練超千萬個(gè)高質(zhì)量的短視頻,得到的具有很強(qiáng)的泛化能力的內(nèi)容理解模型和背后的金山云金睛時(shí)序算法專利。它可以對(duì)視頻內(nèi)容進(jìn)行精準(zhǔn)的場(chǎng)景識(shí)別、對(duì)象跟蹤、行為理解、圖文聯(lián)想等。在視頻內(nèi)容的生產(chǎn)過程中,它可以實(shí)現(xiàn)智能BGM功能,根據(jù)視頻內(nèi)容自動(dòng)推薦背景音樂,還可支持視頻特效功能,指定視頻場(chǎng)景或者動(dòng)作,給出視頻特效等。
核心需求的把握,關(guān)鍵技術(shù)的研發(fā),高精度的識(shí)別率,全維度的解決方案,以及海量數(shù)據(jù)庫、針對(duì)各個(gè)客戶的個(gè)性化分析和定制能力,使得金山云金睛一站式內(nèi)容服務(wù)平臺(tái)可以全方面滿足客戶需求。蘇馳表示,金山云金睛是目前行業(yè)中為數(shù)不多的,將AI技術(shù)實(shí)現(xiàn)落地的企業(yè)。未來,金山云金睛將持續(xù)強(qiáng)化AI和大數(shù)據(jù)等新技術(shù)的融合,提升服務(wù)水平,借助高科技力量,助力內(nèi)容服務(wù)企業(yè)加速升級(jí),全面擁抱5G時(shí)代!