金山云梁守星:AI技術(shù)將成視頻的終極演進(jìn)

責(zé)任編輯:cres

2017-12-04 16:28:51

來源:企業(yè)網(wǎng)D1Net

原創(chuàng)

梁守星表示,人工智能作為一項具備高度信息識別能力的創(chuàng)新技術(shù),已成為社會進(jìn)步的主旋律,并受到越來越多行業(yè)的關(guān)注。

今年年初,谷歌推出了一項名為“谷歌大腦”的深度學(xué)習(xí)項目,能夠把只有64個像素(8X8)的模糊圖片,變成更清晰的圖片。這項被稱為“黑科技”的技術(shù)驚艷了很多人,帶動了AI圖像學(xué)習(xí)的熱潮,也使得人們對視頻有了更多新的想象。
 
11月29日, 第五屆中國網(wǎng)絡(luò)視聽大會在成都召開,作為中國網(wǎng)絡(luò)視音頻領(lǐng)域規(guī)格最高,被稱為“年度風(fēng)向標(biāo)”的行業(yè)盛會,本次會議以“新使命·新視界·新動能”為主題,邀請了網(wǎng)絡(luò)視聽業(yè)界和學(xué)界的領(lǐng)軍人物共聚一堂,共同探討中國網(wǎng)絡(luò)視聽行業(yè)的現(xiàn)在與未來等熱點話題。金山云高級副總裁、合伙人梁守星受邀出席本次會議并發(fā)表《AI,讓視頻更有溫度》的演講,對人工智能與視頻行業(yè)結(jié)合的新技術(shù)以及未來發(fā)展進(jìn)行了分享。

金山云高級副總裁、合伙人梁守星在中國網(wǎng)路視聽大會現(xiàn)場演講
 
梁守星表示,人工智能作為一項具備高度信息識別能力的創(chuàng)新技術(shù),已成為社會進(jìn)步的主旋律,并受到越來越多行業(yè)的關(guān)注。據(jù)有關(guān)統(tǒng)計數(shù)據(jù)顯示,目前AI領(lǐng)域創(chuàng)業(yè)的企業(yè)中,有一半以上都專注在計算機(jī)視覺、服務(wù)機(jī)器人以及語言和自然語言處理等方面,并在不斷向電商、金融、教育、醫(yī)療等各垂直行業(yè)滲透。“AI在自身技術(shù)迭代并向各行業(yè)滲透的過程中,一個新的富媒體時代也隨之而來,并將助力用戶體驗升級,成為視頻的終極演進(jìn)。”梁守星補(bǔ)充道。
 
“AI畫質(zhì)+”還原高清讓媒體 “富”起來
 
自19世紀(jì)中葉,人們初次接觸視頻影像起,視頻技術(shù)一直在圍繞如何讓畫面更清晰、傳輸更穩(wěn)定的方向進(jìn)步。進(jìn)入移動互聯(lián)網(wǎng)時代后,AI技術(shù)豐富了人們對視頻的想象。它將不再扮演單一載體形式,可以與各行各業(yè)結(jié)合,以智能穿戴設(shè)備屏幕、醫(yī)療影像等各種形態(tài),幫助教育、醫(yī)療、安全行業(yè)實現(xiàn)全面升級。
 
不過,在AI出現(xiàn)之前,這種升級面臨較大技術(shù)難度。一方面受限于編解碼技術(shù)能力和網(wǎng)絡(luò)環(huán)境,另一方面網(wǎng)上的圖像和視頻越來越多,存儲與傳輸這些圖像和視頻的成本也就越來越高。如何在片源不清晰,或者經(jīng)過壓縮后還能呈現(xiàn)出高清效果,成為大家亟需解決的問題。
 
梁守星表示,基于深度學(xué)習(xí)能力的超分辨率算法和畫質(zhì)修復(fù)算法,可為視頻提供商和用戶大幅節(jié)省存貯成本與傳輸帶寬,化解成本壓力。目前,金山云已推出基于這兩項算法的“AI畫質(zhì)+“圖像增強(qiáng)技術(shù),并實現(xiàn)在移動端將高清視頻壓縮成低分辨率視頻進(jìn)行傳輸。
 
據(jù)了解,金山云”AI畫質(zhì)+”圖像增強(qiáng)技術(shù)能為不同分辨率、不同類型的視頻訓(xùn)練出不同的模型及模型參數(shù),再通過搜索其他類似經(jīng)過壓縮的高分辨率視頻圖像,尋找圖案、顏色的相似關(guān)系,進(jìn)行視頻還原和修復(fù)。這樣,在接收端將低分辨率視頻還原成高清視頻時,可以做到實時進(jìn)行,完全不會影響到用戶的視覺體驗。
 
270p視頻幀經(jīng)普通的雙線性插值(左)和金山視頻云算法放大四倍的效果(右)
 
如果說超分辨率技術(shù)解決的是高清圖像在傳輸過程中的高成本問題,那么對那些由于硬件設(shè)施較差、網(wǎng)絡(luò)環(huán)境欠佳、拍攝時間久遠(yuǎn)、畫面抖動等等導(dǎo)致畫質(zhì)損傷的片源,金山視頻云則可以通過視頻修復(fù)算法進(jìn)行修復(fù),它可應(yīng)對各種突發(fā)情況導(dǎo)致的畫質(zhì)損傷,將視頻中的馬賽克,毛刺,重影,噪點等實時修復(fù)為較好的畫質(zhì),提升用戶的視頻體驗。
 
金山云火眼“金睛” 守護(hù)網(wǎng)絡(luò)潔凈安全
 
視頻行業(yè)高速發(fā)展,在帶給人們豐富信息的同時,危害社會健康和安全的涉黃、暴力、詐騙等信息業(yè)蜂擁而至。如果只靠人工審核來保持網(wǎng)路環(huán)境的潔凈安全,這將是一項耗時耗力的巨大工程。
 
為此,金山云基于KDL深度學(xué)習(xí)算法,借助每日千萬級海量圖片庫訓(xùn)練出精準(zhǔn)AI算法模型,打造出業(yè)內(nèi)領(lǐng)先的一站式AI內(nèi)容安全監(jiān)管平臺——金山云金睛。它可提供快速智能圖像識別,支持“鑒黃” 、“暴恐” 、“ 涉政” 、“廣告識別”等多種圖像智能識別服務(wù),同時提供“直播實時AI安全監(jiān)管服務(wù)”,“短視頻AI安全審核”解決方案,準(zhǔn)確率高達(dá)99.9%以上。人工審核萬張圖片成本要幾十元甚至上百元,而使用金山云金睛平臺只需要幾塊錢,能帶來80%以上的成本節(jié)省。
 
梁守星表示,移動互聯(lián)網(wǎng)視頻的最大特點是更新快,實時性強(qiáng)。實時性方面,金山云通過圖片、聲音、文字等多層識別監(jiān)督,可以保證監(jiān)管無死角。在準(zhǔn)確地識別各種不合規(guī)視頻方面,金山云在強(qiáng)大的計算能力外,沉淀了海量圖片,目前擁有1.2億海量數(shù)據(jù)標(biāo)注,并每天24小時不間斷識別。
 
隨著蘋果、谷歌、高通等巨頭在AI芯片領(lǐng)域的發(fā)力,視頻將會迎來一個高速發(fā)展階段。未來,金山云將基于深度學(xué)習(xí)能力,充分打造視頻超分辨率和視頻修復(fù)技術(shù),滿足人們對4K視頻高清的體驗的觀看體驗追求,同時將會增強(qiáng)包含聲音、圖片等多層實時視頻鑒別監(jiān)控技術(shù)能力,為視頻和各行業(yè)的發(fā)展保駕護(hù)航!

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號