據(jù)外媒報(bào)道,對(duì)于谷歌(微博)來(lái)說(shuō),識(shí)別圖片中的對(duì)象已不再是挑戰(zhàn)。它的下一個(gè)挑戰(zhàn)就是識(shí)別和搜索視頻中的內(nèi)容,因?yàn)橐曨l的數(shù)據(jù)量比圖片更大,更難概括和識(shí)別。
不單是谷歌,社交網(wǎng)絡(luò)Facebook、閱后即焚應(yīng)用Snap和微博網(wǎng)站Twitter也都在努力識(shí)別視頻內(nèi)容。
但是,很久以來(lái),谷歌旗下的視頻網(wǎng)站YouTube就一直被稱作是全球第二大的搜索引擎,僅次于谷歌搜索引擎。雖然文字搜索請(qǐng)求可以幫助谷歌返回YouTube視頻搜索結(jié)果,但是真正的視頻內(nèi)容搜索技術(shù)尚未得到應(yīng)用。
數(shù)月前,谷歌給科學(xué)研究領(lǐng)域獻(xiàn)上了一份大禮:YouTube-8M 視頻數(shù)據(jù)集。在今天,谷歌又更新了這個(gè)數(shù)據(jù)集。這也許并非巧合。開(kāi)放數(shù)據(jù),特別是斯坦福ImageNet數(shù)據(jù)庫(kù)和微軟COCO數(shù)據(jù)庫(kù),推動(dòng)著圖片識(shí)別搜索的研究。人工智能系統(tǒng)需要數(shù)據(jù)才能變得更為智能。這些組織已在致力于提供這樣的原始數(shù)據(jù)。
當(dāng)然,谷歌并非只想著打造先進(jìn)技術(shù),造福全人類。它也希望借此改善自己的產(chǎn)品,就像它在Gmail郵箱系統(tǒng)中引入Smart Replies智能回復(fù)功能以及在Google Translate翻譯服務(wù)中添加“實(shí)時(shí)視覺(jué)翻譯”功能一樣。谷歌當(dāng)然希望YouTube能夠成為人們搜索視頻的最佳去處。
“如果它能夠識(shí)別奶牛跳過(guò)月球或貓兒跳過(guò)籬笆的視頻,那就太酷了。”谷歌高級(jí)研究員杰夫·迪恩(Jeff Dean)在谷歌首次舉辦的TensorFlow Dev Summit峰會(huì)上說(shuō)。
迪恩稱,這意味著谷歌不再需要依靠描述和評(píng)論等元數(shù)據(jù)來(lái)進(jìn)行搜索了。這種視頻搜索技術(shù)還可以改善視頻推薦服務(wù)。
現(xiàn)在,我們尚不清楚YouTube何時(shí)會(huì)推出這種視頻搜索功能。
迪恩稱,一般來(lái)說(shuō),“視頻搜索可能要落后圖片搜索好幾年。”