鞏固圖像和物體識(shí)別領(lǐng)域領(lǐng)導(dǎo)地位:谷歌出新招

責(zé)任編輯:editor005

作者:Brian Holak

2016-07-27 14:36:56

摘自:TechTarget中國(guó)

為了支撐其已經(jīng)引人矚目的圖像和物體識(shí)別領(lǐng)域的領(lǐng)導(dǎo)地位,搜索巨頭并購(gòu)了法國(guó)創(chuàng)業(yè)公司Moodstocks,該公司擅長(zhǎng)于智能手機(jī)里的基于機(jī)器學(xué)習(xí)的圖像識(shí)別技術(shù)。

Google里有遠(yuǎn)見的領(lǐng)導(dǎo)者已經(jīng)向其計(jì)算機(jī)里注入了他們的愿景。

為了支撐其已經(jīng)引人矚目的圖像和物體識(shí)別領(lǐng)域的領(lǐng)導(dǎo)地位,搜索巨頭并購(gòu)了法國(guó)創(chuàng)業(yè)公司Moodstocks,該公司擅長(zhǎng)于智能手機(jī)里的基于機(jī)器學(xué)習(xí)的圖像識(shí)別技術(shù)。

“我們的夢(mèng)想是將攝像頭調(diào)優(yōu)成智能傳感器來賦予機(jī)器眼睛,讓它們能夠感知周圍的環(huán)境,” Moodstocks在其聲明中這么說。

Google收購(gòu)Moodstocks是其“人才并購(gòu)”中的最新手筆,這樣的并購(gòu)涉及基于機(jī)器學(xué)習(xí)的圖像識(shí)別,這是計(jì)算機(jī)視覺領(lǐng)域的核心組件。Amazon在今年初收購(gòu)Orbeus、Twitter幾周前收購(gòu)了Magic Pony Technology,這起收購(gòu)發(fā)生在這之后,這反映出了業(yè)界觀察家們所描述的科技領(lǐng)導(dǎo)者間的競(jìng)爭(zhēng),他們都在嘗試加速商業(yè)化下一個(gè)計(jì)算機(jī)相關(guān)的前沿領(lǐng)域。

“科技公司已經(jīng)投資了大量時(shí)間和金錢來理解互聯(lián)網(wǎng)文本,”Forrester Research的首席分析師Mike Gualtieri在一封郵件里寫到。“他們現(xiàn)在想要理解圖像,這十分自然。通過文字和圖像的組合意思所能夠提供出的AI,不僅僅能夠理解文字(語(yǔ)音),而且能夠進(jìn)行圖像識(shí)別。”

比如,Google已經(jīng)傳聞在開發(fā)能夠讓用戶僅僅用圖像作為搜索詞,直接從照片里進(jìn)行搜索的功能。Google希望能夠利用Moodstocks的人才力量——他們將會(huì)加入Google位于巴黎的現(xiàn)有的研究和開發(fā)團(tuán)隊(duì),來幫助進(jìn)一步推進(jìn)計(jì)算視覺領(lǐng)域的研究。

“我們已經(jīng)在視覺識(shí)別方面有了很大的成功,” Vincent Simonet寫到,他是Google法國(guó)研究和開發(fā)中心的老大,“但是該領(lǐng)域還有很多事情需要完成。”

大數(shù)據(jù)引領(lǐng)圖像識(shí)別的新紀(jì)元

Google Photos——以及Facebook,F(xiàn)lickr和其他處理圖像分類和標(biāo)記的公司,已經(jīng)在后臺(tái)采用了先進(jìn)的圖像識(shí)別技術(shù),但是“這些方案還能夠更快,更高效,并且要求更少的訓(xùn)練資源,” Tomasz Malisiewicz博士也同意這一點(diǎn),他是Magic Leap Inc.深度學(xué)習(xí)領(lǐng)域的首席軟件工程師,這是一家位于佛羅里達(dá)州的致力于增強(qiáng)現(xiàn)實(shí)技術(shù)的創(chuàng)業(yè)公司。

“在圖像識(shí)別的全新的深度學(xué)習(xí)時(shí)代里,計(jì)算視覺團(tuán)隊(duì)的整個(gè)概念都在被重構(gòu),” Malisiewicz說。“當(dāng)算法開發(fā)還依靠人工的時(shí)候,擁有強(qiáng)大的博士團(tuán)隊(duì)來引導(dǎo)開發(fā)是十分重要的。但是隨著深度學(xué)習(xí)軟件的商業(yè)化,大部分開發(fā)人員都能夠使用今年最流行的神經(jīng)網(wǎng)絡(luò)架構(gòu)來訓(xùn)練識(shí)別模型。”

這個(gè)新時(shí)代的圖像識(shí)別領(lǐng)域里至關(guān)重要的就是數(shù)據(jù)——大量數(shù)據(jù)。

“關(guān)注點(diǎn)已經(jīng)從算法設(shè)計(jì)本身轉(zhuǎn)移到大規(guī)模數(shù)據(jù)管理上,因?yàn)樾阅茏詈玫哪P鸵蠛A康臄?shù)據(jù),” Malisiewicz說。

重構(gòu)視覺世界

對(duì)于公司而言,除了海量數(shù)據(jù)之外,這里面還有些什么?分析師指出,基于機(jī)器學(xué)習(xí)的圖像識(shí)別用例不僅僅是簡(jiǎn)單的分類,比如找到個(gè)人家庭照片或者在購(gòu)物分類里縮小產(chǎn)品類型。

該技術(shù)擁有變革醫(yī)療行業(yè)的可能性,比如,通過醫(yī)療圖像幫助醫(yī)生診斷疾病。另外,增強(qiáng)和虛擬現(xiàn)實(shí)的可穿戴設(shè)備需要使用攝像頭來感知周圍的世界,能夠受益于圖像識(shí)別和改進(jìn)的跟蹤功能,Malisiewicz說。

基于機(jī)器學(xué)習(xí)的圖像識(shí)別能夠幫助企業(yè)自動(dòng)化運(yùn)維功能,比如監(jiān)控,實(shí)地檢測(cè)以及其他任何涉及持續(xù)或者周期性檢查的事情,F(xiàn)orrester的Gualtieri說。

計(jì)算視覺領(lǐng)域的進(jìn)步所帶來的可操作數(shù)據(jù)開啟了企業(yè)盈利的新機(jī)遇,Matthew Zeiler這么認(rèn)為,他是Clarifai的創(chuàng)始人和CEO,這是一家擅長(zhǎng)于視覺識(shí)別的AI公司。

“他們還能夠從之前未標(biāo)記的信息源里收集信息,這些信息源是沒有任何描述,元數(shù)據(jù)或者標(biāo)簽的圖像和視頻,”他補(bǔ)充道。

還會(huì)帶來一些其他的好處。計(jì)算視覺仍然是相對(duì)新的領(lǐng)域,積極探索很重要,密歇根大學(xué)電子工程和計(jì)算機(jī)科學(xué)的副教授Jason Corso博士說。

“很重要的一點(diǎn)是,要注意到這些進(jìn)步和商業(yè)案例很少涉及可能的市場(chǎng)和問題。我們的世界是視覺世界;對(duì)于未來的先進(jìn)技術(shù)而言,利用這個(gè)世界的豐富性是非常重要的,”他說。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)