然后可以通過深度神經(jīng)網(wǎng)絡自動描述由運動傳感器相機自動收集的照片。結(jié)果是一個系統(tǒng)可以自動識別高達99.3%的圖像的動物識別,同時仍然以人類志愿者的眾包團隊96.6%的準確率執(zhí)行。
“這項技術(shù)讓我們能夠準確,不引人注意地,低成本地收集野生生物數(shù)據(jù),這有助于促進生態(tài),野生動物生物學,動物學,保護生物學和動物行為等許多領(lǐng)域向”大數(shù)據(jù)“科學的轉(zhuǎn)變。這將極大地提高我們的能力。研究和保護野生動植物和珍貴的生態(tài)系統(tǒng),“該論文的高級作者杰夫克魯恩說。他是懷俄明大學的Harris副教授,也是優(yōu)步人工智能實驗室的高級研究經(jīng)理。
該論文由Clune撰寫; 他的博士學位 學生Mohammad Sadegh Norouzzadeh; 他以前的博士學位 學生Anh Nguyen(現(xiàn)在奧本大學); 瑪格麗特科斯馬拉(哈佛大學); 阿里斯旺森(牛津大學); 和Meredith Palmer和Craig Packer(均來自明尼蘇達大學)。
深度神經(jīng)網(wǎng)絡是一種計算智能形式,其靈感來源于動物大腦如何看待和理解世界。它們需要大量的訓練數(shù)據(jù)才能正常工作,并且必須準確地標記數(shù)據(jù)(例如,每個圖像被正確標記有哪種動物存在,有多少種等等)。
本研究從http://www.zooniverse.org平臺上的公民科學項目Snapshot Serengeti獲得了必要的數(shù)據(jù)。快照塞倫蓋蒂在坦桑尼亞部署了大量的“攝像機陷阱”(運動傳感器攝像機),在其自然棲息地收集數(shù)百萬只動物圖像,如獅子,豹子,獵豹和大象。這些照片中的信息僅在轉(zhuǎn)換為文本和數(shù)字后才有用。多年來,提取此類信息的最佳方法是讓人力志愿者的眾包團隊手動標記每個圖像。今天發(fā)表的這項研究利用了超過50,000名志愿者多年來以這種方式生產(chǎn)的320萬張標記圖像。
Snile Serengeti項目負責人帕克說:“當我告訴Jeff Clune我們有320萬張帶標簽的圖像時,他就停下了腳步。” “我們想測試是否可以使用機器學習來自動化人類志愿者的工作。我們的公民科學家做了非凡的工作,但我們需要加快處理更多數(shù)據(jù)的過程。深度學習算法令人驚嘆,遠遠超過了我的期望。這是改變野生動物生態(tài)的游戲。“
創(chuàng)建Snapshot Serengeti的Swanson補充說:“世界上有數(shù)百個攝像機陷阱項目,很少有人能夠招募大批人類志愿者來提取他們的數(shù)據(jù)。這意味著他們的大部分知識重要的數(shù)據(jù)集尚未開發(fā)。雖然項目越來越多地轉(zhuǎn)向公民科學進行圖像分類,但隨著對志愿者需求的增長,我們開始認為標記每批圖像的時間越來越長。我們認為深度學習將成為關(guān)鍵。緩解攝像機陷阱項目的瓶頸:將圖像轉(zhuǎn)換為可用數(shù)據(jù)的努力。“
“人工智能系統(tǒng)不僅會告訴你48種不同動物中的哪一種,它還會告訴你它們有多少以及它們正在做什么。它會告訴你它們是否正在進食,睡覺,如果嬰兒存在“等等,”另一位Snapshot Serengeti領(lǐng)導人Kosmala補充道。“我們估計,我們所描述的深度學習技術(shù)管道將為每增加300萬張圖像節(jié)省超過八年的人工標簽工作量。這是一個可以重新部署以幫助其他項目的許多寶貴的志愿者時間。”
第一作者Sadegh Norouzzadeh指出:“深度學習仍在迅速發(fā)展,我們預計其表現(xiàn)將在未來幾年內(nèi)變得更好。在這里,我們希望向野生動物生態(tài)學界展示該技術(shù)的價值,但我們我們希望隨著越來越多的人研究如何改進這種應用的深度學習并發(fā)布他們的數(shù)據(jù)集,天空就是極限。想想這項技術(shù)可以幫助我們完成重要科學和保護任務的所有不同方式,這是令人興奮的。“