編者按:自從兩年前給黑人照片貼上“大猩猩”的標(biāo)簽后,谷歌照片對(duì)“大猩猩”等相關(guān)詞語(yǔ)的處理上一直都非常謹(jǐn)慎,他們給出的做法是,將大猩猩和其他靈長(zhǎng)類(lèi)動(dòng)物的標(biāo)簽從該服務(wù)的詞庫(kù)中刪除。但是在谷歌其他的應(yīng)用中,比如云計(jì)算服務(wù)和谷歌Assistant中,都能直接識(shí)別。文章發(fā)表在《連線》雜志,由36氪編譯。
2015年,一名黑人軟件開(kāi)發(fā)人員在Twitter上說(shuō),谷歌的照片服務(wù)(Google Photos)把他和一個(gè)黑人朋友的照片打上了“大猩猩”的標(biāo)簽,這讓谷歌感到非常尷尬。谷歌宣稱(chēng)自己“感到震驚和由衷的歉意”。一名相關(guān)的工程師表示,谷歌正在“研究更長(zhǎng)期的解決方案”。
兩年多之后,谷歌給出的其中一項(xiàng)修復(fù)措施就是將大猩猩和其他靈長(zhǎng)類(lèi)動(dòng)物的標(biāo)簽從該服務(wù)的詞庫(kù)中刪除。這一尷尬的變通方案表明,谷歌和其他科技公司在推進(jìn)圖像識(shí)別技術(shù)方面仍舊面臨著諸多困難,盡管這些公司希望能夠在自動(dòng)駕駛汽車(chē)、個(gè)人助理和其他產(chǎn)品上使用這些技術(shù)。
《連線》雜志用4萬(wàn)張圖片對(duì)谷歌照片服務(wù)進(jìn)行了測(cè)試,這些照片中有很多動(dòng)物。谷歌照片在尋找包括熊貓和貴賓犬在內(nèi)的許多動(dòng)物上表現(xiàn)得非常棒。但當(dāng)使用“大猩猩”、“黑猩猩”和“猴子”等詞進(jìn)行搜索時(shí),谷歌照片反饋稱(chēng)“沒(méi)有結(jié)果”。
在谷歌照片服務(wù)中, 谷歌對(duì)"大猩猩"、"黑猩猩"和"猴子"等詞的搜索進(jìn)行了審查。
作為一款移動(dòng)應(yīng)用和網(wǎng)站,谷歌照片為5億用戶提供了管理和備份個(gè)人照片的地方。它使用機(jī)器學(xué)習(xí)技術(shù),自動(dòng)將照片進(jìn)行分組,比如湖泊或拿鐵。同樣,用戶也可以利用該技術(shù)對(duì)他們的照片進(jìn)行搜索。
在《連線》雜志的測(cè)試中,谷歌照片確實(shí)識(shí)別出了一些靈長(zhǎng)類(lèi)動(dòng)物。 使用"狒狒"、"長(zhǎng)臂猿"、"狨猴"和"猩猩"等詞進(jìn)行搜索,結(jié)果都還不錯(cuò)。只要搜索時(shí)使用術(shù)語(yǔ)而不是使用M開(kāi)頭的詞語(yǔ), 就可以找到卷尾猴和疣猴。
在另一項(xiàng)測(cè)試中,《連線》上傳了20張黑猩猩和大猩猩的照片,這些黑猩猩和大猩猩來(lái)自非營(yíng)利組織“黑猩猩天堂”和“黛安 · 福西研究所”(Diane Fossey Institute)。有些猩猩可以用使用“森林”、“叢林”或“動(dòng)物園”等關(guān)鍵詞來(lái)搜索到,但事實(shí)證明,其余的都很難被發(fā)現(xiàn)。
結(jié)論是:在谷歌照片中,狒狒是狒狒,但猴子不是猴子。大猩猩和黑猩猩是不可見(jiàn)的。
智能手機(jī)上的谷歌Lens應(yīng)用,也無(wú)法識(shí)別出來(lái)大猩猩。
在第三次測(cè)試中,《連線》雜志上傳了一組1萬(wàn)多張用于面部識(shí)別研究的圖片。用“非洲裔美國(guó)人”這個(gè)詞進(jìn)行搜索,最后只出現(xiàn)了一幅羚羊的畫(huà)面。輸入“黑人男性”、“黑人女性”或“黑人”,谷歌的系統(tǒng)會(huì)返回黑白圖像,按照性別正確排序,但不被種族過(guò)濾。對(duì)于膚色較深的人來(lái)說(shuō),可以使用“非洲式”(afro)和“非洲人”(African)等詞進(jìn)行搜索,盡管結(jié)果好壞參半,并不那么準(zhǔn)確。
谷歌的一位發(fā)言人證實(shí),在2015年的事件發(fā)生后,"大猩猩"就從搜索和圖片標(biāo)簽中刪除了,直到今天"猩猩"、"黑猩猩"和"猴子"等標(biāo)簽仍在屏蔽中。該發(fā)言人在電子郵件中寫(xiě)道:“圖像標(biāo)簽技術(shù)還處于早期階段,但不幸的是,它還遠(yuǎn)遠(yuǎn)不夠完美。”他強(qiáng)調(diào)了谷歌照片的一個(gè)功能,即允許用戶報(bào)告錯(cuò)誤。
谷歌對(duì)大猩猩圖片的謹(jǐn)慎處理,說(shuō)明了現(xiàn)有的機(jī)器學(xué)習(xí)技術(shù)上的一個(gè)不足之處。有了足夠的數(shù)據(jù)和計(jì)算能力,軟件就可以被訓(xùn)練,可以用來(lái)對(duì)圖像進(jìn)行分類(lèi),或者在較高的精確度下對(duì)語(yǔ)音進(jìn)行轉(zhuǎn)錄。但它無(wú)法輕易超越這種從訓(xùn)練中得出的經(jīng)驗(yàn)。即使是最優(yōu)秀的算法,也缺乏像人類(lèi)那樣運(yùn)用常識(shí)或抽象概念的能力,來(lái)完善它們對(duì)世界的詮釋。
因此,機(jī)器學(xué)習(xí)工程師在現(xiàn)實(shí)世界中部署他們的成果時(shí),必須對(duì)他們的訓(xùn)練數(shù)據(jù)中沒(méi)有發(fā)現(xiàn)的“邊緣案例”保持警惕。維吉尼亞大學(xué)教授維恩特·奧達(dá)尼斯·羅梅恩(Vicente ord ez rom n)說(shuō):“你的系統(tǒng)一旦開(kāi)始上線運(yùn)行,你就很難再對(duì)它進(jìn)行建模。”去年,他參與了一項(xiàng)研究,該研究表明,應(yīng)用于圖像的機(jī)器學(xué)習(xí)算法可以識(shí)別并放大人們對(duì)不同性別之間的偏見(jiàn)。
谷歌照片用戶上傳的照片是在各種不完美的條件下拍攝的。考慮到數(shù)據(jù)庫(kù)中的圖片數(shù)量,將一種類(lèi)型的“類(lèi)人猿”誤認(rèn)成另一種類(lèi)型的可能性極小。
谷歌母公司Alphabet和更廣泛的科技行業(yè)面臨著更大的風(fēng)險(xiǎn),比如應(yīng)用在自動(dòng)駕駛汽車(chē)上。羅曼(Román)和他的同事、軟件可靠性專(zhuān)家拜沙希·雷(Baishakhi Ray)一起,正在探索如何限制視覺(jué)系統(tǒng)在自動(dòng)駕駛汽車(chē)等場(chǎng)景中可能的誤判行為。雷說(shuō),這方面已經(jīng)取得了一些進(jìn)展,但目前還不清楚如何能夠很好地控制這些系統(tǒng)的局限性。“我們?nèi)匀徊荒芊浅>唧w地知道這些機(jī)器學(xué)習(xí)模型正在學(xué)習(xí)什么,”她說(shuō)。
谷歌的一些機(jī)器學(xué)習(xí)系統(tǒng)被允許在公開(kāi)場(chǎng)合使用大猩猩照片進(jìn)行檢測(cè)。該公司的云計(jì)算部門(mén)為企業(yè)提供了一項(xiàng)名為云視覺(jué)(Cloud Vision) API的服務(wù)來(lái)構(gòu)建他們自己的項(xiàng)目。當(dāng)《連線》雜志用大猩猩和黑猩猩的照片對(duì)在線演示進(jìn)行測(cè)試時(shí),它同時(shí)識(shí)別出了這兩張照片。
例如,一只成年大猩猩抱著雙胞胎寶寶的照片被谷歌的云視覺(jué)服務(wù)貼上了“西部大猩猩”的標(biāo)簽,其信心指數(shù)為94%。系統(tǒng)會(huì)在相關(guān)的標(biāo)簽上返回一個(gè)最佳猜測(cè)列表。“哺乳動(dòng)物”和“靈長(zhǎng)類(lèi)動(dòng)物”的得分也達(dá)到了90%甚至更多。
谷歌向企業(yè)提供的云計(jì)算圖像識(shí)別服務(wù)可以自由地稱(chēng)大猩猩為大猩猩。
谷歌的Assistant也可以自由地將大猩猩稱(chēng)為“大猩猩”。在安卓手機(jī)上,谷歌Assistant可以被召喚去嘗試解釋手機(jī)屏幕上的內(nèi)容。當(dāng)被要求識(shí)別“一只成年大猩猩抱著雙胞胎寶寶”的照片時(shí),谷歌Assistant給出的建議是“山地大猩猩”。
但是,“谷歌Lnes”,被標(biāo)榜為展示該公司“計(jì)算機(jī)視覺(jué)上的進(jìn)步”的應(yīng)用,在去年10月添加到了谷歌照片上。當(dāng)被要求識(shí)別同一幅圖像時(shí),它回應(yīng)道:“嗯……還沒(méi)看清楚。”
原文鏈接:https://www.wired.com/story/when-it-comes-to-gorillas-google-photos-remains-blind/