搜索引擎操縱了你嗎?

責(zé)任編輯:editor004

作者:木遙 木遙

2016-06-12 14:11:29

摘自:騰訊科技

原來谷歌在同時(shí)討好希拉里和川普,兩面押寶,真是用心險(xiǎn)惡啊……即使原文的基本假設(shè)成立,觀察到「希拉里的搜索結(jié)果有差異」也不能說明谷歌偏向希拉里,至少得說明「只有希拉里的搜索結(jié)果有差異」才行。

搜索引擎操縱了你嗎?

一家名叫 SourceFed 的獨(dú)立媒體的一則報(bào)告在中美互聯(lián)網(wǎng)上都炸鍋了。

它的中心思想是:通過搜索一系列關(guān)于希拉里的負(fù)面新聞,發(fā)現(xiàn)谷歌的自動(dòng)提示竟然沒有包括一些明明應(yīng)該被廣為搜索的詞匯組合,比方說,當(dāng)你搜索 hillary clinton criminal 這個(gè)攻擊希拉里的常見詞匯組合的時(shí)候,看到的不是 crime reform,就是 crisis,總之是一些比較中性的詞匯。通過 google trend 這類反映網(wǎng)民搜索趨勢的工具很容易查到,搜索希拉里 criminal 的人明明遠(yuǎn)比 crime reform 為多,所以這充分說明,谷歌在作弊。

搜索引擎操縱了你嗎?

  結(jié)論是:谷歌在操縱輿論,偏向希拉里。你可以在這里看到比較完整的指控:

現(xiàn)實(shí)版《紙牌屋》?谷歌被指屏蔽對希拉里不利信息

這個(gè)結(jié)論收到普遍歡迎并不奇怪。很多人不喜歡希拉里,或者不喜歡谷歌,或者對它們并無成見,只是喜歡陰謀論。但也有很多人,覺得自己一貫持平公允,看了這篇文章也不禁開始懷疑。文章看起來有理有據(jù),總得有個(gè)解釋吧?

其實(shí)解釋起來再容易不過了。首先,大多數(shù)網(wǎng)民搜索希拉里的時(shí)候根本就不會(huì)打全名,特別是要搜索負(fù)面信息的網(wǎng)民。如果你只搜索 hillary,你其實(shí)是能看到 criminal 這類負(fù)面訊息的:

搜索引擎操縱了你嗎?

搜索引擎操縱了你嗎?

搜索引擎操縱了你嗎?

那么為什么在搜索 Hillary Clinton 全名的時(shí)候沒有這些結(jié)果呢?因?yàn)楣雀璧恼呤潜M量不在全名后提示負(fù)面詞匯,以免自動(dòng)提示這個(gè)功能被利用成為在網(wǎng)絡(luò)上攻擊他人名譽(yù)的工具。這個(gè)政策是對所有人一視同仁的。比如川普,盡人皆知,川普的一個(gè)著名丑聞是涉嫌強(qiáng)奸自己的前妻。Donald Trump rape 或者 Donald Trump lawsuit 和 Hillary Clinton Criminal 一樣都是網(wǎng)民搜索的熱詞。但是在谷歌的自動(dòng)提示里,也不會(huì)出現(xiàn)這個(gè)組合:

搜索引擎操縱了你嗎?

搜索引擎操縱了你嗎?

  抓到了!原來谷歌在同時(shí)討好希拉里和川普,兩面押寶,真是用心險(xiǎn)惡啊……

其實(shí),即使沒有所有這些實(shí)驗(yàn),要看出原文的問題也不困難,這里實(shí)在是有太多邏輯上的漏洞了:

一、原文所依賴的基本假設(shè)是:谷歌的自動(dòng)提示應(yīng)當(dāng)完全依賴于網(wǎng)民的搜索熱度。只要兩者有偏差,就說明谷歌在作弊??墒沁@假設(shè)并不成立,即使不熟悉技術(shù)的人,只要有基本的直覺就會(huì)懂得,自動(dòng)提示這類功能在設(shè)計(jì)的時(shí)候當(dāng)然不可能只考慮一個(gè)影響因素。這道理很簡單,稍加思索就會(huì)明白。

二、即使原文的基本假設(shè)成立,觀察到「希拉里的搜索結(jié)果有差異」也不能說明谷歌偏向希拉里,至少得說明「只有希拉里的搜索結(jié)果有差異」才行。原文甚至連這個(gè)基本功課都沒有做。

三、再假設(shè),即使真的觀察到了只有希拉里的搜索結(jié)果有差異,是不是就能說明谷歌偏向希拉里?還是不行,任何智能算法都會(huì)有出錯(cuò)的基本誤差,需要證明,希拉里的誤差是如此之大,以至于一定不可能是隨機(jī)因素造成的。這就需要至少做一點(diǎn)基本的數(shù)據(jù)統(tǒng)計(jì)和搜集,有多少常見的負(fù)面詞匯,這些負(fù)面詞匯應(yīng)當(dāng)以什么頻率出現(xiàn),實(shí)際上的頻率是怎樣的,偏差的置信度是多少,諸如此類。只靠 criminal 或者 indictment 這一兩個(gè)孤證來作出結(jié)論,這在任何正式的研究項(xiàng)目里都是要被笑掉大牙的。這和說一個(gè)人某天出門路上比平時(shí)多花了十分鐘,所以一定是去從事不法勾當(dāng)了,沒什么本質(zhì)區(qū)別。

一家獨(dú)大的搜索引擎對社會(huì)公平的影響不是什么新鮮話題。歸根結(jié)底,人們依賴谷歌至深,而谷歌的算法又全然隱藏在黑箱之內(nèi)。所以下面這個(gè)問題看起來既合情,也合理:我們難道沒有權(quán)利要求一家搜索引擎給我們一個(gè)「真實(shí)」的輿論場嗎?

沒有。因?yàn)槭澜缟喜⒉淮嬖谶@樣一個(gè)天上掉下來的真實(shí)。

在搜索引擎出現(xiàn)之前,人們獲取信息的渠道是廣播、電視、報(bào)紙、小道消息……它們沒有一樣是不能被特定的人和權(quán)力所把持和影響的。事實(shí)上,在人類歷史上的大多數(shù)時(shí)期和大多數(shù)文化里,操控輿論甚至都未必是一個(gè)負(fù)面詞匯。輿論從來就是被人控制的。

搜索引擎在人類歷史上第一次讓算法替代人來進(jìn)行信息的分揀和排序——搜索和過濾本來就是同一件事的兩種不同的稱呼。隨著算法越來越復(fù)雜,人工智能所占據(jù)的重要性越來越高,我們正在一步一步地讓信息流通擺脫人為因素的作用。

但我們并不能指望算法最終還原給我們一個(gè)客觀的真理世界。真理不該是這樣獲得的。獲得真理的根本途徑,是自己的思考和懷疑,聆聽和理解不同的聲音;是擯棄簡單粗暴的結(jié)論,理解和欣賞世界的復(fù)雜和多樣性;是掌握基本的統(tǒng)計(jì)學(xué)知識(shí),了解如何看待數(shù)據(jù)的規(guī)律,懂得人類在原始時(shí)代進(jìn)化出的本能直覺很可能并不一定適應(yīng)當(dāng)代社會(huì);以及最根本的,是不要讓立場控制自己的思想。這不是算法的責(zé)任,這是你的責(zé)任。

如果你做不到這些,你當(dāng)然會(huì)被操縱,但別讓谷歌背這個(gè)鍋了,這是你自己選的。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)