2020国产精品无码色在线,伧理片看一天草民

搜索引擎操縱了你嗎？

責(zé)任編輯：editor004

作者：木遙木遙

2016-06-12 14:11:29

摘自：騰訊科技

原來谷歌在同時(shí)討好希拉里和川普，兩面押寶，真是用心險(xiǎn)惡啊……即使原文的基本假設(shè)成立，觀察到「希拉里的搜索結(jié)果有差異」也不能說明谷歌偏向希拉里，至少得說明「只有希拉里的搜索結(jié)果有差異」才行。

搜索引擎操縱了你嗎？

一家名叫 SourceFed 的獨(dú)立媒體的一則報(bào)告在中美互聯(lián)網(wǎng)上都炸鍋了。

它的中心思想是：通過搜索一系列關(guān)于希拉里的負(fù)面新聞，發(fā)現(xiàn)谷歌的自動(dòng)提示竟然沒有包括一些明明應(yīng)該被廣為搜索的詞匯組合，比方說，當(dāng)你搜索 hillary clinton criminal 這個(gè)攻擊希拉里的常見詞匯組合的時(shí)候，看到的不是 crime reform，就是 crisis，總之是一些比較中性的詞匯。通過 google trend 這類反映網(wǎng)民搜索趨勢的工具很容易查到，搜索希拉里 criminal 的人明明遠(yuǎn)比 crime reform 為多，所以這充分說明，谷歌在作弊。

搜索引擎操縱了你嗎？

　　結(jié)論是：谷歌在操縱輿論，偏向希拉里。你可以在這里看到比較完整的指控：

現(xiàn)實(shí)版《紙牌屋》？谷歌被指屏蔽對希拉里不利信息

這個(gè)結(jié)論收到普遍歡迎并不奇怪。很多人不喜歡希拉里，或者不喜歡谷歌，或者對它們并無成見，只是喜歡陰謀論。但也有很多人，覺得自己一貫持平公允，看了這篇文章也不禁開始懷疑。文章看起來有理有據(jù)，總得有個(gè)解釋吧？

其實(shí)解釋起來再容易不過了。首先，大多數(shù)網(wǎng)民搜索希拉里的時(shí)候根本就不會(huì)打全名，特別是要搜索負(fù)面信息的網(wǎng)民。如果你只搜索 hillary，你其實(shí)是能看到 criminal 這類負(fù)面訊息的：

搜索引擎操縱了你嗎？

那么為什么在搜索 Hillary Clinton 全名的時(shí)候沒有這些結(jié)果呢？因?yàn)楣雀璧恼呤潜M量不在全名后提示負(fù)面詞匯，以免自動(dòng)提示這個(gè)功能被利用成為在網(wǎng)絡(luò)上攻擊他人名譽(yù)的工具。這個(gè)政策是對所有人一視同仁的。比如川普，盡人皆知，川普的一個(gè)著名丑聞是涉嫌強(qiáng)奸自己的前妻。Donald Trump rape 或者 Donald Trump lawsuit 和 Hillary Clinton Criminal 一樣都是網(wǎng)民搜索的熱詞。但是在谷歌的自動(dòng)提示里，也不會(huì)出現(xiàn)這個(gè)組合：

搜索引擎操縱了你嗎？

　　抓到了！原來谷歌在同時(shí)討好希拉里和川普，兩面押寶，真是用心險(xiǎn)惡啊……

其實(shí)，即使沒有所有這些實(shí)驗(yàn)，要看出原文的問題也不困難，這里實(shí)在是有太多邏輯上的漏洞了：

一、原文所依賴的基本假設(shè)是：谷歌的自動(dòng)提示應(yīng)當(dāng)完全依賴于網(wǎng)民的搜索熱度。只要兩者有偏差，就說明谷歌在作弊?？墒沁@假設(shè)并不成立，即使不熟悉技術(shù)的人，只要有基本的直覺就會(huì)懂得，自動(dòng)提示這類功能在設(shè)計(jì)的時(shí)候當(dāng)然不可能只考慮一個(gè)影響因素。這道理很簡單，稍加思索就會(huì)明白。

二、即使原文的基本假設(shè)成立，觀察到「希拉里的搜索結(jié)果有差異」也不能說明谷歌偏向希拉里，至少得說明「只有希拉里的搜索結(jié)果有差異」才行。原文甚至連這個(gè)基本功課都沒有做。

三、再假設(shè)，即使真的觀察到了只有希拉里的搜索結(jié)果有差異，是不是就能說明谷歌偏向希拉里？還是不行，任何智能算法都會(huì)有出錯(cuò)的基本誤差，需要證明，希拉里的誤差是如此之大，以至于一定不可能是隨機(jī)因素造成的。這就需要至少做一點(diǎn)基本的數(shù)據(jù)統(tǒng)計(jì)和搜集，有多少常見的負(fù)面詞匯，這些負(fù)面詞匯應(yīng)當(dāng)以什么頻率出現(xiàn)，實(shí)際上的頻率是怎樣的，偏差的置信度是多少，諸如此類。只靠 criminal 或者 indictment 這一兩個(gè)孤證來作出結(jié)論，這在任何正式的研究項(xiàng)目里都是要被笑掉大牙的。這和說一個(gè)人某天出門路上比平時(shí)多花了十分鐘，所以一定是去從事不法勾當(dāng)了，沒什么本質(zhì)區(qū)別。

一家獨(dú)大的搜索引擎對社會(huì)公平的影響不是什么新鮮話題。歸根結(jié)底，人們依賴谷歌至深，而谷歌的算法又全然隱藏在黑箱之內(nèi)。所以下面這個(gè)問題看起來既合情，也合理：我們難道沒有權(quán)利要求一家搜索引擎給我們一個(gè)「真實(shí)」的輿論場嗎？

沒有。因?yàn)槭澜缟喜⒉淮嬖谶@樣一個(gè)天上掉下來的真實(shí)。

在搜索引擎出現(xiàn)之前，人們獲取信息的渠道是廣播、電視、報(bào)紙、小道消息……它們沒有一樣是不能被特定的人和權(quán)力所把持和影響的。事實(shí)上，在人類歷史上的大多數(shù)時(shí)期和大多數(shù)文化里，操控輿論甚至都未必是一個(gè)負(fù)面詞匯。輿論從來就是被人控制的。

搜索引擎在人類歷史上第一次讓算法替代人來進(jìn)行信息的分揀和排序——搜索和過濾本來就是同一件事的兩種不同的稱呼。隨著算法越來越復(fù)雜，人工智能所占據(jù)的重要性越來越高，我們正在一步一步地讓信息流通擺脫人為因素的作用。

但我們并不能指望算法最終還原給我們一個(gè)客觀的真理世界。真理不該是這樣獲得的。獲得真理的根本途徑，是自己的思考和懷疑，聆聽和理解不同的聲音；是擯棄簡單粗暴的結(jié)論，理解和欣賞世界的復(fù)雜和多樣性；是掌握基本的統(tǒng)計(jì)學(xué)知識(shí)，了解如何看待數(shù)據(jù)的規(guī)律，懂得人類在原始時(shí)代進(jìn)化出的本能直覺很可能并不一定適應(yīng)當(dāng)代社會(huì)；以及最根本的，是不要讓立場控制自己的思想。這不是算法的責(zé)任，這是你的責(zé)任。

如果你做不到這些，你當(dāng)然會(huì)被操縱，但別讓谷歌背這個(gè)鍋了，這是你自己選的。

谷歌搜索引擎