美國(guó)人使用的地圖服務(wù)非常精良。在網(wǎng)上鍵入“漢堡王”幾個(gè)字,谷歌就可以提供附近十幾個(gè)漢堡王餐廳的信息,每一個(gè)都有精確的經(jīng)度和緯度數(shù)據(jù)。
但在世界上很多其他地方,并沒有這樣的地圖可用。雖然這些國(guó)家可能開展了普查工作,但可能只有縣一級(jí)或者省一級(jí)的數(shù)據(jù)可用,不會(huì)詳細(xì)到街道。
就拿人口數(shù)據(jù)來(lái)舉例吧,現(xiàn)在全世界有74億人口。他們生活在人口密集的城市中心,或者居住在農(nóng)場(chǎng)分隔的小城鎮(zhèn)中,或者住在叢林邊緣。但是其中有很多人口,沒人知道他們究竟住在哪里。
現(xiàn)在,F(xiàn)acebook表示,它已經(jīng)20億人制作出了不錯(cuò)的人口地圖,效果超過(guò)以往任何的項(xiàng)目。該公司的連接實(shí)驗(yàn)室(Connectivity Labs) 本周宣布,它制作了20個(gè)國(guó)家(其中大部分是發(fā)展中國(guó)家)的高分辨率人口分布圖。但是要到今年晚些時(shí)候,它才會(huì)發(fā)布這些地圖中的絕大部分。不過(guò),如果這些地圖真的準(zhǔn)確,它們就會(huì)是大多數(shù)國(guó)家有史以來(lái)質(zhì)量最好的人口地圖。
這些地圖值得注意的另一個(gè)原因是:如果它們很準(zhǔn)確,就會(huì)宣告一個(gè)新的人工智能輔助時(shí)代的到來(lái)。
人口地圖的重要性
在富裕國(guó)家,可靠的人口信息被視為是理所當(dāng)然的事情。
人口分布圖在不同領(lǐng)域有幾十種應(yīng)用。城市規(guī)劃者需要用它來(lái)估計(jì)城市密度,以便規(guī)劃和改善道路狀況。流行病學(xué)和公共衛(wèi)生工作者使用它來(lái)跟蹤疫情或分析人們獲得衛(wèi)生醫(yī)療服務(wù)的狀況。如果有災(zāi)難發(fā)生,人口地圖都可以用來(lái)確定應(yīng)該優(yōu)先考慮為哪些地方提供緊急援助。
Facebook對(duì)這種數(shù)據(jù)的興趣存在利潤(rùn)上的原因。全球大約有40億人還沒有使用Facebook,這事關(guān)該公司的未來(lái)發(fā)展前景,所以它對(duì)地圖的興趣,有基礎(chǔ)設(shè)施方面的原因。該公司想知道,對(duì)于這些地方的人,用哪種方法上網(wǎng)最好:使用光纖,還是無(wú)人機(jī)、衛(wèi)星或高空氣球?
這就是Facebook為什么會(huì)選擇這些國(guó)家的部分原因:在這些國(guó)家的一些農(nóng)村地區(qū),人們?nèi)匀粺o(wú)法上網(wǎng)。一共有20個(gè)國(guó)家,包括尼日利亞、肯尼亞、烏干達(dá)、土耳其、烏克蘭、烏茲別克斯坦和印度。隨便說(shuō)一句,F(xiàn)acebook的Free Basics 產(chǎn)品剛剛在印度被潑了一瓢涼水。Free Basics和連接實(shí)驗(yàn)室都隸屬于Internet.org,這個(gè)組織的目標(biāo)是擴(kuò)大網(wǎng)絡(luò)以及Facebook服務(wù)的覆蓋范圍。
Facebook的方法很簡(jiǎn)單?
但是,在所有這20個(gè)國(guó)家,F(xiàn)acebook是怎么做出更好的人口地圖,超越了當(dāng)?shù)卣降哪??他們又沒有像谷歌街景車那樣到處轉(zhuǎn)悠。答案就在于Facebook擁有極為可觀的計(jì)算能力。
這些地圖其實(shí)是這么制作的:首先,F(xiàn)acebook的連接實(shí)驗(yàn)室要拿到當(dāng)前最優(yōu)質(zhì)的世界人口信息,這是哥倫比亞大學(xué)(Columbia University)提供的一個(gè)數(shù)據(jù)集,被稱為“全球人口網(wǎng)格”(Gridded Population of the World)。它綜合了各地的人口普查數(shù)據(jù),調(diào)整到相同的年份。雖然它是全世界目前最優(yōu)質(zhì)的人口地圖,但它的分辨率不怎么高: Facebook表示,一個(gè)網(wǎng)格可以代表城市地區(qū)的幾平方公里,也可以代表農(nóng)村地區(qū)的幾萬(wàn)平方公里。
然后,F(xiàn)acebook又從DigitalGlobe公司購(gòu)買了大量的高分辨率衛(wèi)星圖像。目前太空中大部分私人的高分辨率地球觀測(cè)衛(wèi)星都是由這家公司經(jīng)營(yíng)的。當(dāng)你在谷歌地圖上看自己的房子時(shí),你通常是(但并不總是)通過(guò)DigitalGlobe公司的四個(gè)軌道鏡頭之一看到的。
DigitalGlobe公司的圖像大多數(shù)屬于“小度量的”,也就是說(shuō),網(wǎng)格的一條邊不是數(shù)百公里,而是50厘米。 Facebook的開發(fā)人員訓(xùn)練該公司的神經(jīng)網(wǎng)絡(luò)算法,讓它識(shí)別在這些數(shù)據(jù)中,一棟建筑物從上面看起來(lái)是什么樣子。然后開始進(jìn)行識(shí)別。該軟件根據(jù)它能看到的建筑物數(shù)量來(lái)估計(jì)城市人口密度,并且進(jìn)行推算,把當(dāng)前最佳人口數(shù)據(jù)分配到居住區(qū)中。
“他們?cè)O(shè)定了一個(gè)相當(dāng)基本的假設(shè):如果看見到一棟建筑物,必定就有人在那里,”哥倫比亞大學(xué)地球科學(xué)家說(shuō)羅伯特·陳說(shuō)。他是Facebook所使用的基礎(chǔ)數(shù)據(jù)集“全球人口網(wǎng)格”團(tuán)隊(duì)的主管。
你可能覺得這種方式聽上去很簡(jiǎn)單,其實(shí)它本來(lái)就這么簡(jiǎn)單。它僅僅需要訪問(wèn)神經(jīng)學(xué)習(xí)軟件,需要耗用大量計(jì)算能力。 Facebook估計(jì)它分析了20個(gè)國(guó)家的2160萬(wàn)平方公里土地,“為此,我們用神經(jīng)網(wǎng)絡(luò)處理了146億張圖像;這是Facebook每天分析的所有圖像數(shù)量的十倍多”。
羅伯特·陳警告說(shuō),F(xiàn)acebook的數(shù)據(jù)不能被用來(lái)計(jì)算和當(dāng)?shù)鼐用裼嘘P(guān)的城市密度。但是,“你可以想見,在其他很多情況下,這些數(shù)據(jù)有多么寶貴,”他說(shuō)。
Facebook還沒有發(fā)布這些地圖的最終版本。它說(shuō),最終版本將在今年夏天發(fā)布。在發(fā)布之前,羅伯特·陳的團(tuán)隊(duì)將對(duì)它的準(zhǔn)確性進(jìn)行判定。雖然Facebook的早期結(jié)果令人鼓舞,他羅伯特·陳說(shuō),他仍然不知道這項(xiàng)技術(shù)會(huì)有多么精確,也不知道適用性是否廣泛。 “我們只看到了它的部分狀況,”他說(shuō),但是,如果該技術(shù)的效果令人滿意,F(xiàn)acebook的這個(gè)項(xiàng)目就會(huì)新增另外6個(gè)國(guó)家。
一個(gè)重大勝利?
如果事實(shí)證明這些數(shù)據(jù)很有用,那么連接實(shí)驗(yàn)室的成功就會(huì)標(biāo)志著一個(gè)重大勝利的到來(lái),因?yàn)殚L(zhǎng)期以來(lái),開發(fā)人員在使用衛(wèi)星數(shù)據(jù)時(shí)一直面臨著一個(gè)阻礙:用算法解釋圖像。
在未來(lái)的五年里,硅谷投資的衛(wèi)星公司將向公眾發(fā)布大量影像,遠(yuǎn)遠(yuǎn)超過(guò)以前的水平。這些影像的成本會(huì)比以往任何時(shí)候都更加便宜,而且也更加“新鮮”:由于衛(wèi)星制造上的進(jìn)步,以及火箭成本的下降,一些公司承諾提供每周六、七次的重訪問(wèn)率(revisit rates)。
如果公司——尤其是金融公司——學(xué)不會(huì)如何用機(jī)器破譯這種新的數(shù)據(jù),它們就不會(huì)有什么價(jià)值。公司必須懂得如何從影像中抽取信息,而不需要人員坐在桌子旁埋頭苦干,目前,像Skybox(屬于Alphabet集團(tuán))和笛卡爾實(shí)驗(yàn)室(Descartes Labs)這樣的初創(chuàng)公司表示,他們已經(jīng)在這方面取得了一些進(jìn)步。如果Facebook制作的地圖真的成功了,那么這個(gè)目標(biāo)的可行性就會(huì)獲得進(jìn)一步的證實(shí)。