2014年1月,四川省迎來了兩位來自大洋彼岸的特殊客人:美國北卡羅來納州的杜克大學(xué)(美國綜合學(xué)校排名前十的高校)生物系的訪問學(xué)者Zoe Jewell碩士與Sky Alibhai博士,他們也是WildTrack動物保護(hù)組織的聯(lián)合創(chuàng)始人,Jewell目前擔(dān)任該組織的主席。
Jewell與Alibhai是受到中國政府的邀請,來為四川省臥龍和雅安的大熊貓保護(hù)工作出謀劃策。
盡管野生大熊貓下山咬人或進(jìn)村“串門”的新聞于近日見諸報端,然而中國“國寶”和“活化石”早已被稱為瀕危野生動物種類,自上世紀(jì)80年代,中國政府就因此停止向國外贈送這個建國以來重要的“外交大使”。但大熊貓仍然隨著生存環(huán)境的惡化而日漸稀少,一些相關(guān)保護(hù)區(qū)的高齡老人都表示從未見過大熊貓的蹤跡。2004年完成的全國第三次熊貓調(diào)查結(jié)果則顯示,全國野生大熊貓種群數(shù)量僅為1590多只(第四次調(diào)查結(jié)果將于今年公布)。
中國政府一直著手改善野生大熊貓的生存環(huán)境,為其繁衍創(chuàng)造各種條件。然而,盡管政府在野生大熊貓保護(hù)方面情致高漲,仍然遇到了有力氣無處使的困擾。Jewell與Alibhai兩位海外專家的造訪,就是應(yīng)邀幫助解決這些問題。
圖:Zoe Jewell(WildTrack動物保護(hù)組織創(chuàng)始人及主席),倫敦衛(wèi)生與熱帶病醫(yī)學(xué)院理科碩士,劍橋大學(xué)獸醫(yī)碩士(左)與Sky Alibhai(WildTrack動物保護(hù)組織共同創(chuàng)始人)烏干達(dá)馬凱雷雷大學(xué)動物學(xué)學(xué)士,牛津大學(xué)動物學(xué)哲學(xué)博士(右)
事實(shí)上,Jewell與Alibhai也曾在前年受邀于國家林業(yè)局貓科動物研究中心副主任、東北林業(yè)大學(xué)野生動物資源學(xué)院教授姜廣順博士,解決另外一種野生動物的保護(hù)難題:姜教授希望在大興安嶺、小興安嶺的野生東北虎的保護(hù)上得到海外同行的幫助。
那么,中國方面遇到的普遍難題是什么?兩位海外專家有什么特殊的能力幫助我們呢?
野生動物保護(hù)的難點(diǎn)
《孫子兵法》云:知彼知己,百戰(zhàn)不殆。在人類的戰(zhàn)爭、商業(yè)活動甚至教育領(lǐng)域,因?yàn)樾畔⒉粚ΨQ而導(dǎo)致悲劇后果的案例比比皆是,我們需要盡可能全面地掌握所實(shí)施項目的信息,從而能夠有針對性地制定相應(yīng)的策略,取得預(yù)期的效果,甚至事半功倍。瀕危動物的保護(hù)也是如此,但中國政府的煩惱恰恰在此。
在臥龍,在雅安,我們只知道大熊貓的存在,卻很難了解某區(qū)域內(nèi)野生大熊貓的詳細(xì)信息,比如數(shù)量、年齡、性別等。前述全國野生大熊貓數(shù)量的統(tǒng)計工作,往往歷時長達(dá)3-4年,這么長的時間,結(jié)果是否精確是一回事,對保護(hù)方案的制定來說,也太遲太遲。
姜教授遇到的也是類似的難題:他不知道東北虎通?;顒拥姆秶?、數(shù)量以及性別比例。他嘗試了很多傳統(tǒng)方法,如看糞便、用野外自動攝像機(jī)等等,甚至進(jìn)行DNA分析,但在希望得到的關(guān)鍵信息上仍是一籌莫展。
在很多年前,解決這一問題的一個方式是采用無線電技術(shù)。Jewell和Alibhai曾經(jīng)在中非采用此技術(shù)保護(hù)當(dāng)?shù)貫l危物種犀牛,即通過給犀牛帶上無線電項圈(您可以理解為某種用于動物的可穿戴設(shè)備),來監(jiān)控它們的生存狀態(tài)。在當(dāng)時,這是非常先進(jìn)的技術(shù)。
然而,有證據(jù)表明,無線電項圈會隨著犀牛、大象等動物的成長而對它們的身體造成傷害,并且會使雌性動物受孕率下降,繁殖周期大為延長,這樣一來,豈不是失去了動物保護(hù)的本意?此外,該技術(shù)成本昂貴,且容易受到叢林干擾,監(jiān)控效果消失,而傷害仍在。
因此,兩位專家力主采用低成本、對動物傷害最少(即“非侵入式技術(shù)”)、易于實(shí)施的方式來應(yīng)對此事,他們確實(shí)找到了獨(dú)門“撒手锏”,就是古老的足跡識別技術(shù)(FIT,F(xiàn)ootprint Identification Technique)!這就是我們?yōu)楹我f他們是“特殊客人”。
當(dāng)然,即便用腳趾頭思考,我們也知道FIT技術(shù)經(jīng)過了新的發(fā)展和改造(想象蘋果重新發(fā)明手機(jī))。但新的FIT技術(shù)究竟能幫助我們識別哪些動物的哪些信息?其精確度有多高?它對中國瀕危動物的保護(hù)能發(fā)揮多大作用?
足跡識別技術(shù)
FIT的發(fā)明,兩位專家其實(shí)受到了非洲獵人的追蹤術(shù)啟發(fā)。古老的追蹤術(shù),可以通過動物的蹤跡和糞便來判斷他們的種群數(shù)量,是否瀕危,是否可追蹤。在非洲獵人看來,這種方式遠(yuǎn)比無線電的方式要簡單、直接、清晰。
FIT的原理,是通過動物腳印的分析、追蹤和比較,確定整個生物種群的生存、生活規(guī)律和發(fā)展的狀況,為動物保護(hù)有關(guān)方面的決策打下基礎(chǔ)。簡言之,有了動物腳印照片,我們可以清晰地推斷其種類、數(shù)量、性別比例的信息;對于成年動物來講,F(xiàn)IT還能告訴我們這是五歲的老虎還是十歲的老虎。
在接到姜教授的請求之后,Jewell與Alibhai利用FIT技術(shù)針對前者收集到的東北虎腳印照片信息進(jìn)行了詳細(xì)的分析,精確地得出結(jié)論:在樣本數(shù)據(jù)特定區(qū)域內(nèi),共有7只東北虎,3雄4雌。
之后,國家林業(yè)局貓科動物研究中心與兩位專家又合作啟動了對東北豹的追蹤和保護(hù)工作,然后才是四川野生大熊貓的調(diào)查和保護(hù)。
相比無線電項圈來說,足跡識別技術(shù)顯然成本更低更方便,并且這是一種非侵入式技術(shù),對人和對動物來說都非常安全。
目前,F(xiàn)IT技術(shù)已經(jīng)被兩位專家應(yīng)用在非洲黑犀牛、白犀牛、獅子、獵豹、非洲大象、山獅、南美犰狳、加拿大北部北極熊等各地多種動物的保護(hù),當(dāng)然還有前述的東北虎、大熊貓。Alibhai說,大到大象、小到老鼠的腳印,F(xiàn)IT技術(shù)都能有用武之地。
非洲獵人之所以善于追蹤,其技術(shù)經(jīng)過祖輩口授以及自身的實(shí)踐驗(yàn)證,經(jīng)驗(yàn)豐富的獵人,判斷結(jié)果會更準(zhǔn)確,這也就是為何獵人慣于使用此技術(shù),而科班出身的動物學(xué)家卻想不到??墒?,目前的人工智能技術(shù)仍然處在發(fā)展的初級階段,縱使數(shù)碼照片纖毫畢現(xiàn)還原現(xiàn)場,機(jī)器感知色差能力強(qiáng),又憑什么超越人類經(jīng)驗(yàn)通過圖片就能推斷動物詳細(xì)信息呢?
數(shù)據(jù)分析顯威
相信聰明的讀者已經(jīng)猜到,足跡識別技術(shù)之所以煥發(fā)新春,其精確的關(guān)鍵,就是與新發(fā)展的高級數(shù)據(jù)分析技術(shù)的結(jié)合。
例如,大熊貓和貓科動物腳印的差異,大熊貓的前面有五個腳趾,在側(cè)面還有一個專門用于抓握東西的小的趾頭,在底下還有一塊類似于小腳掌的東西,這較好辨識。然而,要從兩組很相似的腳印辨別出這是兩支不同的犀牛,這對于非洲獵人可能都是一個重大的考驗(yàn)。但Alibhai介紹,通過正確的統(tǒng)計方法,建立正確的模型,正常人眼里貌似一樣的腳印,在統(tǒng)計學(xué)當(dāng)中有顯著的差異,最終能夠把它還原成兩只不同的犀牛。這種統(tǒng)計模型的實(shí)現(xiàn),正是高級數(shù)據(jù)分析技術(shù)的拿手好戲。
在FIT中,只要針對腳印的模式和特征,以及拍攝環(huán)境,調(diào)整不同的模塊和參數(shù)(如雪的厚度),對腳掌信息拆分,包括腳趾之間的距離,中心點(diǎn)之間的距離,各個中心點(diǎn)連線之后不同的角度等等,作為原始數(shù)據(jù),即可進(jìn)行分析,讓老舊的技術(shù)煥發(fā)新的生命。
然而,動物學(xué)的研究本身就是一項浩瀚的工作,一位優(yōu)秀的動物學(xué)家,窮畢生之心血,尚覺精力有限,還需要分心修習(xí)統(tǒng)計學(xué)這門博大精深的學(xué)問,然后針對不同的物種建立各種不同的模型,這似乎不太科學(xué)——這項工作需要深刻地了解動物,統(tǒng)計學(xué)專家無法完全代勞。
例如,要如何科學(xué)地取中心點(diǎn),又如,要確保東北虎模型的正確性,能夠通過腳印辨識動物信息,需要通過圈養(yǎng)的老虎生成的數(shù)據(jù)進(jìn)行模型訓(xùn)練,然后反復(fù)修正和校驗(yàn),最終才能得到正確的模型用于有效地預(yù)測野生東北虎。
所以我們也看到,目前大數(shù)據(jù)概念熱炒,很多專家都預(yù)測,大數(shù)據(jù)要深入應(yīng)用,數(shù)據(jù)科學(xué)家不可或缺??墒菙?shù)據(jù)科學(xué)家或者數(shù)據(jù)動物學(xué)家,多么的可遇不可求。
幸好,F(xiàn)IT并不需要動物學(xué)家去深入研究統(tǒng)計學(xué)。“你根本不需要懂得太多的統(tǒng)計學(xué)的原理和技術(shù),就可以用FIT去分析你所得到的腳印圖像。我只要把一個圖片的信息拉到我的菜單里,它就能夠自動計算出這些圖形的特征。” Alibhai說。
對于動物學(xué)家來說,這無疑是極大的解放。FIT實(shí)現(xiàn)這一解放的秘密武器是什么呢?
JMP驅(qū)動可視化分析
Jewell與Alibhai揭開了謎底:SAS軟件旗下展現(xiàn)能力極強(qiáng)的JMP數(shù)據(jù)分析軟件平臺。
JMP數(shù)據(jù)分析軟件大中華區(qū)總經(jīng)理嚴(yán)雪林介紹,JMP涵蓋了幾乎所有的常規(guī)統(tǒng)計功能,和一些更高級的計算機(jī)和數(shù)據(jù)分析的交集,即數(shù)據(jù)挖掘。涵蓋了統(tǒng)計分析和生物技術(shù)、計算機(jī)技術(shù)的交叉學(xué)科。JMP除了常規(guī)的統(tǒng)計分析的方法之外,還涵蓋了相當(dāng)一部分?jǐn)?shù)據(jù)挖掘的工具和平臺。
“FIT是基于JMP開發(fā)出來的工具包,在這個工具包上我們使用了JMP的腳本語言,叫JMP Script Language,簡稱JSL。我們使用JMP的腳本語言,幾乎利用了JMP里面所有很重要的能力和元素,來生成FIT的分析包。” Alibhai說。
圖:基于JMP平臺的FIT技術(shù)
腳本語言和其他程序語言不一樣,比較簡單,很容易讀,不會像計算機(jī)編程那樣涉及到很多原理性的東西,可以大大簡化動物學(xué)家的開發(fā)工作。Alibhai介紹,F(xiàn)IT中的東北虎、犀牛等多個工具包,都是用JMP的腳本語言開發(fā)出來的。
杜克大學(xué)與JMP公司在北卡羅來納州比鄰而居,這有利于他們的溝通,但不是FIT選擇基于JMP開發(fā)的理由。
“之所以使用JMP的一個很重要原因就是,和市面上其他的統(tǒng)計分析的工具和軟件相比,JMP圖形化的能力是最強(qiáng)的,而我們的工作恰恰又是和圖形、可視化高度相關(guān)。” Jewell說,一些流行的開源工具如R語言,是沒有辦法提供像JMP一樣對圖形進(jìn)行量化和處理的能力。
可以想象,那么多種動物模型的建立和分析工作,如果都要手工畫圖,寫方程式,工作量該有多大,對分析人員的挑戰(zhàn)該有多大。
圖:JMP數(shù)據(jù)分析軟件大中華區(qū)總經(jīng)理嚴(yán)雪林
兩位專家與SAS軟件聯(lián)合創(chuàng)始人及JMP的創(chuàng)始人John Sall溝通,后者同意把對于圖形、圖像的分析能力引入到JMP的軟件當(dāng)中去,進(jìn)行一些新的開發(fā),以幫助生態(tài)保護(hù)學(xué)家使用JMP分析所需要的圖形和元素。
“JMP的使命就是要結(jié)合圖形化、簡單統(tǒng)一的表達(dá)方式,把它和傳統(tǒng)的數(shù)據(jù)分析的統(tǒng)計原理結(jié)合起來,讓人類社會能夠以更簡單的方式進(jìn)入到數(shù)據(jù)分析的領(lǐng)域里,這是JMP誕生的愿景。”JMP數(shù)據(jù)分析軟件大中華區(qū)總經(jīng)理嚴(yán)雪林說。
Jewell 還透露,他們正在JMP平臺上持續(xù)開發(fā)和完善FIT,希望給它帶來更多的功能和特征,讓野外工作人員更加容易使用和辨識。
“我們想把整個過程進(jìn)行自動化,這樣就不需要由專家在上面一個一個點(diǎn)的放上去,而是完全自動地對這個圖像信息進(jìn)行處理。” Jewell 說。
作為杜克大學(xué)的訪問學(xué)者,兩位專家在中國訪問了中科院、北京大學(xué)、東北林業(yè)大學(xué)等學(xué)術(shù)機(jī)構(gòu),交流野生動物保護(hù)的技術(shù),包括統(tǒng)計分析方法的使用。而John Sall也非??犊刈隽艘粋€承諾,任何野生動物保護(hù)的組織都可以免費(fèi)使用JMP??梢灶A(yù)計,插上了數(shù)據(jù)分析的翅膀,古老的足跡識別技術(shù)將在動物保護(hù)工作中更加大放異彩。
編輯點(diǎn)評:基于數(shù)據(jù)分析的FIT技術(shù)成功應(yīng)用于野生動物保護(hù)的關(guān)鍵,在于兩位專家與同行積極和廣泛的交流,以及分析平臺的正確選擇。
當(dāng)前大數(shù)據(jù)正在被熱炒,但其實(shí)終端用戶并不關(guān)心所采用的是大數(shù)據(jù)還是數(shù)據(jù)分析,真正關(guān)心的是能否真正應(yīng)用,如獲取保護(hù)大熊貓的所需要的信息。因?yàn)閿?shù)據(jù)分析方法本身學(xué)術(shù)的難度,大數(shù)據(jù)進(jìn)入的門檻非常高,國內(nèi)講的更多的是大數(shù)據(jù)的收集和管理,后端的分析講得也比較少。但恰恰是后端的分析,對于整個大數(shù)據(jù)的價值鏈條是最關(guān)鍵的一環(huán)。
因此,JMP幫助實(shí)現(xiàn)FIT技術(shù)保護(hù)野生動物的故事,為大數(shù)據(jù)的真正落地可以帶來很多啟發(fā)。