在2016世界移動通信大會上,一項神秘的研究成果引起國際業(yè)界的關注。在此之前,業(yè)界很難想象利用移動互聯(lián)網(wǎng)用戶的后臺數(shù)據(jù),可以預測人類的行動規(guī)律。
而這項研究的始創(chuàng)者是一位只有32歲的小伙子——國防科技大學信息系統(tǒng)與管理學院講師呂欣。
讓信息告訴我們?nèi)嗽谀?/p>
“人類的行為有一定規(guī)律性,可以被預測出來。”呂欣提起他的研究非常興奮,“在一些重大突發(fā)事件中,預測人類的行動規(guī)律可以幫助我們定位人群,打通救援的第一道關口。”
2010年2月,正在德國參加歐洲物理學會議的博士生呂欣接到來自海地的電話。找他的是瑞典卡羅林斯卡學院的同學、一位醫(yī)學博士,當時正在海地參加震后救援。這場地震造成22萬人死亡,超過60萬人短時間內(nèi)逃到其他地區(qū)。由于當?shù)厣鐣芾砺浜?,國際救援組織難以獲知災民去向并組織災后救援行動。
“能否運用你在數(shù)據(jù)挖掘上的能力幫助我們找到他們?”這位同學告訴呂欣,當?shù)刂饕謾C運營商可以向救援組織提供300萬用戶地震前后約10億條手機定位數(shù)據(jù)。
從數(shù)以億計的手機信息中找出難民去向,顯然不是易事。“當時,學術界一般認為自然災害中人群移動行為是高度不確定的,試圖從浩如煙海的數(shù)據(jù)中發(fā)現(xiàn)震后人群的移動規(guī)律,的確是一次不可思議的探索。”呂欣說,他與國外學者展開合作攻關,通過多次數(shù)據(jù)整理、分析得出結(jié)論,難民通常會選擇去以往社會關系較為密切的地方,如親戚朋友家、以前常去的公園等。事實證明,即便是在嚴重災害發(fā)生后,人類的行為也并不是慌亂而不可預測的,相反卻是非常理性并有跡可循的。
“分析采集大量歷史數(shù)據(jù)可以預測人類的行為規(guī)律。”呂欣為這項發(fā)現(xiàn)歡欣鼓舞。最終,他的研究成果成功描述了地震前后海地災區(qū)難民的人口流動信息,從而為國際援助組織和管理決策者提供了極為有效的決策支持。
以海地災后手機數(shù)據(jù)分析為起點,呂欣及其合作者積極參與了2013年孟加拉國臺風救災、2014年西非埃博拉病毒防控、2015年尼泊爾大地震救災等重大災害救援與管理,生成的報告得到了當?shù)卣吐?lián)合國相關組織的高度重視,被聯(lián)合國人口基金會、聯(lián)合國人道事務辦公室等采用。
網(wǎng)絡抽樣可以更優(yōu)化
2006年,呂欣以四川大學管理科學專業(yè)第二名的成績被保送至國防科大信息系統(tǒng)與管理學院,師從管理學著名專家譚躍進教授,主要開展復雜網(wǎng)絡方面的研究。復雜網(wǎng)絡,就是在龐大復雜的網(wǎng)絡環(huán)境中找到維系網(wǎng)絡關系的核心節(jié)點。
2009年,呂欣赴瑞典卡羅林斯卡學院攻讀博士學位,并在斯德哥爾摩大學社會學系擔任助理研究員。經(jīng)過縝密考慮,他轉(zhuǎn)向研究網(wǎng)絡數(shù)據(jù)挖掘與分析技術,主攻網(wǎng)絡抽樣方法。主要針對高危、特殊人群,通過他們在社交關系中的特點進行抽樣分析,這對公共安全和網(wǎng)絡安全工作來說是一項巨大的突破。
網(wǎng)絡抽樣作為比較成熟的網(wǎng)絡數(shù)據(jù)挖掘方法,已經(jīng)在相關領域得到普遍承認和廣泛應用。然而,實際做好抽樣不僅限于了解被抽樣群體,而是要通過少數(shù)人群了解多數(shù)人群,其中涉及很專業(yè)的數(shù)學算法和計算機知識。
“因為以往做網(wǎng)絡抽樣時,很多假設條件在現(xiàn)實中根本不滿足,就會導致推斷存在誤差,甚至與真實情況相去甚遠。”呂欣解釋說,“實際上,我做了一項改進方法,把推測更加逼近真實值的工作,大大優(yōu)化了統(tǒng)計方法。”
短短幾年時間,呂欣取得了一系列突破:在國際上首次對網(wǎng)絡抽樣方法的統(tǒng)計假設提出質(zhì)疑,并采用在線網(wǎng)絡數(shù)據(jù)對這項研究的偏差進行綜合評估,在此基礎上獨立開發(fā)出一種使用中心網(wǎng)絡數(shù)據(jù)的新方法,避免了傳統(tǒng)方法的局限性。他還設計開發(fā)了國際上首個在線社會網(wǎng)絡調(diào)查系統(tǒng),關于Twitter在線社會網(wǎng)絡挖掘技術的研究成果,在所有同時期的9.4萬多篇論文中,其影響力位列前4%。
通過呂欣的一系列創(chuàng)新性改進,使用社會網(wǎng)絡可以較容易地調(diào)查和發(fā)現(xiàn)以往研究人員難以接觸的社會群體,如吸毒者等。并能通過有限的調(diào)查樣本對總體情況進行估計,從而為公共安全、網(wǎng)絡檢測和控制等提供寶貴信息。該方法目前已在世界范圍內(nèi)得到廣泛應用。
創(chuàng)新路上永無止境
將大數(shù)據(jù)分析成果應用于應急救援、社會管理,這只是呂欣科研工作中的一小部分。讓大數(shù)據(jù)服務國防,為未來戰(zhàn)爭插上信息化翅膀,這是呂欣的強軍夢。
“體系對抗、聯(lián)合作戰(zhàn)、信息化戰(zhàn)爭都會產(chǎn)生大量數(shù)據(jù),如通信、偵查、人員、裝備、指揮控制、火力對抗等等。只有全面、準確、及時地把握戰(zhàn)場態(tài)勢的發(fā)展變化,從龐大的數(shù)據(jù)中挖掘出對敵的關鍵節(jié)點,才能高效地組織對抗,破解戰(zhàn)爭迷霧,實現(xiàn)戰(zhàn)爭的精確設計。”呂欣說。
從走進國防科大的那一天開始,呂欣就高度關注網(wǎng)絡理論的實際應用,創(chuàng)新地提出了戰(zhàn)術通信網(wǎng)絡時空演化模型、信息遠距離傳播算法以及網(wǎng)絡最短路徑節(jié)點合并算法,并在復雜網(wǎng)絡抗毀性研究上做了部分工作,其戰(zhàn)術通信網(wǎng)絡模型的研究在我軍一些部門已經(jīng)得到應用。“高智慧、無人化將是未來戰(zhàn)爭的主要特點,大數(shù)據(jù)技術在完成超越傳統(tǒng)指揮員反應能力的戰(zhàn)場應對中大有可為。”呂欣認為。
2013年,呂欣在人類移動行為動力學及軌跡可預測性研究上取得突出成果,成功將大數(shù)據(jù)分析方法應用到重大自然災害事件的應急管理中,開發(fā)出一套用于人群移動軌跡預測的馬爾科夫模型。成果在《Nature》《PNAS》等國外高水平期刊上得以發(fā)表,成為學校首位先后兩次在國際頂尖學術期刊上發(fā)表文章的學者。國外同行極力挽留他留下來工作,美國圣塔菲研究所等頂級科研機構也向他發(fā)出邀請。他都婉言拒絕,“無論何時,只要祖國需要,我就義無反顧”?;匦:螅e極參與到軍隊相關任務攻關中,為總部決策提供了關鍵技術支撐。
為把研究成果服務到實際工作中,呂欣還積極參與國際公益活動。通過分析手機數(shù)據(jù),定位人流移動,為自然災害管理提供免費、及時、有效的決策支持。因為時差的關系,呂欣往往是在半夜收到國外合作者發(fā)來的災區(qū)數(shù)據(jù)。為了加快研究進度、高效完成數(shù)據(jù)整理和分析,他經(jīng)常連續(xù)把自己關在實驗室,最終保證在12小時內(nèi)完成數(shù)據(jù)分析和提交首份報告,并及時進行數(shù)據(jù)和報告的更新,為國際救援搶到了寶貴的黃金時間。