“在"大數據時代"這個互聯(lián)網開放共贏、互聯(lián)互動的時代,作為從事大數據研究的科研人員,我們的任務是要讓研究成果成為拴住大數據這匹"野馬"的重要力量,使大數據更好地為人民的生活和社會的和諧服務。”哈爾濱工業(yè)大學計算機科學與技術學院副教授、博士生導師王宏志笑著解釋了自己從事的大數據研究工作。
2012年,《紐約時報》稱“大數據”時代已經來臨;2013年,有媒體稱,這一年是世界的“大數據元年”。而早在2011年,王宏志已經很深地介入了大數據的研究。2011年,他在微軟亞洲研究院期間提出的海量圖數據的匹配算法,在國際上首次將子圖匹配算法擴展到了規(guī)模為10億級別的圖上,該算法于2012年發(fā)表以來,已被引用超過60次,并已經進入微軟亞洲研究院的Trinity系統(tǒng)。
王宏志長期從事大數據管理算法和系統(tǒng)的研究,主要集中于復雜大數據的管理與計算,以及大數據質量管理方面。在復雜數據管理方面,他提出了一系列XML大數據和大圖管理方法,博士論文《XML數據查詢處理技術的研究》獲得哈爾濱工業(yè)大學優(yōu)秀博士論文和中國計算機學會優(yōu)秀博士論文。
梅花香自苦寒來。熟悉王宏志的人都知道,王宏志的成功并非偶然。在孜孜不倦地學習追求和更高境界的學術探究中,王宏志付出了艱苦的努力。但王宏志自己覺得,那些經歷都是他人生的寶貴財富,科研的堅實基礎。2004年,王宏志作為訪問研究助理在新南威爾士大學學習深造;2006年,他又來到新加坡國立大學進行實習交流。經過長期的積累和歷練,2008年,他于哈爾濱工業(yè)大學計算機軟件與理論專業(yè)獲得博士學位,隨后留校任教。這期間,王宏志還作為“鑄星計劃”訪問學者和博士后分別在微軟亞洲研究院和美國加州大學歐文分校進行了訪問交流。
“大數據是一把雙刃劍,在給人們帶來更加豐富的資訊的同時,其質量問題也成為日益凸顯的問題,對社會及個人造成一定威脅。”王宏志說,正是看到了大數據“野馬”的“個性”,早在幾年前,他和他所在的科研團隊便開始致力于大數據科研,并取得了系列的成果,也更加堅定了他們拴住大數據這匹“野馬”的信心。
王宏志說,針對大數據質量這一大數據管理中的痛點,國家已經有了足夠的重視和科研布局。在國家重點基礎研究發(fā)展(973)計劃和863計劃的支持下,王宏志作為技術負責人,帶領團隊開發(fā)了適用于大數據的并行數據清洗系統(tǒng),用于解決大數據中的多種數據質量問題。圍繞該項工作中發(fā)現(xiàn)的理論和技術問題,王宏志還作為項目負責人獲得了國家自然科學基金的資助。目前,王宏志正承擔著“大數據錯誤檢測與修復關鍵技術的研究”及國家科技支撐計劃項目“基于大數據的綜合健康服務關鍵技術研究與應用”。
王宏志認為,大數據技術的戰(zhàn)略意義不在于掌握龐大的數據信息,而在于對這些含有意義的數據進行專業(yè)化處理。換言之,如果把大數據比作一種產業(yè),那么這種產業(yè)實現(xiàn)盈利的關鍵,在于提高對數據的“加工能力”,通過“加工”實現(xiàn)數據的“增值”。在王宏志看來,大數據科研的目的和結果,最終是為現(xiàn)實工作和生活服務。王宏志說,他正在進行的“基于大數據的綜合健康服務關鍵技術研究”項目,就是要將研究成果應用于“智慧醫(yī)療”和“健康服務”這一熱點領域。
王宏志說:“雖然大數據還處于初級階段,但由于廣泛的應用前景,大數據將深刻改變你我的未來。”