近年社交網(wǎng)站、網(wǎng)絡(luò)購物、搜尋器等已成為市民生活的一部分,自千禧年后,全球踏入了劃時(shí)代的大數(shù)據(jù)年代。要處理海量數(shù)據(jù),開發(fā)軟件成為當(dāng)代計(jì)算機(jī)科學(xué)學(xué)者面對的重要課題。理工大學(xué)電子計(jì)算學(xué)系學(xué)者表示,大數(shù)據(jù)的應(yīng)用已由金融業(yè)擴(kuò)展至其他行業(yè)如醫(yī)學(xué),例如為研發(fā)新藥物進(jìn)行數(shù)據(jù)分析,或?qū)⒉∪速Y料數(shù)據(jù)進(jìn)行分析,一旦成功將能為病人度身訂造藥物,對醫(yī)學(xué)界是重要的突破。
大數(shù)據(jù)(Big Data)又被稱為海量資料或巨量資料,意思是指大量(Volume)、高速(Velocity)和多變(Variety),在千禧年時(shí)由搜尋器 Google始出現(xiàn)。早期應(yīng)用大數(shù)據(jù)的行業(yè)以金融業(yè)為主,但近年智能手機(jī)和其他流動(dòng)裝置普及,大數(shù)據(jù)應(yīng)用變得隨處可見,如社交網(wǎng)站facebook會(huì)在用戶按下專頁后,自動(dòng)顯示其他推介專頁;網(wǎng)購平臺(tái)淘寶會(huì)在買家購物后,瞬間列出其感興趣的商品,甚至連暑假期間舉行的世界盃,德國隊(duì)奪冠的其中一個(gè)功臣就是大數(shù)據(jù)。
理大電子計(jì)算學(xué)系教授陳振接受本報(bào)專訪表示,大數(shù)據(jù)的應(yīng)用多樣化,十年前已開始進(jìn)行名為「面向新藥研發(fā)的生物大數(shù)據(jù)分析」的研究,最初研究不同藥物之間的成分相同的地方,但過程中提升至了解更多藥物和疾病的關(guān)係,如不同藥物對不同人會(huì)否產(chǎn)生相同的副作用及治療成效。
他表示,人類的基因蛋白和DNA數(shù)目眾多,而目前的西醫(yī)藥未有像中醫(yī)藥般,在相同的疾病下因應(yīng)不同人的體質(zhì)而配置不同的藥物,「人體內(nèi)的DNA 和藥物內(nèi)的化學(xué)分子,是兩個(gè)非常大的數(shù)據(jù)庫,需要利用電腦進(jìn)行大數(shù)據(jù)分析。」由于電腦的速度愈來愈快,加上取得數(shù)據(jù)的容易度大增,陳振展望,大數(shù)據(jù)在醫(yī)學(xué)上的利用將成大趨勢。
從事大數(shù)據(jù)分析的理大電子計(jì)算學(xué)系副教授鐘富禮亦指,大數(shù)據(jù)在未來有很大的發(fā)展空間和潛力,如影像分析和醫(yī)學(xué)研究,但坦言兩者都在起步的階段,預(yù)計(jì)過程非易事,「影像分析不單指人臉檢測,還包括追蹤該人的位置,比實(shí)質(zhì)現(xiàn)有的數(shù)據(jù)分析更難?!顾中稳?,大數(shù)據(jù)是應(yīng)用為本的科技,相信大數(shù)據(jù)日后能在醫(yī)學(xué)上作出貢獻(xiàn),「以香港為例,醫(yī)院管理局儲(chǔ)存了大量病人資料,但未有做過分析方面的研究。若果日后能善用資料庫內(nèi)的數(shù)據(jù)并加以分析,有望為病人度身訂造所需的藥物?!?/p>
不過,要處理大量即時(shí)數(shù)據(jù),除了在硬件上如伺服器的的配合外,開發(fā)相應(yīng)的軟件尤為關(guān)鍵,而與大數(shù)據(jù)分析的軟件五花八門,因應(yīng)不同的用途衍生出不同的工具如著名程式軟體SAS。理大電子計(jì)算學(xué)系副教授盧至力表示,理大目前有五至六個(gè)研究項(xiàng)目與大數(shù)據(jù)有關(guān),「其中一個(gè)研究方向是設(shè)計(jì)大數(shù)據(jù)工具,以及如何確保數(shù)據(jù)在一旦停電的情況下不會(huì)遺失?!顾终J(rèn)為,最大的挑戰(zhàn)是如何做到最好的資源分配,即是盡量利用電腦硬件內(nèi)所有的空間和效能。
大數(shù)據(jù)標(biāo)誌科技踏入新年代,成為各行各業(yè)爭相重點(diǎn)投放開發(fā)資源的工具,但同時(shí)由于涉及大量數(shù)據(jù),尤其是用戶的個(gè)人資料,加密和私隱問題引人關(guān)注。鐘富禮表示,大數(shù)據(jù)看似為生活帶來不少便利之處,但背后存在隱憂,「最大的問題源于數(shù)據(jù)本身,包括其可信性和準(zhǔn)確度,假若數(shù)據(jù)的質(zhì)素不好,做不到任何準(zhǔn)確的預(yù)測。」
此外,在大數(shù)據(jù)時(shí)代,每個(gè)人在不知不覺中被蒐集,包括在社交網(wǎng)站內(nèi)的個(gè)人相片和讚好專頁、網(wǎng)購平臺(tái)的購物記錄,故提升大數(shù)據(jù)處理的保安加密工作將成為未來研究的另一重點(diǎn)。