企業(yè)網(wǎng)D1Net 2012年4月12日 大數(shù)據(jù)的迅速發(fā)展正在改變科學(xué)家進(jìn)行研究的方式,而且,它還使白宮的大數(shù)據(jù)研發(fā)展機(jī)構(gòu)開(kāi)始注重起對(duì)大數(shù)據(jù)的研究。
據(jù)報(bào)道,白宮的大數(shù)據(jù)研發(fā)機(jī)構(gòu)開(kāi)始注重刺激軍事、生物醫(yī)學(xué)、計(jì)算機(jī)和環(huán)境等方面的數(shù)據(jù)技術(shù)需求。在過(guò)去的幾年中,研究人員常用的工具只在他們各自的領(lǐng)域里才發(fā)揮重要作用,但這些工具逐漸被計(jì)算機(jī)和大數(shù)據(jù)集所取代。
最近,白宮宣布了一項(xiàng)2億美元的大數(shù)據(jù)發(fā)展計(jì)劃,通過(guò)分析大量的可用數(shù)據(jù)來(lái)提高科研水平,從而創(chuàng)造出發(fā)展大數(shù)據(jù)技術(shù)的工具。但白宮也表示,這項(xiàng)計(jì)劃還需要提高分析和整理大量的復(fù)雜數(shù)據(jù)資料的技術(shù)。
白宮科學(xué)技術(shù)政策辦公室主任約翰•霍爾德倫(John Holdren)在一份聲明中指出:“我們今天推出的這一舉措有望提升大數(shù)據(jù)應(yīng)用于科學(xué)研究、環(huán)境與生物醫(yī)學(xué)研究、教育和國(guó)家安全方面的能力。” 啟動(dòng)助學(xué)金和研究項(xiàng)目旨在提高管理加工大數(shù)據(jù)集、利用大數(shù)據(jù)加速科學(xué)研究、鼓勵(lì)大學(xué)培養(yǎng)出更多高質(zhì)量的數(shù)據(jù)科學(xué)家和工程師的核心技術(shù)水平。
一般而言,人們對(duì)大數(shù)據(jù)技術(shù)的需求不僅包括計(jì)算機(jī)領(lǐng)域的,而且也包括科學(xué)領(lǐng)域的。通過(guò)人們對(duì)大型數(shù)據(jù)集的微調(diào)查和深入分析,數(shù)據(jù)科學(xué)興起熱潮,并改變了科學(xué)研究的方向和速度。例如,針對(duì)部分帶有特定遺傳標(biāo)記的患者群的醫(yī)學(xué)研究,正在從廣泛的基礎(chǔ)治療領(lǐng)域轉(zhuǎn)向針對(duì)性強(qiáng)的醫(yī)療測(cè)試領(lǐng)域。
大數(shù)據(jù)健康護(hù)理啟動(dòng)Kyruus首席數(shù)據(jù)科學(xué)家兼前物理學(xué)家普尼特•巴特拉(Puneet Batra)表示:“科學(xué)家們已經(jīng)使用了很長(zhǎng)一段時(shí)間的大數(shù)據(jù)。目前的新形勢(shì)是,數(shù)據(jù)發(fā)展規(guī)模急劇膨脹,而這又是對(duì)基礎(chǔ)設(shè)施的挑戰(zhàn)。”科學(xué)的某些領(lǐng)域十分倚重大數(shù)據(jù)集,比如高能粒子物理或核聚變研究。
IBM機(jī)器學(xué)習(xí)部門的經(jīng)理理查德•勞倫斯(Richard Lawrence)表示,由于有來(lái)源于不同渠道的可利用信息,大量數(shù)據(jù)的收集與分析已然在研究和商業(yè)等領(lǐng)域越來(lái)越普遍了。他還指出,“大數(shù)據(jù)直接把焦點(diǎn)從某些科學(xué)學(xué)科轉(zhuǎn)移到那些基礎(chǔ)設(shè)施齊全的大型企業(yè)和民營(yíng)企業(yè)上,是因?yàn)榇髷?shù)據(jù)正變得越來(lái)越普遍化和社會(huì)化了”。而氣候科學(xué)的研究人員現(xiàn)在有許多來(lái)自傳感器的觀測(cè)數(shù)據(jù),這有利于更好地創(chuàng)建模型來(lái)預(yù)測(cè)氣候變化的影響。
數(shù)據(jù)科學(xué)
美國(guó)科學(xué)發(fā)展協(xié)會(huì)與科學(xué)和技術(shù)政策辦公室、國(guó)家科學(xué)基金會(huì)、美國(guó)國(guó)立衛(wèi)生研究院、國(guó)防部和能源部、 DARPA部門,以及美國(guó)地質(zhì)調(diào)查所于今天下午共同舉辦新聞發(fā)布會(huì),會(huì)上討論了關(guān)于大數(shù)據(jù)研究的挑戰(zhàn)和可能性。雖然不同機(jī)構(gòu)的目標(biāo)不同,但所有的研究計(jì)劃都旨在提高人們收集和使用大量信息的能力。
國(guó)防部已在新的研究項(xiàng)目上投資了60萬(wàn)美元,這項(xiàng)研究的主要目標(biāo)是分析不同語(yǔ)言的文字和改善自治系統(tǒng),比如說(shuō)可以收集遙感數(shù)據(jù)并進(jìn)行現(xiàn)場(chǎng)操作的機(jī)器人。與此同時(shí),國(guó)家衛(wèi)生研究院建立了一個(gè)200 TB數(shù)據(jù)的人類遺傳變異網(wǎng)站,其數(shù)據(jù)存儲(chǔ)在Amazon Web服務(wù)器上,并且允許研究人員免費(fèi)查詢和分析。但現(xiàn)在,研究人員需要一種大型數(shù)據(jù)集,這種大型數(shù)據(jù)集要求有最先進(jìn)的軟件工具和高性能的計(jì)算。
Kyruus的工作人員巴特拉稱:“數(shù)據(jù)密度已發(fā)生改變。你從機(jī)器、個(gè)人或頻繁的時(shí)間間隔內(nèi)的物理現(xiàn)象中去收集信息,從而使數(shù)據(jù)規(guī)模變大。因此有了這個(gè)工具后,你就能開(kāi)始分析它。”