《企業(yè)網(wǎng)D1Net》11月11日訊
隨著大數(shù)據(jù)的發(fā)展,關(guān)于大數(shù)據(jù)內(nèi)涵的討論也日益廣泛,大數(shù)據(jù)的內(nèi)涵包括兩個(gè)方面,那就是海量和非結(jié)構(gòu)化。這并非一個(gè)很突然的變化,更不是一個(gè)很新鮮的趨勢(shì),那它究竟意味著什么?
答案是——機(jī)遇。一方面,對(duì)于企業(yè)是一種機(jī)遇。企業(yè)可以基于現(xiàn)有的大量的數(shù)據(jù)、海量數(shù)據(jù)進(jìn)行分析,并利用這些數(shù)據(jù)產(chǎn)生效益。另一方面,對(duì)一些特定領(lǐng)域的發(fā)展來說也是機(jī)遇。如醫(yī)療等領(lǐng)域,有著大量的文獻(xiàn)、化驗(yàn)結(jié)果、病例等等,這些信息大部分以人類語言方式記錄下來,通過對(duì)這些信息的挖掘,可以輔助醫(yī)生作出正確的決策。
當(dāng)然,機(jī)遇與挑戰(zhàn)并存,“大數(shù)據(jù)”對(duì)于企業(yè)來說也是如此。在談如何幫助中小企業(yè)應(yīng)戰(zhàn)“大數(shù)據(jù)”時(shí)代之前,首先需要了解“大數(shù)據(jù)”對(duì)于企業(yè)來說究竟意味著怎樣嚴(yán)峻的挑戰(zhàn)。
“大數(shù)據(jù)”時(shí)代企業(yè)面臨著三大嚴(yán)峻現(xiàn)實(shí)
現(xiàn)實(shí)之一:海量
IDC最新數(shù)字宇宙研究報(bào)告表明,到2020年,全球數(shù)據(jù)使用量預(yù)計(jì)暴增44倍,達(dá)到35.2ZB。35ZB是什么概念?(1ZB=1024EB=1048576PB=1073741824TB,1073741824TB*35=37580963840TB),也就是說全球大概需要376億個(gè)1TB硬盤來存儲(chǔ)數(shù)據(jù)。
現(xiàn)實(shí)之二:非結(jié)構(gòu)化
相對(duì)于結(jié)構(gòu)化數(shù)據(jù)(即行數(shù)據(jù),存儲(chǔ)在數(shù)據(jù)庫里,可以用二維表結(jié)構(gòu)來實(shí)現(xiàn)的數(shù)據(jù))而言,不方便用數(shù)據(jù)庫二維邏輯表來表現(xiàn)的數(shù)據(jù)即稱為非結(jié)構(gòu)化數(shù)據(jù),包括所有格式的辦公文檔、文本、圖片、XML、HTML、各類報(bào)表、圖像和音頻/視頻信息等等。
據(jù)統(tǒng)計(jì),企業(yè)中20%的數(shù)據(jù)是結(jié)構(gòu)化的,80%是非結(jié)構(gòu)化或半結(jié)構(gòu)化的。當(dāng)今世界結(jié)構(gòu)化數(shù)據(jù)增長率大概是32%,而非結(jié)構(gòu)化數(shù)據(jù)增長則是63%,至2012年,非結(jié)構(gòu)化數(shù)據(jù)占有比例將達(dá)到互聯(lián)網(wǎng)整個(gè)數(shù)據(jù)量的75%以上。
現(xiàn)實(shí)之三:實(shí)時(shí)處理
一項(xiàng)對(duì)全球CIO調(diào)查得出的結(jié)論表明:“通過對(duì)企業(yè)界搜集的大量數(shù)據(jù)進(jìn)行實(shí)時(shí)分析,并從中獲得啟示,進(jìn)而將這些啟示轉(zhuǎn)化為自身的競爭優(yōu)勢(shì),對(duì)當(dāng)今企業(yè)來說至關(guān)重要。”
某證券公司的CIO在介紹公司對(duì)于數(shù)據(jù)實(shí)時(shí)處理的需求時(shí)曾經(jīng)表示,上億條數(shù)據(jù)的分析要在5秒鐘內(nèi)完成。
D1Net評(píng)論:
大數(shù)據(jù)帶來的機(jī)遇和挑戰(zhàn)是并存的,對(duì)于企業(yè)來說,大數(shù)據(jù)帶來的嚴(yán)峻挑戰(zhàn)是無法回避的,企業(yè)應(yīng)該勇敢面對(duì),找到正確的解決方法,在大數(shù)據(jù)浪濤翻涌的時(shí)代,企業(yè)若想成功破浪,必須進(jìn)行技術(shù)創(chuàng)新,才是保證長遠(yuǎn)發(fā)展之策。