大數(shù)據其實就是一些數(shù)據的集合,但這樣的數(shù)據卻不是一般的數(shù)據,而是指無法在可承受的時空范圍內,使用一些常規(guī)計算機軟件工具,對其進行捕捉或是管理以及處理的數(shù)據集合。說到底,大數(shù)據就是海量數(shù)據的大集合。
維克多.邁爾-舍恩伯格和肯尼斯.庫克耶兩人,在他們所編寫的《大數(shù)據時代》一書中,對大數(shù)據是做這樣闡述的。他們說大數(shù)據就是指不用隨機分析法這樣的捷徑,而是要采用對所有數(shù)據都需要進行分析和處理。
大數(shù)據所隱含的特點
有人將大數(shù)據的特點概括為5V,即大量(Volume)或是高速(Velocity)以及多樣(Variety),還有價值(Value)以及真實性(Veracity)。其實,這正是巧合了大數(shù)據這些特點的英文書寫方式的第一個英文字母都是V。但這5V也確實是道出了大數(shù)據其本身所蘊含的內部特點,也正是大數(shù)據有5V這樣的特點,才使得大數(shù)據有了難以琢磨的味道。大數(shù)據被列為是一種新興的科學,其利用價值很為廣泛。因為人們已經充分意識到大數(shù)據并不是簡單的一組組數(shù)據了,而是一種數(shù)據信息資產。
大數(shù)據是一種數(shù)據信息資產
大數(shù)據的研究機構,它們對大數(shù)據的理解是這樣的。它們認為大數(shù)據是需要通過新處理模式才可具有更為強大的決策力或是洞察發(fā)現(xiàn)力以及流程優(yōu)化能力的海量或是高增長率以及多樣化的信息資產。但有的科學研究機構,如麥肯錫全球研究所又是對大數(shù)據做這樣解釋的,大數(shù)據是規(guī)模大到在獲取大數(shù)據或是存儲大數(shù)據以及管理大數(shù)據,還有分析大數(shù)據方面都遠遠超過了以往計算機中那些傳統(tǒng)數(shù)據庫軟件工具能力范圍的數(shù)據集合。
大數(shù)據就是一種海量數(shù)據的集合,它的規(guī)模已經大到超乎人們所想象的范圍,是要多大就有多大,甚或是無限大。不過,大數(shù)據具有快速流轉的特性,如果不用正確的捕捉方式,在一般情況下,都難以捕捉到那些海量般的大數(shù)據。不過,不是所有海量數(shù)據都需要進行捕捉,因為大數(shù)據的無限海量,總有捕捉不到的數(shù)據現(xiàn)象存在。