云計(jì)算趨勢:海量數(shù)據(jù)將發(fā)揮核心作用

責(zé)任編輯:sjia

2011-12-07 10:34:35

摘自:程序員

隨著云計(jì)算的發(fā)展,世間每個人每件東西每天每秒所產(chǎn)生的新數(shù)據(jù)都有能夠被更完整和豐富地數(shù)字化,并全部聯(lián)入互聯(lián)網(wǎng)。

隨著云計(jì)算的發(fā)展,世間每個人每件東西每天每秒所產(chǎn)生的新數(shù)據(jù)(位置、狀態(tài),所見、所聞、所思、所言……)都有能夠被更完整和豐富地數(shù)字化,并全部聯(lián)入互聯(lián)網(wǎng)。我曾經(jīng)說過, 云計(jì)算是目前最大的技術(shù)趨勢,也是以互聯(lián)網(wǎng)為基礎(chǔ)的新一代技術(shù)的總稱。寬泛地看,其中除了基礎(chǔ)設(shè)施層面的新型硬件與數(shù)據(jù)中心、分布式計(jì)算、海量數(shù)據(jù)存儲與處理等等技術(shù)之外,還包括人與人之間更多的交流方式(社會化網(wǎng)絡(luò)),終端設(shè)備的多樣化(移動),無所不在的數(shù)據(jù)采集方式(物聯(lián)網(wǎng)),和新一代自然用戶界面、用戶體驗(yàn)。

其中,海量數(shù)據(jù)將發(fā)揮核心作用。

互聯(lián)網(wǎng)企業(yè)與傳統(tǒng)行業(yè)(包括軟硬件和電信廠商)相比最大的優(yōu)勢,就是幾乎消除了任何中間層,所有最終用戶使用產(chǎn)品的行為數(shù)據(jù)可以輕易地保存在服務(wù)器上;通過對這些海量數(shù)據(jù)的挖掘、分析和圖形化呈現(xiàn),能非常清晰地揭示用戶的行為模式,加深對用戶需求的理解,提取用戶的集體智慧,從而為產(chǎn)品研發(fā)人員決策提供依據(jù),同時不斷提高系統(tǒng)的智能化水平,提升產(chǎn)品用戶體驗(yàn)。而社會化網(wǎng)絡(luò)更進(jìn)一步,用戶都以登錄甚至實(shí)名為主,可以為每個人提供個性化的服務(wù)。

早在2005 年,Web 2.0 的主要倡導(dǎo)者Tim O’Reilly在經(jīng)典文章“什么是Web 2.0”中就強(qiáng)調(diào)過“數(shù)據(jù)是新的Intel Inside”,也就是說,就像PC時代Intel 芯片是核心一樣,數(shù)據(jù)是新一代計(jì)算的核心。(細(xì)讀此文,我們會發(fā)現(xiàn)云計(jì)算與Web 2.0之間的緊密關(guān)系。)

2007 年Google 承認(rèn),在很多情況下海量的數(shù)據(jù)比好的搜索算法還要重要。而它的競爭對手近來也在抱怨彼此的差距主要在用戶搜索數(shù)據(jù)的積累上。Google 的很多產(chǎn)品,比如翻譯和語音輸入,同樣得益于海量語料庫的支持。2009 年Google 的研究總監(jiān)Peter Norvig 等人發(fā)表了《The Unreasonable Effectiveness of Data》一文,得出一個結(jié)論:簡單的模型加上海量的數(shù)據(jù)比精巧的模型加上較少的數(shù)據(jù)更有效。也許正是因?yàn)槿绱?,Google 首席經(jīng)濟(jì)學(xué)家Hal Varian 才會堅(jiān)稱數(shù)據(jù)科學(xué)家將是未來十年最具吸引力的職位,他認(rèn)為管理者甚至中小學(xué)生,都應(yīng)該具備對數(shù)據(jù)進(jìn)行處理、從中提取洞察、理解和表達(dá)的能力。

Facebook更是眾所周知的數(shù)據(jù)驅(qū)動無所不在的公司。2006年,為了找出Facebook在某些學(xué)校不受歡迎的原因,公司從華爾街聘請了數(shù)據(jù)科學(xué)家Jeff Hammerbacher(現(xiàn)為Cloudera 的首席科學(xué)家),他和其他幾位同事組成了最早的數(shù)據(jù)團(tuán)隊(duì),在不知不覺中自行研發(fā)了一個商業(yè)智能系統(tǒng)。這成為Facebook 日后產(chǎn)品成功的重要基礎(chǔ),不僅很好地支撐著工程團(tuán)隊(duì),而且在產(chǎn)品設(shè)計(jì)決策中也起到了關(guān)鍵作用——他們的設(shè)計(jì)師也能寫代碼,用真實(shí)內(nèi)容和頁面來做產(chǎn)品原型,然后上線測試,快速迭代,2009年時設(shè)計(jì)團(tuán)隊(duì)每周提交40次。

可以想象,隨著云計(jì)算的發(fā)展,世間每個人每件東西每天每秒所產(chǎn)生的新數(shù)據(jù)(位置、狀態(tài),所見、所聞、所思、所言……)都有能夠被更完整和豐富地數(shù)字化,并全部聯(lián)入互聯(lián)網(wǎng)。近年來互聯(lián)網(wǎng)領(lǐng)域的創(chuàng)新幾乎都可以納入這一模式:Google 將每次搜索和去向存儲下來,F(xiàn)acebook將人們之間的各種交互數(shù)字化,Amazon、淘寶等電子商務(wù)網(wǎng)站將商品流通的信息、人們的購買喜好數(shù)字化,Twitter 等微博將人們稍縱即逝的想法和談話記錄下來,F(xiàn)oursquare 等LBS應(yīng)用將人們?nèi)ミ^那里的信息記錄下來,Instagram、Color 等移動應(yīng)用捕捉瞬間的圖片和音頻、視頻……

這其中蘊(yùn)含的巨大潛力將是空前的,影響極為深遠(yuǎn)?;ヂ?lián)網(wǎng)企業(yè)甚至更多行業(yè)企業(yè)之間的競爭將圍繞誰擁有更多詳細(xì)的用戶數(shù)據(jù)并能善加運(yùn)用展開。我們很有可能打造一個智能系統(tǒng),實(shí)現(xiàn)計(jì)算機(jī)科學(xué)長久以來的人工智能夢想。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號