實(shí)時(shí)數(shù)據(jù)分析堪稱(chēng)大王烏賊 能否帶來(lái)顛覆性變革?

責(zé)任編輯:editor004

2013-10-25 11:36:44

摘自:TechTarget中國(guó)

實(shí)時(shí)數(shù)據(jù)分析就是技術(shù)界傳說(shuō)中的大王烏賊:確實(shí)有公司在做實(shí)時(shí)數(shù)據(jù)分析,卻難覓其蹤跡。

實(shí)時(shí)數(shù)據(jù)分析就是技術(shù)界傳說(shuō)中的大王烏賊:確實(shí)有公司在做實(shí)時(shí)數(shù)據(jù)分析,卻難覓其蹤跡。

Mixcloud,這一流媒體音頻內(nèi)容的在線平臺(tái)就是這種神秘生物的一員。這家總部位于倫敦被稱(chēng)作“音頻YouTube”的創(chuàng)業(yè)公司,不僅使用實(shí)時(shí)分析以做出快速的業(yè)務(wù)決策并創(chuàng)造更好的產(chǎn)品,而且在致力于構(gòu)建一個(gè)面向客戶的實(shí)時(shí)數(shù)據(jù)分析門(mén)戶網(wǎng)站。Mixcloud首席技術(shù)官,也是四個(gè)創(chuàng)始人之一的Mat Clayton說(shuō),當(dāng)這個(gè)門(mén)戶網(wǎng)站完成以后, Mixcloud的客戶將能夠看到是誰(shuí)在何時(shí)收聽(tīng)他們音樂(lè)目錄。

2008年推出的Mixcloud,為用戶提供了一個(gè)創(chuàng)建“cloudcasts”的地方,DJ混音,播客,電臺(tái)節(jié)目,甚至原創(chuàng)內(nèi)容都可上傳至該平臺(tái)上用作在線流媒體和一般消費(fèi)。(該產(chǎn)品還配備移動(dòng)應(yīng)用程序版本和可嵌入其他網(wǎng)站的播放器插件。)正如作家可以通過(guò)互聯(lián)網(wǎng)自行出版他們的作以饗讀者, cloudcast控們現(xiàn)在也可以在云平臺(tái)上播出他們創(chuàng)作的音頻。

分析調(diào)整

Mixcloud作為一個(gè)純互聯(lián)網(wǎng)公司,收集了絕對(duì)訪問(wèn)用戶的相關(guān)數(shù)據(jù)。最初,該公司使用Google Analytics的免費(fèi)工具來(lái)測(cè)量基準(zhǔn)指標(biāo),但是當(dāng)Clayton和他的團(tuán)隊(duì)希望在更細(xì)化的級(jí)別上分析數(shù)據(jù)時(shí),卻遇到了困難。Google Analytics在深入或分割大量的流量數(shù)據(jù)時(shí)使用了很多估計(jì)值。但是他們卻不提供那些估計(jì)值的區(qū)間,Clayton在最近的一次網(wǎng)絡(luò)研討會(huì)上說(shuō)到,該區(qū)間就是所謂的置信區(qū)間,它能夠給出估計(jì)值的可信程度。這意味著,當(dāng)Clayton和他的團(tuán)隊(duì)加入多個(gè)估計(jì)值的情況下,總誤差可能超過(guò)100%。

“就算退一步說(shuō),方差也極大。”Clayton說(shuō),公司對(duì)在這樣的信息基礎(chǔ)上作出產(chǎn)品決策感到很不安。付費(fèi)版本的Google Analytics解決了這個(gè)問(wèn)題,他說(shuō),但“這明顯更加昂貴,我想上一次我看到該費(fèi)用的時(shí)候是六位數(shù)字。” 現(xiàn)在Google Analytics仍被用來(lái)測(cè)量基準(zhǔn)指標(biāo),但Clayton和他的團(tuán)隊(duì)也意識(shí)到,隨著Mixcloud的擴(kuò)大(網(wǎng)站現(xiàn)在有超過(guò)3萬(wàn)月活躍聽(tīng)眾,且可以觀測(cè)到平均每分鐘有三個(gè)小時(shí)的目錄內(nèi)容被上傳),他們需要一個(gè)更復(fù)雜的分析工具。

“我們決定,我們需要一套系統(tǒng),更準(zhǔn)確,而且能夠與我們不斷擴(kuò)大的平臺(tái)相適應(yīng), ”他說(shuō)。

先進(jìn)的軟件

雖然我們的小高科技團(tuán)隊(duì)里有不少工程師,但核心競(jìng)爭(zhēng)力卻不是創(chuàng)建分析平臺(tái),Clayton說(shuō),所以他開(kāi)始尋找和引入外部平臺(tái)。最終他選定了一個(gè)相當(dāng)新鮮面孔的供應(yīng)商,成立于2009年,據(jù)網(wǎng)站稱(chēng)獲得幾家歐洲頂級(jí)風(fēng)投公司資金注入的Acunu Analytics。 Acunu Analytics依賴與一個(gè)開(kāi)源的NoSQL數(shù)據(jù)庫(kù)Apache Cassandra – 該數(shù)據(jù)庫(kù)最初由Facebook開(kāi)發(fā) -目的是要迅速的處理大量數(shù)據(jù)。

“Cassandra擁有可支持大規(guī)模互動(dòng)Web應(yīng)用程序的傳輸實(shí)時(shí)性能,波士頓Wikibon項(xiàng)目研究員Jeff Kelly,在去年的Cassandra峰會(huì)后寫(xiě)道。 “它集合了其存儲(chǔ)和訪問(wèn)數(shù)據(jù)列和超快速嵌入的能力,以及分布式計(jì)數(shù)器的使用和對(duì)固態(tài)硬盤(pán)的充分利用。”

在前端,Acunu Analytics為用戶提供實(shí)時(shí)的儀表板和即時(shí)查詢功能。這些儀表板使Clayton和他的團(tuán)隊(duì)得以實(shí)時(shí)了解服務(wù)器狀態(tài),以及如“跟進(jìn)”或“播放”等按鈕的網(wǎng)站模塊運(yùn)行情況。“如果用戶不能點(diǎn)擊'播放' - 這確實(shí)發(fā)生過(guò)...... [儀表板] 能夠讓我們發(fā)覺(jué)相關(guān)指標(biāo)的飛速下降,從而提醒我們發(fā)現(xiàn)問(wèn)題,”他說(shuō)。 “然后,我們就可以去調(diào)試和修復(fù)它了。 ”

實(shí)時(shí)監(jiān)控不僅確保了高品質(zhì)標(biāo)準(zhǔn)在彈指一揮間得以維持,而且它也使Clayton的團(tuán)隊(duì)能夠測(cè)試出各個(gè)模塊如推薦框,在頁(yè)面的什么位置最受歡迎。通過(guò)移動(dòng)頁(yè)面上的這些模塊以測(cè)試到底是什么觸發(fā)最大量點(diǎn)擊參與,Clayton和他的團(tuán)隊(duì)可以梳理出用戶友好模塊和“最有效點(diǎn)”的位置,然后努力在那些上面“加倍下注”。

“我們處理每天增長(zhǎng)200%的點(diǎn)擊“關(guān)注”的有效用戶量,而點(diǎn)擊了“關(guān)注”的用戶又關(guān)注了200%的更多其他用戶。在網(wǎng)絡(luò)研討會(huì)上克萊頓說(shuō),“這還僅僅是分析應(yīng)該把每一個(gè)按鈕精確的放置位置 –放在哪里有用,放在哪里不好用。 ”

Mixcloud也通過(guò)使用實(shí)時(shí)Acunu Analytics技術(shù),在不需要網(wǎng)站離線的情況下推出新產(chǎn)品或網(wǎng)站功能。在 “飛行模式”下進(jìn)行升級(jí),根據(jù)不同的風(fēng)險(xiǎn)級(jí)別,向部分用戶或全部用戶推出新的產(chǎn)品,他說(shuō)。

關(guān)鍵門(mén)戶

Mixcloud通過(guò)使用數(shù)據(jù)改進(jìn)整個(gè)產(chǎn)品是整個(gè)故事里很重要的一段 – 而公司對(duì)分析的應(yīng)用正書(shū)寫(xiě)著更多新的篇章。這其中包括實(shí)時(shí)分析門(mén)戶網(wǎng)站,一個(gè)讓用戶可以了解跟蹤自己的內(nèi)容如何在網(wǎng)絡(luò)上運(yùn)行的前瞻性個(gè)性化產(chǎn)品,據(jù)Clayton描述。

“用戶上傳內(nèi)容以后,”他說(shuō),“實(shí)際上在短短幾個(gè)小時(shí)內(nèi),該內(nèi)容就被病毒化傳播,或者得到極大的關(guān)注,而能夠提供給這些用戶關(guān)于真實(shí)情況的清晰數(shù)據(jù)將會(huì)是一件好事,這樣用戶就可以解決任何出現(xiàn)的問(wèn)題,把內(nèi)容推送到正確的網(wǎng)絡(luò)位置,將注意力集中在正確的地方。

數(shù)據(jù)爆炸性膨脹是一個(gè)困難的問(wèn)題,他說(shuō),“我們?nèi)绾胃愣ǎ窍乱粋€(gè)挑戰(zhàn)。”

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)