今日頭條張一鳴:大數(shù)據(jù)是網(wǎng)絡(luò)空間的“上帝”

責任編輯:editor006

作者:韓佩

2015-01-21 14:56:30

摘自:鈦媒體

這是一個信息爆炸的時代,因而信息過濾和基于大數(shù)據(jù)的個性化推送,便成了至關(guān)重要的事情?!皞€性化推薦算法就是基于投票的方法,”楊震原說到,今日頭條個性化推薦的核心理念其實就是投票。

這是一個信息爆炸的時代,因而信息過濾和基于大數(shù)據(jù)的個性化推送,便成了至關(guān)重要的事情。而這,也正是今日頭條可以從眾多新聞客戶端中脫穎而出的重要原因。

2012年8月,今日頭條上線,以其獨有的大數(shù)據(jù)分析和定制化推薦而迅速受到熱捧。從資訊客戶端變?yōu)閿?shù)據(jù)挖掘的推薦引擎,創(chuàng)業(yè)不足三年,這家公司的估值已經(jīng)達到5億美元,而這些都是今日頭條背后所蘊藏的大數(shù)據(jù)算法的價值。

如何推測你的喜好?好算法不如大數(shù)據(jù)

當你身在外地旅游時,打開今日頭條,你會突然發(fā)現(xiàn),它為你推送的消息里,多了幾條當?shù)氐穆糜喂ヂ浴.斈阃砩鲜咚恢鴷r,打開APP最先看到的,多是情感相關(guān)的內(nèi)容。這些都是今日頭條用戶使用的場景之一,你也許會好奇,它是如何做到更懂你的呢?今日頭條的負責算法數(shù)據(jù)的技術(shù)副總裁楊震原給了我們答案。

“個性化推薦算法就是基于投票的方法,”楊震原說到,今日頭條個性化推薦的核心理念其實就是投票。“實際上個性化推薦并不是機器給你推薦,而是人與人之間在互相推薦。”

他將個性化算法比作是數(shù)豆子的方法,每一個人拿一個豆子,喜歡哪一篇文章就把豆子給這篇文章,然后由機器去數(shù),最后得到結(jié)果。依照這種算法,同樣兩篇文章,當前三個人都對第一篇文章做出“投票”時,那么,給第四個人推送的必然就是第一篇文章了。

此外,人群可以基于年齡、性別、地域、職業(yè)等分類,而文章也可以通過關(guān)鍵詞、發(fā)布時間、所屬地區(qū)等分類,再結(jié)合用戶反饋的數(shù)據(jù),才有了“你關(guān)心的,才是頭條”。楊震原表示,今日頭條推薦的方法也是機器學習的算法,在移動互聯(lián)網(wǎng)時代有很多豆子產(chǎn)生,當你拿著手機每看一篇文章,你的每一次點擊和搜索,各種行為,都會被記錄下來產(chǎn)生數(shù)據(jù)。

如楊震原所說:

“More data beats better algorithms,大數(shù)據(jù)勝過好算法,大數(shù)據(jù)時代的到來才真正釋放了這些算法的價值和意義。”

今日頭條的下一個五年,機器才能抹平信息鴻溝

創(chuàng)業(yè)三年以來,張一鳴的團隊,積累了2.2億用戶的使用習慣和數(shù)據(jù)。這些數(shù)據(jù)要怎么才能更好玩呢?于是,他們搞了一場有關(guān)“算數(shù)”的發(fā)布會,第一次通過數(shù)據(jù),向外界展示了今日頭條的用戶是怎樣的一群人。

根據(jù)他們發(fā)布的數(shù)據(jù)報告顯示,男性用戶占到了65%的比例,而雖然女性用戶較少,但是她們的平均停留時長在8分鐘,明顯高于男性的5.5分鐘。

“廣西的人最愛點贊,河北人最愛看段子,最關(guān)心時政的是山西人,最關(guān)注八卦的是天津。”

這都是今日頭條根據(jù)用戶習慣得出的數(shù)據(jù)。張一鳴解釋說,

“過去是依靠人總結(jié)知識,現(xiàn)在可以通過系統(tǒng)、學習用戶的行為特征來儲存智慧。有很多人問我,未來5年今日頭條會變成什么樣?其實大家看我研究的APP,大概能知道我在關(guān)注什么。”

張一鳴邊說邊把自己手機里400多個APP展示給大家看。他自己總結(jié)了三個努力的方向:

一是讓更多種類信息,包括文字、圖片、短視頻如何在更多場景下給用戶更好的推薦。其次是能不能把握用戶越來越多的習慣和數(shù)據(jù),使基于相同興趣的用戶更好的進行交流和互動。第三是希望能夠連接更多O2O的服務(wù),讓今日頭條變?yōu)?ldquo;今日生活”。

那么在今日頭條背后做數(shù)據(jù)支持的算法和大數(shù)據(jù)呢?

張一鳴認為,在下一個五年中,將有越來越多人的興趣、行為被投影到網(wǎng)絡(luò)世界,當數(shù)據(jù)越來越多,機器就會越來越懂我們。在張一鳴看來,大數(shù)據(jù)就網(wǎng)絡(luò)空間的“上帝”,在俯視觀察著所有人。

“雖然機器的智商未必高于見多識廣的人,但人的記憶量有限,處理的數(shù)據(jù)量也有限。機器卻可以不知疲倦,每時每刻都可以輸入海量數(shù)據(jù)。通過感知理解判斷之后形成機器的智慧,能夠大規(guī)模的抹平信息的鴻溝。”

上線不足三年,2.2億用戶,2000萬日活。對于團隊所取得的成績,張一鳴并沒有太過沾沾自喜,畢竟今日頭條算法推送的背后還有著太多需要改進和優(yōu)化的地方,產(chǎn)品也仍在遭到用戶不斷的吐槽。更重要的是,1月19日,搜狗剛剛推出了“微信頭條”,競爭對手,正在緊隨其后。

最后,附數(shù)據(jù)圖兩張,小伙伴們請自行對號入座哦~

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號