搞不懂什么是大數(shù)據(jù)?看看作者維克托·邁爾·舍恩伯格的《大數(shù)據(jù)時(shí)代——生活、工作與思維的大變革》一書,足以讓你長舒一口氣,書中對(duì)大數(shù)據(jù)的定義一點(diǎn)也不含糊:“所謂大數(shù)據(jù)(Big Data),就是大量的數(shù)據(jù),它的反義詞小數(shù)據(jù)(Small Data)的定義也同樣簡單,即很少很少的數(shù)據(jù)。” 那么,什么是用大數(shù)據(jù)來做電影?方法很多!隨著現(xiàn)代電影業(yè)技術(shù)的進(jìn)步,大數(shù)據(jù)技術(shù)已經(jīng)越來越系統(tǒng)地滲透到這個(gè)行業(yè),電影工作者和電影產(chǎn)業(yè)的利益相關(guān)者通過分析這些大數(shù)據(jù),可以預(yù)測行業(yè)發(fā)展的趨勢。大數(shù)據(jù)有趨勢成為這個(gè)行業(yè)的主導(dǎo)!
社交媒體數(shù)據(jù)最懂得大眾口味
影迷會(huì)在Twitter、YouTube、Tumblr、Facebook、Instagram、電影博客等網(wǎng)站上發(fā)布他們對(duì)電影制作、導(dǎo)演、演員、劇本、布景和電影細(xì)節(jié)的觀點(diǎn),大數(shù)據(jù)公司則從這些網(wǎng)站上持續(xù)不斷地提取信息,挖掘消費(fèi)者對(duì)電影的口味和喜好,成為未來電影的創(chuàng)作和營銷的關(guān)鍵意見。
大數(shù)據(jù)公司盡可能多地占有信息,遇到問題時(shí)從這海量信息中去“挖掘”方案。美國視頻網(wǎng)站Netflix通過大數(shù)據(jù)來獲取信息,Netflix在全世界擁有3300萬注冊用戶,Netflix每天還會(huì)對(duì)3000萬次“播放”(包括暫停、倒退和快進(jìn)等動(dòng)作)、Netflix注冊用戶的400萬次評(píng)級(jí)、300萬次搜索,以及一天中用戶觀看視頻的時(shí)間和所使用的設(shè)備進(jìn)行觀測。它把《紙牌屋》的成功歸結(jié)于對(duì)大數(shù)據(jù)的高度掌控,它熟知觀眾喜歡看什么東西,把這些元素有機(jī)結(jié)合起來,找到一個(gè)維恩圖解交集,表明買下這部電視劇,作為原創(chuàng)節(jié)目可以穩(wěn)操勝券。
然而現(xiàn)在,Netflix開始制作原創(chuàng)內(nèi)容,因?yàn)樗軌蛳扔谟^眾知道他們想要什么。Netflix負(fù)責(zé)全球公司通訊的約里斯·埃弗斯(Joris Evers)說:“Netflix有3300萬個(gè)不同版本。”
互聯(lián)網(wǎng)電影數(shù)據(jù)庫深知必看準(zhǔn)則
20世紀(jì)80年代,好萊塢電影公司的調(diào)查手段有一套標(biāo)準(zhǔn)的程序:電影上映前幾星期在影院和電視廣告里播放預(yù)告片、發(fā)布平面廣告、推出公告牌,依靠消費(fèi)者調(diào)查來解答“市場宣傳要做到什么程度,才可以讓一部影片成為觀眾的必看片”這樣一個(gè)問題。
但現(xiàn)在仍恪守這種程序恐怕就會(huì)被炒魷魚了,聯(lián)合人才經(jīng)紀(jì)公司(United Talent Agency)與娛樂數(shù)據(jù)公司Rentrak聯(lián)合推出一種名為PreAct的服務(wù)。它同一大批好萊塢新貴一道,推銷“傾聽網(wǎng)絡(luò)”——這是一個(gè)正在發(fā)展的領(lǐng)域,使用算法詳細(xì)分析社交媒體上的閑聊。
再舉一個(gè)具體的例子,在互聯(lián)網(wǎng)電影數(shù)據(jù)庫(IMDB)中含有250萬個(gè)電影動(dòng)態(tài)歸檔,大約50萬用戶參與影評(píng)和電影制作的交流。每個(gè)用戶可以發(fā)表個(gè)人意見,提供給電影營銷和分銷公司。
數(shù)據(jù)定位分析讓地域營銷更精準(zhǔn)
另一個(gè)例子可能是進(jìn)行數(shù)據(jù)定位分析來設(shè)計(jì)特定位置的電影宣傳或營銷活動(dòng),也可以預(yù)測不同影院的票房情況。
大數(shù)據(jù)強(qiáng)調(diào)數(shù)據(jù)量的多和雜,而非小數(shù)據(jù)時(shí)代的少而精。豆瓣閱讀為什么給你推薦《中國合伙人》?可能僅僅是你的朋友最近點(diǎn)了“想看”或“看過”;新浪微博的推薦邏輯也如此。如果你有很多朋友喜歡同一個(gè)事物,那么你喜歡這個(gè)事物的概率也會(huì)大一些。
用大數(shù)據(jù)的算法還可以預(yù)測機(jī)票價(jià)格走勢、交通擁堵情況,英國伯明翰大學(xué)的研究團(tuán)隊(duì)甚至還開發(fā)出一種算法,可以精確預(yù)測人們在一天內(nèi)將要去哪里,平均誤差僅為20米。我們也可以乘著大數(shù)據(jù)的東風(fēng),試試創(chuàng)新跨界。
是什么讓電影中的臺(tái)詞令人難忘?
Jon Kleinberg是康奈爾大學(xué)的一名科學(xué)家,他的團(tuán)隊(duì)從人氣互聯(lián)網(wǎng)電影數(shù)據(jù)庫IMDB上選擇了“經(jīng)典臺(tái)詞”,并使用電影臺(tái)詞在網(wǎng)絡(luò)上出現(xiàn)的次數(shù)作為衡量尺度。然后,他們把這些經(jīng)典臺(tái)詞跟臺(tái)詞所在的完整劇本做比較——總共約1000部電影。
結(jié)果發(fā)現(xiàn),很多經(jīng)典臺(tái)詞是把驚人之詞嵌入到了結(jié)構(gòu)普通的句子中。“我們可以這樣想,經(jīng)典臺(tái)詞是在常見的詞序結(jié)構(gòu)中,填入不尋常的詞語。”他們在研究報(bào)告中寫道。
比如來自電影《甜心先生》(Jerry Maguire)的一句臺(tái)詞:“我對(duì)你一見傾心”(You had me at hello)??巳R因伯格指出,它的詞序基本上跟“我在波士頓遇到了他”(I met him in Boston)是一樣的。
又比如《現(xiàn)代啟示錄》(Apocalypse Now)中的臺(tái)詞“我喜歡早晨汽油彈的氣味”(I love the smell of napalm in the morning),跟“我喜歡早晨咖啡的氣味”(I love the smell of coffee in the morning)只相差一個(gè)詞。