出版業(yè)“大數(shù)據(jù)”時代已來臨

責任編輯:editor004

2016-12-12 12:23:46

摘自:出版頭條

導(dǎo)讀:自2012年底起,“大數(shù)據(jù)”吸引了越來越多的關(guān)注,成了被廣泛討論的概念之一。大數(shù)據(jù)的思維不僅僅可能影響傳統(tǒng)出版業(yè)的各個產(chǎn)業(yè)鏈環(huán)節(jié),還可能為出版社提供新的商業(yè)贏利模式。

導(dǎo)讀:自2012年底起,“大數(shù)據(jù)”吸引了越來越多的關(guān)注,成了被廣泛討論的概念之一。出版業(yè)尚未在“數(shù)字出版”對“傳統(tǒng)出版”的沖擊中摸清門徑,就一下次又被推到了“大數(shù)據(jù)出版”的浪潮之前。大數(shù)據(jù)到底是什么?它會如何影響傳統(tǒng)出版,帶來怎樣的思維方式和商業(yè)模式的變革?它又會給我國傳統(tǒng)出版業(yè)帶來哪些問題和挑戰(zhàn)?這些問題值得傳統(tǒng)出版業(yè)中的有識之士認真思考。

  何謂“出版業(yè)大數(shù)據(jù)”

為了更清晰地認識出版業(yè)大數(shù)據(jù)的面貌,國家新聞出版廣電總局數(shù)字出版司對出版業(yè)大數(shù)據(jù)進行模型構(gòu)建,整體分為五個層面,由內(nèi)而外分別是核心層、產(chǎn)品層、業(yè)務(wù)層、市場層和用戶層。

核心層即出版生產(chǎn)過程中產(chǎn)生的各種內(nèi)容資源數(shù)據(jù);產(chǎn)品層是指產(chǎn)品信息的基礎(chǔ)數(shù)據(jù),目前以書目信息為主;業(yè)務(wù)層是指出版產(chǎn)品流通的數(shù)據(jù),記錄著整個出版業(yè)務(wù)運行狀態(tài)的信息;市場層和用戶層分別包括產(chǎn)品消費數(shù)據(jù)和消費反饋數(shù)據(jù),記錄了廣大用戶的行為數(shù)據(jù)和評價信息。這種劃分從宏觀層面可以更好地理解出版業(yè)大數(shù)據(jù)的發(fā)展整體狀況,對制定大數(shù)據(jù)扶持政策、推動大數(shù)據(jù)發(fā)展具有積極的作用。

“大數(shù)據(jù)”對傳統(tǒng)出版業(yè)的影響

無論國內(nèi)還是國外,業(yè)界普遍接受這樣一種論斷,從選題策劃到出版發(fā)行,出版業(yè)的每一個環(huán)節(jié)都離不開大數(shù)據(jù)。那么大數(shù)據(jù)究竟會對傳統(tǒng)出版業(yè)帶來哪些影響?

具體來說,在選題策劃環(huán)節(jié),過去出版社在出版一本書之前,先是基于經(jīng)驗判斷,然后往往會經(jīng)過市場調(diào)研,以了解市場需求,在這種情況下,出版人對經(jīng)驗判斷的依賴度較高,而在高節(jié)奏的社會發(fā)展背景下,市場需求變化瞬息萬變,單純依據(jù)經(jīng)驗進行判斷的風險度急劇加大,比如今年有眾多出版社針對美國總統(tǒng)大選所進行的選題儲備,就出現(xiàn)了大面積的誤判現(xiàn)象。在大數(shù)據(jù)尚未建立的情況下,市場調(diào)研往往采用隨機抽樣問卷調(diào)查的形式。隨機抽樣式調(diào)查固然有一定的科學(xué)性和可參考性,但其數(shù)據(jù)支撐的天然缺陷是始終存在的。這也是為什么傳統(tǒng)出版業(yè)的出版品種在逐年遞增的原因:為了應(yīng)對市場需求的不確定性,出版企業(yè)往往需要生產(chǎn)過剩的文化產(chǎn)品,再重點推廣其中某些產(chǎn)品,以期望這些產(chǎn)品能夠滿足消費者的需求。很顯然,這種傳統(tǒng)的生產(chǎn)模式不僅增加了成本,還造成了一定程度上的資源浪費。

在大數(shù)據(jù)時代,一個題材的書籍是否有必要發(fā)行,不再是過去那種“經(jīng)驗式”的決策方式,而應(yīng)該是在一定數(shù)據(jù)統(tǒng)計下,經(jīng)過分析后得出的可供參考的,相對客觀的預(yù)測結(jié)論。通過大數(shù)據(jù)分析,可以更實時、準確、小成本地分析現(xiàn)有市場的潛在需求和趨勢。這樣,出版社不必再忙于傳統(tǒng)市場調(diào)研的隨機抽樣問卷調(diào)查,也不必再受制于調(diào)查得出的滯后的市場數(shù)據(jù),更不必再通過過剩生產(chǎn)的方式來滿足受眾需求。出版社通過對用戶數(shù)據(jù)的分析,可以了解到用戶的產(chǎn)品偏好,這樣就可以相對定向地策劃、生產(chǎn)出符合用戶潛在需求的文化產(chǎn)品。出版社可以和掌握相關(guān)用戶數(shù)據(jù)的網(wǎng)站合作,分析用戶使用搜索和“想讀”功能而積累起的海量數(shù)據(jù),從中挖掘出用戶的偏好趨勢和書籍市場的潛在需求。社交網(wǎng)站和搜索引擎也掌握著龐大的數(shù)據(jù)。出版社可以通過對微博上與書籍相關(guān)的關(guān)鍵詞進行排序,挖掘出近期熱門的內(nèi)容題材和作家。

在印量確定環(huán)節(jié),基于數(shù)據(jù)的分析,例如該類書的市場受歡迎程度、作者受歡迎程度、已出版同類書籍的銷售庫存情況,也可以大概推測出這本書的首印量應(yīng)該為多少。新書首印量的確定不僅關(guān)系到出版社的贏利,更關(guān)系到成本控制,相對于印少了來說,印多了不僅不能創(chuàng)造預(yù)期的利潤,更會增加不該有的庫存,占用大量資金,因此對新書首印量的數(shù)據(jù)性分析有助于首印數(shù)的決策參考。

在圖書營銷環(huán)節(jié),大數(shù)據(jù)可利用的范圍就更加廣闊,為圖書提供了精準營銷的可能性,在運用大數(shù)據(jù)之前,對讀者的閱讀喜好調(diào)查多為抽樣調(diào)查,而大數(shù)據(jù)可以通過對數(shù)據(jù)的分析和計算,如某地讀者的閱讀喜好與習慣、不同省份更喜愛的書籍類型,哪些書籍放在一起容易捆綁銷售等這些用戶行為,分析出讀者的需求和喜好,更好地進行推銷。通過對這些信息的收集、加工和整理,就可以得到有意義的統(tǒng)計規(guī)律。社交網(wǎng)站上的用戶關(guān)系也可用于大數(shù)據(jù)分析。利用社會網(wǎng)絡(luò)分析法對社交網(wǎng)站用戶間關(guān)系進行分析,可以辨別出有著不同屬性、興趣愛好和消費能力的“小圈子”。這些小圈子就是典型的細分的目標市場。專業(yè)出版物往往只符合小眾市場的需求,而在這些小圈子進行專業(yè)出版物的營銷活動,利用社交網(wǎng)絡(luò)強關(guān)系和弱關(guān)系的連結(jié),可以取得良好的營銷效果。在大數(shù)據(jù)分析的幫助下,對不同的用戶進行定向的新書推薦和廣告投放,也可以使營銷更有效、更富有針對性。

大數(shù)據(jù)的思維不僅僅可能影響傳統(tǒng)出版業(yè)的各個產(chǎn)業(yè)鏈環(huán)節(jié),還可能為出版社提供新的商業(yè)贏利模式。在傳統(tǒng)出版業(yè),出版是主要環(huán)節(jié),帶動其他環(huán)節(jié)形成出版業(yè)的生產(chǎn)鏈條。在大數(shù)據(jù)時代,數(shù)據(jù)本身就是重要的資產(chǎn)。這種資產(chǎn)就像冰山一角,沒有深入挖掘就不能發(fā)現(xiàn)其潛藏的巨大價值。出版社需要認識到,自身所擁有的龐大內(nèi)容資源,本身就可以是一個巨大的數(shù)據(jù)庫。谷歌于2010年推出的圖書數(shù)據(jù)庫就包括了從1500年到2008年間出版的各類圖書的5000億個單詞,大約有2000萬圖書被掃描成了數(shù)字圖書。用戶可以在電腦上輸入單詞,查看這些單詞歷年的使用頻率。這樣的數(shù)據(jù)庫對于人文社科研究有著巨大的價值。

除去傳統(tǒng)出版的環(huán)節(jié),對數(shù)字出版來說,大數(shù)據(jù)也很有用處。大數(shù)據(jù)為按需出版提供了數(shù)據(jù)支持,出版社可根據(jù)讀者的用戶行為、偏好取向等進行全面分析,將有可能實現(xiàn)真正意義上的個性化定制內(nèi)容和按需出版。

  國際出版業(yè)的實踐

全球領(lǐng)先的學(xué)術(shù)科技期刊和專著出版商施普林格通過大數(shù)據(jù)提升決策效率。施普林格目前在世界25個國家和地區(qū)擁有超過6000名員工,共出版發(fā)行了2000多種學(xué)術(shù)期刊和12.3萬種學(xué)術(shù)專著。施普林格借助大數(shù)據(jù)分析,發(fā)現(xiàn)全球?qū)W術(shù)、科研、政府、企業(yè)機構(gòu)對期刊形式的需求發(fā)生了重大變化,結(jié)果顯示多達88%的機構(gòu)只需要數(shù)字期刊,只有12%的機構(gòu)表示仍需要紙質(zhì)期刊。于是施普林格察覺到了從紙質(zhì)出版向數(shù)字出版發(fā)展的巨大變化,它借助分析結(jié)果進行決策,加速整個公司數(shù)字化出版的進度。

世界著名的大眾圖書出版商西蒙·舒斯特十分重視大數(shù)據(jù)技術(shù)的應(yīng)用,聘請了著名的數(shù)據(jù)科學(xué)家直接指導(dǎo)社內(nèi)大數(shù)據(jù)應(yīng)用項目開展,并借助底層數(shù)據(jù)架構(gòu)為大數(shù)據(jù)項目實施提供基礎(chǔ),借助大數(shù)據(jù)優(yōu)化業(yè)務(wù)管理和拓寬業(yè)務(wù)范圍。通過對讀者購書和閱讀行為數(shù)據(jù)進行全面收集,對數(shù)據(jù)進行大數(shù)據(jù)分析,從而發(fā)現(xiàn)這些數(shù)據(jù)背后的意義,可以分析得出為什么人們喜歡某個作者;通過大數(shù)據(jù)技術(shù)對銷售渠道產(chǎn)生的數(shù)據(jù)進行分析,制定了更優(yōu)的定價策略,并且還可獲知在何種情況下對圖書銷售可能會造成何種影響;通過大數(shù)據(jù)分析還發(fā)現(xiàn)了通過在線社區(qū)和社交媒體宣傳和銷售以吸引讀者關(guān)注圖書的新模式,并可獲知讀者亟需內(nèi)容的類型。

亞馬遜利用大數(shù)據(jù)改變營銷方式的案例也值得借鑒。作為在線售書商,亞馬遜曾經(jīng)專門成立了一個由20多名書評家和編輯組成的團隊。這個團隊通過撰寫書評、推薦新書的形式,承擔起傳統(tǒng)評論人的角色,對書籍銷量產(chǎn)生了巨大的影響。然而,當亞馬遜意識到數(shù)據(jù)的作用后,通過對用戶的大數(shù)據(jù)分析,建立起亞馬遜的購書推薦系統(tǒng)。這個系統(tǒng)能夠自動向用戶推薦經(jīng)數(shù)據(jù)分析后其最有可能會買的書籍,最終,推薦系統(tǒng)獲得了比書評團隊更好的效果,書評團隊也走向解體。

如果出版社擁有自己的電子閱讀器用戶,那么出版社就可以對電子閱讀器用戶的閱讀習慣和閱讀行為進行量化。巴諾書店利用自己的Nook電子閱讀器收集用戶的閱讀行為數(shù)據(jù)。通過數(shù)據(jù)分析,巴諾發(fā)現(xiàn)非小說的閱讀,尤其是篇幅較長的書的閱讀,總是斷斷續(xù)續(xù),往往容易較早被放棄。這些數(shù)據(jù)促使巴諾推出“Nook快照”,加入了從減肥到“占領(lǐng)華爾街”運動等一系列與健康和時事有關(guān)的短小作品,鼓勵讀者閱讀非小說類作品和長篇的新聞作品。甚至,數(shù)據(jù)還能幫助出版社在電子書中合適的地方加入多媒體功能,讓讀者繼續(xù)保持興趣。出版社還能通過讀者的閱讀速度或放棄閱讀的比例來判斷讀者對此書是否還有興趣。

  “大數(shù)據(jù)”對出版業(yè)的真正意義

有關(guān)數(shù)字出版對傳統(tǒng)出版的挑戰(zhàn)與機遇的論述已經(jīng)有許多,觀點也普遍被業(yè)界所接受。但大數(shù)據(jù)時代的來臨對出版業(yè)究竟意味著什么?

美國學(xué)者舍恩伯格曾經(jīng)舉過Google圖書館的例子來說明數(shù)字出版和大數(shù)據(jù)出版的差異:前者只是將書本內(nèi)容搬到了計算機和因特網(wǎng)上供人查閱,而后者則是通過光學(xué)識別軟件將書本中的內(nèi)容轉(zhuǎn)化為計算機可以檢索和運算的信息,從而將所有文獻內(nèi)容集成為一個大數(shù)據(jù)庫,借助計算機可以對其中的任何文本進行挖掘和分析??梢?,數(shù)字出版的歷史進步性在于對信息存儲、復(fù)制和傳播方式的變革,但數(shù)字出版所沒有解決的,是對信息的挖掘和運算問題——而這正是大數(shù)據(jù)出版最關(guān)注的核心價值:在沒有數(shù)據(jù)化之前,所有數(shù)字出版的產(chǎn)品無法被集成和參與運算;而實現(xiàn)了大數(shù)據(jù)出版之后,這些信息孤島就被海底的大陸架所連接,雖然其呈現(xiàn)方式可以是一本本書籍,但其內(nèi)在結(jié)構(gòu)卻是一個可被分析的大數(shù)據(jù)庫。大數(shù)據(jù)技術(shù)的戰(zhàn)略意義不在于掌握龐大的數(shù)據(jù)信息,而在于對這些含有意義的數(shù)據(jù)進行專業(yè)化處理。

大數(shù)據(jù)對傳統(tǒng)出版業(yè)來說更大的價值不在于技術(shù)本身,而在為出版業(yè)提供一種思維方式和思考模式,大數(shù)據(jù)強調(diào)相關(guān)關(guān)系,重視總體數(shù)據(jù),寬容數(shù)據(jù)中的“噪音”,實時地發(fā)現(xiàn)其中從未被了解過的相關(guān)性現(xiàn)象和趨勢,挖掘并創(chuàng)造意想不到的價值,改變了傳統(tǒng)數(shù)據(jù)時代一味追求因果關(guān)系和精致化數(shù)據(jù)處理的思維習慣。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號