李娜再度奪得大滿貫,超越了張德培的華人大滿貫紀(jì)錄,非舉國(guó)體制下的奇跡造就了舉國(guó)的愉悅。在總結(jié)李娜成功因素的時(shí)候,也再次看到了這樣的言論,“是大數(shù)據(jù)起到了重要的作用”。
早在2013年美網(wǎng)期間,就有媒體說大數(shù)據(jù)深度介入賽事、顛覆體育的時(shí)代來臨了。但在仔細(xì)看過了相關(guān)材料后,我們發(fā)現(xiàn),大數(shù)據(jù)的作用僅僅是囿于賽事的外圍,比如觀眾體驗(yàn);并不能夠輕易得出大數(shù)據(jù)在提升球員自身比賽能力方面會(huì)發(fā)揮顯著效果的結(jié)論。這次李娜奪冠,最靠譜的解釋就是李娜在卡洛斯的幫助下提大大提升了心理層面的戰(zhàn)斗力。
可以說在技術(shù)層面領(lǐng)先的前提下,李娜在整場(chǎng)比賽中很好地克服了節(jié)奏的問題,也就是說她具備了一顆冠軍的心臟。 而目前所說的大數(shù)據(jù),無非是告訴球員一些不算具體的技術(shù)指標(biāo)。在個(gè)人競(jìng)技比賽中,高手之間心理素質(zhì)的較量遠(yuǎn)遠(yuǎn)重要于技術(shù)的比拼,否則也不會(huì)有“爆冷”一說??梢哉f,體育比賽的最大魅力就在于那些無法預(yù)知的“黑天鵝”。
2012年9月6日,代表亞洲網(wǎng)球至高水平的中國(guó)選手李娜在美國(guó)迎戰(zhàn)名將小威廉姆斯。當(dāng)時(shí),IBM公司在綜合了美網(wǎng)過去8年的全部比賽數(shù)據(jù)之后,為參賽球員制定了“Keys to the match”的比賽制勝策略。李娜一方獲得贏球的關(guān)鍵包括3個(gè)指標(biāo):1、一發(fā)得分率超過69%;2、4-9拍相持中得分利率要超過48%;3、發(fā)球局30-30或40-40時(shí)得分率要超過67%。
比賽結(jié)果是,李娜潰敗。比賽結(jié)束后,IBM高調(diào)地宣布李娜僅僅完成了三項(xiàng)制勝策略中的一項(xiàng),而小威廉姆斯則完成了自己三項(xiàng)制勝策略中的兩項(xiàng)。 于是,很多人就順著IBM的思路去問,李娜為什么不照著IBM的策略去打球? 美國(guó)著名的博客納特·西爾弗在《信號(hào)與噪音》中提出了一個(gè)命題,數(shù)據(jù)究竟是對(duì)于我們的未來有所幫助的信號(hào),還是毫無意義的噪音。西爾弗成名于奧巴馬選舉期間。
當(dāng)時(shí),奧巴馬和羅姆尼的選戰(zhàn)正在膠著,人們都看不出來誰有可能獲勝。西爾弗用棒球的統(tǒng)計(jì)方法得出結(jié)論,奧巴馬必勝。這一準(zhǔn)確預(yù)測(cè)讓他名聲大噪。但是,西爾弗很快就開始反思,利用大數(shù)據(jù)獲得成功預(yù)測(cè)的案例遠(yuǎn)沒有失敗的多。為何? 為什么911的時(shí)候,美國(guó)政府會(huì)忽視將要有恐怖襲擊的信息,就像當(dāng)年的珍珠港事件一樣?為什么握有大量數(shù)據(jù)的經(jīng)濟(jì)學(xué)家預(yù)測(cè)不出來經(jīng)濟(jì)危機(jī)?為什么美國(guó)職業(yè)棒球大聯(lián)盟中,球探依然無法被數(shù)據(jù)所取代?
西爾弗在書中寫到: “自從有了印刷機(jī),我們的世界已經(jīng)經(jīng)歷太多。信息不再那么稀有,我們擁有的信息太多,甚至多到無從下手,但是用的信息卻寥寥無幾。我們主觀地、有選擇地看待信息,但對(duì)信息的曲解卻關(guān)注不夠。我們以為自己需要信息,但其實(shí)我們真正需要的是知識(shí)。”
西爾弗的話已經(jīng)說得很清楚,人的主觀愿望是決定看到信號(hào)還是聽到噪音的關(guān)鍵因素。當(dāng)美國(guó)情報(bào)部門收到種種美國(guó)即將遭到恐怖襲擊的信號(hào)時(shí),他們并沒有采用相關(guān)性思維將其聯(lián)系起來。2010年,一位民主黨議員給西爾弗打電話,讓他告之自己能否保住席位。西爾弗說你有99%的機(jī)會(huì),你應(yīng)該把自己的競(jìng)選基金捐獻(xiàn)給民主黨相對(duì)弱勢(shì)的地區(qū),可是,這位議員并不愿意為了1%的風(fēng)險(xiǎn)去幫助別的議員。
當(dāng)當(dāng)事人的主觀愿望不積極的時(shí)候,大數(shù)據(jù)對(duì)他們來說不過是噪音而已。同樣,數(shù)據(jù)也會(huì)因?yàn)橹饔^意愿具有欺騙性?!顿€神》中,周潤(rùn)發(fā)扮演的賭神一直有一個(gè)轉(zhuǎn)戒指的習(xí)慣。對(duì)手通過觀看大量的錄像發(fā)現(xiàn)了這一動(dòng)作,并認(rèn)定當(dāng)賭神轉(zhuǎn)動(dòng)戒指的時(shí)候,就是他出千的時(shí)機(jī)。結(jié)果,在一場(chǎng)生死之戰(zhàn)中,賭神欺騙了所有人。他在轉(zhuǎn)動(dòng)戒指后并沒有出千,結(jié)果導(dǎo)致對(duì)手崩潰。如果按照今天的觀點(diǎn)來看,對(duì)手在進(jìn)行數(shù)據(jù)分析的時(shí)候,過于強(qiáng)調(diào)了直接的因果性,模型中缺少了變量。這個(gè)最大的變量就是當(dāng)事人的心理狀態(tài)。
這也是西爾弗一再?gòu)?qiáng)調(diào)的。西爾弗是美國(guó)本土知名的棒球統(tǒng)計(jì)專家,他打造的PECOTA系統(tǒng)被認(rèn)為是最權(quán)威的棒球比賽統(tǒng)計(jì)工具。就在《點(diǎn)球成金》一書在美國(guó)大紅大紫之后,球探這個(gè)職業(yè)一度陷入低谷,各個(gè)球隊(duì)都瘋狂地迷戀上了數(shù)據(jù)。然而,西爾弗認(rèn)為事實(shí)證明,球探最后還是擊敗了數(shù)據(jù)。
數(shù)據(jù)系統(tǒng)的判斷依賴的是歷史數(shù)據(jù),而球探除了依賴歷史之外,還要依賴于現(xiàn)場(chǎng)判斷。西爾弗舉了紅襪隊(duì)明星佩德羅亞的例子。他說數(shù)據(jù)系統(tǒng)告訴自己,佩德羅亞會(huì)是很有潛力的新星。事情的發(fā)展也如他所料,但是當(dāng)西爾弗靠近佩德羅亞的時(shí)候,才發(fā)現(xiàn),佩德羅亞堅(jiān)定的信念和專注力才是決定他在場(chǎng)上可以出色發(fā)揮的關(guān)鍵。而這兩點(diǎn),都是數(shù)據(jù)系統(tǒng)無法感知的。
說回到IBM為大滿貫球員打造的制勝策略上。在和幾位國(guó)內(nèi)資深的網(wǎng)球評(píng)論員交流之后,發(fā)現(xiàn)大家對(duì)這個(gè)所謂的大數(shù)據(jù)系統(tǒng)除了覺得好玩之外,并沒有實(shí)用的價(jià)值。首先,這套系統(tǒng)不能預(yù)測(cè)。其次,這種依賴于歷史數(shù)據(jù)得出來的結(jié)論,早已被球員的教練團(tuán)隊(duì)爛熟于胸。對(duì)于李娜來說,教練員的任務(wù)不是把這些數(shù)據(jù)告訴她以便進(jìn)行針對(duì)性訓(xùn)練,而是側(cè)重于心理輔導(dǎo)。
而且,若要IBM為李娜設(shè)定的三個(gè)指標(biāo)都達(dá)標(biāo)的話,需要兩大因素支持。首先是李娜的臨場(chǎng)心理狀態(tài)。打球不比下棋,想到的可能做不到。其次,在于對(duì)手的壓迫程度。面對(duì)小威這樣的力量型選手時(shí),李娜的發(fā)揮空間會(huì)被大大壓縮。而這兩大因素又是緊密聯(lián)系在一起的。 我們很多時(shí)候都會(huì)被誤導(dǎo),認(rèn)為大數(shù)據(jù)的作用是讓歷史告訴未來。不然。甚至在網(wǎng)球這樣的領(lǐng)域里,歷史數(shù)據(jù)常常會(huì)成為陷阱。
大數(shù)據(jù)之大,一方面在于原始數(shù)據(jù)庫的規(guī)模之大,更在于實(shí)時(shí)流動(dòng)量之大、數(shù)據(jù)來源之大。就像西爾弗所言,一個(gè)好的棒球預(yù)測(cè)系統(tǒng)必須具備三大要素:考慮球員表現(xiàn)的外在因素;區(qū)別看待運(yùn)氣和技術(shù)因素;了解球員的表現(xiàn)和年齡變化之間的關(guān)系。
有意思的是,在另一場(chǎng)女子網(wǎng)球比賽中,一位球員做到了IBM為其制定的三項(xiàng)指標(biāo)中的兩個(gè),她卻失敗了。勝利的一方,只完成了一個(gè)指標(biāo)。