在此次卡塔爾世界杯足球賽期間,球員們將有一種更科學的方式來爭取上場時間。在終場哨響后的幾分鐘內(nèi),賽事組織者將向每位球員發(fā)送一份詳細的表現(xiàn)明細。例如,中鋒的傳球、帶球和射門表現(xiàn);以及當對方控球時,防守隊員對對方的搶斷頻率和程度數(shù)據(jù)等。
這是數(shù)字對這場競賽的完美加持?,F(xiàn)在,數(shù)據(jù)分析有助于指導(dǎo)一切,從球員轉(zhuǎn)會到訓(xùn)練強度,到瞄準對手,再到建議最佳射門點等等。
與此同時,足球運動員還面臨著航天員級別的數(shù)據(jù)審查強度??纱┐鞅承暮图鐜Э梢愿兄\動,用GPS追蹤位置,并計算每只腳的射門次數(shù)。攝像機從多個角度捕捉一切,從頭球得分到球員持球時間。為了讓這些信息有意義,大多數(shù)精英足球隊現(xiàn)在都雇傭了數(shù)據(jù)分析師,其中包括數(shù)學家、數(shù)據(jù)科學家以及從頂級公司和實驗室——比如計算巨頭微軟和歐洲核子研究中心(CERN,位于瑞士日內(nèi)瓦附近的歐洲粒子物理實驗室)——挖來的物理學家。
作為回報,分析人士的見解正在改變比賽的進行方式:中鋒遠距離射門的頻率減少,邊鋒傳球給隊友而不是傳中(cross),教練癡迷于提高球場控球權(quán)——這些戰(zhàn)術(shù)轉(zhuǎn)變都有確鑿證據(jù)來支持教練的直覺。
德國科隆體育大學的體育科學家丹尼爾·梅默特(Daniel Memmert)表示,“大數(shù)據(jù)開創(chuàng)了足球的新時代。它改變了球隊的理念和行為,改變了他們分析對手的方式,改變了他們培養(yǎng)人才和發(fā)掘球員的方式。”
覆蓋所有項目
關(guān)于數(shù)據(jù)如何改變體育運動,最著名的案例之一來自一項不同的比賽。邁克爾·劉易斯(Michael Lewis)在2003年出版的《點球成金(Moneyball)》一書中詳細描述了奧克蘭運動家隊(Oakland Athletics)的經(jīng)理比利·比恩(Billy Beane)是如何依靠球員數(shù)據(jù)在2002年以極低的預(yù)算打造了一支獲勝的棒球隊。據(jù)悉,Beane根據(jù)球員表現(xiàn)的詳細數(shù)據(jù)招募球員,包括以前被低估的測量值,比如擊球手上壘的頻率。
Memmert表示,“通過利用數(shù)據(jù),Beane獲得了極大的優(yōu)勢。不過,足球要比棒球復(fù)雜得多。棒球是一種自然的‘停止-開始’(stop–start)游戲,在同一時間只有一支球隊試圖得分,而且?guī)资陙?,棒球統(tǒng)計數(shù)據(jù)一直被例行收集和大規(guī)模研究。相比之下,足球是一種移動的、得分低的‘入侵’游戲,而且要記錄誰做了什么以及它如何影響結(jié)果也困難得多。”
幾十年來,足球統(tǒng)計學家傾向于關(guān)注進球數(shù)和失球數(shù),并尋找一種方法對它們進行建模來進行預(yù)測。這種方法的變種至今仍被用于預(yù)測比賽結(jié)果。英國牛津大學開發(fā)了一個數(shù)學模型,該模型假設(shè)進球數(shù)和丟球數(shù)分布在一個平均值附近,并正確預(yù)測了意大利將在2020年歐洲杯上擊敗英格蘭。它還正確判斷了8個進入1 / 4決賽的選手中的6個。
這樣的成功案例并不罕見。牛津大學的博士生馬修·佩恩(Matthew Penn)也曾開發(fā)了一個2020年歐洲杯的模型,他說,統(tǒng)計匹配預(yù)測比許多人意識到的更準確。對于正在進行的卡塔爾世界杯,Penn的模型顯示,比利時最有可能捧得冠軍獎杯,其次是巴西。
誰將贏得世界杯?
根據(jù)一種“雙泊松”(double Poisson)統(tǒng)計模型,考慮到各男子足球隊的攻守實力,比利時奪冠幾率最高,而巴西則在FIFA排名中位列第一。
模型排名 | 獲勝幾率(%) | FIFA排名 |
1.比利時 | 13.88 | 1.巴西 |
2.巴西 | 13.51 | 2.比利時 |
3.法國 | 12.11 | 3.阿根廷 |
4.阿根廷 | 11.52 | 4.法國 |
5.荷蘭 | 9.65 | 5.英格蘭 |
6.德國 | 7.24 | 6.意大利 |
7.西班牙 | 6.37 | 7.西班牙 |
8.瑞士 | 5.29 | 8.荷蘭 |
9.葡萄牙 | 3.78 | 9.葡萄牙 |
10.烏拉圭 | 3.36 | 10.丹麥 |
11.丹麥 | 3.17 | 11.德國 |
12.英格蘭 | 2.56 | 12.克羅地亞 |
13.波蘭 | 2.33 | 13.墨西哥 |
14.克羅地亞 | 1.46 | 14.烏拉圭 |
15.墨西哥 | 0.67 | 15.瑞士 |
完美球場
對教練來說,更有趣的是球場上發(fā)生的事件以及球員如何影響事態(tài)走向。
足球分析家一直在記錄這類信息。最成功的是,前皇家空軍會計師查爾斯·雷普(Charles Reep)花了20世紀50年代的大部分時間在英格蘭觀看比賽,并對球場位置和傳球順序等因素進行了基本觀察。Reep甚至用他的數(shù)據(jù)來分析球隊的表現(xiàn),并提出策略和戰(zhàn)術(shù)建議。在伍爾弗漢普頓流浪者足球俱樂部(FC),他甚至幫助引進了一種直接而犀利的打法,這種打法不允許橫傳,成功助力球隊在五年內(nèi)贏得三次聯(lián)賽冠軍。
現(xiàn)代技術(shù)使這些數(shù)據(jù)的獲取和分析變得非常容易,以至于大多數(shù)頂級俱樂部和許多國家隊在十多年前就開始聘請數(shù)據(jù)分析師。目前,它的用途已經(jīng)延伸到足球金字塔的深處。在攻讀博士學位的同時,Penn還在牛津城(Oxford City)俱樂部擔任兼職數(shù)據(jù)分析師。牛津城是一家半職業(yè)俱樂部,在英國足球體系的第六梯隊國家南部聯(lián)盟(National League South)中踢球。
許多分析人士將倫敦俱樂部布倫特福德(Brentford FC)最近的成功部分歸功于一種內(nèi)部算法,該算法為不同聯(lián)賽的球員打分,并幫助球隊招募被低估的球星。利物浦足球俱樂部的數(shù)據(jù)團隊——包括曾在歐洲粒子物理研究所和英國劍橋大學工作的物理學家——已經(jīng)建立了一個模型,可以評估球員在球場上的動作是否更有可能進球。去年,葡萄牙里斯本大學的體育科學家與西班牙豪門巴塞羅那足球俱樂部合作,發(fā)表了一份分析報告,分析了比賽中不同類型的傳球機會能持續(xù)多久。
Penn表示,“我認為我們(在牛津城俱樂部)做的最有用的事情是賽前報告。我們觀察其他球隊球員的屬性,然后繪制一些圖表來顯示他們的比賽和控球情況。之后,我會針對性地提出一些戰(zhàn)術(shù)建議或改變。在最近一場對陣‘霸主’球隊的比賽之前,我們的分析發(fā)現(xiàn)該球隊左后衛(wèi)的頭球數(shù)據(jù)很糟糕。所以我建議讓我們的大中鋒站在球場的右側(cè)。最終,牛津城俱樂部贏得了比賽。”
當然,一些有經(jīng)驗的偵察員用肉眼也能觀察到這些結(jié)果。但Penn認為,“數(shù)據(jù)提供的結(jié)果偏見性要比人為見解少得多”。
俱樂部不需要自己生成這些戰(zhàn)術(shù)分析的原始數(shù)據(jù)。相反,他們可以從商業(yè)公司那里購買信息,這些公司用視頻記錄了約3000個主要比賽事件的結(jié)果,包括運球、傳球和搶斷。起初,這些數(shù)據(jù)是手動記錄的,但現(xiàn)在通常使用一種名為計算機視覺的人工智能來完成。通常情況下,這些數(shù)據(jù)帶有匯總的統(tǒng)計數(shù)據(jù),比如每個球員的完成率。
喬安娜·馬克斯(Joanna Marks)是英國華威大學數(shù)學專業(yè)的本科生,今年早些時候,她與牛津城俱樂部的Penn合作,開發(fā)了一個模型,利用這些原始數(shù)據(jù)來評估牛津聯(lián)賽中所有球員的傳球強度——這種詳細的分析通常無法從公司提供的原始數(shù)據(jù)中獲得。
Marks解釋稱,“你需要考慮到他們的傳球方式。你不能只看完成率,因為有些傳球要難得多。這種模式有助于球隊做好準備,因為如果你知道對手在球場的某個區(qū)域傳球很好,那么你就知道應(yīng)該注意什么。”
拉維·拉米內(nèi)尼(Ravi Ramineni)曾是微軟的一名數(shù)據(jù)分析師,2012年調(diào)往美國職業(yè)大聯(lián)盟(MLS)俱樂部西雅圖海灣人(Seattle Sounders)擔任類似的工作。他的首要任務(wù)之一是使用GPS數(shù)據(jù)記錄球員跑了多遠,以優(yōu)化他們的訓(xùn)練和準備過程。
他解釋稱,“在訓(xùn)練期間收集這些數(shù)據(jù),你可以看出今天的訓(xùn)練可能太多或太少,這樣可以避免球員受傷。當我們運用這些方法的時候,我們確實有了一個非常完美的賽季。”
鏡頭之外的行動
分析人士現(xiàn)在越來越關(guān)注球員沒有球權(quán)時會發(fā)生什么。
Ramineni解釋稱,“在足球分析中,你總會聽到一件事,那就是我們需要知道球員在無球狀態(tài)下做了什么。”
這更困難,因為它需要專門的攝像機,不僅要跟蹤主要行動,還要密切關(guān)注那些沒有直接參與的球員,并以每秒25次的速度標記他們的位置。
Ramineni補充道,“提供這類數(shù)據(jù)的公司傾向于與國家聯(lián)賽簽訂獨家協(xié)議,這使得外來者很難獲得數(shù)據(jù)。這樣一來,如果我從南美或歐洲為美國足球大聯(lián)盟物色一名國際球員,那么我將無法獲悉他們的無球率(off-the-ball)指標。”
近年來,出現(xiàn)了一種更強大的技術(shù),它利用人工智能來預(yù)測拍攝比賽中球員的動作,即使他們沒有被攝像機直接捕捉到。這意味著數(shù)據(jù)公司可以使用比賽的直播畫面(不受限制)為世界上任何地方的球員提供全面的有球和無球分析。
谷歌旗下、總部位于倫敦的人工智能公司DeepMind的研究人員與利物浦FC3的數(shù)據(jù)團隊合作開發(fā)了這樣一個預(yù)測模型。
利物浦足球俱樂部的研究主管伊恩•格雷厄姆(Ian Graham)稱,“有了這種應(yīng)用程序,你就可以開始提出戰(zhàn)術(shù)問題。對于比賽中的一個特定事件,該模型可以生成數(shù)千個不同的模擬結(jié)果,以預(yù)測可能發(fā)生的情況。所以,你有能力談?wù)撛谀嵌螘r間的比賽中,一個進攻動作進行得有多好。”
俱樂部的數(shù)據(jù)團隊傾向于不分享他們正在做什么或工作效果如何的具體信息,所以公布這項工作對利物浦來說是充滿挑戰(zhàn)的一步。但這是與Deep Mind合作的一個條件。
Graham表示,“利物浦擁有足球界最大、最發(fā)達的分析部門之一,但我們自己卻沒有建立這些模型所需的任何資源(其他俱樂部也一定做不到),所以只能與Deep Mind合作開發(fā)這一模型。”
和其他數(shù)據(jù)分析師一樣,Graham并不認為自己是球場上取得勝利的“功臣”。他認為,“足球是一種瞬息萬變的游戲,所以球隊經(jīng)常會在不該輸?shù)臅r候輸,在不該贏的時候贏。在很多時候,當球隊表現(xiàn)不佳時,我們的工作更容易,因為我們的分析可以幫助他們踢得更好。如果我們保持這樣的表現(xiàn),我們將贏得本賽季預(yù)期的比賽數(shù)量。”
DeepMind公司計算機科學家卡爾•圖爾斯(Karl Tuyls)表示,鏡頭外(off-camera)建模工作是創(chuàng)建一個虛擬的、由人工智能驅(qū)動的助理教練的第一步,該助理教練使用實時數(shù)據(jù)指導(dǎo)足球和其他運動的決策。他表示,“你可以想象,AI看到上半場的表現(xiàn)后,會建議改變陣型,這樣可能會做得更好。這種方法在球場之外也很有用,比如在繁忙的城市街道上為自動駕駛汽車和行人的軌跡建模。”
接下來該怎么做?和所有優(yōu)秀的科學家一樣,研究足球數(shù)據(jù)的專家強調(diào),仍需要進行更多的研究。前微軟數(shù)據(jù)科學家莎拉•路德(Sarah Rudd)去年離開了阿森納俱樂部(Arsenal FC),此前他在這家倫敦俱樂部從事了近10年的分析工作?,F(xiàn)在,她對賽車產(chǎn)生的海量遙測數(shù)據(jù)十分垂涎,這些數(shù)據(jù)可以幫助車隊調(diào)整和提高賽車性能。
她表示,“我經(jīng)??碏1,并且總是想著我們足球也能有如此高水平的數(shù)據(jù)就太好了。目前,足球界仍然有很多東西沒有被衡量,或者它正在被衡量,只是我們還沒有弄清楚如何從中得出見解而已。”
下一個進步可能是數(shù)據(jù)顯示球員的方向,甚至他們?nèi)绾无D(zhuǎn)移重心。Rudd認為,“跟蹤數(shù)據(jù)可能還沒有達到人們想要的細粒度。我們還沒有注意到球員為了讓防守者失去平衡或給守門員‘虛晃一槍’而采取的假動作。”
即使是利物浦俱樂部的人工智能驅(qū)動的分析也可能會被這種行為所迷惑。Graham表示,“該模型可能會顯示這個球員出現(xiàn)異常行為,在本該跑的時候并沒有做出預(yù)期動作。但那可能是因為他被絆倒了,正躺在球場上。”
隨著現(xiàn)代足球被數(shù)據(jù)淹沒,數(shù)字如何改變了比賽?
Ramineni認為,“數(shù)據(jù)分析帶來的最大好處可能體現(xiàn)在球員招募方面。另一個領(lǐng)域則是定位球的策略,即球隊在比賽暫停后獲得任意球。”
從數(shù)據(jù)分析中得到的一個明確的教訓(xùn)是,球員不應(yīng)該在距離球門很遠的時候射門。Ramineni解釋稱,“如果你觀看世界上任何一個聯(lián)賽,十年前球員射門的距離要遠得多。這一切改變都得益于從事數(shù)據(jù)分析的人強調(diào),‘你為什么要從那里射擊?只有2%的機會!’”
他補充說,許多球隊現(xiàn)在也不鼓勵球員嘗試向禁區(qū)長傳,因為數(shù)據(jù)顯示大多數(shù)傳中都是無意義的。
最后,Ramineni認為,隨著生成的數(shù)據(jù)量不斷增長,應(yīng)用場景也會不斷增加?,F(xiàn)在,數(shù)據(jù)足跡已經(jīng)遍布整個體育界,也將改變整個體育界的運行方式。
關(guān)于企業(yè)網(wǎng)D1net(r5u5c.cn):
國內(nèi)主流的to B IT門戶,同時在運營國內(nèi)最大的甲方CIO專家?guī)旌椭橇敵黾吧缃黄脚_-信眾智(www.cioall.com)。同時運營18個IT行業(yè)公眾號(微信搜索D1net即可關(guān)注)。
版權(quán)聲明:本文為企業(yè)網(wǎng)D1Net編譯,轉(zhuǎn)載需注明出處為:企業(yè)網(wǎng)D1Net,如果不注明出處,企業(yè)網(wǎng)D1Net將保留追究其法律責任的權(quán)利。