前鋒不轟遠(yuǎn)射,教練癡迷逼搶,大數(shù)據(jù)如何改變足球?
隨著世界杯火熱開打,科研人員利用他們的專業(yè)技術(shù)幫助足球教練訓(xùn)練球員、制定戰(zhàn)術(shù)。
在上個(gè)月曼聯(lián)對(duì)陣紐卡的英超比賽中,葡萄牙巨星C羅(Cristiano Ronaldo)在第72分鐘被替換下場(chǎng)時(shí)面露不悅,這在賽后登上了國(guó)際頭條。但很多球員都會(huì)有這種情緒,因?yàn)闆]有人希望教練將自己換下。
在本屆卡塔爾世界杯上,球員會(huì)以一種“更講證據(jù)”的方式來向教練展示自己在場(chǎng)上的價(jià)值。比賽結(jié)束后幾分鐘之內(nèi),賽事主辦方就會(huì)給每位球員發(fā)送一份他們?cè)趫?chǎng)上表現(xiàn)的詳細(xì)分析。前鋒可以看到他們的跑動(dòng)次數(shù)和被漏防的次數(shù)。后衛(wèi)則能看到他們?cè)趯?duì)方持球時(shí)進(jìn)行了多少次干擾。
這是數(shù)字在足球賽事中的最新應(yīng)用。如今,數(shù)據(jù)分析能為球場(chǎng)內(nèi)外的所有一切提供指導(dǎo),從球員轉(zhuǎn)會(huì)、訓(xùn)練強(qiáng)度,到制定針對(duì)性戰(zhàn)術(shù)、給出球場(chǎng)上的實(shí)時(shí)最佳傳球線路等等。
2018年世界杯四分之一決賽,比利時(shí)(紅色球衣)戰(zhàn)勝巴西。來源:TF-Images/Getty
與此同時(shí),球員們所面對(duì)的基本是宇航員級(jí)別的數(shù)據(jù)檢視。如今,可穿戴背心和手環(huán)能感知運(yùn)動(dòng),利用GPS追蹤位置,還能計(jì)算每只腳的射門次數(shù)。多角度設(shè)置的攝像機(jī)組可以捕捉到從爭(zhēng)頂成功次數(shù)到球員持球時(shí)間在內(nèi)的一切信息。為了理解這些信息,大多數(shù)頂級(jí)球隊(duì)都會(huì)雇用數(shù)據(jù)分析師,包括從微軟和日內(nèi)瓦近郊?xì)W洲粒子物理實(shí)驗(yàn)室(CERN)等計(jì)算應(yīng)用巨頭挖來的數(shù)學(xué)家、數(shù)據(jù)科學(xué)家和物理學(xué)家。
相應(yīng)地,分析專家的見解也在改變足球的踢法。前鋒現(xiàn)在更少選擇遠(yuǎn)射,邊鋒會(huì)更傾向于選擇傳給隊(duì)友而非傳中,而教練則更癡迷于前場(chǎng)高位逼搶——這些戰(zhàn)術(shù)變化都有堅(jiān)實(shí)的證據(jù),以支持教練自己的直覺。
“大數(shù)據(jù)開創(chuàng)了足球的新時(shí)代,”科隆德國(guó)體育學(xué)院的體育科學(xué)家Daniel Memmert說,“它改變了球隊(duì)的戰(zhàn)術(shù)思想、行為、分析對(duì)手的方式以及培養(yǎng)人才和發(fā)掘球員的方法?!?/p>
面面俱到
數(shù)據(jù)改變運(yùn)動(dòng)的一個(gè)著名案例來自于棒球運(yùn)動(dòng)。Michael Lewis在2003年出版的《魔球》(Moneyball)一書中,詳細(xì)講述了2002年奧克蘭運(yùn)動(dòng)家隊(duì)總經(jīng)理Billy Beane是如何依靠球員數(shù)據(jù),利用極有限的預(yù)算打造出一支連勝棒球隊(duì)的。Beane基于比賽表現(xiàn)的詳細(xì)數(shù)據(jù)來召集球員,這些數(shù)據(jù)包括先前未受關(guān)注的指標(biāo),如擊球手上壘的頻率。
Beane比搞足球的那些人更有優(yōu)勢(shì)。Memmert說:“足球比棒球復(fù)雜多了?!卑羟虮旧砭褪且环N回合制比賽,一回合內(nèi)只有攻方球隊(duì)可以得分。而且在過去幾十年里,棒球數(shù)據(jù)的采集和大范圍研究已成為常態(tài)。相反,足球是一種動(dòng)態(tài)的、低比分的“侵略”游戲(即雙方領(lǐng)地時(shí)刻此消彼長(zhǎng)),因此要記錄球員的行為以及其如何影響比賽結(jié)果就更加困難。數(shù)十年來,足球統(tǒng)計(jì)師更關(guān)注得失分,并嘗試建立模型來預(yù)測(cè)。
如今,人們?nèi)匀辉谟眠@種方法的變體預(yù)測(cè)比賽結(jié)果。牛津大學(xué)的幾位流行病學(xué)家假定足球得分和失分是在某個(gè)平均值上下分布的,并據(jù)此建立了一個(gè)數(shù)學(xué)模型。該模型準(zhǔn)確地預(yù)測(cè)出意大利會(huì)在2020年歐洲杯中擊敗英格蘭,它還準(zhǔn)確預(yù)測(cè)了進(jìn)入四分之一決賽的8支隊(duì)伍中的6支[1]。
這類成功并非偶然。2020年歐洲杯預(yù)測(cè)模型的開發(fā)者、牛津大學(xué)的博士生Matthew Penn表示,利用統(tǒng)計(jì)手段預(yù)測(cè)比賽結(jié)果的準(zhǔn)確性超出了很多人的意料。
“首先根據(jù)每支隊(duì)伍的總進(jìn)球數(shù)和每場(chǎng)比賽對(duì)手的相對(duì)強(qiáng)弱,來計(jì)算各隊(duì)伍的進(jìn)攻和防守能力值,”他說,“求解方程組得到上述兩種能力值,之后就能輕松預(yù)測(cè)每場(chǎng)比賽的結(jié)果了?!睂?duì)于本屆卡塔爾世界杯,Penn的模型顯示比利時(shí)(截至本期《自然》交印,比利時(shí)奪冠賠率高達(dá)14/1)最可能舉起大力神杯,其次才是巴西(見下表‘誰將贏得世界杯?’)
完美表現(xiàn)
對(duì)教練來說,他們更感興趣的信息是關(guān)于球場(chǎng)上的各種事件,以及球員會(huì)如何影響這些事件。
足球分析師一直在記錄這類信息。其中最成功的當(dāng)數(shù)英國(guó)皇家空軍的前會(huì)計(jì)Charles Reep。在上世紀(jì)50年代,他花了大量時(shí)間觀看英格蘭的球賽,并觀察了球員位置和傳球順序等基礎(chǔ)要素。Reep甚至用他的數(shù)據(jù)來分析球隊(duì)表現(xiàn),并提出了戰(zhàn)略戰(zhàn)術(shù)方面的建議。他為狼隊(duì)(Wolverhampton Wanderers Football Club)帶來了一種直切要害的比賽風(fēng)格——即減少橫向傳遞,幫助他們?cè)谖迥陜?nèi)三奪聯(lián)賽冠軍。
現(xiàn)代技術(shù)大大簡(jiǎn)化了這些數(shù)據(jù)的采集和分析,因此大多數(shù)頂級(jí)俱樂部和許多國(guó)家隊(duì)從十多年前就開始聘請(qǐng)數(shù)據(jù)分析師。數(shù)據(jù)的使用深入到了英格蘭足球聯(lián)賽系統(tǒng)內(nèi)部。Penn在攻讀博士之余,還擔(dān)任牛津城足球俱樂部的兼職數(shù)據(jù)分析師。這是一支半職業(yè)俱樂部,隸屬英格蘭第六級(jí)別聯(lián)賽,全國(guó)聯(lián)賽南區(qū)。
許多分析師認(rèn)為倫敦的布倫特福德足球俱樂部近期的成功一定程度上得益于一套內(nèi)部算法。這套算法給各個(gè)聯(lián)賽中的球員打分,幫助球隊(duì)引入轉(zhuǎn)會(huì)市場(chǎng)上被低估的球星。利物浦足球俱樂部的數(shù)據(jù)團(tuán)隊(duì)包括曾在CERN和劍橋大學(xué)供職的物理學(xué)家,他們構(gòu)建了一套模型,專門評(píng)估球員在場(chǎng)上的行動(dòng)是否更可能導(dǎo)致進(jìn)球。里斯本大學(xué)的體育科學(xué)家在和西甲巨頭巴塞羅那俱樂部合作期間,于去年發(fā)表了一篇分析文章,研究不同類型的傳球在場(chǎng)上有多長(zhǎng)的機(jī)會(huì)窗口[2]。
“我們【在牛津城】做的最有用的事是賽前報(bào)告,”Penn說,“我們會(huì)研究另一支球隊(duì)中球員的屬性,并繪制圖表來說明他們的比賽方式,以及他們?nèi)绾闻芪弧?/strong>我會(huì)據(jù)此給出一些戰(zhàn)術(shù)建議或變化。”最近一次面對(duì)牛津城苦主的比賽前,Penn分析發(fā)現(xiàn)對(duì)方左后衛(wèi)的頭球數(shù)據(jù)較差。他說:“于是我建議讓高前鋒踢右路。”牛津城最后取得了勝利。
這也是老練的球探憑雙眼就能看出來的事。但Penn表示,“數(shù)據(jù)比人更加客觀。”
俱樂部并不需要自己生成戰(zhàn)術(shù)分析的原始數(shù)據(jù),他們可以向商業(yè)公司購買。后者會(huì)將比賽錄像轉(zhuǎn)碼,并記錄下場(chǎng)內(nèi)近3000種主要事件,包括帶球、傳球和搶斷。一開始,這類數(shù)據(jù)的記錄交由人工完成,但如今已被計(jì)算機(jī)視覺這種人工智能(AI)技術(shù)所取代。通常來說,數(shù)據(jù)會(huì)和匯總統(tǒng)計(jì)資料一并生成,如每名球員的傳球成功率。
2019年女足世界杯,電視攝像機(jī)正在拍攝挪威與英格蘭的比賽。來源:Catherine Ivill/FIFA/Getty
今年早些時(shí)候,英國(guó)華威大學(xué)數(shù)學(xué)系的本科生Joanna Marks與Penn合作為牛津城開發(fā)了一個(gè)模型。該模型利用原始數(shù)據(jù)來評(píng)估牛津城所在聯(lián)賽中所有球員的傳球能力——這種詳細(xì)的分析在商業(yè)公司提供的原始數(shù)據(jù)中通常是沒有的。
“你需要考慮他們的傳球方式,而不能只計(jì)算傳球成功率,因?yàn)橛行﹤髑螂y度更高,”Marks說,“這個(gè)模型能幫助隊(duì)伍備戰(zhàn)。倘若你知道對(duì)手擅長(zhǎng)在場(chǎng)上某些區(qū)域傳球,那么你就能對(duì)其進(jìn)行針對(duì)性布防?!?/p>
Ravi Ramineni曾經(jīng)在微軟擔(dān)任數(shù)據(jù)分析師。2012年,他跳槽到本地一家美職聯(lián)(MLS)俱樂部——西雅圖海灣人(Seattle Sounders),從事與之前類似的工作。他最初的任務(wù)之一,是用GPS數(shù)據(jù)計(jì)算球員的跑動(dòng)距離,從而優(yōu)化他們的訓(xùn)練和備賽時(shí)間。“訓(xùn)練的時(shí)候收集這些信息,就可以判斷當(dāng)天的訓(xùn)練量是過了還是少了,這樣可以預(yù)防傷病。”
這有用嗎?“我們使用這些方法的時(shí)候,的確取得了幾個(gè)賽季的好成績(jī)。但我不知道。因?yàn)楸苊舛嗌賯∑鋵?shí)是最難量化的東西?!?/p>
不確定性為數(shù)據(jù)有助于取得體育佳績(jī)的說法蒙上了疑云,因?yàn)槟銦o法開展對(duì)照實(shí)驗(yàn)證實(shí)其效果。不過,Ramineni表示西雅圖的教練對(duì)他的分析持開放態(tài)度,包括訓(xùn)練分析和評(píng)估球員能力評(píng)估。
“我可以和教練溝通,甚至可以直接去跟球員談,”他說,“在其他俱樂部里情況則不一樣。教練有時(shí)甚至不和數(shù)據(jù)分析師交流?!?/p>
鏡頭以外的跑動(dòng)
分析師們現(xiàn)在越來越關(guān)注球員在無球狀態(tài)下的跑動(dòng)。
Ramineni說:“你在足球分析中經(jīng)常聽到的一句話是,我們需要了解球員在無球狀態(tài)下的跑動(dòng)。”
這項(xiàng)任務(wù)難度更大,而且更加費(fèi)錢,因?yàn)樗枰玫綄S脭z像機(jī)。這種攝像機(jī)不僅能追蹤主要的動(dòng)作場(chǎng)景,還能留意那些未直接參與這些場(chǎng)景的球員,并以每秒25次左右的頻率記錄他們的位置。提供這類數(shù)據(jù)的公司基本都會(huì)和各國(guó)聯(lián)賽簽署獨(dú)家協(xié)議,Ramineni說,這就使局外人很難獲取。
他說:“如果我想挖一名南美或是歐洲的球員,我將無法獲取他們無球狀態(tài)下的指標(biāo)數(shù)據(jù)?!?/p>
近年興起了一項(xiàng)更強(qiáng)大的技術(shù),該技術(shù)利用AI預(yù)測(cè)比賽錄像中球員的跑動(dòng),甚至是那些在攝像機(jī)鏡頭之外球員的跑動(dòng)。這意味著數(shù)據(jù)公司可以使用播出的比賽錄像(無版權(quán)限制)來對(duì)世界各地球員的有球和無球跑動(dòng)展開全面分析。
谷歌旗下的AI公司DeepMind與利物浦足球俱樂部的數(shù)據(jù)團(tuán)隊(duì)合作開發(fā)了一個(gè)類似的預(yù)測(cè)模型[3]。
利物浦足球俱樂部的研究主管Ian Graham說:“有了這種應(yīng)用,我們就可以探討戰(zhàn)術(shù)或是假設(shè)場(chǎng)景方面的問題了?!盙raham曾是劍橋大學(xué)的高分子物理學(xué)博士后,后來他辭去了博后并開始從事足球統(tǒng)計(jì)方面的工作。
“針對(duì)比賽中某個(gè)特定事件,模型可以模擬出數(shù)千種可能出現(xiàn)的場(chǎng)景。這樣,你便能對(duì)比賽中某次進(jìn)攻組織的流暢性進(jìn)行評(píng)估?!?/p>
動(dòng)畫展現(xiàn)了一場(chǎng)球賽中球員(深藍(lán)色為進(jìn)攻方,深紅色為防守方)的實(shí)際跑動(dòng)路線與模型預(yù)測(cè)的鏡頭之外的球員跑動(dòng)路線?;疑年幱安糠质请娨晹z像機(jī)鏡頭覆蓋的區(qū)域(FOV),它會(huì)跟隨足球(黑線)移動(dòng)。模型預(yù)測(cè)了FOV以外的攻方球員(綠色)和防守球員(橙色)的位置(雙方實(shí)際的位置分別由淡藍(lán)和粉色標(biāo)示)。來源:DeepMind
俱樂部的數(shù)據(jù)團(tuán)隊(duì)其實(shí)不希望分享其具體的工作細(xì)節(jié)或是成效,因此發(fā)表這篇論文對(duì)利物浦來說有點(diǎn)勉強(qiáng)。但這是他們和DeepMind合作的條件之一。
Graham說:“利物浦的分析部門屬于世界足壇中規(guī)模最大、技術(shù)最先進(jìn)的那一批,但我們?nèi)匀蝗鄙儋Y源來獨(dú)立構(gòu)建這些模型。”這使他確信其他俱樂部也不行。
同其他數(shù)據(jù)分析師一樣,Graham不太愿意承認(rèn)球場(chǎng)上的獲勝有自己的直接功勞。“足球是一項(xiàng)充滿變數(shù)的運(yùn)動(dòng),因此球隊(duì)經(jīng)常會(huì)輸?shù)舯静辉撦數(shù)谋荣?,也?huì)贏下那些很難贏的比賽,”他說,“從許多方面講,球隊(duì)成績(jī)不佳的時(shí)候我們的工作會(huì)更輕松,因?yàn)槲覀兊姆治龀3?huì)證明我們踢得沒問題。只要保持這種戰(zhàn)術(shù)風(fēng)格,球隊(duì)在這個(gè)賽季的勝場(chǎng)數(shù)將會(huì)達(dá)到我們的期望?!?/p>
DeepMind的計(jì)算機(jī)科學(xué)家Karl Tuyls表示,鏡頭之外的建模是創(chuàng)造AI虛擬助理教練的第一步。這套系統(tǒng)會(huì)使用實(shí)時(shí)數(shù)據(jù)指導(dǎo)足球等運(yùn)動(dòng)中的決策。他說:“想象一下,AI看完了上半場(chǎng)比賽,然后建議球隊(duì)在下半場(chǎng)變陣。”
Tuyls還表示,這種方法在體育之外的領(lǐng)域也很有用,例如為繁忙的城市街道上的自動(dòng)駕駛汽車和行人的軌跡建模。
接下來呢?和所有的優(yōu)秀科學(xué)家一樣,足球數(shù)據(jù)領(lǐng)域的專家強(qiáng)調(diào)今后仍需開展更多研究。前微軟數(shù)據(jù)科學(xué)家、曾在阿森納從事了近十年分析工作的Sarah Rudd于去年離職。她十分羨慕賽車所能產(chǎn)生的大量遙測(cè)數(shù)據(jù),這些數(shù)據(jù)能夠幫助團(tuán)隊(duì)做出改進(jìn)并提升表現(xiàn)。
“我們經(jīng)??碏1的比賽,要是球隊(duì)能有那樣的數(shù)據(jù)就太棒了,”她說,“足球里還有很多東西有待測(cè)量,或是正在測(cè)量但我們還不清楚要如何分析?!?/p>
那些反映球員朝向或是重心改變的數(shù)據(jù)可能是足球數(shù)據(jù)分析接下來的發(fā)展方向?!败壽E數(shù)據(jù)的精細(xì)度可能仍不理想,”Rudd說,“現(xiàn)在還沒辦法收集到那些能讓防守球員失去平衡,或是能讓守門員遲疑一下的那種急停變向或是重心變換動(dòng)作的數(shù)據(jù)。”
即便是利物浦的AI驅(qū)動(dòng)分析模型,也會(huì)被不完備的球員位置認(rèn)知所迷惑?!叭绻P涂吹揭晃磺騿T本該在這個(gè)位置啟動(dòng)卻沒有,可能就會(huì)認(rèn)為他出現(xiàn)了重大失誤,”Graham說,“但那或許只是因?yàn)樗麆偨O倒了,正躺在草皮上呢?!?/p>
隨著海量數(shù)據(jù)涌入現(xiàn)代球場(chǎng),數(shù)據(jù)如何改變了比賽?
Ramineni說:“我認(rèn)為球員轉(zhuǎn)會(huì)可能是獲益最大的領(lǐng)域。”此外還有定位球戰(zhàn)術(shù),即球隊(duì)獲得任意球時(shí)的戰(zhàn)術(shù)。
數(shù)據(jù)分析所給出的一條明確經(jīng)驗(yàn)是,球員不該在離球門很遠(yuǎn)的位置射門。“如今在全球各地的聯(lián)賽中,球員的射門距離比十年前近得多,”Ramineni說,“這是因?yàn)閿?shù)據(jù)分析師開始對(duì)球員說,‘你為什么從那個(gè)地方射門?命中率只有2%!’”
很多球隊(duì)現(xiàn)在也不鼓勵(lì)球員嘗試朝對(duì)方禁區(qū)長(zhǎng)傳,他補(bǔ)充道,因?yàn)榻y(tǒng)計(jì)表明這種傳球大多是無意義的。
隨著生成的數(shù)據(jù)量越來越大,就業(yè)機(jī)會(huì)也將越來越多,Ramineni說,“我感覺如今體育賽事中數(shù)據(jù)無處不在,而且只會(huì)有增無減?!?/p>
掃描二維碼推送至手機(jī)訪問。
版權(quán)聲明:本文由財(cái)神資訊-領(lǐng)先的體育資訊互動(dòng)媒體轉(zhuǎn)載發(fā)布,如需刪除請(qǐng)聯(lián)系。