你聽到的足球大數(shù)據(jù),是這樣來的丨顏強專欄
一場足球比賽,產(chǎn)生的數(shù)據(jù),從人工統(tǒng)計的百余條,到30年前計算機介入的千余條,再到移動互聯(lián)網(wǎng)時代引發(fā)的數(shù)據(jù)大爆炸,至今已經(jīng)超過十萬條。
據(jù)極其詳盡,能從無數(shù)個側(cè)面去還原甚至重構(gòu)一場比賽,或許這正是數(shù)據(jù)時代的特點。
“足球極客”的理想世界
各種專業(yè)性的數(shù)據(jù)公司提供的服務(wù),主要是針對兩類群體:職業(yè)俱樂部和專業(yè)媒體。
對于前者,提供的數(shù)據(jù)量非常豐富,因為越來越多的職業(yè)教練、運動員和管理者,都更愿意用數(shù)據(jù)說話,以數(shù)據(jù)為基礎(chǔ)分析競賽、尋找答案。
后者更是傳播信息、呈現(xiàn)比賽以及提供娛樂的需要。
每一場英超聯(lián)賽、歐冠聯(lián)賽、德甲聯(lián)賽、以及西甲意甲和法甲聯(lián)賽幕后,都會有一些像小蜜蜂般辛勤作業(yè)的數(shù)據(jù)統(tǒng)計師。
《衛(wèi)報》轉(zhuǎn)載的一篇特寫里,專門追蹤了一位名為大衛(wèi)·雷伊的足球比賽數(shù)據(jù)統(tǒng)計師,看他是如何為馬丁·泰勒、約翰·莫特森、彼得·德魯里這樣的評論大腕們提供數(shù)據(jù)支持的。
大衛(wèi)描述自己的工作,屬于“足球極客”最理想的世界。他職業(yè)生涯從西班牙開始,當(dāng)初大學(xué)本科專業(yè)就是體育新聞。他曾經(jīng)為皇馬電視臺、BT體育制作公司服務(wù)過,現(xiàn)在是自由撰稿人。
他的工作主體,就是為BT體育這樣的體育賽事傳播機構(gòu),提供數(shù)據(jù)服務(wù)。
“每場比賽我們做出來的數(shù)據(jù)包,不僅僅是分發(fā)給現(xiàn)場評論員的”,大衛(wèi)說,“演播室的主持人、評論嘉賓以及比賽制作人,都需要豐富的數(shù)據(jù)?!?/strong>
對解說員、評論員而言,這個數(shù)據(jù)包是一場比賽轉(zhuǎn)播是否到位的關(guān)鍵。反倒是足球?qū)I(yè)人士,那些賽前、中場和賽后點評的嘉賓,雖然也重視這樣的數(shù)據(jù)提供,但更是自取所需的態(tài)度。埃弗頓門將皮克福德的水瓶上印著西漢姆聯(lián)球員主罰點球的習(xí)慣。
埃弗頓門將皮克福德的水瓶上印著西漢姆聯(lián)球員主罰點球的習(xí)慣
word文檔40頁起
一場足球比賽、尤其高水平歐洲聯(lián)賽的數(shù)據(jù)包有多大,幾乎難以用字數(shù)衡量——因為每場比賽包含的前因后果、前情后續(xù),實在太多,并且比賽的每一個參與者、每一個側(cè)面、每一個細節(jié),都會牽涉到無窮無盡的信息。
單就兩支參賽隊的現(xiàn)時狀態(tài)、過往交手紀錄、球隊當(dāng)中的每一名球員、兩隊教練的過往成績和職業(yè)特性等,就已經(jīng)蔚然大觀。
像BT這樣的英超持權(quán)轉(zhuǎn)播商,一場英超比賽賽前提供給評論員的數(shù)據(jù)包,至少是25000字——拿到過這種數(shù)據(jù)包的評論員都可以證明。
英超官方信號制作、提供的數(shù)據(jù)包,哪怕是聯(lián)賽排名吊尾球隊,word文檔基本都是40頁起。
這樣海量的數(shù)據(jù),已經(jīng)是大衛(wèi)們精挑細選的結(jié)果,而這樣一個數(shù)據(jù)包,最終在比賽直播中,透過評論員聲音傳播出來的,不過是數(shù)據(jù)包信息總量的1%上下——絕大部分數(shù)據(jù),都屬于“有備無患”的儲備。
隨機應(yīng)變的“數(shù)據(jù)包”
至于職業(yè)俱樂部的數(shù)據(jù)挖掘和數(shù)據(jù)提煉,就是另一個維度的話題了。
歐洲五大聯(lián)賽俱樂部,數(shù)據(jù)分析師是標配。這些數(shù)據(jù)分析師,未來職業(yè)前途更是助理教練、俱樂部管理者。而為媒體服務(wù)的數(shù)據(jù)分析師,更是拿數(shù)據(jù)來講故事的人,他們此時不知名,未來職業(yè)前景更可能是制作人制片人以及其他媒體管理崗位。
為了尋找一條有傳播價值的數(shù)據(jù),這些分析師在賽時期間的工作,會經(jīng)常出現(xiàn)“莫測癲狂”場景:歐冠轉(zhuǎn)播,評論員想知道切爾西后衛(wèi)克里斯滕森上一個進球發(fā)生在何時——切爾西球迷知道這是丹麥中衛(wèi)加盟以來137場的首球,但誰能記得他上一個進球是效力門興格拉德巴赫時,在歐聯(lián)杯對沙爾克04的進球?
然而大衛(wèi)·雷伊做到了及時解惑。這些看似極其細微,甚至是邊角余料的數(shù)據(jù),都在他指尖,在他的電腦數(shù)據(jù)儲存中,而且他有自己獨特的方式,通過極快的關(guān)鍵詞搜索,找到他要的數(shù)據(jù)答案。
每場比賽,在真正的高水準轉(zhuǎn)播過程中,評論員、制片人、導(dǎo)播、主持人和數(shù)據(jù)分析師之間,都有著大量的交流互動,大家共同目的都是為了更好地呈現(xiàn)比賽,提供更好的媒體產(chǎn)品,從而獲得商業(yè)收益。
哪怕是一條克里斯滕森上一個進球這樣平素可能毫無價值的數(shù)據(jù),也可能成為比賽傳播過程中,給觀眾留下積極印象的加分內(nèi)容。
所以評論員德魯里會說:“準備一場比賽,你可以投入極大的時間和精力,但每場比賽都會有超乎你意料的情況發(fā)生。”
“理想狀況下,每個評論員、每個說球的人,當(dāng)然希望自己就能完成所有準備工作,但實際上我們對于這種‘?dāng)?shù)據(jù)包’的依賴越來越強。”
“傳統(tǒng)的解說員,都會用一張A4紙,用極簡方式涵蓋自己準備好的信息點,現(xiàn)在只靠這一張紙,根本不可能應(yīng)對臨場的各種變數(shù)?!?/strong>
你能找到120年前的數(shù)據(jù)
體育賽事的第三方數(shù)據(jù)采集,已經(jīng)有了超過30年歷史,真正為專業(yè)媒體提供相應(yīng)數(shù)據(jù)服務(wù)的,例如Opta這樣的機構(gòu),則是從2006-2007賽季才有具備一定廣度的數(shù)據(jù)延展服務(wù)。
像泰勒、德魯里這樣主說英超的評論員,會非常重視英國足球檔案庫這樣的數(shù)據(jù)庫——能像英格蘭這樣重視自己足球文化傳承,并且將百余年來職業(yè)聯(lián)賽的所有資訊,匯集成公共檔案的,也確實全球罕見。
這個檔案庫對職業(yè)聯(lián)賽早期賽季的記錄,現(xiàn)在看來當(dāng)然非常粗疏,但即便是1888-1889賽季,每場比賽的雙方陣容等基本資訊,絕不缺乏——這個檔案庫至今已經(jīng)累積了234182場比賽、46151名球員的相關(guān)信息。
而這樣的檔案庫,必然是數(shù)據(jù)分析師構(gòu)建自己工作素材的基石。
用最快的速度查找
比賽開場哨響,往往也是這部分數(shù)據(jù)工作最緊張、最容易犯錯,同時也最容易出彩的時刻,因為所有人都得面對不可測——體育競賽就是這個世界上最不可測的真人秀,除非我們看到的是一場假球……
每場比賽,也都會有對數(shù)據(jù)統(tǒng)計師的挑戰(zhàn),例如新近加盟萊斯特城的前鋒帕特森·達卡,客場對莫斯科斯巴達打進第二球后,數(shù)據(jù)分析師就得用最快速度查找,看歐聯(lián)杯里,打進最快帽子戲法的球員是誰、上一個歐聯(lián)杯帽子戲法球員是誰、上一個歐聯(lián)杯客場帽子戲法球員是誰……
大衛(wèi)和他的搭檔,以閃電速度發(fā)現(xiàn)了結(jié)果:上一位在莫斯科斯巴達上演帽子戲法的客隊球員,是2008年7月代表莫斯科中央陸軍的巴西人勒夫,他們以最快速度將數(shù)據(jù)傳遞給評論員。
而讓分析師們興奮的是,達卡不僅完成了帽子戲法,還上演了大四喜——這位新援在代表萊斯特城的第三場歐聯(lián)比賽,就成為了萊斯特城歐戰(zhàn)的最佳射手……
故事還在延展——會有人想知道,還有誰能在客場上演大四喜?
大衛(wèi)·雷伊說,他根本沒查數(shù)據(jù)庫,以最快速度告訴評論員:“2009年,阿爾沙文在安菲爾德那場利物浦和阿森納4比4打平的比賽里,一人包攬阿森納4球?!?/p>
雷伊說,他本就是個利物浦球迷……
掃描二維碼推送至手機訪問。
版權(quán)聲明:本文由財神資訊-領(lǐng)先的體育資訊互動媒體轉(zhuǎn)載發(fā)布,如需刪除請聯(lián)系。