Pubblicato il 6 febbraio 2019 su TennisAbstract – Traduzione di Edoardo Salvati
// Siamo di fronte a una pietra miliare. Il Match Charting Project – la piattaforma che ho ideato per la raccolta di dati punto per punto delle partite di tennis professionistico con il contributo di volontari – ha completato la partita numero 5000.
La cifra tonda appartiene alla qualificazione di Coppa Davis tra Robin Haase e Lukas Rosol, mappata da Zindaras, che ha da poco iniziato a contribuire al progetto, immediatamente seguita dalla 5001, la finale del torneo di Hua Hin tra Dayana Yastremska e Ajla Tomljanovic (al momento della traduzione si è già arrivati a 5032, n.d.t.).
Dati non disponibili altrove
Senza troppi giri di parole, i dati del Match Charting Project non sono disponibili da nessun’altra parte. Di ogni colpo vengono tracciati tipologia e direzione, oltre alla direzione di ogni servizio e alla profondità di ogni risposta. In tutto, abbiamo collezionato più di 770.000 punti e più di 3 milioni di colpi. È un insieme di dati che ha reso possibile analisi come quella che ho fatto di recente per l’Economist sulle tattiche di gioco in grado di contrastare Novak Djokovic, o anche un tentativo di quantificare il valore dello smash, una dissertazione sulla posizione insolita alla risposta di Kei Nishikori e uno sguardo all’evoluzione del rovescio di Juan Martin Del Potro.
Non avrei mai immaginato, alla nascita del progetto nel 2013, di arrivare a raccogliere una massa così imponente di informazioni. Avevo in mente di andare nello specifico della profondità, non tanto di mettere insieme la maggior quantità possibile di occorrenze. Invece ora entrambe sono disponibili.
In circa 100 volontari siamo riusciti a inserire quasi tutte le finali Slam fino al 1980, la maggior parte delle finali Masters fino al 1990, e un crescente numero di semifinali di Slam e di finali Premier femminili. Più recentemente, abbiamo mappato tutte le finali del circuito maggiore del 2018 e del 2019, tutti gli scontri diretti tra i Fantastici Quattro e quasi tutte le finali giocate da ciascuno di loro.
5000 partite sono tante
L’ampiezza dei dati disponibili va oltre le partite di alto profilo che ho elencato. C’è almeno una partita per circa 1100 tra giocatori e giocatrici, almeno 10 partite per 268 giocatori, almeno 20 per 117 giocatori, almeno 50 per 33 giocatori e più di 100 per 11 diversi giocatori.
È sempre più possibile usare i dati del Match Charting Project per seguire l’evoluzione di un giocatore, un aspetto che non pensavo rientrasse nel perimetro del progetto. Soprattutto, a differenza di molte iniziative relative alle statistiche nello sport, in questa c’è equilibrio tra i due generi. Le partite femminili infatti rappresentano il 47% del totale, nonostante la difficoltà nel reperire le immagini per quelle addietro negli anni (non che i problemi degli ultimi tempi con lo streaming della WTA abbiano aiutato).
Fa riflettere che la partita 5000 sia stata mappata da un nuovo volontario, perché le prime settimane del 2019 segnano uno dei periodi più prolifici nella storia del progetto, sia in termini di volontari, sia per il numero di partite inserite. Solo del 2019, ci sono già più di 200 partite, tra cui 85 degli Australian Open. A dare ulteriore impulso è stato un altro nuovo volontario, tsitsi, con più di 130 partite da quando ha iniziato poco più di un mese fa.
Naturalmente i ringraziamenti vanno a tutti quelli che hanno contribuito. Come detto, quasi 100 persone si sono date da fare, alcune più di altre. Edo ha inserito 663 partite, tra cui molte delle finali e semifinali Slam. Oltre a Edo e tsitsi, altri 8 hanno contribuito con almeno 50 partite: Isaac, Lowell, ChapelHeel66, Edged, Palaver, Salvo, 1HandBH, and DebLDecker.
Le prossime 5000
Spero vivamente che vi uniate al gruppo. Qui trovate la mia guida rapida per iniziare, oltre a 11 buoni motivi per contribuire. Il tennis è uno sport complesso, ma credo che anche una curva di apprendimento in salita meriti l’investimento di tempo.
Anche se non vi sentite pronti per contribuire, il mio incoraggiamento, rivolto a tutti gli appassionati, è di approfittare dei dati a disposizione. Una sola partita mappata, come ad esempio la finale degli Australian Open 2019, contiene migliaia di informazioni sui singoli punti, a descrizione di diversi ambiti di gioco.
Trovo incredibilmente illuminante confrontare i numeri della specifica partita con le medie del circuito, della superficie e dei giocatori che, per la maggior parte delle statistiche su ciascuna pagina, si visualizzano muovendo il cursore del mouse sui numeri. Ci sono anche le medie specifiche per giocatore sulle pagine come questa per Petra Kvitova. Per chi è alla ricerca di dati grezzi, la maggior parte è sulla mia pagina GitHub.
L’obiettivo che mi sono sempre posto con Tennis Abstract, Heavy Topspin e il Match Charting Project è di aguzzare la vista nel tennis, cioè di acquisire una migliore comprensione di ciò che succede sul campo, senza mai dare per assodata la saggezza popolare.
Direi che stiamo facendo progressi. ◼︎