Il più grande archivio italiano di analisi statistiche sul tennis professionistico. Parte di Tennis Abstract

Probabilmente il più grande archivio italiano di analisi statistiche sul tennis professionistico. Parte di Tennis Abstract

È diventato più difficile fare previsioni in periodo di Covid?

ULTIMI ARTICOLI

ULTIMI ARTICOLI

Pubblicato il 6 marzo 2021 su StatsOnTheT – Traduzione di Edoardo Salvati

// L’avvento e il prolungarsi della pandemia hanno causato l’interruzione più duratura che abbia mai colpito il calendario del tennis. Seppure con un ritorno alle competizioni negli ultimi sei mesi, si è ben lontani dalla normalità a cui eravamo soliti. Con tutte le problematiche che giocatori e organizzatori hanno dovuto affrontare, in molti certamente si chiederanno se il professionismo è cambiato in modo definitivo. Proverò a fare chiarezza sulla questione analizzando le dinamiche di pronosticabilità di un torneo prima e durante la pandemia. 

Capacità di adattamento

Esattamente un anno fa il primo torneo importante, l’Indian Wells Masters 2020, veniva cancellato a seguito della diffusione del virus. Nelle settimane successive, con l’aggravarsi della situazione sanitaria in tutto il mondo, la supposizione più accreditata è che non ci sarebbero state altre partite per tutto il 2020. Fortunatamente, all’approssimarsi degli US Open, le misure restrittive applicate della Federazione americana hanno consentito lo svolgimento del torneo in condizioni di sicurezza. Da li in avanti, molti altri eventi di rilievo, tra cui il Roland Garros 2020 e gli Australian Open 2021, sono andati a conclusione senza che ci fossero conseguenze dirette, almeno apparentemente, per tutte le persone coinvolte e per la popolazione locale. C’è meno certezza invece sulla portata nel lungo periodo delle ricadute negative di carattere finanziario, sia per i giocatori che per i tornei. 

Alla ripresa, giocatori e organizzatori hanno dovuto dare fondo alla loro capacità di adattamento. L’assenza di spettatori è il primo esempio che viene in mente. Ma ci sono molte altre attività abitudinarie che possono passare inosservate o in secondo piano, come la gestione degli spostamenti o la bravura nel rimanere in allenamento. Sono stati in grado i giocatori di adattarsi o la pandemia ha inciso sul loro rendimento in maniera significativa e misurabile? Un tentativo di misurazione della variazione di rendimento passa attraverso la valutazione della bontà di alcuni dei migliori modelli predittivi disponibili per il tennis. La logica sottostante è che ci si aspetta che un modello che si è comportato bene a lungo in un contesto di normalità, continui a farlo a meno che non subentri un’alterazione fondamentale di cui il modello non ha tenuto conto. Un esempio di shock di questo tipo è l’introduzione della tecnologia nella produzione delle racchette, che ha dato ad alcuni giocatori un dritto da supereroi. È così anche per la pandemia?  

Prevedibile o imprevedibile?

Ho scelto come riferimento le previsioni pre-partita basate sulle mie valutazioni Elo dei giocatori, che storicamente hanno un livello di accuratezza negli Slam del 70-75%. L’immagine 1 mostra la regressione logistica log-loss con le valutazioni di giocatori e giocatrici dal 2010 fino agli Australian Open 2021. L’area in rosso rappresenta la pandemia. Si osserva che, in tempi normali, la varianza log-loss anno su anno non è andata oltre lo 0.1. Solo il Roland Garros 2021 è stato più imprevedibile di quanto non avrebbe dovuto esserlo rispetto allo storico. Il rendimento in tutti gli altri Slam giocati durante la pandemia a oggi si è mosso all’interno del solito intervallo di casualità.  

IMMAGINE 1 – Valore medio di log-loss per giocatori (ATP) e giocatrici (WTA) nelle partite di singolare degli Slam dal 2010 al 2021

Per capire meglio se la difficoltà di fare previsioni sui risultati del Roland Garros 2020 è stata solo un’anomalia, ho analizzato la media mobile di log-loss rispetto alle categorie di tornei del circuito maggiore. Per quanto riguarda gli uomini, si è giocato il maggior numero di tornei tra i 250. Tra questi, la tendenza è simile: un valore di log-loss sorprendentemente alto sulla terra battuta, ma niente fuori dall’ordinario sul cemento.

IMMAGINE 2 – Media mobile di log-loss per le partite di singolare maschile in funzione della categoria di torneo e della superficie dal 2010 al 2021

Pur con meno dati sulle partite femminili, i tornei sulla terra battuta durante la pandemia si sono posizionati nella parte alta del tipico intervallo di log-loss, ma non così all’estremo della distribuzione storica come accaduto tra gli uomini. 

IMMAGINE 3 – Media mobile di log-loss per le partite di singolare femminile in funzione della categoria di torneo e della superficie dal 2010 al 2021

Per molti giocatori e giocatrici, il Roland Garros 2020 è stato il primo torneo rilevante giocato dopo un’interruzione di più di sei mesi. Le temperature non proprio miti di Parigi hanno rappresentato un ulteriore ostacolo. È motivo sufficiente a spiegare la maggiore casualità dei tornei sulla terra a fine 2020 se confrontata con quella di altri tornei dello stesso periodo.   

La bontà di un modello predittivo è solo uno dei possibili strumenti per valutare la stabilità del tennis professionistico nel lungo periodo. Il risultato è relativamente positivo visto che, per la maggior parte dei tornei, fare previsioni non è diventato né molto più facile, né molto più difficile. Dopo sei mesi di adattamento del tennis alla presenza del Covid-19, cresce la speranza che le cose, da qui in avanti, possano migliorare. ◼︎

Have Matches Become Harder to Predict in the Time of Covid?

DELLO STESSO AUTORE