Pubblicato il 27 ottobre 2017 su sportsbrain – Traduzione di Edoardo Salvati
// Valutazioni e pronostici sulle prestazioni di un giocatore o di una squadra non possono prescindere dal fattore fatica. Nella NBA ad esempio, le squadre devono tipicamente giocare tre o quattro partite a settimana, un ritmo che può comportare una diminuzione nel livello di gioco, specialmente verso la fine della stagione regolare.
È per questo che alcuni allenatori, come Greg Popovich dei San Antonio Spurs, fanno riposare a più riprese i loro giocatori migliori nelle fasi conclusive del campionato, prima dell’inizio dei play-off.
La fatica a cui un giocatore è sottoposto è di particolare preoccupazione per gli scommettitori, che aggiustano i loro modelli predittivi nel caso in cui un giocatore o una squadra siano costretti dal calendario a giocare due giorni di fila o si trovino alla fine di una lunga trasferta.
Contesto e livello di stanchezza
Il tennis è un altro sport che impone di mantenere un alto livello di rendimento fisico e mentale, in cui la maggior parte dei giocatori viaggia durante una stagione di nove mesi in più continenti, con il cambio di molti fusi orari.
I modelli che predicono gli esiti di una partita di tennis considerano variabili quali la bravura di un giocatore o il tipo di superficie. Può però essere utile esaminare anche il contesto in cui si svolge la partita e il grado di stanchezza di un giocatore nel momento in cui si accinge ad affrontarla.
La maggior parte di questi modelli predittivi ipotizza che ogni game e ogni servizio siano indipendentemente e identicamente distribuiti. Cosa accade però se un determinato giocatore ha un rendimento migliore al servizio quando è avanti nel punteggio ma fa fatica quando è alla risposta, ad esempio sulla terra battuta? E riesce ad avere delle buone prestazioni in partite più lunghe della media?
Rendimento in partite più lunghe della media
L’analisi che segue cerca di rispondere a quest’ultima domanda. Si è principalmente interessati infatti a valutare se il rendimento di un giocatore diminuisca in termini di vittorie e sconfitte a seguito di una partita più lunga di 101 minuti (la mediana della durata di una partita del campione considerato). È stato escluso il confronto nel caso in cui un giocatore abbia avuto più un paio di giorni di riposo tra una partita e l’altra, in quanto l’effetto fatica ne verrebbe limitato.
È stato selezionato un campione casuale di 481 partite dalla stagione maschile 2016 del circuito maggiore, utilizzando i dati messi a disposizione da Jeff Sackmann di TennisAbstract.
Si è creata poi una variabile binaria per verificare se una partita è durata più di 101 minuti ed è stata usata una funzione ForLoop di Python per calcolare l’esito della partita successiva del medesimo giocatore, considerando elementi come il nome del vincitore, la lunghezza della partita in minuti, la classifica sia del vincitore che dello sconfitto.
Il modello di regressione logistica usato è costruito sulla classifica del vincitore, sulla classifica dello sconfitto e sulla durata della partita precedente nel caso sia andata oltre il valore mediano di 101 minuti.
La classifica è più predittiva del livello di stanchezza
Complessivamente, si è trovato che la fatica non altera in modo significativo il rendimento di un giocatore in termini di partite vinte e perse (p > 0.05), è stata invece la classifica del giocatore che ha perso quella determinata partita a essere molto più predittiva dell’esito finale (p < 0.01).
IMMAGINE 1 – La relazione tra la differenza nella durata della partita tra partite consecutive in termini di minuti e probabilità di vittoria. Una differenza negativa di durata indica che la partita attuale di un giocatore è stata più corta della precedente, e viceversa
Questo suggerisce che la fatica nel tennis ha un ruolo di secondo piano rispetto al livello di bravura del giocatore. È importante notare però che il modello non tiene conto della durata della precedente partita giocata dall’avversario e che si basa su un campione di partite esclusive della stagione 2016.
Classificatore bayesiano
È stato anche usato un basico classificatore bayesiano – un algoritmo “predittivo di una classe dato un insieme di un insieme di caratteristiche” – per misurare la probabilità di vittoria di un determinato giocatore in funzione del fatto che la sua precedente partita abbia avuto una durata superiore o inferiore rispetto alla durata mediana di una partita.
Rispetto al basico classificatore bayesiano, è difficile stabilire l’ampiezza del ruolo della fatica in una vittoria o in una sconfitta. Nel campione, i giocatori che hanno giocato una partita più lunga della mediana (nella partita precedente) avevano il 47% di probabilità di vittoria, contro il 48% di probabilità nelle partite che sono terminate prima della durata mediana.
È importante anche aggiungere che il classificatore non considera se la precedente partita dell’avversario è durata più a lungo del valore mediano.
Altre analisi e altri modelli
Ci sono altre analisi che si concentrano sulla diminuzione della velocità del servizio di un giocatore all’avanzare del torneo, come quella di Stephanie Kovalchik del Game Insight Group di Tennis Australia, la Federazione australiana, che ha verificato come il servizio di Dominic Thiem agli US Open 2017 sia sceso dai 150 km/h dell’inizio del torneo ai 135 km/h del quarto e suo ultimo turno.
Questo evidenzia la presenza di un fattore fatica nel tennis. Vittorie e sconfitte però non sono necessariamente legate alla durata della partita ed è più probabile che sia il livello di bravura di un giocatore o del suo avversario a determinare l’esito finale.
Altri modelli potrebbero valutare in che misura il riposo (quindi il giorno o i giorni tra una partita e la successiva) influisca sulla prestazione dei giocatori.
Il codice dell’analisi è disponibile qui. ◼︎