Pubblicato il 13 marzo 2023 su TennisAbstract – Traduzione di Edoardo Salvati
// Aryna Sabalenka ha esordito a Indian Wells venerdì scorso, battendo facilmente Evgeniya Rodina. Ha vinto infatti il primo set 6-1 per poi andare sul 3-0 nel secondo. Il telecronista Mikey Perera ha fatto notare che a quel punto la probabilità di vittoria di Sabalenka era arrivata al 100%, pur esprimendo (giustamente!) dello scetticismo al riguardo.
La probabilità di vittoria ha trovato uno spazio stabile nel commento televisivo delle partite di tennis. Spesso vengono mostrate le percentuali prima dell’inizio della partita e poi quelle al momento specifico in cui si è arrivati. L’ingenuità di una probabilità di vittoria del 100% nel mezzo della partita ha una spiegazione elementare, cioè che il dato è solitamente indicato come intero. Per la maggior parte degli appassionati, non c’è una differenza rilevante tra 55.7% e 58% ma, in casi estremi, l’aggiunta di un decimale sarebbe molto utile.
L’algoritmo televisivo era corretto?
La previsione di vittoria per Sabalenka sulla base delle mie valutazioni Elo prima della partita era del 94.8%. Per previsioni nel corso della partita, servono statistiche più granulari. Nel 2023, Sabalenka ha vinto il 65.5% dei punti al servizio e il 46.7% di quelli alla risposta (compresa la partita contro Rodina) e se arrotondiamo i punti vinti alla risposta al 47%, si ottiene una previsione del 94.7%, fondamentalmente identica a quella di Elo. Inserendo quei numeri nel mio modello di probabilità di vittoria con Rodina al servizio sotto 1-6 0-3, si genera una probabilità di vittoria per Sabalenka del 99.7%. Portandolo all’intero più vicino, la probabilità di vittoria è del 100%. E così deve essere sembrato a Rodina.
In realtà, Sabalenka aveva raggiunto il “100%” (99.5%) già nel game precedente, superando il livello del 99.5% sul 2-0 15-0, per poi scendere sotto quel valore sulla parità e passarlo di nuovo sulle due situazioni di vantaggio in suo favore. Fino a qui, ho usato un modello predittivo della parte restante della partita relativamente semplice (e certamente sufficiente allo scopo). Se però avessimo scommesso dei soldi — e specialmente se i primi dieci game della partita si fossero svolti in modo meno prevedibile — sarebbe servito uno strumento più sofisticato. Ho ipotizzato che sul 6-1 3-0 Sabalenka avrebbe poi giocato come ci si aspettava all’inizio della partita. In questa circostanza, è un’ipotesi solida. Per un metodo più preciso però, si dovrebbe prenderebbe in considerazione l’andamento della partita sino a quel punto. Nei primi dieci game, Sabalenka stava giocando meglio della previsione iniziale del 66.5% di punti vinti al servizio e del 47% alla risposta. Se da un lato al servizio era meno efficace, con il 64.4%, dall’altro alla risposta distruggeva qualsiasi vantaggio Rodina potesse avere, vincendo quasi il 55% dei punti. Avessimo saputo prima della partita che quello sarebbe stato il suo livello di gioco, la previsione pre-partita avrebbe assegnato a Sabalenka una probabilità di vittoria del 99.4%. Sul 6-1 3-0, questo si traduce in una schiacciante previsione di vittoria del 99.97%.
Con il progredire della partita, abbiamo raccolto quindi ulteriori informazioni sul fatto che il rendimento in campo — per via delle condizioni di gioco, dello stato di forma fisica o psicologica delle giocatrici quel giorno, del particolare confronto tra le due, o di qualsiasi altro elemento — sarebbe stato ancora più a senso unico. Avessimo fattorizzato tutti questi aspetti sul 6-1 3-0, il calcolo sarebbe stato una combinazione del 99.7% (sulla base dei numeri pre-partita) e del 99.97% (sulla base del rendimento in campo). La parte difficile è assegnare il giusto peso a quei due numeri, perché diventa una questione complicata: è sufficiente dire che la risposta corretta è all’interno del loro intervallo. L’algoritmo usato in telecronaca si è sbilanciato con una probabilità di vittoria del 100%, ma non ci è andato troppo lontano. A prescindere da quanto una partita sia a senso unico, può sempre accadere l’insolito, anche se probabilmente poi non succederà. ◼︎