Pubblicato il 19 settembre 2011 su TennisAbstract – Traduzione di Edoardo Salvati
// Si può fare molto quando si hanno a disposizione dati punto-per-punto e probabilità di vittoria per oltre 600 partite di tornei Slam.
Ho preso a prestito alcune idee da Brian Burke di Advanced NFL Stats, che ha inventato un paio di semplici statistiche utilizzando la probabilità di vittoria per mettere a confronto diversi gradi di recupero e di emozione a cui si può assistere durante le partite di football americano.
Sono concetti facilmente trasferibili al tennis.
Fattore Recupero
Il fattore recupero (FR) identifica la probabilità a sfavore del vincitore nel suo momento peggiore della partita. L’ho definito nello stesso modo in cui Burke lo intende per il football americano: FR è l’inverso della minore probabilità di vittoria del vincitore. Ad esempio, nella semifinale degli US Open 2011 tra Novak Djokovic e Roger Federer, la minore probabilità di vittoria di Djokovic è stata dell’1.3%, o 0.013. Quindi, il suo fattore recupero è 1/0.013, o circa 79, che è uno dei valori più alti osservabili.
Dalla parte opposta, il fattore recupero non può mai essere inferiore a 2.0, cioè il valore che si ottiene se la percentuale di vittoria del vincitore non scende mai sotto il 50%. Le partite dominate dal vincitore hanno spesso un FR vicino a 2.0, come nella semifinale tra Andy Murray e Rafael Nadal. In quella partita, il momento peggiore per Nadal è stata l’unica palla break da annullare sul 2-3 nel primo set; il fattore recupero in quel caso è di 2.3.
Un buon modo per interpretare il fattore recupero è questo: “Nel suo momento peggiore, il vincitore aveva probabilità di vittoria pari a 1 su [FR]”.
Indice Emozionale
L’indice emozionale (IE) è una misura della volatilità, o l’importanza media di ciascun punto in una partita. La “volatilità” misura l’importanza di ogni singolo punto, l’IE è la volatilità media nel corso della partita.
(Burke somma le volatilità, perché considera il football americano, uno sport molto rapido e con molte azioni, già di per sé ad alto tasso emozionale. Visto che il tennis non è uno sport a tempo – almeno non come tradizionalmente s’intende – sembra più consono fare una media delle volatilità. Le probabilità di vittoria incorporano già l’emozione e l’importanza di un set decisivo).
Per il momento, calcolo l’IE moltiplicando la volatilità media per 1000. La partita tra Murray e Nadal ha un IE di 35 (non una partita molto entusiasmante anche se Murray ha cercato di recuperare), quella tra Djokovic e Federer è di 47 (ne parlo a breve), mentre il secondo turno tra Donald Young e Stanislas Wawrinka è di 64. Non ho potuto analizzare tutte le partite, ma generalmente l’indice emozionale è un valore compreso tra 10 e 100, anche se può raramente eccedere 100 come ad esempio nella maratona tra John Isner e Nicolas Mahut a Wimbledon 2010.
La partita tra Djokovic e Federer dovrebbe avere un IE più alto, forse perché ci si ricorda dell’emozione dell’ultimo set (e potrebbe essere che l’ultimo set venga soppesato correttamente per il calcolo). Guardando però all’andamento della partita, ci sono stati molti game rapidi, che si traducono in volatilità relativamente bassa. Al contrario, quella tra Young e Wawrinka ha avuto più momenti da montagne russe con i giocatori che si sono alternati nel conquistare i set, oltre a un paio di break a metà dell’ultimo set che hanno fatto andare la volatilità alle stelle.
In lavorazione
La parametrizzazione e l’esatta definizione dell’indice emozionale sono ancora in lavorazione. Appena ne ho la possibilità, farò un’analisi delle partite per le quali ho dati punto-per-punto al fine di una maggiore comprensione di entrambe queste statistiche, nuove per il tennis.