Il più grande archivio italiano di analisi statistiche sul tennis professionistico. Parte di Tennis Abstract

Probabilmente il più grande archivio italiano di analisi statistiche sul tennis professionistico. Parte di Tennis Abstract

La competitività negli Slam dal 2000 al 2016

ULTIMI ARTICOLI

ULTIMI ARTICOLI

Pubblicato il 27 settembre 2017 su PureFreedom – Traduzione di Edoardo Salvati

// Dopo la pubblicazione di una mia analisi sul punteggio nelle partite degli Slam, ho ricevuto diverse richieste per un approfondimento. Ben Rothenberg del New York Times, da cui avevo preso spunto, ha scritto in un tweet: “ [..] curioso anche di sapere quanto spesso il quarto e il quinto set mancano di competitività perché un giocatore ha finito la benzina o è demoralizzato, rispetto a una partita al meglio dei tre set”.  

Ho fatto quindi un’ulteriore analisi sulle oscillazioni in quella categoria di partite. Si può dire che la competitività di una partita subisce variazioni su base regolare? Esiste evidenza che i set conclusivi di una partita sono più appannaggio del vincitore? Inoltre, con il progredire della partita, è possibile prevedere chi è avvantaggiato per la vittoria finale? Le considerazioni che seguono cercano di trovare risposte a questi interrogativi.  

Ai fini di quest’analisi, il campione statistico considerato è composto da tutte le partite Slam terminate per il periodo dal 2000 al 2016, a eccezione dei ritiri precedenti e durante la partita. Si tratta di 8253 partite per complessivi 30.455 set e 298.207 game. Occorre ricordare che in quegli anni gli Slam non avevano il tiebreak all’ultimo set, tranne gli US Open. Questo si traduce in un leggero aumento delle medie relative ai game del quinto set, quando la partita ha richiesto di andare al quinto set.

Medie complessive

IMMAGINE 1 – Punteggio medio in termini di game per set in funzione del numero di set giocati per il periodo dal 2000 al 2016 

Note:

  • il punteggio medio per set non distingue tra chi vince e chi perde la partita, ma è una misura della competitività aggregata di un set medio
  • utilizzando il Differenziale di Punteggio come criterio, si osserva una maggiore disparità nella competitività tra le partite in tre set e quelle in quattro set, rispetto a quella esistente tra le partite in quattro set e quelle in cinque set.

Partite in tre set

IMMAGINE 2 – Punteggio medio in termini di game per partite terminate in tre set per il periodo dal 2000 al 2016

Note:

  • i primi due set mostrano un livello di competitività simile. Il terzo set invece è più dominato dal vincitore della partita. Lo si può dedurre dal salto del Differenziale di Punteggio nel terzo set e dalla continua diminuzione del numero di tiebreak.

Partite in quattro set

IMMAGINE 3 – Punteggio medio in termini di game per partite terminate in quattro set per il periodo dal 2000 al 2016

Note:

  • il punteggio medio per set non distingue tra chi vince e chi perde la partita, ma è una misura della competitività aggregata di un set medio
  • si assiste a una graduale diminuzione della competitività fino al quarto set, che invece mostra, rispetto agli altri set, un maggiore aumento nel Differenziale di Punteggio e una maggiore diminuzione dei tiebreak. 

IMMAGINE 4 – Punteggio medio in termini di game per le possibili combinazioni con cui una partita in quattro set può essere vinta   

Note:

  • a prescindere dall’andamento dei set, il vincitore della partita ha vinto ognuno dei tre set vinti in maniera più risoluta del singolo set vinto dal giocatore che ha perso la partita
  • la combinazione in cui il vincitore della partita ha dominato di più è quella in cui perde il primo set vincendo poi i tre successivi. Ne è conferma il fatto che il Differenziale di Punteggio complessivo pari a 6.10 è il più alto di qualsiasi possibile scenario. Come visto nella precedente analisi sul punteggio, questa è anche la sequenza più frequente tra quelle di una partita in quattro set.  

Partite in cinque set

IMMAGINE 5 – Punteggio medio in termini di game per partite terminate in cinque set per il periodo dal 2000 al 2016

*Nel periodo considerato, a eccezione degli US Open nessuno degli altri Slam aveva il tiebreak al quinto set. Per lo scopo di questa sola analisi, un quinto set che supera il punteggio di 6-6 è classificato come un set al tiebreak.

Note:

  • il punteggio medio per set non distingue tra chi vince e chi perde la partita, ma è una misura della competitività aggregata di un set medio
  • come per le partite in tre e quattro set, si assiste a una diminuzione del livello competitivo al progredire della partita. Lo testimonia il graduale incremento del Differenziale di Punteggio. A prescindere dal set, non si osserva una chiara tendenza relativamente alla probabilità che si arrivi al tiebreak.

IMMAGINE 6 – Punteggio medio in termini di game per le possibili combinazioni con cui una partita in cinque set può essere vinta  

Note:

  • il vincitore della partita ha vinto i suoi tre set in maniera più risoluta con il progredire della partita, giocando meglio nell’ultimo set
  • ci sono tre scenari in cui il vincitore della partita ha vinto gli ultimi due set e sono anche le vittorie più dominanti e quelle in cui il quinto set ha un Differenziale di Punteggio più alto.

Indicatori predittivi

Quando la partita arriva a una situazione di punteggio di due set pari, il rendimento dei giocatori nei primi quattro set è in qualche modo indicativo di chi vincerà il quinto set? Vale a dire, se uno dei giocatori ha vinto più game dell’avversario all’inizio del quinto set, ha storicamente un vantaggio per la vittoria finale?  

IMMAGINE 7 – Probabilità di vincere la partita all’inizio del quinto set in funzione Differenziale di Game per il periodo dal 2000 al 2016

Note:

  • se un giocatore ha vinto più game dell’avversario all’inizio del quinto set, vince il 55% di quelle partite, con percentuali specifiche indicate nel grafico in funzione del numero di game in più rispetto all’avversario. Ad esempio, se dopo quattro set il punteggio è di 6-2 4-6 6-1 3-6 e un giocatore è avanti 19–15 nei game, storicamente vincerà poi quella partita il 61% delle volte
  • nel 15.1% delle partite al quinto set, i giocatori hanno vinto lo stesso numero di game e non si è quindi nella possibilità di fare una previsione 
  • il punteggio di una partita consente di aver vinto nove o dieci game in più dopo quattro set, ma nel periodo temporale considerato per l’analisi non è mai accaduto.

Cosa succede quando i giocatori hanno vinto un set per parte? Con un campione di due soli set, si può fare una previsione di vittoria sulla base del numero di game vinti fino a quel momento?

IMMAGINE 8 – Probabilità di vincere la partita sul punteggio di un set pari in funzione Differenziale di Game per il periodo dal 2000 al 2016

Note:

  • se un giocatore ha vinto più game dell’avversario dopo due set, vince il 58% di quelle partite, con percentuali specifiche indicate nel grafico in funzione del numero di game in più rispetto all’avversario
  • nel 24.6% delle partite sulla situazioni di un set pari, il numero di game vinti è identico e non si è quindi nella possibilità di fare una previsione
  • nonostante un campione di partite più ridotto, si tratta di un indicatore predittivo più accurato di chi vincerà la partita rispetto alla situazione vista in precedenza.

Distribuzione dei tiebreak

IMMAGINE 9 – Distribuzione dei tiebreak per il periodo dal 2000 al 2016

Note:

  • su un totale di 4915 tiebreak, il punteggio medio è stato 7,48—4,32.

Riconoscimenti

La fonte della maggior parte dei dati grezzi utilizzati nell’analisi è il database dei risultati delle partite del circuito maschile compilato e messo a disposizione da Jeff Sackmann. In caso di dati mancanti, ho fatto riferimento al sito ufficiale dell’ATP. Chi volesse approfondire, può scaricare il file Microsoft Excel con i dati grezzi che ho raccolto. ◼︎ 

Measuring the Competitiveness at Tennis Majors from 2000-2016

DELLO STESSO AUTORE