Il più grande archivio italiano di analisi statistiche sul tennis professionistico. Parte di Tennis Abstract

Probabilmente il più grande archivio italiano di analisi statistiche sul tennis professionistico. Parte di Tennis Abstract

Le ripercussioni degli scontri diretti in campo maschile

ULTIMI ARTICOLI

ULTIMI ARTICOLI

Pubblicato il 15 marzo 2019 su StatsOnTheT – Traduzione di Edoardo Salvati

// Nell’opinionismo tennistico, le ripercussioni legate a partite tra specifici giocatori costituiscono un’idea diffusa. Risiedono al centro di commenti su come un particolare stile si adatti a quello dell’avversario. Un modo per identificarle è fornito da uno scontro diretto con esito a sorpresa, cioè quello in cui il risultato finale smentisce quanto ci saremmo attesi in funzione della bravura complessiva dei due giocatori.

Questo tipo di ripercussioni esistono? E sono sufficientemente concrete da ricoprire un ruolo nel fare previsioni migliori sulle partite di tennis?

Da tempo ormai mi occupo di previsioni di vittoria nel tennis. In qualsiasi conversazione sul metodo con esperti analisti, sono certa dell’arrivo di quella famigerata domanda (se solo predire i risultati delle partite fosse altrettanto facile!), se ho cioè considerato gli scontri diretti.

Per certi versi, qualsiasi metodo che includa i risultati passati di un giocatore considera anche gli scontri diretti. Però so che non è esattamente questo il punto della domanda, che invece si riferisce alle possibili conseguenze in termini di vantaggio che un giocatore potrebbe avere sull’avversario, ad esempio elementi come lo stile o l’intimidazione, e che vanno oltre quanto è possibile ricavare dal suo livello di bravura.

Alterazione della proprietà transitiva

La maggior parte dei metodi predittivi (e ne ho provati molti negli anni) ipotizzano che le capacità dei giocatori siano transitive. Vale a dire, se il giocatore A è due volte qualitativamente più forte dei giocatori B e C, allora le sue aspettative di vittoria in una partita contro B dovrebbero essere le stesse che contro C. Le ripercussioni degli scontri diretti mandano all’aria la proprietà transitiva, ponendosi a tutti gli effetti come un agente che contribuisce ad alterare il risultato delle partite tra giocatori in misura superiore a quanto spiegabile dalla bravura di uno contro l’altro, e viceversa.

Questo passaggio ci porta sulla giusta strada per come individuare la presenza di ripercussioni degli scontri diretti. Ipotizziamo di affidarci al nostro metodo preferito per pronosticare la probabilità che un giocatore i vinca una partita contro il giocatore j, che non tiene conto degli scontri diretti (ad esempio, escludendo le quote degli allibratori). Chiamiamo questa aspettativa di vittoria p̂ij. Un modello basilare per considerare gli scontri diretti è dato dalla formula:

logit[P(Wij=1)] = β0 + β1ij + αij

Il parametro αij è quello chiave. Si tratta di una costante sconosciuta per lo specifico scontro diretto che corregge le nostre aspettative quando p̂ij ipotizza che la bravura è transitiva.

Qual è lo scontro diretto tipico?

Prima di adattare il modello di riferimento, e anche prima di decidere se usare un metodo basato sulla probabilità o uno bayesiano, dobbiamo scegliere quali dati utilizzare. Rimanendo in campo maschile, vanno inclusi anche i Future o i Challenger? Oppure ci si limita solo al circuito maggiore?

Si ottiene una risposta guardando in quale livello più spesso si verificano partite tra gli stessi giocatori. Sappiamo che il tennis ha una struttura piramidale, per cui al diminuire della categoria dei tornei la dimensione del serbatoio competitivo aumenta repentinamente. Per questa ragione, si può sospettare ad esempio che i giocatori a livello Challenger non accumulino spesso un divario sostanziale negli scontri diretti con altri giocatori dello stesso circuito.

Cosa rivelano i dati?

Se si guarda a tutte le partite degli ultimi dieci anni sul circuito Challenge con almeno uno scontro diretto, si ottiene un numero molto elevato. La probabilità però che due giocatori estratti a caso dal serbatoio competitivo (cioè chiunque abbia giocato un Challenger o un torneo superiore nel periodo di riferimento) abbiano già giocato contro è solo di 2 su 100. Quella invece che due giocatori abbiano scontri diretti per almeno tre partite è di 3 su 1000. Si aveva già sensazione che la rivalità di 53 partite tra Rafael Nadal e Novak Djokovic fosse insolitamente lunga, ma diventa quasi incredibile quando più di tre scontri diretti nel tennis professionistico sono un evento con probabilità pari all’1% dell’1%.

Anche escludendo i tornei Challenger, la situazione non cambia drasticamente. Tra i giocatori più stabilmente nel circuito maggiore, la probabilità che due abbiano giocato tre o più partite contro in un periodo di dieci anni è comunque inferiore all’1%.

Perché queste considerazioni dovrebbero incidere sulla stima delle ripercussioni degli scontri diretti?

La presenza di molte partite tra due giocatori con un solo scontro diretto può alterare la stima delle ripercussioni spingendone qualsiasi effetto verso lo zero in misura maggiore di quanto accadrebbe con un campione più concentrato. La bassa frequenza di rivalità con molti scontri diretti suggerisce anche che eventuali correzioni che ne tengano conto (se fossero giustificate) difficilmente contribuiscono a un sostanziale e generalizzato miglioramento nel rendimento del modello predittivo. Ci tornerò più avanti, ma sarebbero comunque poche in una stagione le partite in cui due giocatori hanno accumulato anche un moderato numero di scontri diretti.

Rispetto alla media, abbiamo visto che aver giocato più di tre partite contro lo stesso avversario è una rivalità insolitamente lunga. Come mostra l’immagine 1, tra le partite di questo sottogruppo una su tre si è verificata a livello di Challenger, una su quattro nei tornei 250 e una su cinque nei Masters 1000.

IMMAGINE 1 – Distribuzione delle partite di rivalità lunghe (n > 3) per categoria di torneo

Ripercussioni degli scontri diretti

Data la preponderanza degli scontri diretti costituiti da una sola partita, mi concentro sulle ripercussioni di partite tra coppie di giocatori con una rivalità di almeno due partite a livello Challenger o superiore, prima del 2018 (lasciando le partite del 2018 e 2019 per un analisi esterna al campione principale).

Per l’aspettativa di vittoria p̂ij utilizzo le valutazioni Elo specifiche per superficie [1], perché sono un modello transitivo dinamico che tiene conto anche della bravura su una determinata superficie. Nella scelta di Elo come covariante predittiva, lo scopo per gli scontri diretti è quello di catturare qualsiasi ripercussione intransitiva che non abbia spiegazione dalla bravura complessiva o dalla preferenza di superficie dei giocatori.

Adattando un modello logistico combinato per questi scontri diretti, la deviazione standard per l’effetto casuale tra giocatore e avversario è stata di σ = 0.40, a indicazione della presenza di ripercussioni da scontri diretti. Se osserviamo la media condizionale delle stime per lo specifico effetto α̂ij il valore di 1 su 6 implicherebbe una correzione nelle previsioni di almeno il 15%. Vale a dire, un altro segnale statisticamente significativo di ripercussioni degli scontri diretti.

Le cento maggiori ripercussioni degli scontri diretti

Il grafico dell’immagine 2 è una Forest plot (o Blobbogram) delle cento maggiori ripercussioni degli scontri diretti dal campione di partite maschili. L’effetto è espresso in termini di fattore con cui moltiplicare la probabilità standard associata a questi giocatori in modo da riflettere le ripercussioni degli scontri diretti. Il giocatore a beneficiare dell’effetto generato dagli scontri diretti è il primo dei due nomi che compaiono nell’asse delle ordinate. Bolle più grandi indicano ripercussioni con maggiore certezza relativa.

Si possono fare molte interessanti considerazioni da questi risultati (e su un campione dei soli centro scontri diretti più ampi!). In cima all’elenco troviamo un gruppo di scontri diretti che riguardano Stanislas Wawrinka e Tomas Berdych, con il loro particolare accostamento che complessivamente registra l’effetto più sostanziale. Hanno giocato contro 16 volte in carriera, con Wawrinka avanti 11 a 5 e un solo set perso in dieci partite dal 2010. Le mie valutazioni specifiche per superficie evidenziano che Berdych aveva una valutazione più alta in tutte le ultime dieci partite, pur rimanendo molto vicini e in ogni partita a una distanza non superiore ai 50 punti. Questo rende il vantaggio di Wawrinka su Berdych sorprendentemente a senso unico.

Anche il confronto tra Wawrinka e Marin Cilic segue una simile dinamica. Wawrinka ha vinto le otto più recenti partite (su un totale di quattordici), nonostante Cilic avesse una valutazione Elo migliore nel 2016 e nel 2017.

IMMAGINE 2 – Cento maggiori ripercussioni degli scontri diretti con almeno due partite a livello Challenger o superiore

Non c’è la rivalità tra Nadal e Federer

Alcuni nomi ricorrono spesso, come quello di Fabio Fognini, che per cinque delle sette volte in cui è presente beneficia di un effetto positivo, con il margine più ampio nei confronti di Roberto Bautista Agut. Seguono Berdych e Horacio Zeballos, entrambi con sei apparizioni. David Ferrer compare cinque volte e per quattro subisce l’effetto negativo (contro Andy Murray, Djokovic, Wawrinka e Kei Nishikori). Ferrer è un caso interessante perché è spesso considerato tra i giocatori più forti a uscire sempre sconfitto contro i Fantastici Quattro. E questo ci dice che le ripercussioni degli scontri diretti emergono anche in riferimento al limite intrinseco del talento di un giocatore, e non necessariamente solo per una questione di opposizione di stili.

Ci saremmo aspettati di vedere tra i primi centro alcuni scontri diretti, come, tra tutti, quello di Nadal e Roger Federer. L’effetto in questo caso è a favore di Nadal per il 7% di probabilità di vittoria, non insignificante ma nemmeno grande quanto si sarebbe potuto pensare. Credo che si possa spiegare con il fatto che la maggior parte delle vittorie di Nadal è arrivata sulla terra battuta (13 su 23), dove la sua valutazione specifica per superficie giustifica quel record.

Federer e Wawrinka

Le ripercussioni degli scontri diretti tra Federer e Wawrinka hanno un effetto maggiore, poiché Federer riceve un aumento del 20% nella probabilità di vittoria. La recente vittoria all’Indian Wells Masters sembra quindi meno sorprendente. Un altro scontro diretto che ha avuto rilevanza a Indian Wells è quello tra Gael Monfils e Philipp Kohlschreiber. Dopo che Kohlschreiber aveva ottenuto un grande vittoria a sorpresa contro Djokovic, in molti avrebbero potuto pensare che sarebbe arrivato in fondo al torneo. Monfils sarebbe stato un avversario ostico per chiunque, ma l’effetto derivante dagli scontri diretti suggerisce che per Kohlschreiber lo è ancora di più, ponendolo tra i primi cento dell’elenco e costringendolo a una diminuzione della probabilità di vittoria di ben il 30%.

Miglioramento predittivo

Non serve applicare il correttivo degli scontri diretti per sapere che, per la maggior parte delle partite, non contribuirà a un miglioramento predittivo. Ci sono infatti pochissime partite tra giocatori che hanno giocato contro più di una volta in passato affinché questa correzione dia benefici di qualche tipo. Non significa però che manchi di valore.

La natura del tennis implica che le rivalità più grandi tenderanno a essere quelle tra i giocatori più famosi. Le tre maggiori rivalità nel campione di dati di quest’analisi sono tra Nadal e Djokovic, Federer e Djokovic, Djokovic e Murray. Per quanto rare siano le occorrenze con un alto numero di scontri diretti, quando si verificano riguardano partite di notevole impatto.

Se concentriamo l’attenzione solo sulle partite in cui gli scontri diretti potrebbero avere un peso, cosa troviamo?

Rivalità con almeno tre scontri diretti

Con partite dalle stagioni 2018 e 2019 come dati di analisi, ce ne sono state 754 in cui i giocatori avevano già collezionato più di tre scontri diretti. Va notato che per questo gruppo la variazione complessiva nell’accuratezza predittiva da previsioni standard a previsioni corrette con l’effetto degli scontri diretti è stata irrilevante.

Sottogruppo di partite più equilibrate

Se analizziamo il gruppo di partite più equilibrate di questo insieme, per le quali le previsioni standard erano tra il 40% e il 60%, possiamo dire che le previsioni corrette hanno avuto un rendimento superiore? L’accuratezza è stata del 55.4% con la correzione per scontri diretti rispetto al 54.9% di quella standard. È sicuramente un miglioramento, che potrebbe però non mantenersi su campionamenti ripetuti, visto che in questo caso si basava su 233 partite.

Sottogruppo con pronostico ribaltato

L’ultimo gruppo considerato è quello in cui la correzione per le ripercussioni degli scontri diretti ha di fatto ribaltato il pronostico del giocatore favorito (cioè quello con una vittoria attesa maggiore del 50%). Ci sono state solo 21 partite, un campione ridotto quindi, ma in cui è emersa la differenza più significativa tra previsioni con scontri diretti e standard, con un guadagno in precisione per la prima di cinque punti.

Per l’interesse associato a questo sottogruppo, e per il fatto che la correzione per scontri diretti ha avuto l’impatto più rilevante, ne ho costruito rappresentazione grafica come da immagine 3. Risultati e previsioni sono da leggersi in riferimento al primo giocatore della sfida.

IMMAGINE 3 – Previsioni corrette per scontri diretti e deviazione dalle previsioni standard per le partite con differenza più significativa

Si vede ad esempio che, per l’effetto scontri diretti, Stefanos Tsitsipas avrebbe ricevuto un incremento di 2 punti percentuali sulla previsione di vittoria contro David Goffin nella semifinale di Marsiglia 2019, che ha poi effettivamente vinto in due set.

Sebbene ci siano stati più cambiamenti a favore del già pronosticato vincitore, ce ne sono stati molti anche nella direzione sbagliata, fra tutti la sconfitta di Cilic contro Alexander Zverev alle Finali di stagione 2018. Con la correzione degli scontri diretti, il pronostico favoriva maggiormente Cilic (il 53% rispetto al 45% di Zverev) anche se poi la partita è stata vinta da Zverev.

Stile di gioco e scontri diretti

Pur in presenza di qualche segnale di miglioramento predittivo in rivalità con molti scontri diretti, campioni di partite ridotti rendono la correzione con le ripercussioni degli scontri diretti di difficile applicazione. Il metodo più immediato per ovviare al problema sarebbe quello di raggruppare i giocatori secondo lo stile di gioco, così da poter applicare alla stima degli effetti una maggiore sicurezza predittiva derivante da stili di gioco simili. Resta però poco chiaro come definire lo stile di gioco.

Allo stato attuale, correggere per specifiche ripercussioni degli scontri diretti possiede del merito, rivelando al contempo risultati attesi e sorprendenti sugli effetti più marcati derivanti dagli scontri diretti. ◼︎

Note:

[1] Tecnicamente, il sistema di valutazioni Elo assume una relazione lineare tra la probabilità logaritmica di vittoria a la differenza in valutazione tra giocatori. Tuttavia, utilizzare la conversione in probabilità della previsione di vittoria consente una maggiore stabilità numerica del modello. In ogni caso, la scelta della modalità di conversione non ha un impatto sostanziale sui risultati.

Head-to-Head Effects

DELLO STESSO AUTORE