Pubblicato il 12 aprile 2019 su StatsOnTheT – Traduzione di Edoardo Salvati
// In un precedente articolo, ho cercato di capire se statistiche di base della partita, come ace e minuti giocati per punto, potrebbero essere d’aiuto nella descrizione dello stile di gioco. Oggi, approfondisco le caratteristiche delle tipologie di stili ed esamino i raggruppamenti di stili di gioco che ne emergono.
La volta scorsa ho fatto un piccolo esperimento con le ripercussioni dagli scontri diretti di due giocatori per verificarne il potenziale di determinazione di tipologie di stili di gioco tra loro differenti. Le ripercussioni analizzate erano la frequenza di ace e i minuti giocati per punto di un giocatore rispetto a quelli di un giocatore medio, stimati mediante modello gerarchico con ripercussioni da scontri diretti casuali. I risultati erano promettenti, con raggruppamenti in grado di separare, ad esempio, giocatori dal servizio notoriamente dominante da giocatori estremamente solidi in difesa.
Probabilmente però, ace e durata dei punti non riescono a descrivere tutte le declinazioni degli stili di gioco come potrebbero fare le statistiche della partita. Dopo altre riflessioni e commenti di analisti di tennis su Twitter, ho deciso di includere i seguenti aspetti.
Frequenza di doppi falli
Dovrebbe far emergere quei giocatori che rischiano molto al servizio e quelli che invece non reggono la pressione.
Differenza tra punti vinti sulla prima e sulla seconda di servizio
Per la maggior parte dei giocatori, ci si aspetta che il numero di punti vinti al servizio diminuisca quando devono servire la seconda. Stabilire quanta differenza ci sia tra le due situazioni potrebbe evidenziare particolari tecniche sulla seconda di servizio o quanto la capacità di attacco sia legata alla forza bruta del servizio.
Differenza tra punti vinti sulla prima e alla risposta
Se i punti vinti sulla prima sono una misura della bravura complessiva al servizio – come summa della tecnica stessa al servizio, della tattica sul terzo colpo e della capacità di scambio – e se i punti vinti alla risposta lo sono dell’acume difensivo, la differenza dovrebbe allora aiutare a determinare il bilanciamento di un giocatore tra abilità in attacco e in difesa.
Pur avendo considerato anche altri indicatori come il rapporto tra vincenti ed errori o la frequenza degli approcci a rete, sarebbe stato complicato trovare dati per più anni al di fuori degli Slam. Pensando inoltre alla scarsa frequenza dei punti a rete e alla variabilità nelle classificazione degli errori da un torneo all’altro, credo che l’affidabilità delle ripercussioni dagli scontri diretti avrebbe valore limitato se riferita alle sole partite degli Slam. Per il momento, quindi, le ho messe da parte.
Correlazione tra caratteristiche
Prima di procedere con l’algoritmo di raggruppamento, dobbiamo capire il significato di queste caratteristiche e di come si rapportano alle altre. In tal senso, si può utilizzare un grafico di accoppiamento. L’immagine 1 mostra i risultati per i giocatori del circuito e per quelli che hanno giocato negli Slam per tutte le partite dal 2017 a oggi, in assenza di distinzione tra superfici.
Tutte le ripercussioni sono su scala standardizzata, in modo da risultare centrate intorno allo zero e in un intervallo da -5 a +5, nella maggior parte dei casi. Ci sono diverse coppie che possiedono una correlazione positiva forte o moderata. La più solida è quella tra la frequenza di ace e la differenza tra punti vinti sulla prima e alla risposta, a indicazione del fatto che un servizio dominante potrebbe generare valori sopra la media per quest’ultimo indicatore. Vista la vicinanza di relazione tra queste due caratteristiche, escludo la differenza tra punti vinti sulla prima e alla risposta in modo da non ottenere una rappresentazione eccessiva dello stile associato a un servizio dominante.
IMMAGINE 1 – Correlazione tra varie statistiche della partita per i giocatori del circuito maggiore
È interessante notare una correlazione simile tra la frequenza di doppi falli e la differenza tra punti vinti sulla prima e sulla seconda di servizio ma non con la differenza tra punti vinti sulla prima e alla risposta. Questo suggerisce che la frequenza di doppi falli può fornire indicazioni sulle scelte decisionali e sulla strategia in presenza di una seconda di servizio, che non verrebbero parimenti evidenziate da nessuna delle altre caratteristiche. Come ci si poteva attendere, data l’enfasi della maggior parte delle caratteristiche su aspetti del servizio, la durata dei punti possiede una correlazione nulla o negativa con il resto delle caratteristiche dello stile.
Identificazione dei raggruppamenti
Con qualche elemento in più, possiamo ora raggruppare i giocatori tramite algoritmo k-means, come fatto in precedenza. Il totale entro la somma dei quadrati identifica in 10 gruppi una scelta ragionevole per questo campione di giocatori.
In presenza di quattro sole caratteristiche, la differenza di stile tra i raggruppamenti è facilmente visualizzata da un grafico a coordinate parallele, come nell’immagine 3. Ciascun colore rappresenta un raggruppamento di riferimento, e le linee più spesse la media del gruppo specifico di quel colore. Un dettaglio che emerge da subito è la rimarchevole variazione tra raggruppamenti per quanto riguarda la differenza tra punti vinti sulla prima e sulla seconda, vale a dire la variabile che più di tutte contribuisce a separare i raggruppamenti. All’opposto, la durata dei punti è quella in cui la distanza tra i raggruppamenti è minima.
IMMAGINE 2 – Raggruppamento tramite algoritmo k-means
IMMAGINE 3 – Raggruppamento di stili rispetto alla differenza nelle caratteristiche individuate
Utilità pratica
Il campione contiene più di 250 giocatori, rendendo difficile mostrare in modo compatto il raggruppamento di stile di ciascun giocatore. Possiamo selezionare i tre giocatori più rappresentativi per ogni raggruppamento mediante le ripercussioni da scontri diretti più adiacenti al centro geometrico del raggruppamento cui appartengono, come mostrato dalla tabella. La percentuale di giocatori che rientra in ciascun raggruppamento va dal 3% al 15%, con il raggruppamento 3 a essere il meno frequente e il raggruppamento 8 il più comune.
L’utilità pratica di questi raggruppamenti è legata al loro potere predittivo. Se possono dare delucidazioni in termini di rendimento dei giocatori ai fini del risultato di una partita, rendimento che non sia già espresso dalla bravura complessiva (come valorizzata dalla classifica ufficiale o dalle valutazioni Elo), significa che esiste la speranza per rendere le ripercussioni da scontri diretti un fattore senza che siano legate al bilancio di vittorie e sconfitte, ma allo stile di gioco. Sarà questo l’argomento chiave del mio prossimo articolo sulla tematica. ◼︎
More Exploration on Using Match Stats to Classify Playing Styles