Il più grande archivio italiano di analisi statistiche sul tennis professionistico. Parte di Tennis Abstract

Probabilmente il più grande archivio italiano di analisi statistiche sul tennis professionistico. Parte di Tennis Abstract

I 22 miti del tennis di Klaassen & Magnus – Mito 10 (sulla misura della qualità)

ULTIMI ARTICOLI

ULTIMI ARTICOLI

Pubblicato l’8 maggio 2016 su StatsOnTheT – Traduzione di Edoardo Salvati

// Un’analisi del Mito 9.

Dopo due semifinali combattute, Andy Murray, numero 2 della classifica, deve difendere il titolo al Madrid Masters nella finale del 2016 contro il numero 1, Novak Djokovic. La presenza dei primi due giocatori del mondo in finale fa pensare di poter assistere a una partita di qualità, nonostante Djokovic sia largamente favorito (Djokovic ha infatti poi vinto con il punteggio di 6-2 3-6 6-3, n.d.t.).

Quali indicazioni fornisce la differenza di una posizione in classifica rispetto alla qualità attesa di una partita? C’erano cinque posizioni di differenza nella semifinale tra Djokovic e il numero 6 Kei Nishikori, solamente 3 tra Murray e Rafael Nadal. Sarebbe stato giusto aspettarsi, sulla base di questa sola informazione, una partita più equilibrata tra Murray e Nadal rispetto all’altra semifinale?

L’elemento centrale di queste domande riguarda la capacità della classifica di un giocatore di fornire informazioni relativamente alla sua bravura e come la qualità si comporti all’aumentare della classifica. Questo è anche l’oggetto di analisi del Mito 10 dei 22 miti del tennis di Klaassen e Magnus.

Mito 10: “La qualità è una piramide”

Il Mito 10 si discosta leggermente dagli altri miti di Analyzing Wimbledon. Mentre quest’ultimi infatti sottopongono assiomi ben conosciuti del tennis alle forche caudine dell’analisi statistica, l’idea che la qualità sia una piramide è un affermazione che probabilmente non si è mai sentita prima.

Dove vogliono arrivare esattamente Klaassen e Magnus?

IMMAGINE 1 – Forme rappresentative della qualità in funzione dei punti della classifica

Ipotizziamo di utilizzare i punti della classifica come unità di misura della qualità. Per vedere la “piramide”, partiamo dalla cima della scala in cui i pioli sono rappresentati dai punti in classifica – dove si trova attualmente Djokovic con 15.550 punti – e scendiamo con con intervalli uguali equivalenti a 500 punti, contando il numero di giocatori la cui valutazione in termini di qualità ricade all’interno dell’attuale “gradone” di suddivisione dato dai punti in classifica. Scendendo, il numero di giocatori è inizialmente ridotto, per aumentare poi nelle posizioni più basse in classifica. Se dovessimo rappresentare l’altezza dei gradoni attraverso i punti della classifica e la loro grandezza attraverso il numero di giocatori, troveremmo – sostengono Klaassen e Magnus – una forma a piramide come quella a sinistra nell’immagine 1.

La qualità non segue la classifica in modo lineare

La piramide mette in evidenza un elemento chiave, cioè che la qualità non segue la classifica di un giocatore in modo lineare. Se ci fosse un rapporto lineare, vorrebbe dire che alla stessa differenza di classifica corrisponderebbe una medesima differenza nella qualità dei giocatori. Djokovic e Marin Cilic al momento sono separati da 10 posizioni in classifica. In presenza di un rapporto lineare, la differenza di qualità tra Djokovic e Cilic equivarrebbe alla differenza tra il 100esimo giocatore (al momento Albert Montanes) e il 111esimo (al momento Yuichi Sugita). Nella realtà, anziché rimanere equivalenti, le differenze nella qualità dei giocatori si riducono al diminuire della classifica.

Una volta illustrata la non linearità, i due autori discutono una modifica al sistema di classifica in modo da associarlo linearmente alla qualità. Quale è il motivo di tale ricerca? Gli statistici amano muoversi su linee dritte e Klaassen e Magnus volevano trovare una modalità di valutazione qualitativa che avesse una relazione lineare con la probabilità di vincere un punto al servizio. Hanno introdotto quindi la modifica “turno atteso”, che è semplicemente il logaritmo su base 2 delle differenze di classifica tra due avversari. Suona complicato, ma è sensato se si riflette sul fatto che i tornei di tennis sono strutturati in modo tale da eliminare a ogni turno metà dei giocatori dalla classifica più bassa.

Una rivisitazione del Mito 10

Una delle risultanze della discussione di Klaassen e Magnus sulla “qualità come piramide” è la possibilità di acquisire informazioni sull’estensione del livello di bravura del circuito attraverso la forma che assume il rapporto tra punti in classifica e numero di giocatori classificati.

Ad esempio, se si mette a confronto la piramide con la forma rettangolare nell’immagine 1, la piramide è evidenza di un livello di bravura meno esteso, come in periodi di dominio da parte di un ristretto gruppo di giocatori con la qualità che diminuisce in modo netto nelle posizioni più basse della classifica. La forma rettangolare rappresenta l’altro estremo, nel quale nessun giocatore è in grado di dominare ma per ogni livello di qualità vi è un gruppo numeroso di giocatori abbastanza vicini tra loro.

Un bicchiere di vino rovesciato

È un modo insolito di considerare i punti della classifica, ma aiuta ad approfondire la conoscenza sul livello di bravura del circuito. Il grafico dell’immagine 2 mette in relazione i punti della classifica con la grandezza del campione di giocatori per intervalli di 500 punti (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). Si nota come, attualmente, il rapporto tra qualità e classifica è ancora più estremo di una piramide. Il divario creato da Djokovic e gli altri giocatori di vertice è tale per cui la forma della curva è più simile a un bicchiere di vino rovesciato di quanto non lo sia a una piramide.

IMMAGINE 2 – Rappresentazione dei punti in classifica dell’attuale classifica ATP

Il grafico dell’immagine 2 conteggia il numero di giocatori che rientrano in sezioni della classifica parimenti suddivise. Se si mettono invece in relazione diretta i punti della classifica con i giocatori classificati, si ottiene una curva più somigliante a una funzione più comunemente nota. L’immagine 3 mostra la relazione tra i primi 500 della classifica attuale e i primi 500 della classifica 2001, quando Gustavo Kuerten era il numero 1. La ripida inclinazione a cui si assiste muovendosi da sinistra verso destra sull’asse delle ascisse (dal giocatore con la classifica più alta a quello con la più bassa) e la lunga coda sulla destra determinano la forma caratteristica della distribuzione della legge di potenza.

IMMAGINE 3 – Legge di Potenza di punti della classifica e classifica

Legge di potenza

La legge di potenza si manifesta quando un cambiamento relativo di una quantità è proporzionalmente correlato a un cambiamento relativo in una variabile esplicativa. Nel caso di qualità e classifica, questo si traduce nell’equazione

Qualità = α(Classifica)−θ

che fornisce una buona approssimazione del rapporto tra qualità e classifica. A questo proposito, i sistemi di classificazione nello sport non sono speciali rispetto ad altri contesti. La legge di potenza in realtà è una delle più diffuse relazioni matematiche osservate in natura e possiede caratteristiche che sembrano adattarsi a qualsiasi tipo di relazione, dall’intensità dei terremoti alla distribuzione del reddito.

Estensione del livello di bravura o piramidalità

Aver individuato la legge di potenza permette di provare a determinare l’estensione del livello di bravura o “piramidalità” del circuito in qualsiasi periodo. Utilizzando il grafico logaritmo-logaritmo, la legge di potenza è lo strumento per ottenere l’agognata relazione lineare tra qualità e classifica. In questo caso l’inclinazione fornisce l’esponente (identificato con θ), che corrisponde all’estensione del livello di bravura del circuito.
Considerando che il 2001 è stata una fase del recente passato rappresentativa di una sorta di periodo di transizione – la fine dell’era Pete Sampras / Andre Agassi e appena precedente l’ascesa di Roger Federer nella storia dello sport – ci si può attendere che sia un buon test rispetto agli anni in cui il circuito è stato dominato da un numero ridotto di giocatori. L’immagine 4 mostra la versione logaritmo-logaritmo della relazione tra la legge di potenza del 2001 e del 2016. Si osserva un’inclinazione più ripida per il 2016, specialmente tra i giocatori di vertice, contro una curva quasi piatta per il 2001.

IMMAGINE 4 – Rappresentazione Logaritmo-Logaritmo di punti della classifica e classifica

Quindi, forse, la qualità viene descritta meglio da una legge di potenza che da una piramide.

La misurazione della qualità

Nel corso dell’analisi, ho utilizzato i punti della classifica come misura della qualità. Si potrebbe però dare vita a una discussione di tutt’altro tipo (e molto più lunga) sui problemi associati all’uso dei punti o delle posizioni in classifica come misura della bravura di un giocatore e sulle diverse opzioni meglio adatte all’obiettivo (nemmeno la nuova ATP Stats Leaderboards è una soluzione). Ad ogni modo, sia con una misurazione della bravura data da una semplice percentuale di partite vinte in una stagione o con un sistema più complesso come quello delle valutazioni Elo, la natura del tennis – di selezione della specie – suggerisce che la legge di potenza continuerà ad avere un ruolo predominante. ◼︎

Klaassen & Magnus’s 22 Myths of Tennis— Myth 10

DELLO STESSO AUTORE