Pubblicato il 19 novembre 2015 su TennisAbstract – Traduzione di Edoardo Salvati
// Alla fine de “La cattedrale di Turing”, George Dyson suggerisce che sebbene i computer non siano sempre in grado di rispondere alle nostre domande in modo utile, sono però capaci di generare uno sbalorditivo e inaudito patrimonio di risposte, anche se le relative domande non sono in realtà mai state formulate.
Pensiamo a un motore di ricerca: ha indicizzato ogni possibile parola e frase, in molti casi ancora in attesa del primo utente che le cerchi.
Cinque milioni di miliardi di diverse interrogazioni
TennisAbstract è la stessa cosa. Utilizzando i menù a sinistra nella pagina di Roger Federer – anche evitando di filtrare per gli scontri diretti, i tornei, i paesi, le statistiche della partita e altri parametri specifici come data e classifica – si possono generare cinque milioni di miliardi di diverse interrogazioni. Sono dodici zeri, e solo per Federer. Stando alle visualizzazioni generate dal sito, ci vorrà ancora un po’ prima che vengano provate tutte quelle combinazioni.
Ogni filtro ha il suo motivo di esistere, un tentativo cioè di rispondere a domande degne di nota relative a un determinato giocatore. La grande maggioranza di quei cinque milioni di miliardi di interrogazioni però fornisce informazioni su quesiti che nessuna persona sana di mente penserebbe di porsi, ad esempio il record di Federer nei tornei Master del 2010 sul cemento dopo aver vinto il primo set 6-1 contro giocatori fuori dai primi 10 (record di 2 vittorie e 0 sconfitte).
Il pericolo di possedere tutte queste risposte risiede nella tentazione di credere che stessimo effettivamente facendo domande o, peggio, che stessimo facendo domande sospettando per tutto il tempo che le risposte sarebbero state di questo tipo.
Il primo istinto è di cercare prova delle nostre consapevolezze
I dati forniti da Hawk-Eye durante le telecronache sono l’esempio perfetto. Quando la grafica mostra la traiettoria di vari servizi o il percorso della pallina per ogni colpo dello scambio, si sta osservando un’enorme mole di dati grezzi, più di quanto la maggior parte di noi sarebbe in grado di intendere se non fossero accompagnati dal familiare sfondo di un campo da tennis. Considerate tutte quelle risposte, il nostro primo istinto è troppo spesso quello di cercare prova di qualcosa di cui siamo già ben consapevoli, che il dritto arrotato di Jack Sock è quello che gli fa vincere più punti o che la seconda di servizio di Rafael Nadal è attaccabile.
È difficile prendere una posizione su questo tipo di affermazioni, soprattutto in presenza di grafiche ad alto contenuto tecnologico che sembrano servire da controprova. Se quelle grafiche rappresentano delle “risposte” (o se lo sono i risultati delle interrogazioni a più filtri su TennisAbstract), lo fanno riferendosi solamente a domande di portata ridotta, che di rado dimostrano le tesi che invece ci convinciamo riescano a dimostrare.
Queste risposte limitate sono semplicemente punti di partenza per domande cariche di significato. Anziché osservare i numeri generati dal rovescio di Novak Djokovic durante una partita dichiarando “Lo sapevo, il suo rovescio lungolinea è il migliore che ci sia in giro” dovremmo renderci conto che stiamo analizzando un piccolo e decontestualizzato insieme di dati, e cogliere l’opportunità di chiedersi, “Il suo rovescio lungolinea è sempre così impressionante?” oppure “Qual è il rendimento del suo rovescio lungolinea rispetto agli altri?” o ancora “Un rovescio lungolinea quanto fa aumentare la probabilità di vincere lo scambio?”
Domande poco significative e conclusioni tratte da pseudo-risposte
Sfortunatamente, la conversazione si interrompe di solito prima che venga formulata una domanda significativa. Anche senza che i dati raccolti dal sistema Hawk-Eye siano pubblicamente condivisi, stiamo iniziando a possedere le informazioni necessarie per fare ricerche su molte di queste domande.
Per quanto siamo propensi a lamentarci della scarsità di analisi statistiche nel tennis, sono troppe le persone che traggono conclusioni dalle pseudo-risposte associate a grafiche scintillanti. Con il più grande numero di dati a disposizione di sempre, è un peccato confondere risposte semplici e limitative per risposte profonde e di ampia portata. ◼︎