Chi ha vinto la Serie A 2018/19?


Domanda scontata, fin troppo. La Juventus ha aritmeticamente vinto il campionato il 20 aprile, alla 33esima giornata, ma già alla fine del girone di andata aveva un rassicurante margine di 9 punti sul Napoli, secondo in classifica sia a Natale che a fine stagione. Dietro i partenopei si è scatenata una bagarre che ha portato l’Inter a chiudere il campionato in terza posizione, l’Atalanta ad uno storico piazzamento in Champions League (quarta in classifica), e Milan e Roma in Europa League, rispettivamente quinta e sesta.

Ma esiste un mondo parallelo in cui non solo la Juve non ha vinto lo scudetto, ma addirittura è arrivata quarta, dietro ad un Napoli Campione d’Italia, ad una sorprendente Atalanta, ed un’Inter sempre una volta terza forza del campionato. In questo stesso universo l’Empoli di Andreazzoli si è salvato, con 43 punti ed un dignitosissimo undicesimo posto, lasciando il terzultimo posto che vale la retrocessione al Parma con appena 30 punti, che invece nel mondo reale si è piazzato quattordicesimo con 41 punti.

Potrebbe sembrare fantascienza, ma l’universo parallelo che vi abbiamo descritto segue una logica razionale, molto più razionale di quella che governa il mondo del calcio, fatto di giocate sorprendenti, campioni imprevedibili e risultati inattesi: il mondo degli Expected Goal.


Che cosa sono gli Expected Goal?

La metrica degli Expected Goal è basata sull’assunzione - tutt’altro che inverosimile - che quanto più una squadra calcia in porta, tanto maggiore è la probabilità di segnare. Tuttavia misurare la quantità dei tiri in porta indipendentemente dalla qualità degli stessi rappresenta un limite evidente: calciare al volo da 40 m con numerosi avversari sulla traiettoria non può essere paragonato ad un semplice tap-in con il pallone rasoterra, nell’area piccola, a porta vuota.

Trascurando la gestazione che ha portato alla definizione delle specifiche metriche, si è arrivati al concetto di Expected Goal, declinato in diversi modelli a seconda degli algoritmi utilizzati per il calcolo.

Gli Expected Goals (xGoal) sono un metodo di misurazione della qualità delle occasioni create (o concesse) da una squadra con l’obiettivo di misurare quanti gol quella stessa squadra avrebbe segnato (o subito) in media in base alla qualità e alla qualità dei tiri effettuati (o concessi). Assegnando ad ogni tiro presente, passato o futuro la rispettiva probabilità di essere convertito in rete, siamo ora in grado di valutare ogni tiro in una scala che va da 0 a 1: ovviamente più alto sarà il valore, più alta sarà la possibilità che il tiro venga convertito in gol” (da UltimoUomo.com).

Se una squadra riesce a produrre un valore elevato di xGoal durante tutto il corso della partita, si può verosimilmente dedurre che - indipendentemente dal risultato finale - abbia espresso un gioco di qualità e quindi una buona prestazione. Lo scostamento tra il valore di xGoal e il valore effettivo di gol realizzati è in parte spiegabile da elementi casuali, quali la fortuna, la bravura degli attaccanti di convertire occasioni in reti e l’abilità dei portieri di neutralizzare i tiri avversari.

Alcuni esempi possono aiutare meglio a comprendere il concetto di Expected Goal.


In questo episodio (minuto 0.40 del video) la Roma costruisce una buona azione che permette a Dzeko di calciare da un’ottima posizione. Questa occasione genera un valore alto di xGoal (stimabile tra 0.7-0.8), che però non viene trasformato in gol a causa della scarsa vena realizzativa dell’attaccante (almeno fino a quel momento: nel prosieguo della gara avrebbe realizzato una doppietta).


In questa partita l’Atalanta produce oltre 5 xGoal, ma non ne converte neanche uno. La gran parte del merito di questo esito è del portiere dell’Empoli Dragowski che realizza una prestazione eccezionale, con parate dall’alto coefficiente di difficoltà: risultato finale di 0-0.


Questa punizione di Pulgar è il gol realizzato da un’occasione con il minor valore di xGoal di tutta la serie A durante la stagione passata, secondo i dati raccolti da Alfredo Giacobbe. In questo caso è l’abilità di Pulgar che permette di trasformare in rete un valore bassissimo di xGoal.

Nei primi due video proposti si parla pertanto di underperformance, ovvero di valori di xGoal maggiori rispetto ai gol realizzati; si definisce invece overperformance la situazione opposta, come nel terzo caso. Il discorso si ribalta spostando il focus dall’attacco alla difesa: una difesa che subisce meno gol degli xGoal concessi overperforma; diversamente, underperforma.

Le classifiche

Durante tutta la stagione passata abbiamo tenuto costantemente aggiornata la classifica, considerata però non in base al risultato maturato sul campo, ma agli xGoal calcolati secondo l’algoritmo di understat.com, che si basa su una rete neurale sviluppata a partire da un dataset di oltre 100.000 tiri. Tuttavia ci siamo immediatamente resi conto che così facendo sarebbe stato pressoché impossibile avere un pareggio, con entrambe le squadre appaiate ad uno stesso valore di xGoal, uguale fino al centesimo di unità; si è definita pertanto una soglia minima di differenza tra le due squadre, al di sotto della quale il risultato finale era di pareggio. Tale valore soglia è stato impostato a 0,5 xGoal.

Prendiamo ad esempio l'ultima giornata dello scorso campionato, per vedere come il risultato delle partite possa discostarsi - anche di molto - dai valori degli xGoal: un rapido sguardo ad alcune partite può aiutare a comprendere meglio come è stata stilata la xClassifica.

Sampdoria - Juventus

risultato reale 2-0 → vittoria Sampdoria
risultato xGoal 0.69-0.49 → pareggio


Bologna - Napoli


risultato reale 3-2 → vittoria Bologna
risultato xGoal 0.94-1.80 → vittoria Napoli


Cagliari - Udinese


risultato reale 1-2 → vittoria Udinese
risultato xGoal 2.45-0.74 → vittoria Cagliari


Gli indicatori

Una volta fatta questa lunga ma doverosa premessa, sperando di non aver perso troppi lettori, possiamo mostrarvi la nostra xClassifica al termine della stagione scorsa, includendo anche i dati relativi agli xGoal prodotti (xGF) e subiti (xGS).


Di seguito riportiamo invece la classifica reale.


Come si può vedere, la xClassifica include anche i dati relativi a gol fatti e gol subiti, calcolati sommando semplicemente rispettivamente gli xGoal prodotti e concessi nelle singole partite: il confronto tra dato reale e valore atteso può essere pertanto declinato in diverse valutazioni. Sono stati pertanto definiti due indicatori, basati sul rapporto tra gol reali e attesi, sia realizzati che subiti.


In primo luogo è possibile ragionare in termine di gol subiti, confrontato il valore reale con la somma degli xGoal concessi; per sintetizzare tale confronto, è stata definita la metrica

DEF = xGoal concessi / gol subiti

Laddove questa metrica assuma valore superiore al 100%, significa che la difesa ha overperformato, concedendo meno gol di quanti ne fossero statisticamente attesi. Diversamente un indice inferiore al 100% significa che la squadra in questione ha concesso più gol di quanti attesi.

Con qualche dovuta eccezione, si può notare che le squadre a concedere più gol di quanto atteso sono le squadre di bassa classifica. Fanno eccezione Cagliari e Udinese, che avrebbero dovuto subire circa 8 goal in più. Nella colonna sinistra della classifica risalta il Torino, con i suoi 10 gol subiti in meno. Buona parte di questi risultati sono dovuti all’abilità dei portieri delle rispettive squadre (Cragno, Musso e Sirigu) di neutralizzare occasioni importanti in più partite. Altri valori potrebbero sorprendere (per esempio l’Atalanta), ma non riteniamo che una differenza inferiore ai 7 goal sia abbastanza statisticamente rilevante da trarre alcuna conclusione sulla base di questo dato.

Analogamente, è stato individuato un indice relativo alla capacità realizzativa delle squadre, che vada a descrivere la capacità di convertire in gol realizzati gli expected goal prodotti. L’indicatore relativo alle capacità realizzative è stato calcolato come segue:

ATK = gol realizzati / xGoal prodotti

L’indicatore assume valore superiore al 100% per le squadre che sono state capaci di realizzare più gol rispetto agli xGoal prodotti, concretizzando bene le occasioni create. Diversamente un valore inferiore al 100% indica che sono stati realizzati meno gol rispetto agli xGoal prodotti, e quindi l'attacco della squadra ha underperformato e/o la squadra avversaria è stata brava ad neutralizzare le occasioni da loro create. Tuttavia, questa seconda valutazione relativa alle capacità difensive degli avversari rappresenta una causa credibile di underperformance nel breve termine - ovvero nell’arco di una o poche partite - ma non nel lungo termine, nell’arco di un intero campionato.

Anche in questo caso si può notare che i peggiori attacchi sono nella parte bassa della classifica: il Chievo ne è l’esempio più lampante. Nella parte alta della classifica invece si noti l’Inter, che ha convertito 9 gol in meno di quanti attesi: non a caso la squadra nerazzurra ha avuto un anno difficile con le proprie punte. I migliori attacchi sono quelli di Juventus, Napoli e Sampdoria che hanno convertito 8 goal in più del previsto, probabilmente grazie ai rispettivi attaccanti (Ronaldo, la coppia Milik-Mertens e Quagliarella).

Le analisi

In conclusione, un’ultima analisi è richiesta dai casi in cui la posizione nella nostra xClassifica risulta sostanzialmente diversa rispetto al piazzamento reale, cercando nei numeri una spiegazione e facendo sempre riferimento ai due indicatori di cui sopra.


In primo luogo la Juventus non è più campione, ma addirittura quarta, con 74 punti virtuali contro i 90 reali: entrambi gli indicatori sono superiori al 100%, a parziale conferma dell’importanza dei singoli e delle loro giocate: l'imprevedibilità dei campioni è difatti difficilmente riconducibile a rigide metriche matematiche. I punti realizzati (90) sono eccessivi rispetto non solo rispetto al valore teorico (74), ma anche tenendo considerazione dell’importo dato dai singoli. L’incredibile capacità della Juventus è stata quella di distribuire il gioco espresso e il talento dei suoi giocatori in modo equilibrato e funzionale ad ottenere la vittoria in ogni singola partita.

Il Campione d’Italia del nostro universo parallelo sarebbe stato il Napoli, con 5 punti in più rispetto a quanti ne ha conquistati nella realtà: nonostante questo gap non sia poi così ampio, gli 84 punti virtuali gli avrebbero garantito un margine di sicurezza di 6 punti sulla seconda. Sicuramente è stato degno di nota il lavoro del comparto offensivo partenopeo, con un ATK pari al 111%.


L’Inter si sarebbe confermata terza forza del campionato, ma con ben 8 punti in più. La difesa nerazzurra ha lavorato sicuramente molto bene (DEF=111%), mentre l’attacco ha sofferto non poco, con l’indice offensivo peggiore del campionato, secondo solo al Chievo ultimo in classifica (ATK=86%): in diverse partite è stata evidente l’incapacità della squadra di Spalletti di rendersi pericolosa in avanti, anche a causa delle frequenti assenze degli attaccanti (basti pensare alle partite giocate con Ranocchia unica punta…).


L’Atalanta rivelazione del campionato sarebbe stata ancora più sorprendente, con un secondo posto in classifica mai raggiunto nella storia del club: 9 punti in più per la squadra di Gasperini, che però ha raggiunto un indice difensivo tra i peggiori della Serie A (88%, meglio solo del Chievo). Ciò è dovuto allo scarso cinismo della squadra di Gasperini che è stata capace di overperformare in partite già vinte e perdere punti in modo clamoroso in altre partite (come contro l’Empoli).

Il Milan sarebbe uscito dalle Coppe in ogni caso, ma stavolta senza neanche essersi qualificata sul campo. La squadra si è rivelata modesta, ma Gattuso è riuscito a ottenere ben 13 punti in più grazie a una buona compattezza difensiva (DEF: 115%) e rendendo l’attacco efficace (ATK: 107%, 3 goal più del previsto). Era difficile ottenere più di così con questo organico.

Roma e Lazio sono le squadre che più di altre hanno avuto un andamento complessivo che si allinea quasi perfettamente ai valori attesi: la Roma ha conquistato esattamente gli stessi punti della xClassifica (66), la Lazio uno in più (59 contro 58). Allo stesso modo gli indicatori offensivi e difensivi si spostano di pochi punti percentuali rispetto all’unità.


Tra le squadre della seconda metà della classifica, la Fiorentina ha sicuramente stupito negativamente, rischiando addirittura la retrocessione: al contrario, nella nostra xClassifica, avrebbe raggiunto un piazzamento valido per l’Europa League, con 19 punti in più rispetto alla classifica reale. Una possibile giustificazione può essere individuata nell’incapacità di concretizzare le occasioni da rete, con un indice offensivo pari all’87%. Tuttavia questo valore è viziato da un finale di stagione pessimo (1 goal in 8 partite), che ha compromesso a tutti gli effetti anche il risultato in classifica (quella vera).

Infine l’Empoli merita un commento a parte: la retrocessione è stata da più parti definita ingiusta, alla luce del buon gioco espresso dalla squadra di Andreazzoli. E infatti i numeri della nostra xClassifica concordano nel riconoscergli un ben migliore undicesimo posto, con 5 punti in più. L’attacco è stato sorprendente, non tanto per il valore assoluto (ATK: 100%), ma in confronto alle altre squadre retrocesse. È stato decisivo il contributo dell’attaccante più prolifico (Caputo), che è necessario a rendere l’attacco efficace. Nel caso di Parma (con Inglese e Gervinho) e Spal (Petagna) questo contributo si è rivelato decisivo per la salvezza.

E quindi?



Ragionando per un anno intero in termini di xGoal e stilando la xClassifica che vi abbiamo appena raccontato, abbiamo sperimentato per la prima volta questa metrica nel nostro campionato, in maniera strutturata e organica.

La maggiore evidenza è che tutte le squadre si sono dimostrate imperfette: alcune hanno mostrato carenza di gioco espresso, altre uno scarso cinismo, altre ancora poco equilibrio.

Juventus, Milan, Torino e Sampdoria sono state molto ciniche, ma non hanno espresso un buon gioco in modo continuativo: non a caso tre di queste quattro squadre hanno cambiato la propria guida tecnica. Lazio e Roma hanno mostrato la necessità di rinforzarsi per arrivare alle prime quattro, mostrando sul campo tutto il proprio potenziale, e quindi anche i propri limiti.

Nella parte destra della classifica quasi tutte le squadre hanno rischiato la retrocessione: la Fiorentina ha avuto un problema mentale più che tecnico, e ha voluto poi rivoluzionare la rosa in vista di questa stagione.

Questi brevi commenti vogliono mettere in luce le potenzialità e i limiti della metrica degli xGoal: è infatti capace di evidenziare problemi sistematici di una rosa (ad esempio il comparto offensivo dell’Inter), o il crollo psicologico di un’altra, incapace di fare risultato nonostante una rosa di discreta qualità (leggasi Fiorentina).

Tuttavia il calcio è fatto di giocate imprevedibili di campioni e di irrazionalità, e rimarrà sempre estremamente difficile modellizzare tali fattori in un sistema statistico.

Ma - forse - è proprio questo il bello del calcio: la sua irrazionalità.

Nessun commento:

Posta un commento

Il blogger, essendo responsabile penalmente di tutto ciò che viene pubblicato sul suo blog, modererà tutti i commenti, che non saranno pertanto visibili prima della sua approvazione: è richiesta la massima educazione e moderazione nei termini.