Le correlazioni spurie: se le conosci, le eviti (Vincenzo Giglio)

L’8 giugno 2025 Wired ha pubblicato nella sezione cultura “Cos’è la correlazione spuria e perché può essere usata come potente antidoto alle fake news”, a firma di Marta Francesca Amodeo, consultabile a questo link.

Ne abbiamo tratto parecchie informazioni interessanti.

A cominciare dalla definizione di correlazioni spurie che vanno intese come eventi che per un accidente statistico si verificano più volte simultaneamente senza essere legati necessariamente (A e B si manifestano allo stesso tempo ma A non è causa di B e B non è causa di A).

La Amodeo cita molti esempi, tratti in parte dal saggio Why do We get some nonsense correlations between time series? A study in sampling and the nature of time series (letteralmente: Perché a volte otteniamo correlazioni senza senso tra serie temporali? Uno studio sul campionamento e la natura delle serie temporali) pubblicato nel 1926 dallo statistico britannico   George Udny Yule, e già la bizzarria degli abbinamenti ne dimostra la natura spuria.

Eccone alcuni:

ogni volta che Nicolas Cage ha partecipato a un nuovo film tra il 1999 e il 2009, qualcuno nel mondo, è morto annegato in piscina;

al crescere delle celebrazioni di nozze, anche non religiose, aumenta il numero delle rondini in cielo;

ogni volta che Aaron Ramsey, centrocampista del Cardiff City e della nazionale gallese segna un gol (e, stando agli ultimi conteggi, ne ha segnati 74 in tutta la carriera), muore qualche personaggio pubblico;

il consumo di margarina negli Stati Uniti tra il 2000 e il 2009 ha avuto lo stesso andamento del numero di divorzi firmati, in quegli anni, nello stato del Maine.

Faremmo un torto ai lettori se perdessimo tempo a spiegare perché tali abbinamenti siano pure coincidenze e nient’altro.

Eppure, le correlazioni spurie non sono solo materia per ricerche stravaganti – ne ricordo ancora una che si proponeva di capire se ci fossero differenze tra uomini e donne nel modo in cui dispongono i rotoli di carta igienica nell’apposito sostegno – candidate al premio IG-NOBEL.

Il punto è che con connessioni del genere si può dare un’apparenza di fondamento alle tesi più strampalate e tutti abbiamo una memoria ancora viva di quante ne siano proliferate nel periodo della pandemia da Coronavirus.

Se poi si oltrepassa lo steccato scientifico, che costituisce il naturale bersaglio di chi della scienza si fa beffe, e si entra nell’ambito giuridico, chiunque lo frequenti si è imbattuto più volte in correlazioni spurie il cui terreno di elezione sono ovviamente i sillogismi indiziari.

Leggiamo insieme vari esempi di correlazioni spurie in questo campo di ricerca:

Dalla sentenza non risulta in che modo si verificò l’investimento e in quale punto della carreggiata avvenne. La motivazione del provvedimento impugnato allude a possibili difficoltà nell’avvistamento del pedone, ma non spiega se dipendessero dalla eccessiva velocità del veicolo o da altre cause. La motivazione è così laconica da far ritenere che la sussistenza della colpa sia stata desunta ex post dal fatto che l’evento si è verificato” (correlazione spuria di tipo allusivo e postergato).

Iudex peritus peritorum” (correlazione spuria per accostamento non autoevidente tra giudice ed esperto).

Iura novit curia” (correlazione spuria per accostamento non autoevidente tra diritto e “cattedre” giudiziarie).

E per ora può bastare.