STATISTICA E PROBABILITÀ PUNTATA 10 DI "N"
Nel libro: “La briscola in cinque” Marco Malvaldi ironizza sugli intervalli di confidenza. Quando il medico legale dice che il soggetto è morto tra le 2 e le 5 ore fa, Massimo gli chiede se effettivamente abbia significato un intervallo così ampio. E se è così ampio, significa che il momento reale della morte cade necessariamente fra quei limiti? Forse invece: “lo dice per avere la certezza”… (citazione dal libro di Malvaldi).
Partiamo dal fondo: la certezza non c’è, quindi non si conosce esattamente il momento della morte. Di conseguenza la morte potrebbe anche essere avvenuta più di 5 ore fa, ad esempio 6 ore fa, oppure meno di 1 ora fa, per esempio mezz’ora fa. Con ciò intendo dire che anche un intervallo molto ampio non garantisce che il valore ricercato vi cada necessariamente dentro. Ma la vera questione è: qual è il significato che si può attribuire agli intervalli di confidenza?
Noi cerchiamo un parametro incognito – ad esempio il momento esatto della morte – e abbiamo a disposizione un campione, che dovrebbe essere stato estratto (da una popolazione) in modo casuale, cioè secondo il modello dell’urna. Allora cerchiamo il nostro parametro nel campione, ma di campioni se ne potrebbero estrarre un mucchio, e sarebbero tutti diversi. Inoltre occorre scegliere un livello di confidenza; a tal proposito cito da “Non è colpa della statistica”: “Se ad esempio il livello di confidenza è il 95%, l’intervallo sarà costruito in modo tale che 95 casi su 100 ricadano dentro e 5 su 100 finiscano fuori. Questa è una stima intervallare che contiene il valore θ ricercato in 95 campioni su 100”. Possiamo anche scegliere un livello di confidenza del 99% e costruire quindi un intervallo più ampio (ma ovviamente meno utile), ma non potremo mai arrivare al 100%.
Di conseguenza, se volessimo usare un linguaggio più approssimativo (ma più comprensibile per i non addetti ai lavori) potremmo affermare che è molto probabile che il parametro incognito rientri nell’intervallo, ma non è certo. D’altronde gli intervalli di confidenza – in un certo senso – servono proprio per mettere le mani avanti, cioè per garantire trasparenza comunicando anche l’incertezza. Sarebbe bello possedere dati certi, sarebbero dati molto convincenti per tutti e costituirebbero di fatto degli elementi su cui si potrebbe fare solido affidamento. Ma i risultati che otteniamo da un campione, facendo inferenza sulla popolazione, sono caratterizzati comunque da incertezza. Ed è quindi giusto e doveroso comunicare questa incertezza, anche tramite misure che siano più accurate possibile. Proprio a questo servono gli intervalli di confidenza.
Ed ecco una conferma: “Lo scopo principale degli intervalli di confidenza è quindi quello di indicare la (im)precisione delle stime campionarie come rappresentazione dei valori della popolazione” affermano D. G. Altman, D. Machin, T. N. Bryant e M.J. Gardner nel libro: “Statistica medica – Intervalli di confidenza nella ricerca biomedica” (Edizioni Minerva Medica).
Walter Caputo
Divulgatore specializzato in Scienze Statistiche
Autore del libro: "Non è colpa della statistica" (C1V Edizioni, 2023).
Post a Comment