Header Ads

STATISTICA E PROBABILITA': PUNTATA 11 DI "N"

Buonasera a tutti e ben tornati su questa pagina, in cui prosegue la serie "Statistica e Probabilità", iniziata il 27 giugno 2023 e giunta oggi all'undicesima puntata. Vi siete persi le puntate precedenti? Non c'è problema, eccole qui: 1 - 2 - 3 - 4 - 5 - 6 - 7 - 8 - 9 - 10). Torniamo quindi a parlare di intervalli di confidenza.

Posto che un intervallo di confidenza è tanto più preciso quanto più è ristretto, la sua ampiezza dipende essenzialmente da tre elementi:

- il numero di soggetti studiati: se il campione è grande (a parità di altre variabili) l’errore standard sarà piccolo e di conseguenza l’intervallo di confidenza sarà ristretto;

- la variabilità della caratteristica oggetto di studio: più è bassa la variabilità più è bassa la deviazione standard, di conseguenza (a parità delle altre variabili), più piccolo sarà l’errore standard e quindi più ristretto sarà l’intervallo di confidenza;

- il livello di confidenza richiesto: più basso è il livello di confidenza (ad esempio 90%), più ristretto è l’intervallo di confidenza, ma ciò implica che il parametro incognito ricercato (in questo esempio) sarà fuori dall’intervallo in 10 campioni su 100. Al contrario, scegliere un livello di confidenza del 99% significa che il parametro sarà fuori dall’intervallo in un campione su 100, ma l’intervallo di confidenza sarà necessariamente più ampio (e quindi meno preciso e – di fatto – poco utile).

Come scrivono in maniera esplicita gli autori citati da “Statistica medica” (si veda la puntata n. 10) il valore “p” (o p-value) non è un sostituto degli intervalli di confidenza. Tale valore tende a togliere contenuto informativo ai risultati di un’indagine statistica, riducendo all’esito dicotomico: significativo oppure non significativo. 

Il punto è che “significativo” non vuol dire perfetto sotto tutti i punti di vista, come “non significativo” non vuol dire da scartare in assoluto. E’ inaccettabile ogni comportamento del ricercatore teso a ridurre, banalizzare e togliere informazioni al risultato dell’applicazione di uno o più metodi statistici. 

Naturalmente non va neanche bene usare in modo scorretto gli intervalli di confidenza, ad esempio verificando soltanto se l’intervallo contiene il valore nullo, che sarebbe un indicatore che non vi è differenza fra due gruppi (ai quali ad esempio è stato somministrato un trattamento diverso). Non si vuole qui affermare che il valore “p” sia inutile, ma che non sia utile da solo: può andar bene se è integrato agli intervalli di confidenza, quando questi ultimi vengono utilizzati in modo corretto. A tal proposito colgo l’occasione per ribadire un concetto: come ho scritto nel mio libro “Non è colpa della statistica”, la colpa può ricadere soltanto su coloro che usano la Statistica in modo improprio o che addirittura la manipolano per raggiungere fini personali. 

Può anche capitare che la statistica sia usata in modo improprio involontariamente, ma – in ogni caso – è decisamente utile per tutti i non addetti ai lavori incrementare il proprio livello di cultura statistica. Perché tutti i metodi statistici devono essere usati in maniera corretta, non solo gli intervalli di confidenza o il valore “p”.

Arrivederci alla prossima puntata!

Walter Caputo

Dal 2008 divulgatore specializzato in Scienze Statistiche

Autore di: "Non è colpa della statistica" (C1V Edizioni, 2023)

Nessun commento