Jessica Utts. Division of Statistics, UC Davis

Abstract

jessica-utts

Jessica Utts, ASA American Statistical Association President-elect (2016 president)

I metodi statistici sono utilizzati per individuare e misurare relazioni effetti in situazioni i cui risultati non possono essere replicati in modo certo a causa della variabilità naturale delle misure stesse di interesse.
Essi sono utilizzati in generale come passo intermedio tra l’aneddoto e la determinazione di rapporti di causa effetto.
Molti fenomeni anomali come ad esempio la bilocazione (?) oppure il possibile effetto delta preghiera sulla guarigione, sono suscettibili di studio rigoroso.
I metodi statistici giocano un ruolo importante nel trarre conclusioni appropriate da tale studio.
Questo articolo esamina il ruolo che la statistica può avere nel riassumere e trarre conclusioni da studi di casi singoli o multipli.
Esso presenta due esempi di uso della meta-analisi per valutare i fatti e presenta anche un confronto fra tali esempi.
II primo esempio, convenzionale, collega l’uso delle anti-piastrine (anticoagulanti) alla riduzione delle malattie vascolari.
II secondo esempio viene dalla ricerca sulla mente – materia e illustra dei risultati di esperimenti di ganzfeld ??? e (visioni a distanza) (bilocazione)?.

Parole chiave: evidenza statistica livello di significatività (p-value) -meta-analisi-ripetibilità

1. La statistica e i fenomeni anomali
Come in ogni dominio, la facilità con cui i fenomeni anomali possono essere studiati usando metodi scientifici tradizionali dipende dal tipo di evidenza che viene proposta per tali fenomeni, dal tipo di dati con i quali i fenomeni vengono descritti.
L’evidenza tende a dividersi in due categorie.
In una, che include aree tipo abduzioni aliene e reicarnazioni, l’evidenza è totalmente aneddotica a non possibile preparare situazioni che prevedano l’accadimento di tali fenomeni su richiesta. La seconda categoria, the riguarda questo studio, include situazioni che accadono su richiesta.
Questa categoria include abilità quali telepatia, chiaroveggenza o precognizione, la possibilità di guarigioni a distanza con la preghiera) p. es. Sichier e al., 1998), a cosi via. II tema comune a che tali fenomeni possono essere richiesti in esperimenti che hanno un controllo casuale degli stessi, e risultati possono essere misurate e comparati a quelli che ci si sarebbe aspettati con accadimenti casuali.
Questo è il tipo di situazioni per cui i metodi statistici sono generalmente applicabili.

2. La statistica ed il Processo Scientifico
All’interno di questo scritto i termini “statistici” e “metodi statistici” sono utilizzati nella loro definizione standard e comprendono: il progetto, la raccolta dei dati e l’analisi degli studi includendo la ripetizione casuale o variabili naturali.
Una definizione standard è:

La statistica è una raccolta di procedure e principi per raccogliere e processare informazioni in modo da prendere decisioni quando si è di fronte ad incertezze. (Utts, 1999, p. 3).

Il processo scientifico è generalmente rappresentato in due fasi, una di scoperta ed una di giustificazione (p. es. Hanson 1958).
Il metodo statistico molto spesso gioca un importante ruolo nella fase di scoperta. Questi metodi sono un passo intermedio tra l’evidenza aneddotica o la speculazione teorica che conduce alla scoperta della ricerca, e alla fase di giustificazione del processo di ricerca in cui sono dimostrate le teorie elaborate e le comprensioni.
Se in medicina, in parapsicologia o in qualche altro settore in cui per lo più la ricerca è iniziata su evidenze aneddotiche, teorie basate su precedenti ricerche o analogie con altri campi di indagine suggeriscono una possibile relazione od effetto. Per esempio, ci sono stati rapporti di visioni precognitive e sogni relativi a storie completamente registrati, tali da consentire ai ricercatori di riprodurre gli effetti precognitivi in laboratorio.
In Medicina, la teoria suggerirebbe che l’aspirina o medicine simili, potrebbero aiutare a ridurre la possibilità di attacchi cardiaci in quanto queste tendono a fluidificare il sangue.
Così i ricercatori hanno progettato esperimenti controllati a caso per comparare l’uso di medicine tipo aspirina a placebo allo scopo di ridurre l’occorrenza di malattie vascolari.
In ogni caso la fase di giustificazione della ricerca seguirebbe soltanto dopo la formulazione di ragionevoli teorie basate sui risultati statistici della fase di scoperta.
Per esempio la fase di scoperta della riduzione di attacchi cardiaci dopo l’assunzione costante di aspirina ha incluso una varietà di studi usando diversi dosaggi o composizioni di medicine, su diversi tipi di malattie vascolari e livelli di salute, e così via. La fase di giustificazione seguirà dopo che sarà stata accumulata una sufficiente evidenza da consentire la speculazione circa le cause fisiologiche e sarà basata principalmente su conoscenze biochimiche piuttosto che su metodi statistici.
La fase dì scoperta della ricerca nelle precognizioni condurrebbe ad una modifica delle teorie, che invece potrebbero essere consolidate nella fase di giustificazione. Questa distinzione illustra un punto importante circa i metodi statistici, e cioè che questi non possono essere utilizzati per dare prove definitive.
C’è sempre un elemento di incertezza nei risultati basati sui metodi statistici.
Questi risultati possono suggerire percorsi causali, ma non possono verificarli in modo esaustivo.

3. Perché l’uso della statistica
Sembra essere una errata concezione tra alcuni scienziati circa il ruolo dei metodi statistici nella scienza e in modo specifico circa le situazioni in cui tali metodi sono più utili. Tale erra concezione è stata utilizzata in alcune circostanze per negare l’evidenza di fenomeni anomali.
Per es. Hyman, sulla sua rivista del governo americano relativa ai programmi di visioni a distanza, scrisse:

Soltanto la parapsicologia si dichiara scienza sulla base di fenomeni la cui presenza può essere trovata rigettando una ipotesi nulla

Questo è il ruolo della statistica per identificare e quantificare importanti effetti e relazioni prima che sia trovata qualsiasi spiegazione, ed uno dei mezzi più comuni per arrivare a questo è l’uso di dati empirici per rigettare una “ipotesi nulla”, cioè che non c’è alcuna relazione o alcun effetto.
Il metodo statistico ha valore soltanto in situazioni in cui non è possibile una esatta replica della situazione oggetto di studio.
Nei casi in cui la statistica viene applicata in medicina ed anche se c’è una spiegazione fisiologica legata ai risultati, la naturale differenza tra un essere umano e l’altro, o altri sistemi di confronto, determina una naturale variabilità sui risultati ottenuti.
Per esempio, una particolare medicina può abbassare la pressione del sangue per reazioni note, ma non riesce ad abbassare la pressione della stessa quantità su tutti gli individui, o avere il preciso effetto ogni giorno sulla stessa persona.
I metodi statistici quindi sono progettati per misurare ed incorporare le naturali variabili fra individui per determinare quale relazione o sviluppo mantenere per aggregare i risultati o determinare una media.
Alcuni esempio sui quali stabilire che l’uso del metodo statistico è o non è utile:
Non è chiaramente utile per determinare la relazione che si ottiene ogni volta che si chiudono gli occhi se c’è un soffio d’aria diretto o se un libro cadrà se lo lasci a “mezz’aria”
E’ utile per indicare l’esistenza di una relazione od effetto che non si determina ogni volta o su ogni singolo individuo e che non ha già avuto una spiegazione causale. Per esempio, che l’uso dell’aspirina riduca il rischio di attacchi cardiaci era stato già provato oltre dieci anni fa, ma soltanto recentemente sono state studiate spiegazioni causali.
Per riassumere dove qualche volta la ricerca scientifica inizia con una teoria causale e procede alla sua verifica con dei dati, i metodi statistici sono molto più efficaci in situazioni dove il processo avviene in modo contrario.
Il seguito di questo articolo discute in dettaglio tale processo.

4. Cosa costituisce l’evidenza statistica?
I due metodi più comuni utilizzati per singoli studi sono il “test per ipotesi” e gli “intervalli di confidenza”.
Questi due metodi applicati per ogni singolo studio sono stati praticati in modo standard per alcuni decenni. Solo recentemente si è sviluppata la tendenza ad utilizzare metodi statistici per esaminare evidenza accumulata su molti studi fatti sullo stesso argomenti. infatti la recente tendenza di studio si rivolge ad analisi quantitative, al contrario delle analisi qualitative e soggettive del passato.
Il metodo di analisi quantitativo è chiamato “Meta-analisi”.
Attualmente sono in corso dibattiti sulla capacità della meta-analisi di fornire migliore evidenza di risultati quantitativi verso quelli ottenuti su un ampio e ben sviluppato studio su un unico argomento.
La replica è il cuore di ogni scienza che fa affidamento sull’evidenza poiché ogni singolo studio può avere, potenzialmente, falle nascoste che provoca risultati spuri. ( per esempio gli esperimenti replicati sulla fusione a freddo). Comunque il significato della ripetizione è differente se relativo a studi su un sistema vivente, che richiede metodi statistici inferenziali, o se applicata a studi che si suppone abbiano un risultato fissato e prevedibile.
Se la variabilità naturale è piccola e la relazione o la differenza è forte allora potrebbero emergere risultati similari per ogni studio. Ma quando la variabilità è ampia, la relazione è debole o l’effetto è raro, la variabilità potrebbe mascherare la relazione in tutti gli studi tranne che negli enormi studi. (per esempio il cancro ai polmoni sviluppato da fumatori e non) un effetto o una relazione.
Numericamente in questo caso il potere è 1-ß ß rappresenta la probabilità di non riscontrare un effetto reale quando esso esista.
Il potere di un test è anche strettamente legato al tipo di grandezza del test stesso. Un esempio molto grande fornisce un test abbastanza potente da rigettare l’ipotesi nulla anche quando l’effetto è molto piccolo. Per contro, un piccolo esempio ha un potere molto ristretto per rigettare l’ipotesi nulla anche se l’effetto è moderatamente grande.
Per esempio, uno studio molto ampio condotto dal Comitato Dei Physicians’ Health Study Research Group (1988) ha rilevato l’incidenza di attacchi cardiaci su una gamma di 22.071 uomini che, divisi in gruppi in modo causale, prendevano sia aspirina che placebo a giorni per cinque anni.
L’ipotesi nulla era che prendendo aspirina non si evidenziavano effetti diversi sull’incidenza di attacchi cardiaci dal prendere un placebo.
L’ipotesi alternativa era che prendendo aspirina c’era un impatto sull’incidenza di attacchi cardiaci. Ci furono 17,13 attacchi cardiaci su 1000 uomini appartenenti ad uno dei gruppi che prendeva il placebo ma soltanto 9,42 attacchi su 1000 uomini appartenenti ad uno dei gruppi che prendeva aspirina.
Il p-value per questo tipo di studio era estremamente piccolo, e mostrava che se non c’era un reale impatto nel prendere aspirina, una differenza tanto grande come quella osservata in questo studio sarebbe estremamente difficile da rilevare in uno studio con 22,071 partecipanti.
(da notare che fermare uno studio prima è statisticamente non giustificato perchè questo potrebbe essere fermato in un momento favorevole alla ipotesi alternativa. Questo “blocco opzionale” era una base di critica per i primi esperimenti di parapsicologia.
Comunque, fatti etici a volte superano fatti statistici nei percorsi della medicina..).


Iscriviti alla Newsletter

Classifica 30 Articoli più letti sul sito