Introduzione alla teoria della verifica di ipotesi statistiche (test statistici)
L'obiettivo di queste tecniche statistiche è quello di verificare,
in termini probabilistici, se una certa affermazione relativa ad una o più popolazioni è
da ritenersi vera sulla base dei dati campionari. Questo viene realizzato convertendo
le affermazioni in un sistema di ipotesi composto dall'
ipotesi nulla
(H0) e dall'
ipotesi alternativa (H1).
Se per esempio si vuole verificare che il valore di un parametro corrisponda a quello da
noi ipotizzato un sistema di ipotesi utile a tale scopo portebbe essere:
H0 :
H1 :
L'ipotesi H
1 dell'esempio viene detta
semplice in quanto fissa
un unico valore per il parametro studiato. Nel caso ne fissi più di uno viene invece chiamata
composta e può essere ulteriormente classificata in
monodirezionale e
bidirezionale.
Verrà considerata monodirezionale quando si controllerà soltanto una coda della distribuzione, viceversa
quando verranno controllate entrambe le code sarà invece bidirezionale.
H0 :
|
|
H1 :
|
Ipotesi semplice |
H1 :
|
Ipotesi composta monodirezionale |
H1 :
|
Ipotesi composta monodirezionale |
H1 :
|
Ipotesi composta bidirezionale |
Definito il sistema di ipotesi si deciderà qual'è il test statistico più appropriato per verificare
l'ipotesi nulla. Supposta verà H
0 si potrà allora calcolare il valore della
statistica test in tale condizione e questo esprimerà la probabilità associata agli eventi osservati.
Sarà quindi logico non rifiutare H
0 se la probabilità è alta, mentre al contrario
sarà naturale rifiutarla nel caso in cui la probabilità sia bassa.
Diventa allora chiaro che un test statistico crea sostanzialmente una bipartizione dello spazio campionario;
vengono così definite la
regione di accettazione e la
regione di rifiuto dell'ipotesi nulla. In
altre parole se il valore campionario
y appartiene alla regione di accettazione si concluderà che
H
0 è sostenuta dai dati sperimentali e la accetteremo, viceversa se
y
appartiene alla regione di rifiuto si deciderà per il rifiuto dell'ipotesi nulla.
Bisogna comunque ricordare che la decisione che stiamo valutando è basata sulle leggi della probabilità
ciò significa che la decisione non è mai certa e di conseguenza non bisognerà aspettarsi che il test
si infallibile. Può infatti accadere che sebbene H
0 sia vera il campione estratto
sostenga la scelta dell'ipotesi alternativa; si commette così una errore di
I tipo. Va inoltre
ricordato che può anche accadere che l'ipotesi H
1 sia vera e l'evidenza campionaria
porti alla scelta di non rifiutare l'ipotesi nulla; si commette in questo modo un errore di
II tipo.
E' chiaro allora che l'obiettivo è quello di scegliere la bipartizione dello spazio campionario che rende
entrambi gli errori poco probabili. Sfortunatamente è possibile dimostrare che non è possibile diminuire la
probabilità associata ad un tipo di errore senza aumentarne quella associata all'altro.
Riassumendo dopo aver scelto il test più opportuno per lo studio che si sta compiendo e averne calcolato il
valore sotto l'ipotesi nulla è necessario determinare le regioni di accettazione e rifiuto cercando di
rendere minima la probabilità di commettere errori. Seguendo l'impostazione "classica" o di Neyman-Pearson
il problema può essere risolto fissando la probabilità massima di commettere l'errore di I tipo cercando
contemporaneamente di minimizzare quella associata all'altro errore. Tale valore viene solitamente
indicato con

e rappresenta il
livello di
significatività del test utilizzato.
Se consideriamo un test con ipotesi bidirezionali e ne rappresentiamo la sua distribuzione di probabilità
sotto l'ipotesi H
0 otterremmo le seguenti regioni di accettazioni e rifiuto:
Procedimento generale
| - |
Formulare l'ipotesi nulla e l'eventuale ipotesi alternativa (prima di esaminare il campione).
|
| - |
Individuare il test statistico più appropriato per saggiare l'ipotesi nulla.
|
| - |
Scegliere il livello di significatività e ampiezza del campione.
|
| - |
Trovare la distribuzione teorica del test statistico sotto l'ipotesi nulla.
|
| - |
Stabilire la zona di rifiuto.
|
| - |
Calcolare il valore del test statistico sulla base dei dati sperimentali, stimando il
valore di probabilità ad esso associato.
|
| - |
Se la probabilità è superiore a quella tabulata, non si può rifiutare H0; se la
probabilità è inferiore a quella tabulata, si rifiuta H0 ossia si accetta
H1.
|