Per una persona che viene da un non-statistici di sfondo più confusa aspetto di statistiche, sono sempre fondamentali della statistica test, e quando utilizzare. Questo post del blog è un tentativo di segnare la differenza tra i test più comuni, l’uso di ipotesi di valore nullo in questi test e delineando le condizioni in cui un particolare test deve essere utilizzato.,
Prima di avventurarci sulla differenza tra i diversi test, dobbiamo formulare una chiara comprensione di cosa sia un’ipotesi nulla. Un’ipotesi nulla, propone che non esista alcuna differenza significativa in un insieme di osservazioni date. Ai fini di questi test in generale
Null: Dati due mezzi campione sono uguali
Alternate: Dati due mezzi campione non sono uguali
Per rifiutare un’ipotesi nulla, viene calcolata una statistica del test. Questo test-statistica viene quindi confrontato con un valore critico e se si trova ad essere maggiore del valore critico l’ipotesi viene respinta., “Nelle basi teoriche, i test di ipotesi si basano sulla nozione di regioni critiche: l’ipotesi nulla viene respinta se la statistica del test cade nella regione critica. I valori critici sono i confini della regione critica. Se il test è unilaterale (come un test χ2 o un test t unilaterale) allora ci sarà solo un valore critico, ma in altri casi (come un test t bilaterale) ce ne saranno due”.,
Valore critico
Un valore critico è un punto (o punti) sulla scala della statistica del test oltre il quale rifiutiamo l’ipotesi nulla e deriva dal livello di significatività α del test. Il valore critico può dirci, qual è la probabilità di due mezzi campione appartenenti alla stessa distribuzione. Maggiore, il valore critico significa minore la probabilità di due campioni appartenenti alla stessa distribuzione. Il valore critico generale per un test a due code è 1,96, che si basa sul fatto che il 95% dell’area di una distribuzione normale è entro 1.,96 deviazioni standard della media.
I valori critici possono essere utilizzati per eseguire test di ipotesi nel modo seguente
1. Calcola la statistica di prova
2. Calcolare i valori critici in base al livello di significatività alfa
3. Confronta la statistica del test con i valori critici.
Se la statistica del test è inferiore al valore critico, accettare l’ipotesi o rifiutare l’ipotesi., Per verificare come calcolare un valore critico in dettaglio, controllare
Prima di andare avanti con diversi test statistici è imperativo capire la differenza tra un campione e una popolazione.
Nelle statistiche “popolazione” si riferisce all’insieme totale di osservazioni che possono essere fatte. Per esempio, se vogliamo calcolare l’altezza media degli esseri umani presenti sulla terra,” popolazione “sarà il”numero totale di persone effettivamente presenti sulla terra”.,
Un campione, d’altra parte, è un insieme di dati raccolti / selezionati da una procedura predefinita. Per il nostro esempio sopra, sarà un piccolo gruppo di persone selezionate casualmente da alcune parti della terra.
Per trarre inferenze da un campione convalidando un’ipotesi è necessario che il campione sia casuale.
Ad esempio, nel nostro esempio sopra se selezioniamo persone casualmente da tutte le regioni(Asia, America, Europa, Africa ecc.,)sulla terra, la nostra stima sarà vicina alla stima effettiva e può essere assunta come media campionaria, mentre se effettuiamo la selezione diciamo solo dagli Stati Uniti, la nostra stima dell’altezza media non sarà accurata ma rappresenterebbe solo i dati di una particolare regione (Stati Uniti). Tale campione viene quindi chiamato campione parziale e non è un rappresentante della “popolazione”.
Un altro aspetto importante da capire nelle statistiche è la “distribuzione”., Quando la” popolazione ” è infinitamente grande è improbabile convalidare qualsiasi ipotesi calcolando il valore medio o i parametri di test sull’intera popolazione. In tali casi, si presume che una popolazione sia di un certo tipo di distribuzione.
Le forme più comuni di distribuzioni sono Binomiali, Poisson e Discrete., Tuttavia, ci sono molti altri tipi che sono menzionati in dettaglio
La determinazione del tipo di distribuzione è necessario determinare il valore critico e test a scelta per convalidare le ipotesi
Ora, quando ci sono chiare sulla popolazione, campione, e di distribuzione, siamo in grado di andare avanti per capire i diversi tipi di test e la distribuzione di tipi per cui vengono utilizzati.,
Relazione tra p-value, critical value e test statistic
Come sappiamo il valore critico è un punto oltre il quale rifiutiamo l’ipotesi nulla. Il valore P d’altra parte è definito come la probabilità a destra della rispettiva statistica (Z, T o chi). Il vantaggio dell’uso del valore p è che calcola una stima di probabilità, possiamo testare a qualsiasi livello di significatività desiderato confrontando questa probabilità direttamente con il livello di significatività.
Per esempio, assumere il valore Z per un particolare esperimento risulta essere 1.67 che è maggiore del valore critico al 5% che è 1.,64. Ora per verificare un diverso livello di significatività dell ‘ 1% è necessario calcolare un nuovo valore critico.
Tuttavia, se calcoliamo il valore p per 1.67, diventa 0.047. Possiamo usare questo valore p per rifiutare l’ipotesi al livello di significatività del 5% da 0.047 < 0.05. Ma con un livello di significatività più rigoroso dell ‘ 1% l’ipotesi sarà accettata da 0.047 > 0.01. Punto importante da notare qui è che non v’è alcun doppio calcolo richiesto.
Z-test
In un z-test, si presume che il campione sia normalmente distribuito., Un punteggio z viene calcolato con parametri di popolazione come “media della popolazione” e” deviazione standard della popolazione ” e viene utilizzato per convalidare l’ipotesi che il campione prelevato appartenga alla stessa popolazione.,
Null: la media del Campione è la stessa come la media della popolazione.
Alternativo: media del Campione non è uguale alla media della popolazione.
Le statistiche utilizzate per questo test di ipotesi è chiamato z-statistic, il punteggio è calcolato come
z = (x — µ) / (s / √n), dove
x= media del campione
µ = popolazione media
s / √n = deviazione standard della popolazione
Se la statistica test è inferiore al valore critico, accettare l’ipotesi oppure rifiutare l’ipotesi
T-test
Un t-test viene utilizzato per confrontare la media dei due campioni., Come un test z, anche un test t presuppone una distribuzione normale del campione. Un test t viene utilizzato quando i parametri di popolazione (media e deviazione standard) non sono noti.
Esistono tre versioni di t-test
1. Campioni indipendenti t-test che confronta media per due gruppi
2. Campione accoppiato t-test che confronta i mezzi dello stesso gruppo in tempi diversi
3. Un campione t-test che verifica la media di un singolo gruppo contro una media nota.,
La statistica per questo test di ipotesi è chiamato t-statistic, il punteggio è calcolato come
t = (x1 — x2) / (s / √n1 + s / √n2), dove
x1 = media del campione 1
x2 = media del campione 2
n1 = dimensione del campione 1
n2 = dimensione del campione 2
Ci sono più variazioni di t-test che vengono descritti in dettaglio qui
ANOVA
ANOVA, noto anche come l’analisi della varianza, viene utilizzato per confrontare multiplo (tre o più) campioni con un singolo test. Ci sono 2 sapori principali di ANOVA
1., ANOVA unidirezionale: viene utilizzato per confrontare la differenza tra i tre o più campioni/gruppi di una singola variabile indipendente.
2. MANOVA: MANOVA ci permette di testare l’effetto di una o più variabili indipendenti su due o più variabili dipendenti. Inoltre, MANOVA può anche rilevare la differenza di co-relazione tra variabili dipendenti dati i gruppi di variabili indipendenti.
L’ipotesi testata in ANOVA è
Null: tutte le coppie di campioni sono uguali, cioè, tutti i mezzi di campionamento sono uguali
Alternate: Almeno una coppia di campioni è significativamente diversa
Le statistiche utilizzate per misurare il significato, in questo caso, sono chiamate F-statistics. Il valore F viene calcolato utilizzando la formula
F= ((SSE1 — SSE2)/ m)/SSE2/n-k, dove
SSE = somma residua di quadrati
m = numero di restrizioni
k = numero di variabili indipendenti
Ci sono più strumenti disponibili come SPSS, pacchetti R, Excel ecc. per eseguire ANOVA su un dato campione.,
Test Chi-Quadrato
Il test Chi-quadrato viene utilizzato per confrontare le variabili categoriali. Esistono due tipi di test chi-quadrato
1. Bontà del test di adattamento, che determina se un campione corrisponde alla popolazione.
2. Un test di adattamento chi-quadrato per due variabili indipendenti viene utilizzato per confrontare due variabili in una tabella di contingenza per verificare se i dati si adattano.
a. Un piccolo valore chi-quadrato significa che i dati si adattano
b. Un valore chi-quadrato alto significa che i dati non si adattano.,
L’ipotesi testata per il chi-quadrato è
Null: la variabile A e la Variabile B sono indipendenti
Alternate: la variabile A e la Variabile B non sono indipendenti.
La statistica utilizzata per misurare il significato, in questo caso, è chiamata statistica chi-quadrato., La formula utilizzata per il calcolo della statistica
Χ2 = Σ dove
O,c = frequenza osservata contare a livello r della Variabile A e c a livello della Variabile B
Er,c = frequenza prevista per contare a livello r della Variabile A e c a livello della Variabile B
Nota: Come si può vedere dagli esempi di cui sopra, in tutte le prove una statistica viene confrontato con un valore critico per accettare o rifiutare una ipotesi., Tuttavia, la statistica e il modo di calcolarlo differiscono a seconda del tipo di variabile, del numero di campioni analizzati e se i parametri della popolazione sono noti. Quindi, a seconda di tali fattori, viene scelto un test adatto e un’ipotesi nulla.
Questo è il punto più importante che ho notato, nei miei sforzi per conoscere questi test e trovarlo strumentale nella mia comprensione di questi concetti statistici di base.
Disclaimer
Questo post si concentra molto sui dati normalmente distribuiti., Z-test e t-test possono essere utilizzati per i dati che non sono normalmente distribuiti pure se la dimensione del campione è maggiore di 20, tuttavia ci sono altri metodi preferibili da utilizzare in tale situazione. Si prega di visitare http://www.statisticshowto.com/probability-and-statistics/non-normal-distributions/ per maggiori informazioni sui test per distribuzioni non normali.
Riferimento
2. http://blog.minitab.com/blog/adventures-in-statistics-2/understanding-analysis-of-variance-anova-and-the-f-test
3. http://www.statisticshowto.com/p-value/
4. http://www.statisticshowto.com/probability-and-statistics/chi-square/
5. http://stattrek.com/chi-square-test/independence.aspx?Tutorial=AP
6. https://www.investopedia.com/terms/n/null_hypothesis.asp
7. https://math.stackexchange.com/questions/1732178/help-understanding-difference-in-p-value-critical-value-results