statistiska tester – när ska man använda vilka ?

för en person som kommer från en icke-statistisk bakgrund är den mest förvirrande aspekten av statistiken alltid den grundläggande statistiska tester, och när man ska använda vilken. Detta blogginlägg är ett försök att markera skillnaden mellan de vanligaste testerna, användningen av nollvärdehypotesen i dessa tester och beskriva de förhållanden under vilka ett visst test ska användas.,

innan vi vågar på skillnaden mellan olika tester måste vi formulera en tydlig förståelse för vad en nollhypotes är. En nollhypotes föreslår att det inte finns någon signifikant skillnad i en uppsättning givna observationer. För dessa tester i allmänhet

Null: givet två provmedel är lika

alternativ: givet två provmedel är inte lika

för att avvisa en nollhypotes beräknas en teststatistik. Denna teststatistik jämförs sedan med ett kritiskt värde och om det visar sig vara större än det kritiska värdet avvisas hypotesen., ”I den teoretiska grunden bygger hypotesprov på begreppet kritiska regioner: nollhypotesen avvisas om teststatistiken faller i den kritiska regionen. De kritiska värdena är gränserna för den kritiska regionen. Om testet är ensidigt (som ett χ2-test eller ett ensidigt t-test) kommer det bara att finnas ett kritiskt värde, men i andra fall (som ett tvåsidigt t-test) kommer det att finnas två”.,

kritiskt värde

ett kritiskt värde är en punkt (eller punkter) på skalan av teststatistiken bortom vilken vi avvisar nollhypotesen, och härleds från testets nivå av betydelse α. Kritiskt värde kan berätta för oss, vad är sannolikheten för två provmedel som tillhör samma fördelning. Högre betyder det kritiska värdet lägre sannolikheten för två prover som tillhör samma fördelning. Det allmänna kritiska värdet för ett tvåsvansat test är 1,96, vilket bygger på det faktum att 95% av området för en normalfördelning ligger inom 1.,96 standardavvikelser för medelvärdet.

kritiska värden kan användas för att göra hypotesprovning på följande sätt

1. Beräkna teststatistiken

2. Beräkna kritiska värden baserat på signifikansnivå alfa

3. Jämför teststatistiken med kritiska värden.

om teststatistiken är lägre än det kritiska värdet, Acceptera hypotesen eller avvisa hypotesen., För att kontrollera hur man beräknar ett kritiskt värde i detalj, kontrollera

innan vi går vidare med olika statistiska tester är det absolut nödvändigt att förstå skillnaden mellan ett prov och en population.

i statistiken ”population” avser den totala uppsättningen observationer som kan göras. För t. ex., om vi vill beräkna den genomsnittliga höjden av människor som finns på jorden,” population ”kommer att vara”det totala antalet människor som faktiskt finns på jorden”.,

ett prov är å andra sidan en uppsättning data som samlas in/väljs från en fördefinierad procedur. För vårt exempel ovan kommer det att vara en liten grupp människor som väljs slumpmässigt från vissa delar av jorden.

för att dra slutsatser från ett prov genom att validera en hypotes är det nödvändigt att provet är slumpmässigt.

till exempel i vårt exempel ovan om vi väljer människor slumpmässigt från alla regioner(Asien, Amerika, Europa, Afrika etc.,) på jorden kommer vår uppskattning att ligga nära den faktiska uppskattningen och kan antas som ett provmedel, medan om vi gör urval låt oss bara säga från USA, kommer vår genomsnittliga höjd uppskattning inte att vara korrekt men skulle bara representera data från en viss region (USA). Ett sådant prov kallas sedan ett partiskt prov och är inte representativt för ”befolkning”.

en annan viktig aspekt att förstå i statistiken är ”distribution”., När ”population” är oändligt stor är det osannolikt att validera någon hypotes genom att beräkna medelvärdet eller testparametrarna på hela befolkningen. I sådana fall antas en population vara av någon typ av distribution.

de vanligaste formerna av distributioner är Binomial, Poisson och diskret., Det finns dock många andra typer som nämns i detalj på

bestämningen av distributionstyp är nödvändig för att bestämma det kritiska värdet och testet som ska väljas för att validera någon hypotes

Nu, när vi är tydliga på befolkning, prov och distribution kan vi gå vidare för att förstå olika typer av test och de distributionstyper för vilka de används.,

förhållandet mellan p-värde, kritiskt värde och teststatistik

som vi vet är kritiskt värde en punkt bortom vilken vi avvisar nollhypotesen. P-värde å andra sidan definieras som sannolikheten till höger om respektive statistik (Z, T eller chi). Fördelen med att använda p-värde är att det beräknar en sannolikhetsuppskattning, vi kan testa på önskad nivå av betydelse genom att jämföra denna sannolikhet direkt med signifikansnivån.

För t. ex. antar Z-värde för ett visst experiment kommer ut att vara 1,67 som är större än det kritiska värdet vid 5% vilket är 1.,64. Nu för att kontrollera en annan signifikansnivå på 1% ska ett nytt kritiskt värde beräknas.

men om vi beräknar p-värde för 1,67 kommer det att bli 0,047. Vi kan använda detta p-värde för att avvisa hypotesen på 5% signifikansnivå sedan 0.047 < 0.05. Men med en strängare signifikansnivå på 1% kommer hypotesen att accepteras sedan 0.047 > 0.01. Viktig punkt att notera här är att det inte finns någon dubbel beräkning krävs.

Z-test

i ett z-test antas provet normalt distribueras., En z-poäng beräknas med populationsparametrar som ”population mean” och ”population standardavvikelse” och används för att validera en hypotes att provet som dras tillhör samma population.,

Null: Sample mean is same as the population mean

Alternate: Sample mean is not same as the population mean

den statistik som används för denna hypotesprovning kallas z-statistisk, vars poäng beräknas som

z = (x — μ) / (σ / √n), där

X= sample mean

μ = population mean

σ / √n = population standardavvikelse

X = sample mean

p >

om teststatistiken är lägre än det kritiska värdet, Acceptera hypotesen eller avvisa hypotesen

t-test

ett T-test används för att jämföra medelvärdet av två givna prover., Som ett z-test förutsätter ett t-test också en normal fördelning av provet. Ett T-test används när populationsparametrarna (medel-och standardavvikelse) inte är kända.

det finns tre versioner av T-test

1. Oberoende prov t-test som jämför medelvärdet för två grupper

2. Parat prov t-test som jämför medel från samma grupp vid olika tidpunkter

3. Ett prov t-test som testar medelvärdet av en enda grupp mot ett känt medelvärde.,

statistiken för denna hypotesprovning kallas T-statistik, vars poäng beräknas som

t = (x1 — x2) / (σ / √N1 + σ / √N2), där

x1 = medelvärde för prov 1

x2 = medelvärde för Prov 2

N1 = storlek för prov 1

N2 = storlek på prov 2

det finns flera varianter av T-test som förklaras i detalj här

anova

ANOVA, även känd som variansanalys, används för att jämföra flera (tre eller fler) prover med ett enda test. Det finns 2 stora smaker av ANOVA

1., Envägsanova: det används för att jämföra skillnaden mellan de tre eller flera proverna/grupperna av en enda oberoende variabel.

2. MANOVA: manova tillåter oss att testa effekten av en eller flera oberoende variabler på två eller flera beroende variabler. Dessutom kan MANOVA också upptäcka skillnaden i samförhållande mellan beroende variabler med tanke på grupperna av oberoende variabler.

hypotesen som testas i ANOVA är

Null: alla par av prover är samma dvs, alla urvalsmedel är lika

alternativ: minst ett par prover är signifikant olika

statistiken som används för att mäta betydelsen kallas i detta fall F-statistik. F-värdet beräknas med formeln

f= ((SSE1 — SSE2)/m)/ sse2/n-k, där

SSE = restsumma av rutor

m = antal begränsningar

k = antal oberoende variabler

det finns flera verktyg som SPSS, R-paket, Excel etc. att utföra ANOVA på ett givet prov.,

Chi-Square Test

Chi-square test används för att jämföra kategoriska variabler. Det finns två typer av chi-square test

1. Godhet fit test, som avgör om ett prov matchar befolkningen.

2. Ett chi-square fit-test för två oberoende variabler används för att jämföra två variabler i en beredskapstabell för att kontrollera om data passar.

a. ett litet chi-square-värde innebär att data passar

b. ett högt chi-square-värde innebär att data inte passar.,

hypotesen som testas för chi-square är

Null: variabel A och variabel B är oberoende

alternativ: variabel A och variabel B är inte oberoende.

den statistik som används för att mäta betydelse kallas i detta fall chi-square statistik., Den formel som används för att beräkna statistiken är

Χ2 = Σ där

eller,C = observerat frekvensantal vid nivå r för variabel A och nivå C för variabel b

Er,C = förväntat frekvensantal vid nivå r för variabel A och nivå C för variabel b

Obs: som man kan se av ovanstående exempel jämförs en statistik i alla tester med ett kritiskt värde för att acceptera eller avvisa en hypotes., Statistiken och sättet att beräkna den skiljer sig emellertid beroende på typen av variabel, antalet prover som analyseras och om populationsparametrarna är kända. Således väljs en lämplig test-och nollhypotes beroende på sådana faktorer.

detta är den viktigaste punkten som jag har noterat, i mina ansträngningar att lära mig om dessa tester och hitta den som är avgörande för min förståelse för dessa grundläggande statistiska begrepp.

ansvarsfriskrivning

det här inlägget fokuserar starkt på normalt distribuerade data., Z-test och t-test kan användas för data som inte normalt distribueras också om provstorleken är större än 20, men det finns andra föredragna metoder att använda i en sådan situation. Besök http://www.statisticshowto.com/probability-and-statistics/non-normal-distributions/ för mer information om tester för icke normala distributioner.

referens

2. http://blog.minitab.com/blog/adventures-in-statistics-2/understanding-analysis-of-variance-anova-and-the-f-test

3. http://www.statisticshowto.com/p-value/

4. http://www.statisticshowto.com/probability-and-statistics/chi-square/

5. http://stattrek.com/chi-square-test/independence.aspx?Tutorial=AP

6. https://www.investopedia.com/terms/n/null_hypothesis.asp

7. https://math.stackexchange.com/questions/1732178/help-understanding-difference-in-p-value-critical-value-results

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *