For en person som fra en ikke-statistisk bakgrunn i de mest forvirrende aspekt av statistikk, er alltid den grunnleggende statistiske tester, og når du skal bruke hvor. Denne bloggen er et forsøk på å markere forskjellen mellom de mest vanlige tester, bruk av null-hypotesen i disse testene, og skisserte under hvilke vilkår en bestemt test bør brukes.,
Før vi går på forskjellen mellom forskjellige tester, trenger vi å formulere en klar forståelse av hva en null-hypotese. En null-hypotese, foreslår at ingen signifikant forskjell i et sett av gitte observasjoner. For hensikten med disse testene generelt
Null: Gitt to eksempel betyr er lik
Alternativ: Gitt to eksempel betyr ikke lik
For å avvise en null-hypotesen, testen statistikken er beregnet. Denne test-statistikken er så sammenlignet med en kritisk verdi og hvis det viser seg å være større enn den kritiske verdien hypotesen blir forkastet., «I det teoretiske grunnlaget, tester hypotesen er basert på oppfatningen av kritiske områder: nullhypotesen blir forkastet hvis teststatistikk faller i den kritiske regionen. De kritiske verdiene er grensene av den kritiske regionen. Hvis testen er en-sidig (som en χ2-test eller en ensidig t-test) så vil det bare være ett kritisk verdi, men i andre tilfeller (som en to-sidig t-test) det vil være to».,
Kritisk Verdi på
En kritisk verdi er et punkt (eller poeng) på skalaen av teststatistikk utover som forkaster vi nullhypotesen, og er avledet fra det nivået av betydning α av testen. Kritisk verdi kan fortelle oss, hva er sannsynligheten for to eksempel betyr å tilhøre den samme fordelingen. Høyere, kritisk verdi betyr lavere sannsynlighet for to prøver som hører til samme fordeling. Den generelle kritiske verdien for en to-tailed testen er 1.96, som er basert på det faktum at 95% av arealet av en normal fordeling er innen 1.,96 standardavvik over gjennomsnittet.
Kritiske verdier kan brukes til å gjøre hypotesetesting på følgende måte
1. Beregne test statistikk
2. Beregne kritiske verdier basert på betydningen nivå alfa
3. Sammenligne test-statistikken med kritiske verdier.
Hvis testen statistikk er lavere enn den kritiske verdien, akseptere hypotesen eller annet avvise hypotese., For å sjekke ut hvordan å beregne en kritisk verdi i detalj vennligst sjekk
Før vi går frem med ulike statistiske tester er det viktig å forstå forskjellen mellom en prøve og en befolkning.
I statistikk «befolkningen» refererer til det totale sett av observasjoner som kan gjøres. For eksempel, hvis vi ønsker å beregne gjennomsnittlig høyde av mennesker til stede på jorden, «befolkning» vil være den «totale antall mennesker faktisk er til stede på jorden».,
Et eksempel, på den annen side, er et sett av data som samles inn/valgt fra en pre-definert prosedyre. For vårt eksempel ovenfor, vil det være en liten gruppe av personer valgt tilfeldig fra noen deler av verden.
for Å trekke slutninger fra et utvalg ved å bekrefte en hypotese det er nødvendig at utvalget er tilfeldig.
For eksempel, i vårt eksempel ovenfor hvis vi velger folk tilfeldig fra alle områder(Asia, Amerika, Europa, Afrika etc.,)på jorden, vårt estimat vil være nær den faktiske estimat som kan antas som et eksempel mener, men hvis vi gjør utvalget la oss bare si fra Usa, så vår gjennomsnittlig høyde estimat vil ikke være nøyaktig, men ville bare representere data i et bestemt område (Usa). Et slikt eksempel er da kalles et skjevt utvalg og er ikke en representant for «befolkningen».
et Annet viktig aspekt for å forstå i statistikken er «distribusjon»., Når «befolkningen» er uendelig stort at det er umulig å validere alle hypotesen ved å beregne middelverdien eller test-parametere på hele befolkningen. I slike tilfeller, en befolkning er antatt å være av en viss type distribusjon.
De mest vanlige former for utdelinger er Binomial, Poisson og Diskret., Det er imidlertid mange andre typer som er nevnt i detalj på
fastsettelse av utbredelse typen er nødvendig for å avgjøre den kritiske verdien og test for å bli valgt til å validere noen hypotese
Nå, når vi er klare på befolkningen, prøve, og distribusjon kan vi gå videre til å forstå ulike typer test og distribusjon typer som de er brukt.,
Forholdet mellom p-verdi kritisk verdi og test statistikk
Som vi vet kritisk verdi er et punkt utenfor som forkaster vi nullhypotesen. P-verdi på den annen side er definert som sannsynligheten til høyre for respektive statistikk (Z, T eller chi). Fordelen med å bruke p-verdi er at den beregner en sannsynlighet anslå, kan vi teste på ønsket nivå av betydning ved å sammenligne denne sannsynligheten direkte med betydning nivå.
For eksempel, anta at Z-verdi for en bestemt eksperiment kommer ut til å være 1.67 som er større enn den kritiske verdien på 5%, som er 1.,64. Nå for å se etter en annen betydning nivå på 1% i en ny kritisk verdi skal beregnes.
hvis vi Imidlertid beregne p-verdien for 1.67 det kommer til å bli 0.047. Vi kan bruke denne p-verdien for å avvise hypotese på 5% signifikans nivå siden 0.047 < 0.05. Men med en strengere betydning nivå på 1% hypotesen vil bli akseptert siden 0.047 > 0.01. Viktig poeng å merke seg her er at det er ingen dobbeltrom beregning nødvendig.
Z-test
I en z-test, prøve-antas å være normalfordelt., En z-score er beregnet med befolkningen parametere som «befolkningen mener» og «standardavviket» og brukes for å bekrefte en hypotese om at utvalget trukket tilhører samme bestand.,
Null: Eksempel mener er de samme som populasjonsgjennomsnitt
Alternativ: utvalgsgjennomsnitt er ikke samme som populasjonsgjennomsnitt
statistikken brukes for dette hypotesetesting er kalt z-statistikk, poengsummen som er beregnet som
z = (x — μ) / (σ / √n), hvor
x= utvalgsgjennomsnitt
μ = populasjonsgjennomsnitt
σ / √n = standardavviket
Hvis testen statistikk er lavere enn den kritiske verdien, akseptere hypotesen eller annet avvise hypotesen
T-test
En t-test er brukt for å sammenligne gjennomsnittet av to gitte prøver., Som en z-test, t-test forutsetter også en normal fordeling av prøven. En t-test er brukt når befolkningen parametre (gjennomsnitt og standardavvik) er ikke kjent.
Det er tre versjoner av t-test
1. Independent samples t-test som sammenligner bety for to grupper
2. Paired sample t-test som sammenligner midler fra den samme gruppen på forskjellige tider
3. En sample t-test som tester gjennomsnittet av en enkelt gruppe mot en kjent mener.,
statistikken for dette hypotesetesting er kalt t-statistikk, poengsummen som er beregnet som
t = (x1 — x2) / (σ / √n1 + σ / √n2), hvor
x1 = gjennomsnitt av eksempel 1
x2 = gjennomsnitt av eksempel 2
n1 = størrelse på utvalg 1
n2 = størrelse på utvalg 2
Det finnes flere varianter av t-test som er forklart i detalj her
ANOVA
ANOVA, også kjent som analyse av varians, brukes til å sammenligne flere (tre eller flere) prøver med en enkel test. Det er 2 store smaker av ANOVA
1., One-way ANOVA: Det er brukt for å sammenligne forskjellen mellom tre eller flere prøver/grupper av én uavhengig variabel.
2. MANOVA: MANOVA tillater oss å teste effekten av en eller flere uavhengige variable på to eller flere avhengige variabler. I tillegg, MANOVA kan også oppdage forskjellen i co-forhold mellom avhengige variabler gitt grupper av uavhengige variabler.
Den hypotesen som skal testes i ANOVA er
Null: Alle par av prøvene er samme dvs., alle eksempel betyr er lik
Alternativ: minst ett par av prøvene er vesentlig forskjellig
statistikken brukes til å måle betydning, i dette tilfellet, er kalt F-statistikk. F-verdien er beregnet ved hjelp av formelen
F= ((SSE1 — SSE2)/m)/ SSE2/n-k, hvor
SSE = residual sum of squares
m = antall restriksjoner
k = antall uavhengige variabler
Det finnes flere verktøy tilgjengelig, for eksempel SPSS, R pakker, Excel etc. for å gjennomføre ANOVA på en gitt prøve.,
Chi-Kvadrat-Test
Chi-kvadrat-test er brukt for å sammenligne kategoriske variabler. Det er to typer chi-kvadrat-test
1. Goodness of fit test, som avgjør om et utvalg kamper befolkningen.
2. En chi-kvadrat-fit test for to uavhengige variabler brukes til å sammenligne to variabler i en situasjon bordet for å sjekke om data passer.
en. En liten chi-kvadrat verdi betyr at data passer
b. En høy chi-kvadrat verdi betyr at data som ikke passer.,
hypotesen testes for chi-square er
Null: En Variabel og Variabel B er uavhengige
Alternativ: Variabel og En Variabel B er ikke uavhengige.
statistikken brukes til å måle betydning, i dette tilfellet, heter chi-kvadrat statistikk., Formelen som er brukt for å beregne statistikk
Χ2 = Σ hvor
Eller,c = observert frekvens teller på nivå r av Variabel A og nivå c av Variabel B
Han,c = forventet frekvens teller på nivå r av Variabel A og nivå c av Variabel B
Merk: Som man kan se av eksemplene ovenfor, i alle tester en statistikk blir sammenlignet med en kritisk verdi til å akseptere eller forkaste en hypotese., Men, statistikken og måte å beregne det forskjellig avhengig av hvilken type variabel, antall prøver som blir analysert, og hvis befolkningen parametere er kjent. Dermed avhengig av slike faktorer en passende test og nullhypotesen er valgt.
Dette er det viktigste poenget som jeg har nevnt i mine anstrengelser for å lære om disse testene, og synes det er instrumental i min forståelse av disse grunnleggende statistiske begreper.
Ansvarsfraskrivelse
Dette innlegget fokuserer tungt på normalfordelt data., Z-tester og t-test kan brukes for data som er ikke-normalfordelt så godt hvis prøven blir større enn 20, men det er andre foretrekke metoder til bruk i en slik situasjon. Vennligst besøk http://www.statisticshowto.com/probability-and-statistics/non-normal-distributions/ for mer informasjon om tester for ikke-normale fordelinger.
Referanse
2. http://blog.minitab.com/blog/adventures-in-statistics-2/understanding-analysis-of-variance-anova-and-the-f-test
3. http://www.statisticshowto.com/p-value/
4. http://www.statisticshowto.com/probability-and-statistics/chi-square/
5. http://stattrek.com/chi-square-test/independence.aspx?Tutorial=AP
6. https://www.investopedia.com/terms/n/null_hypothesis.asp
7. https://math.stackexchange.com/questions/1732178/help-understanding-difference-in-p-value-critical-value-results