tilastolliset testit – milloin käyttää mitä ?

henkilö on ei-tilastollinen tausta kaikkein hämmentävä osa tilastojen on aina olennainen tilastollisia testejä, ja kun käyttää joka. Tämä blogi on yritys merkitä eroa yleisin testit, käyttää null-arvo, hypoteesi testit, ja jossa esitetään ehdot, joilla tiettyä testiä tulisi käyttää.,

Ennen me venture ero eri testejä, meidän täytyy muotoilla selkeä käsitys siitä, mitä nollahypoteesi on. Nollahypoteesi ehdottaa, että annettujen havaintojen joukossa ei ole merkittävää eroa. Varten nämä testit yleensä

Null: Koska kahden näytteen keinoja ovat tasa-arvoisia

Varajäsen: otetaan kaksi näytettä tarkoittaa, eivät ole tasa-arvoisia

Varten hylätä nollahypoteesi, a testimuuttuja on laskettu. Tätä testi-statistiikkaa verrataan sitten kriittiseen arvoon ja jos sen todetaan olevan kriittistä arvoa suurempi, hypoteesi hylätään., ”Teoreettinen perustuksista, hypoteesi testit perustuvat käsite kriittinen alueilla: nollahypoteesi hylätään, jos testin tilastollinen tulos osuu kriittisen alueen. Kriittiset arvot ovat kriittisen alueen rajoja. Jos testi on yksipuolinen (kuten χ2-testiä tai yksisuuntaista t-testi) sitten siellä on vain yksi kriittinen arvo, mutta muissa tapauksissa (kuten kaksipuolinen t-testi) on kaksi”.,

Kriittinen Arvo

kriittinen arvo on piste (tai pisteet) asteikolla testin tilastollinen arvo, jonka jälkeen voimme hylätä nollahypoteesin, ja on johdettu merkitsevyystaso α testi. Kriittinen arvo voi kertoa, mikä on todennäköisyys kahden näytteen tarkoittaa kuulumista samaan jakaumaan. Suurempi kriittinen arvo tarkoittaa sitä, että kahden samaan jakaumaan kuuluvan näytteen todennäköisyys pienenee. Yleinen kriittinen arvo kaksi-tailed test on 1,96, joka perustuu siihen, että 95% alueen normaali jakelu on majoitusliike 1.,96 keskiarvon keskihajonnat.

Kriittisten arvojen voidaan tehdä hypoteesi, testaus seuraavalla tavalla

1. Laske testitilasto

2. Lasketaan kriittiset arvot merkitsevyystason alpha

3 perusteella. Vertaa testitilastoja kriittisiin arvoihin.

Jos testitilasto on kriittistä arvoa pienempi, hyväksy hypoteesi tai muuten hylkää hypoteesi., Tsekata miten laskea kriittinen arvo yksityiskohtaisesti, älä tarkista,

Ennen kuin siirrymme eteenpäin eri tilastollisia testejä on välttämätöntä ymmärtää ero otos ja populaatio.

tilastossa ”populaatio” tarkoittaa kokonaishavaintojen joukkoa, joka voidaan tehdä. Jos esimerkiksi haluamme laskea maan päällä olevien ihmisten keskimääräisen korkeuden, ” populaatio ”on”niiden ihmisten kokonaismäärä, jotka todellisuudessa ovat maan päällä”.,

otos taas on joukko ennalta määritellystä menettelystä kerättyjä / valittuja tietoja. Esimerkiksi edellä, se on pieni ryhmä ihmisiä valitaan satunnaisesti joissakin osissa maailmaa.

tehdä päätelmiä otoksen validointi hypoteesi on välttämätöntä, että otos on satunnainen.

esimerkiksi, esimerkissä edellä, jos me valita ihmisiä satunnaisesti kaikkia alueita(Aasia, Amerikka, Eurooppa, Afrikka jne.,)maan päällä, meidän arvio on lähellä varsinainen arvio ja voidaan olettaa, näyte tarkoittaa, että jos emme tee valinta sanotaan vain yhdysvalloista, sitten meidän keskimääräinen korkeus arvio ei ole tarkka, mutta olisi vain edustavat tiedot tietyn alueen (yhdysvallat). Tällaista otosta kutsutaan silloin puolueelliseksi otokseksi, eikä se edusta ”populaatiota”.

toinen tilastoissa ymmärrettävä tärkeä näkökohta on ”distribution”., Kun” populaatio ” on äärettömän suuri, on epätodennäköistä vahvistaa mitään hypoteesia laskemalla koko populaation keskiarvo-tai testiparametrit. Tällöin populaation oletetaan olevan tietyntyyppinen jakauma.

yleisimmät jakaumien muodot ovat binomi, Poisson ja diskreetti., Kuitenkin, on olemassa monia muita, jotka on mainittu yksityiskohtaisesti,

määrittäminen lupa on tarpeen määrittää kriittinen arvo ja testi olisi päättänyt vahvistaa mitään hypoteesi

Nyt, kun olemme varmoja, väestö -, näyte -, ja jakelu voimme siirtyä eteenpäin, ymmärtää erilaisia testi-ja jakelu-tyypit, joita varten niitä käytetään.,

p-arvon, kriittisen arvon ja testitilaston suhde

koska tiedämme kriittisen arvon olevan piste, jonka jälkeen hylkäämme nollahypoteesin. P-arvo taas määritellään todennäköisyydeksi kunkin tilaston oikealle puolelle (Z, T tai chi). Hyöty käyttämällä p-arvo on, että se laskee todennäköisyyden arvio, emme voi testata halutulla merkitsevyystasolla vertaamalla tämä todennäköisyys suoraan merkitsevyystaso.

esimerkiksi, olettaa, että Z-arvo tietylle kokeilu tulee ulos on 1.67, joka on suurempi kuin kriittinen arvo 5%, joka on 1.,64. Nyt tarkistetaan eri merkitsevyystaso 1% Uusi kriittinen arvo on laskettava.

kuitenkin, jos laskemme p-arvon 1,67, se tulee olemaan 0,047. Voimme käyttää tätä p-arvo hylätä hypoteesi 5% merkitsevyystaso, koska 0.047 < 0.05. Mutta tiukempia merkitsevyystaso 1% hypoteesi hyväksytään, koska 0.047 > 0.01. Tärkeää on huomata tässä, että ei ole olemassa kaksinkertaista laskentaa tarvitaan.

Z-testi

z-testissä näytteen oletetaan olevan normaalisti jakautunut., Z-pisteet on laskettu väestön parametrit, kuten ”väestö tarkoittaa” ja ”väestön standardi poikkeama” ja käytetään vahvistaa hypoteesi, että näyte laadittu kuuluu samaan väestöstä.,

Null: Näytteen keskiarvo on sama kuin populaation keskiarvo,

Varajäsen: Näytteen keskiarvo ei ole sama kuin populaation keskiarvo,

tilastotiedot, joita käytetään tämän hypoteesin testaus on nimeltään z-arvo, pisteet, jotka lasketaan

z = (x — µ) / (σ / √n), jossa

x= näytteen keskiarvo,

µ = populaation keskiarvo,

σ / √n = perusjoukon keskihajonta

Jos testin tilastollinen tulos on pienempi kuin kriittinen arvo, hyväksyä hypoteesi tai muuten hylätä hypoteesi,

T-testi

t-testiä käytetään vertaamaan kahden antanut näytteitä., Z-testin tavoin myös t-testi olettaa näytteen normaalin jakautumisen. T-testiä käytetään, kun populaatioparametreja (keskiarvo ja keskihajonta) ei tunneta.

t-testistä on kolme versiota

1. Riippumattomat näytteet t-testi, jossa verrataan kahden ryhmän keskiarvoa

2. Paritettu näyte t-testi, jossa verrataan saman ryhmän keskiarvoja eri aikoina

3. Yksi näyte t-testi, jossa testataan yhden ryhmän keskiarvo tunnettua keskiarvoa vastaan.,

tilasto tämän hypoteesin testaus on nimeltään t-statistic, pisteet, jotka lasketaan

t = (x1 — x2) / (σ / √n1 + σ / √n2), jossa

x1 = keskiarvo näyte 1

x2 = keskiarvo näyte 2

n1 = koko näytteen 1

n2 = otoksen 2

On olemassa useita muunnelmia t-testi, joka selitetään yksityiskohtaisesti täällä

ANOVA

ANOVA, joka tunnetaan myös nimellä varianssianalyysi. käytetään vertaamaan useita (kolme tai enemmän) näytteet, joiden yksittäinen testi. ANOVA

1: stä on olemassa 2 merkittävää makua., Yksisuuntainen ANOVA: sitä käytetään vertaamaan yhden riippumattoman muuttujan kolmen tai useamman näytteen/ryhmän välistä eroa.

2. MANOVA: MANOVA antaa meille mahdollisuuden testata yhden tai useamman riippumattoman muuttujan vaikutusta kahteen tai useampaan riippuvaiseen muuttujaan. Lisäksi MANOVA pystyy havaitsemaan myös erot riippuvuussuhteessa toisistaan riippuvien muuttujien välillä, kun otetaan huomioon itsenäisten muuttujien ryhmät.

hypoteesi on testattu ANOVA on

Null: Kaikki parit näytteet ovat samat eli, kaikki näyte tarkoittaa, ovat tasa-arvoisia

Varajäsen: vähintään yhdet näytteet on merkittävästi erilainen

tilastot käytetään mittaamaan merkitys, tässä tapauksessa, on nimeltään F-tilastot. F-arvo lasketaan kaavalla

F:= ((SSE1 — SSE2)/m)/ SSE2/n-k, jossa

SSE = jäljellä oleva summa neliöt

m = useita rajoituksia

k = määrä riippumattomia muuttujia

On olemassa useita työkaluja, kuten SPSS, R paketteja, Excel jne. suorittaa ANOVA tietyssä näytteessä.,

Chi-Square-Testi

Chi-square-testiä käytetään vertaamaan kategorisia muuttujia. Chi-neliötestejä on kahta tyyppiä

1. Hyvyys fit testi, joka määrittää, jos näyte vastaa väestöä.

2. Chi-square fit testi kaksi riippumatonta muuttujaa käytetään vertailla kahta muuttujaa kontingenssitaulukossa tarkistaa, jos tiedot sopii.

a. Pieni chi-square-arvo tarkoittaa, että tiedot sopii

b. Korkea chi-square-arvo tarkoittaa, että tiedot ei sovi.,

hypoteesi testataan khiin neliö-on

Null: Muuttuja ja Muuttujan B ovat riippumattomia

Varajäsen: Muuttuja ja Muuttujan B eivät ole riippumattomia.

merkitystä mittaavaa tilastoa kutsutaan tässä tapauksessa chi-neliötilastoksi., Kaava laskennassa käytetty tilastotieto on

Χ2 = Σ, missä

Tai,c = havaittu frekvenssi count tasolla r Muuttujan A-ja c-tason Muuttujan B

Er,c = odotettu frekvenssi lasketaan tasolla r Muuttujan A-ja c-tason Muuttujan B

Huomautus: Kuten voidaan nähdä edellä mainitut esimerkit, kaikki testit tilastotieto on verrattu kriittinen arvo, hyväksyä tai hylätä hypoteesi., Kuitenkin, tilastotieto ja tapa laskea se vaihdella riippuen vaihteleva määrä näytteitä on analysoitu ja jos väestö parametrit ovat tiedossa. Näistä tekijöistä riippuen valitaan sopiva testi ja nollahypoteesi.

Tämä on kaikkein tärkein asia, jonka olen huomannut, minun pyrkimyksiä oppia nämä testit ja löytää se instrumentaali minun ymmärrystä näiden perus tilastollisia käsitteitä.

Disclaimer

Tämä viesti keskittyy vahvasti normaalisti jakautunut tiedot., Z-testiä ja t-testiä voidaan käyttää tietoa, joka on ei-normaalisti jakautunut samoin, jos otoskoko on suurempi kuin 20, on kuitenkin olemassa muita menetelmiä parempi käyttää tällaisessa tilanteessa. Osoitteessa http://www.statisticshowto.com/probability-and-statistics/non-normal-distributions/ lisätietoja testit kuin normaalijakauma.

Viite

2. http://blog.minitab.com/blog/adventures-in-statistics-2/understanding-analysis-of-variance-anova-and-the-f-test

3. http://www.statisticshowto.com/p-value/

4. http://www.statisticshowto.com/probability-and-statistics/chi-square/

5. http://stattrek.com/chi-square-test/independence.aspx?Tutorial=AP

6. https://www.investopedia.com/terms/n/null_hypothesis.asp

7. https://math.stackexchange.com/questions/1732178/help-understanding-difference-in-p-value-critical-value-results

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *