statistische Tests – wanneer welke ?


Voor a persoon die uit een niet-statistische achtergrond het meest verwarrende aspect van de statistieken, zijn altijd de fundamentele statistische tests, en wanneer te gebruiken die. Deze blog post is een poging om het verschil tussen de meest voorkomende tests markeren, het gebruik van nul waarde hypothese in deze tests en waarin de voorwaarden waaronder een bepaalde test moet worden gebruikt.,

voordat we het verschil tussen verschillende tests onderzoeken, moeten we een duidelijk begrip formuleren van wat een nulhypothese is. Een nulhypothese, stelt voor dat er geen significant verschil bestaat in een set van gegeven waarnemingen. Voor deze tests in het algemeen wordt

Null: gegeven twee monstermedia gelijk zijn

afwisselend: gegeven twee monstermedia niet gelijk zijn

Voor het afwijzen van een nulhypothese wordt een teststatistiek berekend. Deze teststatistiek wordt dan vergeleken met een kritische waarde en als deze groter blijkt te zijn dan de kritische waarde, wordt de hypothese afgewezen., “In de theoretische onderbouwing, hypothese tests zijn gebaseerd op de notie van kritische gebieden: de nulhypothese wordt afgewezen als de teststatistiek valt in de kritieke regio. De kritische waarden zijn de grenzen van de kritieke regio. Als de test eenzijdig is (zoals een χ2-test of een eenzijdige t-test) dan zal er slechts één kritische waarde zijn, maar in andere gevallen (zoals een dubbelzijdige t-test) zullen er twee zijn”.,

kritische waarde

een kritische waarde is een punt (of punten) op de schaal van de teststatistiek waarboven we de nulhypothese verwerpen en wordt afgeleid van het significantieniveau α van de test. Kritische waarde kan ons vertellen, wat is de waarschijnlijkheid van twee steekproef betekent behoren tot dezelfde verdeling. Hoger, de kritische waarde betekent lager de waarschijnlijkheid van twee monsters die tot dezelfde verdeling behoren. De Algemene kritische waarde voor een tweestaartproef is 1,96, wat gebaseerd is op het feit dat 95% van het oppervlak van een normale verdeling binnen 1 ligt.,96 standaardafwijkingen van het gemiddelde.

kritische waarden kunnen worden gebruikt om hypothesen te testen op de volgende manier

1. Bereken de teststatistiek

2. Bereken kritische waarden op basis van significantieniveau Alfa

3. Vergelijk teststatistieken met kritische waarden.

als de teststatistiek lager is dan de kritische waarde, accepteer de hypothese dan wel weiger de hypothese., Om uit te zoeken hoe je een kritische waarde in detail kunt berekenen, controleer dan

voordat we verder gaan met verschillende statistische tests is het noodzakelijk om het verschil tussen een steekproef en een populatie te begrijpen.

in statistieken verwijst “populatie” naar de totale reeks waarnemingen die kunnen worden gedaan. Voor bijvoorbeeld, als we willen de gemiddelde hoogte van de mensen aanwezig zijn op de aarde te berekenen, ” bevolking “zal het”totale aantal mensen daadwerkelijk aanwezig zijn op de aarde”.,

een steekproef daarentegen is een reeks gegevens die zijn verzameld / geselecteerd op basis van een vooraf gedefinieerde procedure. Voor ons voorbeeld hierboven, het zal een kleine groep mensen willekeurig geselecteerd uit sommige delen van de aarde.

om conclusies te trekken uit een monster door een hypothese te valideren, is het noodzakelijk dat het monster willekeurig is.

bijvoorbeeld, in ons voorbeeld hierboven als we willekeurig mensen selecteren uit alle regio ‘ s(azië, amerika, europa, afrika etc.,) op aarde, zal onze schatting dicht bij de werkelijke schatting en kan worden aangenomen als een steekproef gemiddelde, terwijl als we selectie maken laten we zeggen alleen uit de Verenigde Staten, dan is onze gemiddelde hoogte schatting zal niet nauwkeurig zijn, maar zou alleen de gegevens van een bepaald gebied (Verenigde Staten) vertegenwoordigen. Een dergelijke steekproef wordt dan een bevooroordeelde steekproef genoemd en is geen vertegenwoordiger van “bevolking”.

een ander belangrijk aspect in de statistiek is “distributie”., Wanneer de” populatie ” oneindig groot is, is het onwaarschijnlijk om een hypothese te valideren door het berekenen van de gemiddelde waarde of testparameters op de gehele populatie. In dergelijke gevallen wordt aangenomen dat een populatie van een soort van verdeling is.

De meest voorkomende vormen van distributies zijn binomiaal, Poisson en discreet., Er zijn echter veel andere types die in detail worden vermeld bij

de bepaling van het distributietype is nodig om de kritische waarde en test te bepalen die moeten worden gekozen om elke hypothese te valideren

nu, als we duidelijk zijn over populatie, steekproef en distributie, kunnen we verder gaan om verschillende soorten testen en de distributietypes waarvoor ze worden gebruikt te begrijpen.,

relatie tussen p-waarde, kritische waarde en teststatistiek

omdat we weten dat kritische waarde een punt is waarboven we de nulhypothese verwerpen. P-waarde daarentegen wordt gedefinieerd als de waarschijnlijkheid rechts van de respectieve statistiek (Z, T of chi). Het voordeel van het gebruik van p-waarde is dat het een kansschatting berekent, we kunnen testen op elk gewenst niveau van significantie door deze waarschijnlijkheid direct te vergelijken met het significantieniveau.neem bijvoorbeeld aan dat de Z-waarde voor een bepaald experiment 1,67 is, wat groter is dan de kritische waarde bij 5%, die 1 is.,64. Om nu te controleren op een ander significantieniveau van 1% moet een nieuwe kritische waarde worden berekend.

echter, als we p-waarde berekenen voor 1,67 komt het op 0,047. We kunnen deze p-waarde gebruiken om de hypothese af te wijzen op 5% significantieniveau sinds 0,047 < 0,05. Maar met een strengere significantieniveau van 1% zal de hypothese worden aanvaard sinds 0,047 > 0,01. Belangrijk om hier op te merken is dat er geen dubbele berekening vereist.

Z-test

bij een z-test wordt aangenomen dat het monster normaal is verdeeld., Een Z-score wordt berekend met populatieparameters zoals ” populatiegemiddelde “en” populatiestandaardafwijking ” en wordt gebruikt om een hypothese te valideren dat de getrokken steekproef tot dezelfde populatie behoort.,

Null: het steekproefgemiddelde is hetzelfde als het populatiegemiddelde

afwisselend: het steekproefgemiddelde is niet hetzelfde als het populatiegemiddelde

de voor deze hypothese gebruikte statistieken worden z-statistisch genoemd, waarvan de score wordt berekend als

z = (x — μ) / (σ / √n), waarbij

x= steekproefgemiddelde

μ = populatiegemiddelde

σ / √n = populatiestandaardafwijking

als de teststatistiek lager is dan de kritische waarde, accepteer dan de hypothese of weiger de hypothese

t-test

een T-test wordt gebruikt om het gemiddelde van twee gegeven monsters te vergelijken., Net als een z-test gaat een t-test ook uit van een normale verdeling van het monster. Een t-test wordt gebruikt wanneer de populatieparameters (gemiddelde en standaardafwijking) niet bekend zijn.

Er zijn drie versies van t-test

1. Onafhankelijke monsters t-test waarbij het gemiddelde voor twee groepen

2 wordt vergeleken. Gepaarde Monster t-test die gemiddelden van dezelfde groep op verschillende tijdstippen

3 vergelijkt. Eén Monster t-test waarbij het gemiddelde van één groep wordt getoetst aan een bekend gemiddelde.,

de statistiek voor deze hypothese wordt t-statistisch genoemd, waarvan de score wordt berekend als

t = (x1 — x2) / (σ / √n1 + σ / √N2), waarbij

x1 = gemiddelde van monster 1

x2 = gemiddelde van monster 2

n1 = grootte van monster 1

N2 = grootte van monster 2

er zijn meerdere variaties van de T-test die hier in detail worden uitgelegd

ANOVA

ANOVA, ook bekend als variantieanalyse, wordt gebruikt om meerdere (drie of meer) monsters met één enkele test te vergelijken. Er zijn 2 belangrijke smaken van ANOVA

1., One-way ANOVA: het wordt gebruikt om het verschil tussen de drie of meer monsters/groepen van een enkele onafhankelijke variabele te vergelijken.

2. MANOVA: met MANOVA kunnen we het effect van een of meer onafhankelijke variabelen testen op twee of meer afhankelijke variabelen. Daarnaast kan MANOVA ook het verschil in co-relatie tussen afhankelijke variabelen detecteren gegeven de groepen van onafhankelijke variabelen.

de hypothese die wordt getest in ANOVA is

Null: alle paren monsters zijn hetzelfde, d.w.z., alle steekproefmedia zijn gelijk

afwisselend: ten minste één paar monsters is significant verschillend

de statistieken die worden gebruikt om de significantie te meten, worden in dit geval F-statistieken genoemd. De F-waarde wordt berekend met behulp van de formule

F= ((SSE1 — SSE2)/ m)/SSE2/n-k, waarbij

SSE = restsom van kwadraten

m = aantal beperkingen

k = aantal onafhankelijke variabelen

Er zijn meerdere hulpmiddelen beschikbaar zoals SPSS, R-pakketten, Excel etc. om ANOVA uit te voeren op een bepaald monster.,

Chi-Kwadraattest

Chi-kwadraattest wordt gebruikt om categorische variabelen te vergelijken. Er zijn twee soorten chi-kwadraattest

1. Goodness of fit test, die bepaalt of een monster overeenkomt met de populatie.

2. Een chi-kwadraat fit test voor twee onafhankelijke variabelen wordt gebruikt om twee variabelen in een contingency tabel te vergelijken om te controleren of de gegevens passen.

a. een kleine chi-kwadraatwaarde betekent dat gegevens passen

b. een hoge chi-kwadraatwaarde betekent dat gegevens niet passen.,

de hypothese die wordt getest voor het chi-kwadraat is

nul: variabele A en variabele B zijn onafhankelijk

alternatief: variabele A en variabele B zijn niet onafhankelijk.

de statistiek die gebruikt wordt om significantie te meten, wordt in dit geval chi-kwadraat statistiek genoemd., De voor de berekening van de statistiek gebruikte formule is

Χ2 = Σ waarbij

of,c = waargenomen frequentietelling op niveau r van variabele A en niveau c van variabele B

Er,C = verwachte frequentietelling op niveau r van variabele A en niveau C van variabele B

opmerking: zoals uit de bovenstaande voorbeelden blijkt, wordt in alle tests een statistiek vergeleken met een kritische waarde van een hypothese accepteren of afwijzen., Echter, de statistiek en de manier om het te berekenen verschillen afhankelijk van het type variabele, het aantal monsters worden geanalyseerd en als de populatie parameters bekend zijn. Dus afhankelijk van dergelijke factoren wordt een geschikte test en nulhypothese gekozen.

Dit is het belangrijkste punt dat ik heb opgemerkt, in mijn pogingen om meer te weten te komen over deze tests en het instrumenteel te vinden in mijn begrip van deze fundamentele statistische concepten.

Disclaimer

Dit bericht richt zich sterk op normaal gedistribueerde gegevens., Z-test en t-test kunnen worden gebruikt voor gegevens die ook niet-normaal worden verspreid als de steekproefgrootte groter is dan 20, maar er zijn andere methoden die de voorkeur verdienen om in een dergelijke situatie te gebruiken. Bezoek http://www.statisticshowto.com/probability-and-statistics/non-normal-distributions/ voor meer informatie over testen voor niet-normale distributies.

referentie

2. http://blog.minitab.com/blog/adventures-in-statistics-2/understanding-analysis-of-variance-anova-and-the-f-test

3. http://www.statisticshowto.com/p-value/

4. http://www.statisticshowto.com/probability-and-statistics/chi-square/

5. http://stattrek.com/chi-square-test/independence.aspx?Tutorial=AP

6. https://www.investopedia.com/terms/n/null_hypothesis.asp

7. https://math.stackexchange.com/questions/1732178/help-understanding-difference-in-p-value-critical-value-results

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *