Statistische Tests – Wann verwendet man Was ?


Für eine Person mit nichtstatistischem Hintergrund ist der verwirrendste Aspekt der Statistik immer der grundlegende statistische tests und wann welche zu verwenden. Dieser Blogbeitrag ist ein Versuch, den Unterschied zwischen den häufigsten Tests, die Verwendung von Null-Wert-Hypothese in diesen Tests und umreißt die Bedingungen, unter denen ein bestimmter Test verwendet werden soll, zu markieren.,

Bevor wir uns mit dem Unterschied zwischen verschiedenen Tests beschäftigen, müssen wir ein klares Verständnis dafür formulieren, was eine Nullhypothese ist. Eine Nullhypothese legt nahe, dass in einer Reihe von gegebenen Beobachtungen kein signifikanter Unterschied besteht. Für die Zwecke dieser Tests im Allgemeinen

Null: Gegeben sind zwei Stichprobenmittel gleich

Alternate: Gegeben sind zwei Stichprobenmittel nicht gleich

Zur Ablehnung einer Nullhypothese wird eine Teststatistik berechnet. Diese Teststatistik wird dann mit einem kritischen Wert verglichen, und wenn festgestellt wird, dass sie größer als der kritische Wert ist, wird die Hypothese abgelehnt., „In die theoretischen Grundlagen und Hypothesen-tests basieren auf der Idee, dass Sie kritische Bereiche: die Nullhypothese wird abgelehnt, wenn die test-Statistik fällt in der kritischen region. Die kritischen Werte sind die Grenzen des kritischen Bereichs. Wenn der Test einseitig ist (wie ein χ2-Test oder ein einseitiger t-Test), gibt es nur einen kritischen Wert, aber in anderen Fällen (wie einem zweiseitigen T-Test) gibt es zwei“.,

Kritischer Wert

Ein kritischer Wert ist ein Punkt (oder Punkte) auf der Skala der Teststatistik, über den hinaus wir die Nullhypothese ablehnen, und wird von der Signifikanzstufe α des Tests abgeleitet. Kritischer Wert kann uns sagen, Was ist die Wahrscheinlichkeit, dass zwei Stichprobenmittel zur gleichen Verteilung gehören. Höher bedeutet der kritische Wert niedriger die Wahrscheinlichkeit, dass zwei Proben zur gleichen Verteilung gehören. Der allgemeine kritische Wert für einen Zweischwanztest beträgt 1,96, was auf der Tatsache beruht, dass 95% der Fläche einer Normalverteilung innerhalb von 1 liegen.,96 Standardabweichungen des Mittelwerts.

Kritische Werte können verwendet werden, um Hypothesentests auf folgende Weise durchzuführen

1. Berechnen Sie die Teststatistik

2. Berechnen Sie kritische Werte basierend auf der Signifikanzstufe alpha

3. Vergleichen Sie die Teststatistik mit kritischen Werten.

Wenn die Teststatistik niedriger als der kritische Wert ist, akzeptieren Sie die Hypothese oder lehnen Sie die Hypothese ab., Um herauszufinden, wie man einen kritischen Wert im Detail berechnet, überprüfen Sie bitte

Bevor wir mit verschiedenen statistischen Tests fortfahren, ist es unerlässlich, den Unterschied zwischen einer Stichprobe und einer Population zu verstehen.

In der Statistik bezieht sich „Population“ auf den gesamten Satz von Beobachtungen, die gemacht werden können. Wenn wir beispielsweise die durchschnittliche Höhe der auf der Erde vorhandenen Menschen berechnen möchten, ist“ Bevölkerung „die“Gesamtzahl der tatsächlich auf der Erde anwesenden Menschen“.,

Eine Stichprobe hingegen ist ein Satz von Daten, die aus einer vordefinierten Prozedur gesammelt/ausgewählt wurden. Für unser Beispiel oben wird es eine kleine Gruppe von Menschen sein, die zufällig aus einigen Teilen der Erde ausgewählt wurden.

Um Rückschlüsse aus einer Stichprobe durch Validierung einer Hypothese zu ziehen, ist es notwendig, dass die Stichprobe zufällig ist.

Zum Beispiel in unserem obigen Beispiel, wenn wir Personen aus allen Regionen(Asien, Amerika, Europa, Afrika usw.) zufällig auswählen.,)auf der Erde, unsere Schätzung werden in der Nähe der eigentlichen Schätzung und kann vermutet werden, als ein Beispiel bedeuten, während, wenn wir machen die Auswahl sagen wir mal nur von den Vereinigten Staaten, dann die Durchschnittliche Höhe Schätzung wird nicht genau sein, aber Sie würde nur die Daten repräsentieren eines bestimmten region (USA). Eine solche Stichprobe wird dann als voreingenommene Stichprobe bezeichnet und ist kein Vertreter der „Population“.

Ein weiterer wichtiger Aspekt, der in der Statistik zu verstehen ist, ist die „Verteilung“., Wenn „Population“ unendlich groß ist, ist es unwahrscheinlich, dass eine Hypothese durch Berechnung des Mittelwerts oder der Testparameter für die gesamte Population validiert wird. In solchen Fällen wird angenommen, dass eine Population von einer Art Verteilung ist.

Die häufigsten Verteilungsformen sind Binomial, Poisson und Diskret., Es gibt jedoch viele andere Typen, die im Detail unter

Die Bestimmung des Verteilertyps ist erforderlich, um den kritischen Wert und den Test zu bestimmen, der ausgewählt werden muss, um eine Hypothese zu validieren

Wenn wir uns über Population, Stichprobe und Verteilung im Klaren sind, können wir verschiedene Arten von Tests und die Verteilertypen, für die sie verwendet werden, verstehen.,

Beziehung zwischen p-Wert, kritischer Wert und Teststatistik

Wie wir wissen, ist kritischer Wert ein Punkt, über den wir die Nullhypothese ablehnen. P-Wert hingegen ist definiert als die Wahrscheinlichkeit rechts von der jeweiligen Statistik (Z, T oder chi). Der Vorteil der Verwendung von p-Wert ist, dass es eine Wahrscheinlichkeitsschätzung berechnet, wir können auf jedem gewünschten Signifikanzniveau testen, indem wir diese Wahrscheinlichkeit direkt mit dem Signifikanzniveau vergleichen.

Nehmen wir zum Beispiel an, dass der Z-Wert für ein bestimmtes Experiment 1,67 beträgt, was größer ist als der kritische Wert bei 5%, der 1 ist.,64. Um nun auf eine andere Signifikanzstufe von 1% zu prüfen, ist ein neuer kritischer Wert zu berechnen.

Wenn wir jedoch den p-Wert für 1,67 berechnen, beträgt er 0,047. Wir können diesen p-Wert verwenden, um die Hypothese auf 5% Signifikanzniveau abzulehnen, da 0.047 < 0.05. Bei einem strengeren Signifikanzniveau von 1% wird die Hypothese jedoch seit 0.047 > 0.01 akzeptiert. Wichtiger Punkt hier zu beachten ist, dass es keine doppelte Berechnung erforderlich ist.

Z-Test

Bei einem Z-Test wird angenommen, dass die Probe normal verteilt ist., Ein z-Score wird mit Populationsparametern wie „Populationsmittel“ und „Populationsstandardabweichung“ berechnet und verwendet, um eine Hypothese zu validieren, dass die gezogene Stichprobe zur gleichen Population gehört.,

Null: Stichprobenmittelwert ist derselbe wie der Grundgesamtmittelwert

Alternativ: Stichprobenmittelwert ist nicht derselbe wie der Grundgesamtmittelwert

Die für diese Hypothesentests verwendete Statistik wird als z-Statistik bezeichnet, deren Punktzahl als

z = (x — μ) / (σ / √n) berechnet wird, wobei

x= Stichprobenmittelwert

μ = Grundgesamtmittelwert

σ / √n = Grundgesamtstandardabweichung

Wenn die Teststatistik niedriger als der kritische Wert ist, akzeptieren Sie die Hypothese oder lehnen Sie die Hypothese ab

T-Test

Ein T-Test wird verwendet, um den Mittelwert zweier gegebener Proben zu vergleichen., Wie ein Z-Test nimmt auch ein t-Test eine Normalverteilung der Probe an. Ein t-Test wird verwendet, wenn die Grundgesamtparameter (Mittelwert und Standardabweichung) nicht bekannt sind.

Es gibt drei Versionen des t-test

1. Unabhängige Proben t-Test, der Mittelwert für zwei Gruppen vergleicht

2. Gepaart Probe t-Test, die Mittel aus der gleichen Gruppe zu verschiedenen Zeiten vergleicht

3. Eine Probe t-Test, der den Mittelwert einer einzelnen Gruppe gegen einen bekannten Mittelwert testet.,

Die Statistik für diesen Hypothesentest heißt t-statistic, deren Score berechnet wird als

t = (x1 — x2) / (σ / √n1 + σ / √n2), wobei

x1 = Mittelwert der Probe 1

x2 = Mittelwert der Probe 2

n1 = Größe der Probe 1

n2 = Größe der Probe von Probe 2

Es gibt mehrere Variationen des t-Tests, die hier ausführlich erläutert werden

ANOVA

ANOVA, auch bekannt als Varianzanalyse, wird verwendet, um mehrere (drei oder mehr) Proben mit einem einzigen Test zu vergleichen. Es gibt 2 Hauptaromen von ANOVA

1., Einweg-ANOVA: Es wird verwendet, um die Differenz zwischen den drei oder mehr Stichproben/Gruppen einer einzelnen unabhängigen Variablen zu vergleichen.

2. MANOVA: Mit MANOVA können wir die Wirkung einer oder mehrerer unabhängiger Variablen auf zwei oder mehr abhängige Variablen testen. Darüber hinaus kann MANOVA auch den Unterschied in der Co-Beziehung zwischen abhängigen Variablen anhand der Gruppen unabhängiger Variablen erkennen.

Die in ANOVA getestete Hypothese ist

Null: Alle Probenpaare sind gleich, dh, alle Stichprobenmittel sind gleich

Abwechselnd: Mindestens ein Stichprobenpaar unterscheidet sich signifikant

Die zur Messung der Signifikanz verwendete Statistik wird in diesem Fall als F-Statistik bezeichnet. Der F — Wert wird mit der Formel

F= ((SSE1-SSE2)/m)/ SSE2/n-k berechnet, wobei

SSE = Restsumme der Quadrate

m = Anzahl der Einschränkungen

k = Anzahl unabhängiger Variablen

Es stehen mehrere Tools wie SPSS, R-Pakete, Excel usw. zur Verfügung. um eine Analyse an einer bestimmten Probe durchzuführen.,

Chi-Quadrat-Test

Chi-Quadrat-Test wird verwendet, um kategoriale Variablen zu vergleichen. Es gibt zwei Arten von chi-Quadrat-test

1. Güte des Fit-Tests, der bestimmt, ob eine Stichprobe mit der Population übereinstimmt.

2. Ein Chi-Quadrat-Fit-Test für zwei unabhängige Variablen wird verwendet, um zwei Variablen in einer Kontingenztabelle zu vergleichen, um zu überprüfen, ob die Daten passen.

a. Ein kleiner Chi-Quadrat-Wert bedeutet, dass Daten passen

b. Ein hoher Chi-Quadrat-Wert bedeutet, dass Daten nicht passen. ,

Die Hypothese, die für Chi-Quadrat getestet wird, ist

Null: Variable A und Variable B sind unabhängig

Alternate: Variable A und Variable B sind nicht unabhängig.

Die zur Messung der Signifikanz verwendete Statistik wird in diesem Fall als Chi-Quadrat-Statistik bezeichnet., Die für die Berechnung der Statistik verwendete Formel lautet

Χ2 = Σ wobei

Oder c = beobachtete Frequenzzählung auf Ebene r der Variablen A und Ebene c der Variablen B

Er,c = erwartete Frequenzzählung auf Ebene r der Variablen A und Ebene c der Variablen B

Hinweis: Wie aus den obigen Beispielen hervorgeht,wird in allen Tests eine Statistik mit einem kritischen Wert verglichen, um eine hypothese., Die Statistik und die Art der Berechnung unterscheiden sich jedoch je nach Variablentyp, Anzahl der zu analysierenden Stichproben und Bekanntheit der Populationsparameter. Daher wird abhängig von solchen Faktoren eine geeignete Test-und Nullhypothese gewählt.

Dies ist der wichtigste Punkt, den ich bei meinen Bemühungen festgestellt habe, diese Tests kennenzulernen und sie für mein Verständnis dieser grundlegenden statistischen Konzepte von entscheidender Bedeutung zu finden.

Disclaimer

Dieser Beitrag konzentriert sich stark auf normalverteilte Daten., Z-Test und t-Test können für Daten verwendet werden, die nicht normal verteilt sind, wenn die Stichprobengröße größer als 20 ist, es gibt jedoch andere bevorzugte Methoden, die in einer solchen Situation verwendet werden können. Bitte besuchen Sie http://www.statisticshowto.com/probability-and-statistics/non-normal-distributions/ für weitere Informationen zu Tests für nicht normale Distributionen.

Referenz

2. http://blog.minitab.com/blog/adventures-in-statistics-2/understanding-analysis-of-variance-anova-and-the-f-test

3. http://www.statisticshowto.com/p-value/

4. http://www.statisticshowto.com/probability-and-statistics/chi-square/

5. http://stattrek.com/chi-square-test/independence.aspx?Tutorial=AP

6. https://www.investopedia.com/terms/n/null_hypothesis.asp

7. https://math.stackexchange.com/questions/1732178/help-understanding-difference-in-p-value-critical-value-results

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.