Pro člověka je z non-statistické pozadí nejvíce matoucí aspekt statistiky, jsou vždy základní statistické testy, a kdy použít kterou. Tento blogový příspěvek je pokusem označit rozdíl mezi nejčastějšími testy, použitím hypotézy nulové hodnoty v těchto testech a nastíněním podmínek, za kterých by měl být použit konkrétní test.,
než se pustíme do rozdílu mezi různými testy, musíme formulovat jasné pochopení toho, co je nulová hypotéza. Nulová hypotéza, navrhuje, že v souboru daných pozorování neexistuje žádný významný rozdíl. Pro účely těchto testů obecně.
Null: Vzhledem k tomu, dvou výběrových průměrů se rovná
Alternativní: Vzhledem k tomu, dva ukázkové znamená, že nejsou rovná
Pro zamítnutí nulové hypotézy, testovací statistika počítá. Tato testovací statistika je pak porovnána s kritickou hodnotou a pokud se zjistí, že je větší než kritická hodnota, hypotéza je odmítnuta., „V teoretických základech jsou testy hypotéz založeny na pojmu kritických oblastí: nulová hypotéza je odmítnuta, pokud statistika testu spadá do kritické oblasti. Kritické hodnoty jsou hranice kritické oblasti. Pokud je test jednostranný (jako test χ2 nebo jednostranný t-test), bude existovat pouze jedna kritická hodnota, ale v jiných případech (jako oboustranný t-test) budou dvě“.,
Kritická Hodnota
kritická hodnota, je bod (nebo body) na stupnici testovací statistika, nad kterou jsme nulovou hypotézu zamítnout, a je odvozen od úrovně významnosti α testu. Kritická hodnota nám může říct, jaká je pravděpodobnost dvou vzorových prostředků patřících do stejné distribuce. Vyšší, kritická hodnota znamená nižší pravděpodobnost dvou vzorků patřících do stejné distribuce. Obecná kritická hodnota pro dvouocasý test je 1,96, což je založeno na skutečnosti, že 95% plochy normální distribuce je v rámci 1.,96 směrodatných odchylek průměru.
kritické hodnoty lze použít k testování hypotéz následujícím způsobem
1. Vypočítejte statistiku testu
2. Vypočítejte kritické hodnoty na základě úrovně významnosti alfa
3. Porovnejte statistiku testu s kritickými hodnotami.
Pokud je statistika testu nižší než kritická hodnota, přijměte hypotézu nebo hypotézu odmítněte., Pro kontrolu, jak vypočítat kritické hodnoty v detailu, prosím, zkontrolujte,
předtím, Než jsme se kupředu s různými statistickými testy, je nezbytné pochopit rozdíl mezi vzorkem a populací.
ve statistice „populace“ označuje celkový soubor pozorování, které lze provést. Například, pokud chceme vypočítat průměrnou výšku lidí přítomných na zemi, „populace“ bude „celkový počet lidí skutečně přítomných na zemi“.,
vzorek je naopak soubor dat shromážděných / vybraných z předem definovaného postupu. Pro náš výše uvedený příklad to bude malá skupina lidí náhodně vybraných z některých částí země.
Chcete-li vyvodit závěry ze vzorku ověřením hypotézy, je nutné, aby vzorek byl náhodný.
například, v našem příkladu výše, pokud vybíráme lidi náhodně ze všech regionů(Asie, Amerika, Evropa, Afrika atd.,)na zemi, náš odhad bude blízký skutečnému odhad a lze předpokládat, že jako výběrový průměr, vzhledem k tomu, že když uděláme výběr řekněme pouze ze Spojených Států, pak je naše průměrná výška odhad nebude přesný, ale představují pouze data z určitého regionu, (Spojené Státy). Takový vzorek se pak nazývá zkreslený vzorek a není zástupcem „populace“.
dalším důležitým aspektem, který je třeba pochopit ve statistice, je „distribuce“., Když je“ populace “ nekonečně velká, je nepravděpodobné ověřit jakoukoli hypotézu výpočtem průměrné hodnoty nebo testovacích parametrů na celé populaci. V takových případech se předpokládá, že populace má nějaký druh distribuce.
nejběžnější formy distribucí jsou binomické, Poissonové a diskrétní., Nicméně, existuje mnoho dalších typů, které jsou uvedeny v detailu,
stanovení licence je nutné stanovit kritické hodnoty a test, aby být vybrán pro ověření nějaké hypotézy,
Nyní, když máme jasno o populace, vzorek, a distribuce se můžeme pohnout kupředu, aby pochopili různé druhy test a distribuce druhů, pro které jsou používány.,
vztah mezi hodnotou p, kritickou hodnotou a statistikou testu
jak víme, kritická hodnota je bod, za kterým odmítáme nulovou hypotézu. P-hodnota na druhé straně je definována jako pravděpodobnost napravo od příslušné statistiky (Z, T nebo chi). Výhodou použití hodnoty p je, že vypočítá odhad pravděpodobnosti, můžeme testovat na libovolné požadované úrovni významu porovnáním této pravděpodobnosti přímo s úrovní významnosti.
například, předpokládejme, Z-hodnota pro konkrétní experiment vyjde, že je 1.67, což je větší než kritická hodnota na 5%, což je 1.,64. Nyní pro kontrolu jiné úrovně významnosti 1% je třeba vypočítat novou kritickou hodnotu.
Nicméně, pokud počítáme p-hodnoty pro 1.67 to přijde být 0.047. Tuto hodnotu p můžeme použít k odmítnutí hypotézy na úrovni 5% významnosti od 0.047 < 0.05. Ale s přísnější úrovní významnosti 1% bude hypotéza přijata od 0.047 > 0.01. Důležitým bodem, který je třeba poznamenat, je, že není vyžadován žádný dvojitý výpočet.
z-test
V z-testu se předpokládá, že vzorek je normálně distribuován., Z-skóre se vypočítá s populační parametry jako je „populační průměr“ a „směrodatná odchylka“, a je používána k ověření hypotézy, že vzorek tažené patří do stejné populace.,
Null: výběrový průměr je stejný jako průměr populace
Alternativní: výběrový průměr je stejný jako průměr populace
statistiky použité pro toto testování hypotéz se nazývá z-statistiky, skóre, které se vypočítá jako
z = (x — μ) / (σ / √n), kde
x= výběrový průměr
μ = populační průměr,
σ / √n = směrodatná odchylka
Pokud testovací statistika je nižší než kritická hodnota, přijímáme hypotézu, jinak zamítnout hypotézu,
T-test
t-test slouží k porovnání střední hodnoty dvou daných vzorků., Stejně jako z-test, t-test také předpokládá normální distribuci vzorku. T-test se používá, pokud nejsou známy parametry populace (střední a směrodatná odchylka).
existují tři verze t-testu
1. Nezávislé vzorky t-test, který porovnává průměr pro dvě skupiny
2. Spárovaný vzorek t-test, který porovnává prostředky ze stejné skupiny v různých časech
3. Jeden vzorek t-test, který testuje průměr jedné skupiny proti známému průměru.,
statistiky pro toto testování hypotéz se nazývá t-statistiky, skóre, které se vypočítá jako
t = (x1 — x2) / (σ / √n1 + σ / √n2), kde
x1 = průměr vzorek 1
x2 = průměr vzorek 2
n1 = velikost vzorku 1
n2 = velikost vzorku 2,
Existuje několik variant t-testu, které jsou podrobně vysvětleny zde,
ANOVA
ANOVA, také známý jako analýza rozptylu, slouží k porovnání několika (třemi nebo více) vzorků s jeden test. Existují 2 hlavní příchutě ANOVA
1., Jednosměrná ANOVA: používá se k porovnání rozdílu mezi třemi nebo více vzorky/skupinami jedné nezávislé proměnné.
2. MANOVA: MANOVA nám umožňuje testovat účinek jedné nebo více nezávislých proměnných na dvou nebo více závislých proměnných. Kromě toho může MANOVA také detekovat rozdíl ve vztahu mezi závislými proměnnými vzhledem ke skupinám nezávislých proměnných.
hypotéza testovaná v Anově je
Null: všechny páry vzorků jsou stejné, tj., všechny prostředky vzorku jsou stejné
střídavé: alespoň jeden pár vzorků se výrazně liší
statistika použitá k měření významu se v tomto případě nazývá F-statistika. F hodnota je vypočítána pomocí vzorce,
F= ((SSE1 — SSE2)/m)/ SSE2/n-k, kde
SSE = reziduální součet čtverců
m = počet omezení,
k = počet nezávislých proměnných,
Existuje několik nástrojů k dispozici, jako je SPSS, R balíčky, Excel atd. provést ANOVU na daném vzorku.,
Chi-Square Test
Chi-square test se používá k porovnání kategorických proměnných. Existují dva typy testu chi-square
1. Dobrý test fit, který určuje, zda vzorek odpovídá populaci.
2. Test chi-square fit pro dvě nezávislé proměnné se používá k porovnání dvou proměnných v pohotovostní tabulce ke kontrole, zda se data hodí.
. Malé chi-kvadrát hodnota znamená, že data se hodí,
b. Vysoké chi-kvadrát hodnota znamená, že údaje nesedí.,
testovaná hypotéza pro chi-square je
Null: proměnná a a proměnná B jsou nezávislé
alternativní: proměnná a a proměnná B nejsou nezávislé.
statistika používaná k měření významu se v tomto případě nazývá chi-čtvercová statistika., Vzorec použitý pro výpočet statistika je
Χ2 = Σ, kde
Nebo,c = pozorované četnosti na úrovni r Proměnné a a úroveň c Proměnné B
Er,c = očekávané četnosti na úrovni r Proměnné a a úroveň c Proměnné B
Poznámka: Jak je vidět z výše uvedených příkladů, ve všech testech, statistika je porovnána s kritickou hodnotou přijmout nebo odmítnout hypotézu., Statistika a způsob výpočtu se však liší v závislosti na typu proměnné, počtu analyzovaných vzorků a v případě, že jsou známy parametry populace. V závislosti na takových faktorech je tedy zvolen vhodný test a nulová hypotéza.
toto je nejdůležitější bod, který jsem zaznamenal ve svém úsilí dozvědět se o těchto testech a najít to pomocný v mém chápání těchto základních statistických pojmů.
Disclaimer
tento příspěvek se silně zaměřuje na normálně distribuovaná data., Z-test a T-test lze použít pro data, která nejsou běžně distribuována, pokud je velikost vzorku větší než 20, existují však i jiné vhodnější metody, které je třeba v takové situaci použít. Navštivte http://www.statisticshowto.com/probability-and-statistics/non-normal-distributions/ pro více informací o testech pro normální distribuce.
Reference
2. http://blog.minitab.com/blog/adventures-in-statistics-2/understanding-analysis-of-variance-anova-and-the-f-test
3. http://www.statisticshowto.com/p-value/
4. http://www.statisticshowto.com/probability-and-statistics/chi-square/
5. http://stattrek.com/chi-square-test/independence.aspx?Tutorial=AP
6. https://www.investopedia.com/terms/n/null_hypothesis.asp
7. https://math.stackexchange.com/questions/1732178/help-understanding-difference-in-p-value-critical-value-results