teste statistice – când se utilizează care ?

Pentru o persoană fiind de la un non-statistice de fundal cel mai confuz aspect de statistică, sunt mereu fundamentale teste statistice, și atunci când pentru a utiliza care. Această postare pe blog este o încercare de a marca diferența dintre cele mai frecvente teste, utilizarea ipotezei valorii nule în aceste teste și conturarea condițiilor în care trebuie utilizat un anumit test.,înainte de a ne aventura pe diferența dintre diferite teste, trebuie să formulăm o înțelegere clară a ceea ce este o ipoteză nulă. O ipoteză nulă, PROPUNE că nu există nicio diferență semnificativă într-un set de observații date. În scopul acestor teste în general

Null: având în vedere două mijloace de probă sunt egale

alternativ: având în vedere două mijloace de probă nu sunt egale

pentru respingerea unei ipoteze nule, se calculează o statistică a testului. Această statistică a testului este apoi comparată cu o valoare critică și dacă se constată că este mai mare decât valoarea critică, ipoteza este respinsă., „În bazele teoretice, testele de ipoteză se bazează pe noțiunea de regiuni critice: ipoteza nulă este respinsă dacă statistica testului cade în regiunea critică. Valorile critice sunt limitele regiunii critice. Dacă testul este unilateral (ca un test χ2 sau un test t unilateral), atunci va exista o singură valoare critică, dar în alte cazuri (ca un test t bidirecțional) vor exista două”.,

Valoarea Critică

O valoare critică este un punct (sau puncte) pe scara de statistica testului dincolo de care se respinge ipoteza nulă, și este derivat de la nivelul de semnificație α testului. Valoarea critică ne poate spune, care este probabilitatea a două mijloace de probă aparținând aceleiași distribuții. Mai mare, valoarea critică înseamnă mai mică probabilitatea a două probe aparținând aceleiași distribuții. Valoarea critică generală pentru un test cu două cozi este de 1,96, care se bazează pe faptul că 95% din suprafața unei distribuții normale este în limita a 1.,96 deviații standard ale mediei.

valorile critice pot fi folosite pentru a face testarea ipotezelor în felul următor

1. Calculați statistica testului

2. Calculați valorile critice pe baza nivelului de semnificație alfa

3. Comparați statistica testului cu valorile critice.dacă statistica testului este mai mică decât valoarea critică, acceptați ipoteza sau respingeți ipoteza., Pentru verificarea cum de a calcula o valoare critică în detaliu vă rugăm să verificați

Înainte de a trece mai departe cu diferite teste statistice este imperativ să se înțeleagă diferența între o probă și o populație.în statistici „populația” se referă la setul total de observații care pot fi făcute. De exemplu, dacă dorim să calculăm înălțimea medie a oamenilor prezenți pe pământ, „populația” va fi „numărul total de oameni prezenți efectiv pe pământ”.,un eșantion, pe de altă parte, este un set de date colectate/selectate dintr-o procedură predefinită. Pentru exemplul nostru de mai sus, va fi un grup mic de oameni selectați aleatoriu din unele părți ale pământului.

Pentru a trage concluzii dintr-un eșantion de validarea unei ipoteze este necesar ca eșantionul este aleator.

de exemplu, în exemplul nostru de mai sus, dacă selectăm aleatoriu persoane din toate regiunile(Asia, America, Europa, Africa etc.,) pe pământ, estimarea noastră va fi aproape de estimarea reală și poate fi asumată ca o medie de probă, în timp ce dacă facem selecția să spunem doar din Statele Unite, atunci estimarea noastră medie de înălțime nu va fi exactă, ci ar reprezenta doar datele unei anumite regiuni (Statele Unite). Un astfel de eșantion este apoi numit eșantion părtinitor și nu este un reprezentant al „populației”.un alt aspect important de înțeles în statistici este”distribuția”., Când „populația” este infinit de mare, este improbabil să se valideze orice ipoteză prin calcularea valorii medii sau a parametrilor de testare pe întreaga populație. În astfel de cazuri, se presupune că o populație este de un anumit tip de distribuție.cele mai comune forme de distribuții sunt binomiale, Poisson și Discrete., Cu toate acestea, există multe alte tipuri care sunt menționate în detaliu

determinarea de licență este necesară pentru a determina valoarea critică și de testare pentru a fi ales pentru a valida orice ipoteză

Acum, când ne sunt clare cu privire la populație, eșantion, și de distribuție putem merge mai departe pentru a înțelege diferite tipuri de teste și tipuri de distribuție pentru care sunt utilizate.,

relația dintre valoarea p, valoarea critică și statistica testului

după cum știm, valoarea critică este un punct dincolo de care respingem ipoteza nulă. Valoarea P, pe de altă parte, este definită ca Probabilitatea din dreapta statisticii respective (Z, T sau chi). Beneficiul utilizării valorii p este că calculează o estimare a probabilității, putem testa la orice nivel dorit de semnificație comparând această probabilitate direct cu nivelul de semnificație.

de exemplu, presupunem că valoarea Z pentru un anumit experiment este 1.67, care este mai mare decât valoarea critică la 5%, care este 1.,64. Acum, pentru a verifica un nivel de semnificație diferit de 1%, trebuie calculată o nouă valoare critică.

cu toate acestea, dacă vom calcula valoarea p pentru 1.67 este vorba de 0.047. Putem folosi această valoare p pentru a respinge ipoteza la un nivel de semnificație de 5% din 0.047 < 0.05. Dar cu un nivel de semnificație mai strict de 1%, ipoteza va fi acceptată de la 0.047 > 0.01. Punct Important de remarcat aici este că nu există nici un calcul dublu necesar.

testul Z

într-un test z, se presupune că eșantionul este distribuit în mod normal., Un scor z este calculat cu parametrii populației, cum ar fi” media populației „și” deviația standard a populației ” și este utilizat pentru a valida o ipoteză conform căreia eșantionul extras aparține aceleiași populații.,

Null: Eșantionului este același ca populația să spun

Alternative: Eșantionului nu este același ca populația să spun

statisticile utilizate pentru testarea ipotezelor este numit z-statistic, scorul pentru care se calculează ca

z = (x — μ) / (σ / √n), în cazul în care

x= eșantion înseamnă

μ = populația medie

σ / √n = abaterea standard a populației

Dacă statistica testului este mai mică decât valoarea critică, accepta ipoteza sau altceva respinge ipoteza

T-test

Un t-test este folosit pentru a compara înseamnă a dat două probe., Ca un test z, un test t presupune, de asemenea, o distribuție normală a eșantionului. Un test t este utilizat atunci când parametrii populației (deviația medie și standard) nu sunt cunoscuți.

există trei versiuni ale t-test

1. Eșantioane independente t-test care compară media pentru două grupuri

2. Eșantion asociat t-test care compară mijloace din același grup la momente diferite

3. Un eșantion t-test care testează media unui singur grup împotriva unei medii cunoscute.,

statistice pentru testarea ipotezelor este numit t-statistic, scorul pentru care se calculează ca

t = (x1 — x2) / (σ / √n1 + σ / √n2), în cazul în care

x1 = media eșantionului 1

x2 = mijloc de proba 2

n1 = mărimea eșantionului 1

n2 = mărimea eșantionului 2

Există mai multe variante de t-test, care sunt explicate în detaliu aici

ANOVA

ANOVA, de asemenea, cunoscut sub numele de analiză de varianță, este folosit pentru a compara mai multe (trei sau mai multe) mostre cu un singur test. Există 2 arome majore de ANOVA

1., ANOVA cu sens unic: este utilizat pentru a compara diferența dintre cele trei sau mai multe eșantioane/grupuri ale unei singure variabile independente.

2. MANOVA: MANOVA ne permite să testăm efectul uneia sau mai multor variabile independente asupra a două sau mai multe variabile dependente. În plus, MANOVA poate detecta, de asemenea, diferența de co-relație între variabilele dependente, având în vedere grupurile de variabile independente.

ipoteza testată în ANOVA este

nul: toate perechile de probe sunt aceleași, adică., toate mijloacele de probă sunt egale

alternativ: cel puțin o pereche de probe este semnificativ diferită

Statisticile utilizate pentru a măsura semnificația, în acest caz, se numește F-statistici. Valoarea F este calculată folosind formula

F= ((SSE1 — SSE2)/m)/ SSE2/n-k, unde

SSE = suma reziduală a pătratelor

m = numărul de restricții

k = numărul variabilelor independente

Există mai multe instrumente disponibile, cum ar fi SPSS, R pachete, Excel etc. pentru a efectua ANOVA pe un eșantion dat.,

testul Chi-pătrat

testul Chi-pătrat este utilizat pentru a compara variabilele categorice. Există două tipuri de test chi-pătrat

1. Bunătatea testului fit, care determină dacă o probă se potrivește cu populația.

2. Un test de potrivire chi-pătrat pentru două variabile independente este utilizat pentru a compara două variabile într-un tabel de urgență pentru a verifica dacă datele se potrivesc.

a. o valoare chi-pătrat mică înseamnă că datele se potrivesc

b. o valoare chi-pătrat mare înseamnă că datele nu se potrivesc.,ipoteza testată pentru chi-pătrat este

Null: variabila A și variabila B sunt independente

Alternate: variabila A și variabila B nu sunt independente.statistica utilizată pentru a măsura semnificația, în acest caz, se numește statistica chi-pătrat., Formula utilizată pentru calcularea statistică este

Χ2 = Σ unde

Sau c = observate frecvenței la nivelul r Variabil și nivel c de Variabilă B

Er,c = frecvența așteptată conta la nivelul r Variabil și nivel c de Variabilă B

Notă: După cum se poate vedea din exemplele de mai sus, in toate testele o statistică este comparată cu o valoare critică a accepta sau de a respinge o ipoteză., Cu toate acestea, Statistica și modul de calculare a acesteia diferă în funcție de tipul variabilei, numărul de probe analizate și dacă parametrii populației sunt cunoscuți. Astfel, în funcție de astfel de factori, se alege un test adecvat și o ipoteză nulă.acesta este cel mai important punct pe care l-am remarcat, în eforturile mele de a învăța despre aceste teste și de a-l găsi instrumental în înțelegerea acestor concepte statistice de bază.

Disclaimer

Acest post se concentrează foarte mult pe date distribuite în mod normal., Z-test și T-test pot fi utilizate pentru date care nu sunt distribuite în mod normal, de asemenea, dacă dimensiunea eșantionului este mai mare de 20, cu toate acestea, există alte metode preferabile de utilizat într-o astfel de situație. Vă rugăm să vizitați http://www.statisticshowto.com/probability-and-statistics/non-normal-distributions/ pentru mai multe informații despre testele pentru distribuții non normale.

referință

2. http://blog.minitab.com/blog/adventures-in-statistics-2/understanding-analysis-of-variance-anova-and-the-f-test

3. http://www.statisticshowto.com/p-value/

4. http://www.statisticshowto.com/probability-and-statistics/chi-square/

5. http://stattrek.com/chi-square-test/independence.aspx?Tutorial=AP

6. https://www.investopedia.com/terms/n/null_hypothesis.asp

7. https://math.stackexchange.com/questions/1732178/help-understanding-difference-in-p-value-critical-value-results

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *