pruebas estadísticas – ¿cuándo usar cuáles ?

Para una persona de fuera de la estadística de fondo de la mayoría de los aspecto confuso de las estadísticas, son siempre los estadísticos fundamentales pruebas, y cuando usar que. Esta entrada de blog es un intento de marcar la diferencia entre las pruebas más comunes, el uso de hipótesis de valor nulo en estas pruebas y delinear las condiciones bajo las cuales se debe usar una prueba en particular.,

antes de aventurarnos en la diferencia entre diferentes pruebas, necesitamos formular una comprensión clara de lo que es una hipótesis nula. Una hipótesis nula, propone que no existe diferencia significativa en un conjunto de observaciones dadas. Para el propósito de estas pruebas en general

Null: dadas dos medias de muestra son iguales

Alternate: dadas dos medias de muestra no son iguales

Para rechazar una hipótesis nula, se calcula un estadístico de prueba. Esta prueba estadística se compara con un valor crítico y si se encuentra que es mayor que el valor crítico, la hipótesis se rechaza., «En los fundamentos teóricos, las pruebas de hipótesis se basan en la noción de regiones críticas: la hipótesis nula se rechaza si la estadística de la prueba cae en la región crítica. Los valores críticos son los límites de la región crítica. Si la prueba es unilateral (como una prueba de χ2 o una prueba t unilateral), entonces solo habrá un valor crítico, pero en otros casos (como una prueba t bilateral) habrá dos».,

valor crítico

un valor crítico es un punto (o puntos) en la escala del estadístico de la prueba más allá del cual rechazamos la hipótesis nula, y, se deriva del nivel de significación α de la prueba. El valor crítico puede decirnos, cuál es la probabilidad de dos medios de la muestra que pertenecen a la misma distribución. Mayor, el valor crítico significa menor la probabilidad de que dos muestras pertenezcan a la misma distribución. El valor crítico general para una prueba de dos colas es 1.96, que se basa en el hecho de que el 95% del área de una distribución normal está dentro de 1.,96 desviaciones estándar de la media.

Los valores críticos se pueden utilizar para hacer pruebas de hipótesis de la siguiente manera

1. Calcular la estadística de la prueba

2. Calcular valores críticos basados en el nivel de significancia Alfa

3. Compare la estadística de prueba con valores críticos.

si el estadístico de la prueba es menor que el valor crítico, acepte la hipótesis o rechace la hipótesis., Para comprobar cómo calcular un valor crítico en detalle, por favor, consulten

Antes de seguir adelante con diferentes pruebas estadísticas es imprescindible para entender la diferencia entre una muestra y una población.

en Estadística «población» se refiere al conjunto total de observaciones que se pueden hacer. Por ejemplo, si queremos calcular la altura promedio de los seres humanos presentes en la tierra, «población» será el «número total de personas realmente presentes en la tierra».,

una muestra, por otro lado, es un conjunto de datos recogidos/seleccionados de un procedimiento predefinido. Para nuestro ejemplo anterior, será un pequeño grupo de personas seleccionadas al azar de algunas partes de la tierra.

para sacar inferencias de una muestra validando una hipótesis es necesario que la muestra sea aleatoria.

por ejemplo, en nuestro ejemplo anterior si seleccionamos personas al azar de todas las regiones (Asia, América, Europa, África, etc.,en la tierra, nuestra estimación será cercana a la estimación real y se puede suponer como una media de muestra, mientras que si hacemos la selección digamos solo de los Estados Unidos, entonces nuestra estimación de altura promedio no será precisa sino que solo representará los datos de una región en particular (Estados Unidos). Dicha muestra se denomina muestra sesgada y no es representativa de la «población».

otro aspecto importante a entender en Estadística es la «distribución»., Cuando la «población» es infinitamente grande, es improbable validar cualquier hipótesis calculando el valor medio o los parámetros de prueba en toda la población. En tales casos, se supone que una población tiene algún tipo de distribución.

las formas más comunes de distribución son Binomial, Poisson y discreta., Sin embargo, hay muchos otros tipos que se mencionan en detalle en

la determinación del tipo de distribución es necesaria para determinar el valor crítico y la prueba a elegir para validar cualquier hipótesis

ahora, cuando tenemos claro la población, la muestra y la distribución, podemos avanzar para comprender los diferentes tipos de prueba y los tipos de distribución para los que se utilizan.,

relación entre valor p, valor crítico y estadística de prueba

Como sabemos valor crítico es un punto más allá del cual rechazamos la hipótesis nula. Por otro lado, el valor P se define como la probabilidad a la derecha de la estadística respectiva (Z, T o chi). El beneficio de usar el valor p es que calcula una estimación de probabilidad, podemos probar en cualquier nivel deseado de significancia comparando esta probabilidad directamente con el nivel de significancia.

por ejemplo, supongamos que el valor Z para un experimento en particular resulta ser 1.67, que es mayor que el valor crítico al 5%, que es 1.,64. Ahora, para verificar un nivel de significancia diferente del 1%, se debe calcular un nuevo valor crítico.

sin Embargo, si calculamos el valor de p para 1.67 viene a ser 0.047. Podemos usar este valor p Para rechazar la hipótesis a nivel de significancia del 5% desde 0.047 < 0.05. Pero con un nivel de significancia más estricto de 1%, la hipótesis será aceptada desde 0.047 > 0.01. Un punto importante a tener en cuenta aquí es que no se requiere doble cálculo.

prueba Z

en una prueba z, se supone que la muestra está distribuida normalmente., Una puntuación z se calcula con parámetros poblacionales como» media poblacional «y» desviación estándar poblacional » y se utiliza para validar una hipótesis de que la muestra dibujada pertenece a la misma población.,

Null: La media muestral es la misma que la media poblacional

Alternate: la media muestral no es la misma que la media poblacional

Las estadísticas utilizadas para esta prueba de hipótesis se denominan estadísticas z, cuya puntuación se calcula como

z = (x-μ) / (σ / √n), donde

x= media muestral

μ = media poblacional

σ / √n = desviación estándar poblacional

si el estadístico de la prueba es menor que el valor crítico, acepte la hipótesis o rechace la hipótesis

t — test

se utiliza una prueba T para comparar la media de dos muestras dadas., Al igual que una prueba z, una prueba t también asume una distribución normal de la muestra. Se utiliza una prueba t cuando no se conocen los parámetros poblacionales (media y desviación estándar).

Hay tres versiones de t-test

1. Muestras independientes t-test que compara la media para dos grupos

2. Prueba t de muestra emparejada que compara medias del mismo grupo en diferentes momentos

3. Una prueba t de muestra que prueba la media de un solo grupo contra una media conocida.,

el estadístico para esta prueba de hipótesis se llama t-statistic, cuya puntuación se calcula como

t = (X1 — x2) / (σ / √n1 + σ / √n2), donde

x1 = media de la muestra 1

x2 = media de la muestra 2

n1 = tamaño de la muestra 1

/p>

n2 = Tamaño de la muestra 2

Hay múltiples variaciones de la prueba T que se explican en detalle aquí

ANOVA

ANOVA, también conocido como análisis de varianza, se utiliza para comparar múltiples (tres o más) muestras con una sola prueba. Hay 2 sabores principales de ANOVA

1., ANOVA unidireccional: se utiliza para comparar la diferencia entre las tres o más muestras/grupos de una sola variable independiente.

2. MANOVA: MANOVA nos permite probar el efecto de una o más variables independientes sobre dos o más variables dependientes. Además, MANOVA también puede detectar la diferencia en la co-relación entre variables dependientes dados los grupos de variables independientes.

la hipótesis que se está probando en ANOVA es

Null: todos los pares de muestras son iguales i. e., todas las medias de la muestra son iguales

alternativa: al menos un par de muestras es significativamente diferente

las estadísticas utilizadas para medir la significación, en este caso, se denominan F-estadísticas. El valor de F Se calcula utilizando la fórmula

F= ((SSE1 — SSE2)/ m)/SSE2/n-k, donde

SSE = suma residual de cuadrados

m = Número de restricciones

k = número de variables independientes

Hay múltiples herramientas disponibles como SPSS, paquetes R, Excel, etc. realizar ANOVA sobre la muestra dada.,

prueba de Chi-Cuadrado

la prueba de Chi-cuadrado se utiliza para comparar variables categóricas. Hay dos tipos de prueba de chi-cuadrado

1. Prueba de bondad de ajuste, que determina si una muestra coincide con la población.

2. Una prueba de ajuste chi-cuadrado para dos variables independientes se utiliza para comparar dos variables en una tabla de contingencia para verificar si los datos se ajustan.

a. un valor chi-cuadrado pequeño significa que los datos encajan

b. Un valor chi-cuadrado alto significa que los datos no encajan.,

la hipótesis que se está probando para chi-cuadrado es

Null: Variable A y Variable B son independientes

Alternate: Variable A y Variable B no son independientes.

la estadística utilizada para medir la significación, en este caso, se llama estadística chi-cuadrado., La fórmula utilizada para calcular la estadística es

Χ2 = Σ donde

Or,c = recuento de frecuencia observado en el nivel r de la Variable A y el nivel c de la Variable b

Er,c = recuento de frecuencia esperado en el nivel r de la Variable A y el nivel c de la Variable b

Nota: Como se puede ver en los ejemplos anteriores, en todas las pruebas valor para aceptar o rechazar una hipótesis., Sin embargo, la estadística y la forma de calcularla difieren según el tipo de variable, el número de muestras analizadas y si se conocen los parámetros poblacionales. Por lo tanto, dependiendo de tales factores, se elige una prueba adecuada y una hipótesis nula.

Este es el punto más importante que he notado, en mis esfuerzos por aprender sobre estas pruebas y encontrarlo instrumental en mi comprensión de estos conceptos estadísticos básicos.

Descargo de responsabilidad

Esta publicación se centra en gran medida en los datos distribuidos normalmente., La prueba Z y la prueba t también se pueden usar para datos que no se distribuyen normalmente si el tamaño de la muestra es mayor que 20, sin embargo, hay otros métodos preferibles para usar en tal situación. Visite http://www.statisticshowto.com/probability-and-statistics/non-normal-distributions/ para obtener más información sobre las pruebas para distribuciones no normales.

Referencia

2. http://blog.minitab.com/blog/adventures-in-statistics-2/understanding-analysis-of-variance-anova-and-the-f-test

3. http://www.statisticshowto.com/p-value/

4. http://www.statisticshowto.com/probability-and-statistics/chi-square/

5. http://stattrek.com/chi-square-test/independence.aspx?Tutorial=AP

6. https://www.investopedia.com/terms/n/null_hypothesis.asp

7. https://math.stackexchange.com/questions/1732178/help-understanding-difference-in-p-value-critical-value-results

Yakaranda