supongamos que se le da una serie de datos. Alguien le pide que cuente algunos datos interesantes sobre esta serie de datos. ¿Cómo puedes hacerlo? Puedes decir que puedes encontrar la media, la mediana o el modo de esta serie de datos y contar sobre su distribución. ¿Pero es lo único que puedes hacer? ¿Son las tendencias centrales la única manera por la cual podemos llegar a conocer acerca de la concentración de la observación? En esta sección, aprenderemos sobre otra medida para saber más sobre los datos., Aquí, vamos a saber acerca de la medida de dispersión. Empecemos.,=»3b6554cc1e»>
) no-repeat 50% 50%; background-size: portada»>
las Medidas de Dispersión
Como el nombre sugiere, la medida de dispersión muestra la scatterings de los datos., Indica la variación de los datos entre sí y da una idea clara sobre la distribución de los datos. La medida de dispersión muestra la homogeneidad o la heterogeneidad de la distribución de las observaciones.,
busque más temas en medidas de Tendencia Central y dispersión
- media aritmética
- mediana y modo
- Valores de partición o Fractiles
- media armónica y media geométrica
- rango y desviación media
- cuartiles, desviación cuartil y coeficiente de desviación cuartil
- desviación estándar y coeficiente de variación
supongamos que tiene cuatro conjuntos de datos del mismo tamaño y la media es también la misma, digamos, M. en todos los casos la suma de las observaciones será la misma., Aquí, la medida de la tendencia central no está dando una idea clara y completa sobre la distribución para los cuatro conjuntos dados.
¿podemos hacernos una idea de la distribución si llegamos a conocer la dispersión de las observaciones entre sí dentro y entre los conjuntos de datos? La idea principal sobre la medida de dispersión es conocer cómo se propagan los datos. Muestra cuánto varían los datos de su valor promedio.,
características de las medidas de dispersión
- Una medida de dispersión debe definirse rígidamente
- Debe ser fácil de calcular y comprender
- No afectada mucho por las fluctuaciones de las observaciones
- basado en todas las observaciones
clasificación de las medidas de dispersión
la medida de dispersión se categoriza como:
(i) una medida absoluta de dispersión:
- Las medidas que expresan la dispersión de la observación en términos de distancias, es decir, rango, desviación cuartil.,
- La medida que expresa las variaciones en términos de la media de desviaciones de observaciones como la desviación media y la desviación estándar.
(ii) una medida relativa de dispersión:
utilizamos una medida relativa de dispersión para comparar distribuciones de dos o más conjuntos de datos y para la comparación libre de unidades. Ellos son el coeficiente de gama, el coeficiente de desviación media, el coeficiente de desviación cuartil, el coeficiente de variación y el coeficiente de la desviación estándar.,
rango
un rango es la medida de dispersión más común y fácilmente comprensible. Es la diferencia entre dos observaciones extremas del conjunto de datos. Si X max y X min Son las dos observaciones extremas entonces
Range = X max – X min
méritos de rango
- Es la medida de dispersión más simple
- Fácil de calcular
- Fácil de entender
- independiente del cambio de origen
deméritos de rango
- se basa en dos observaciones extremas., Por lo tanto, se ven afectados por las fluctuaciones
- un rango no es una medida confiable de dispersión
- dependiente del cambio de escala
desviación del cuartil
los cuartiles dividen un conjunto de datos en cuartos. El primer cuartil, (Q1) Es el número medio entre el número más pequeño y la mediana de los datos. El segundo cuartil, (Q2) Es la mediana del conjunto de datos. El tercer cuartil, (Q3) es el número medio entre la mediana y el número más grande.,= ½ × (Q3 – Q1)
méritos de desviación de cuartil
- Todos los inconvenientes de rango se superan por desviación de cuartil
- Utiliza la mitad de los datos
- independiente del cambio de origen
- La mejor medida de dispersión para clasificación de extremo abierto
deméritos de desviación de cuartil
- ignora el 50% de los datos
- dependiente del cambio de escala
- No es una medida fiable de dispersión
desviación media
la desviación media es la media aritmética de las desviaciones absolutas de las observaciones de una medida de tendencia central., Si x1, x2, … , xn son el conjunto de observación, entonces la desviación media de x sobre el promedio A (media, mediana o modo) es
desviación media del promedio a = 1⁄n
para una frecuencia agrupada, se calcula como:
desviación media del promedio a = 1⁄N, N = ∑fi
aquí , xi y fi son respectivamente el valor medio y la frecuencia del intervalo de clase I.,t proporciona un valor mínimo cuando las desviaciones se toman de la mediana
deméritos de desviación media
- No fácilmente comprensible
- Su cálculo no es fácil y requiere mucho tiempo
- dependiente del cambio de escala
- La ignorancia del signo negativo crea artificialidad y se vuelve inútil para un tratamiento matemático posterior
desviación estándar
una desviación estándar es la raíz cuadrada positiva de la media aritmética de los cuadrados de las desviaciones de los valores dados de su media aritmética., Se denota por una letra griega sigma, σ. También se conoce como desviación cuadrada media de la raíz. La desviación estándar es dado como
σ = ½ = ½
Para una distribución de frecuencias agrupadas, es
σ = ½ = ½
El cuadrado de la desviación estándar es la varianza. También es una medida de dispersión.
σ 2 = ½ =
Para una distribución de frecuencias agrupadas, es
σ 2 = ½ = .
si en lugar de una media, elegimos cualquier otro número arbitrario, digamos A, la desviación estándar se convierte en la desviación media raíz.,
varianza de la serie combinada
Si σ1, σ2 son dos desviaciones estándar de dos series de tamaños n1 y n2 con medias ȳ1 y ȳ2. La varianza de las dos series de tamaños n1 + n2 es:
σ 2 = (1/ n1 + n2) ÷
donde, d1 = ȳ 1 − ȳ , d2 = ȳ 2 − ȳ , y ȳ = (n1 ȳ 1 + n2 ȳ 2) ÷ ( n1 + n2).,e inconveniente de ignorar signos en desviaciones Medias
deméritos de desviación estándar
- No es fácil de calcular
- difícil de entender para un lego
- dependiente del cambio de escala
coeficiente de dispersión
siempre que queramos comparar la variabilidad de las dos series que difieren ampliamente en sus promedios., Además, cuando la unidad de medida es diferente. Necesitamos calcular los coeficientes de dispersión junto con la medida de dispersión. Los coeficientes de dispersión (C. D.) basados en diferentes medidas de dispersión son
coeficiente de variación
100 veces el coeficiente de dispersión basado en la desviación estándar es el coeficiente de variación (C. V.).
C. V. = 100 × (SD / Media) = (σ/ȳ ) × 100.
ejemplo resuelto sobre medidas de dispersión
problema: a continuación se muestra la tabla que muestra los valores de los resultados para dos empresas a y B.,
- ¿Cuál de la empresa tiene una mayor masa salarial?
- calcular los coeficientes de variación para ambas empresas.
- calcular el salario medio diario y la variación de la distribución de los salarios de todos los empleados de las empresas a y B en su conjunto.
solución:
para la empresa a
No. de los empleados = n1 = 900, y el salario diario promedio = Rs 1 = Rs. 250
sabemos, salario diario promedio = salario total ⁄ número Total de empleados
o, salario Total = empleados totales × salario diario promedio = 900 × 250 = Rs., 225000 … (i)
para la empresa B
No. de los empleados = n2 = 1000, y el salario medio diario = Rs 2 = Rs. 220
So, total wages = total employees × average daily wage = 1000 × 220 = Rs. 220000 ii (ii)
comparando (I), y (ii), vemos que la empresa A tiene una mayor masa salarial.
para la empresa a
varianza de distribución de salarios = σ12 = 100
C. V. de distribución de salarios = 100 x desviación estándar de distribución de salarios / salario medio diario
Or, C. V., A = 100 × √100⁄250 = 100 × 10⁄250 = 4 … (I)
para la empresa B
varianza de la distribución de los salarios = σ22 = 144
C. V. B = 100 × √144⁄220 = 100 × 12⁄220 = 5.45 … (ii)
comparando (i), y (ii), vemos que la Compañía B tiene mayor variabilidad.
para las empresas a y B, tomadas en conjunto
los salarios medios diarios para ambas empresas tomadas en conjunto