supposons que vous receviez une série de données. Quelqu’un vous demande de raconter des faits intéressants sur cette série de données. Comment pouvez-vous le faire? Vous pouvez dire que vous pouvez trouver la moyenne, la médiane ou le mode de cette série de données et parler de sa distribution. Mais est-ce la seule chose que vous pouvez faire? Les tendances centrales sont-elles le seul moyen de connaître la concentration de l’observation? Dans cette section, nous allons découvrir une autre mesure pour en savoir plus sur les données., Ici, nous allons connaître la mesure de la dispersion. Nous allons commencer.,= »3b6554cc1e »>
) no-repeat 50% 50%; background-size: couverture »>
les Mesures de Dispersion
Comme le nom le suggère, la mesure de la dispersion montre la dispersion des données., Il indique la variation des données les unes des autres et donne une idée claire de la distribution des données. La mesure de la dispersion montre l’homogénéité ou l’hétérogénéité de la distribution des observations.,
parcourir plus de sujets sous mesures de la tendance centrale et de la Dispersion
- moyenne arithmétique
- médiane et Mode
- valeurs de Partition ou Fractiles
- moyenne harmonique et moyenne géométrique
- intervalle et écart moyen
- Quartiles, écart Quartile et Coefficient d’écart Quartile
- écart type et Coefficient de Variation
supposons que vous ayez quatre ensembles de données de la même taille et la moyenne est également la même, disons, m. Dans tous les cas, la somme des observations sera la même. , Ici, la mesure de la tendance centrale ne donne pas une idée claire et complète de la distribution pour les quatre ensembles donnés.
pouvons-nous avoir une idée de la distribution si nous apprenons à connaître la dispersion des observations les unes des autres à l’intérieur et entre les ensembles de données? L’idée principale sur la mesure de la dispersion est d’apprendre à connaître la façon dont les données sont réparties. Il montre à quel point les données varient par rapport à leur valeur moyenne.,
caractéristiques des mesures de Dispersion
- Une mesure de dispersion doit être définie de manière rigide
- Elle doit être facile à calculer et à comprendre
- peu affectée par les fluctuations des observations
- sur la base de toutes les observations
Classification des mesures de Dispersion
la mesure de dispersion est catégorisée comme suit:
(i) une mesure absolue de dispersion:
- Les mesures qui expriment la diffusion de l’observation en termes de distances, c’est-à-dire de portée, de déviation quartile.,
- la mesure qui exprime les variations en termes de la moyenne des écarts d’observations comme l’écart moyen et l’écart type.
(ii) une mesure relative de la dispersion:
Nous utilisons une mesure relative de la dispersion pour comparer les distributions de deux ensembles de données ou plus et pour la comparaison sans unité. Ils sont le coefficient de plage, le coefficient d’écart moyen, le coefficient d’écart quartile, le coefficient de variation et le coefficient d’écart type.,
Plage
une plage est la mesure de dispersion la plus courante et facilement compréhensible. C’est la différence entre deux observations extrêmes de l’ensemble de données. Si X max et min X sont les deux extrêmes observations, puis
Gamme = X max – X min
les Mérites de la Gamme
- C’est le plus simple de la mesure de la dispersion
- Facile à calculer
- Facile à comprendre
- Indépendant de changement d’origine
Inconvénients de Gamme
- Elle est basée sur deux observations extrêmes., Par conséquent, être affecté par les fluctuations
- une plage n’est pas une mesure fiable de la dispersion
- dépendante du changement d’échelle
déviation des quartiles
les quartiles divisent un ensemble de données en quartiers. Le premier quartile (Q1) est le nombre intermédiaire entre le plus petit nombre et la médiane des données. Le deuxième quartile (Q2) est la médiane de l’ensemble de données. Le troisième quartile (Q3) est le nombre intermédiaire entre la médiane et le plus grand nombre.,= ½ × (Q3 – Q1)
mérites de L’écart Quartile
- tous les inconvénients de la plage sont surmontés par l’écart quartile
- Il utilise la moitié des données
- indépendamment du changement d’origine
- La meilleure mesure de la dispersion pour la classification à extrémité ouverte
données
déviation moyenne
la déviation moyenne est la moyenne arithmétique des écarts absolus des observations par rapport à une mesure de tendance centrale., Si x1, x2, … , xn sont l’ensemble de l’observation, alors l’écart moyen de x autour de la moyenne A (Moyenne, Médiane ou mode) est
écart moyen par rapport à la moyenne A = 1⁄N
pour une fréquence groupée, il est calculé comme suit:
écart moyen par rapport à la moyenne A = 1⁄N, N = fi fi
ici , xi et la fréquence du i intervalle de classe.,t fournit une valeur minimale lorsque les écarts sont pris par rapport à la médiane
démérites de L’écart moyen
- pas facilement compréhensible
- son calcul n’est pas facile et prend du temps
- dépendant du changement d’échelle
- L’Ignorance du signe négatif crée de l’artificialité et devient inutile pour un traitement mathématique ultérieur
écart type
Un écart type est la racine carrée positive de la moyenne arithmétique des carrés des écarts des valeurs données par rapport à leur moyenne arithmétique., Il est désigné par une lettre grecque sigma, σ. Il est également appelé déviation quadratique moyenne. L’écart type est donné comme
σ = ½ = ½
Pour un groupe de distribution de fréquences, il est
σ = ½ = ½
Le carré de l’écart-type est la variance. C’est aussi une mesure de la dispersion.
σ 2 = ½ =
Pour un groupe de distribution de fréquences, il est
σ 2 = ½ = .
Si au lieu d’une moyenne, nous choisissons un autre nombre arbitraire, disons A, l’écart type devient l’écart moyen racine.,
Variance de la série combinée
Si σ1, σ2 sont deux écarts types de deux séries de tailles n1 et n2 avec des moyennes ȳ1 et ȳ2. La variance des deux séries de tailles n1 + n2 est:
σ 2 = (1/ n1 + n2) ÷
où, d1 = ȳ 1 − ȳ , d2 = ȳ 2 − ȳ , et ȳ = (n1 ȳ 1 + n2 ȳ 2) ÷ ( n1 + n2).,e inconvénient d’ignorer les signes dans les écarts moyens
démérites de L’écart type
- pas facile à calculer
- difficile à comprendre pour un profane
- dépendant du changement
coefficient de dispersion
chaque fois que nous voulons comparer la variabilité des deux séries qui diffèrent largement dans leurs moyennes., En outre, lorsque l’Unité de mesure est différente. Nous devons calculer les coefficients de dispersion avec la mesure de dispersion. Les coefficients de dispersion (C. D.) basés sur différentes mesures de dispersion sont
Coefficient de Variation
100 fois le coefficient de dispersion basé sur l’écart type est le coefficient de variation (C. V.).
C. V. = 100 × (S. D. / Moyenne) = (σ/ȳ ) × 100.
exemple résolu sur les mesures de Dispersion
problème: voici le tableau montrant les valeurs des résultats pour deux sociétés A et B.,
- de la société a une plus grosse masse salariale?
- Calculer les coefficients de variation pour les deux sociétés.
- calculer le salaire journalier moyen et la variance de la répartition des salaires de tous les employés des entreprises A et B pris ensemble.
la Solution:
Pour la Société A
Non. des employés = n1 = 900, et le salaire journalier moyen = ȳ 1 = Rs. 250
nous savons, salaire journalier moyen = salaire total ⁄ nombre Total d’employés
ou, salaire Total = total des employés × salaire journalier moyen = 900 × 250 = Rs., 225000 … (j’ai)
Pour la Société B
Non. des employés = n2 = 1000, et le salaire journalier moyen = ERC2 = Rs. 220
ainsi, salaire Total = total des employés × salaire journalier moyen = 1000 × 220 = Rs. 220000 ii (ii)
en comparant (i) et (ii), nous voyons que la société A a une masse salariale plus importante.
pour L’entreprise A
Variance de la distribution des salaires = σ12 = 100
C. V. de la distribution des salaires = 100 x écart type de la distribution des salaires/salaire journalier moyen
ou, C. V., A = 100 × √100⁄250 = 100 × 10⁄250 = 4 … (i)
pour L’entreprise B
Variance de la distribution des salaires = σ22 = 144
C. V. B = 100 × √144⁄220 = 100 × 12⁄220 = 5.45 … (II)
en comparant (i) et (ii), nous voyons que la société B présente une plus grande variabilité.
pour les entreprises A et B, prises ensemble
Le salaire journalier moyen des deux entreprises prises ensemble