Angenommen, Sie erhalten eine Datenreihe. Jemand bittet Sie, einige interessante Fakten über diese Datenreihe zu erzählen. Wie kannst du das tun? Sie können sagen, dass Sie den Mittelwert, den Median oder den Modus dieser Datenreihe finden und über ihre Verteilung berichten können. Aber ist es das einzige, was Sie tun können? Sind die zentralen Tendenzen die einzige Möglichkeit, die Konzentration der Beobachtung kennenzulernen? In diesem Abschnitt erfahren Sie mehr über eine andere Maßnahme, um mehr über die Daten zu erfahren., Hier werden wir über das Maß der Dispersion Bescheid wissen. Fangen wir an.,=“3b6554cc1e“>
) no-repeat 50% 50%; background-size: cover“>
Maße der Streuung
Wie der Name schon sagt, zeigt das Maß der Streuung die Streuungen der Daten., Es erzählt die Variation der Daten voneinander und gibt eine klare Vorstellung von der Verteilung der Daten. Das Maß der Dispersion zeigt die Homogenität oder die Heterogenität der Verteilung der Beobachtungen.,
Durchsuchen Sie weitere Themen unter Measures Of Central Tendency And Dispersion
- Arithmetic Mean
- Median and Mode
- Partition Values or Fractiles
- Harmonic Mean and Geometric Mean
- Range and Mean Deviation
- Quartiles, Quartile Deviation and Coefficient of Quartile Deviation
- Standard deviation and Coefficient of Variation
Angenommen, Sie haben vier datensätze gleicher Größe und Mittelwert sind auch gleich, sagen wir, m. In allen Fällen ist die Summe der Beobachtungen gleich. , Hier gibt das Maß der zentralen Tendenz keine klare und vollständige Vorstellung von der Verteilung für die vier gegebenen Sätze.
Können wir uns ein Bild von der Verteilung machen, wenn wir die Streuung der Beobachtungen innerhalb und zwischen den Datensätzen voneinander erfahren? Die Hauptidee über das Maß der Dispersion ist zu wissen, wie die Daten verteilt werden. Es zeigt, wie stark die Daten von ihrem Durchschnittswert abweichen.,
Merkmale der Dispersionsmaße
- Ein Dispersionsmaß sollte starr definiert sein
- Es muss leicht zu berechnen und zu verstehen sein
- Nicht stark von den Fluktuationen der Beobachtungen beeinflusst werden
- Basierend auf allen Beobachtungen
Klassifizierung der Dispersionsmaße
Das Dispersionsmaß wird kategorisiert als:
(i) Ein absolutes Dispersionsmaß:
- Die Maße, die die Streuung der Beobachtung in Bezug auf Entfernungen ausdrücken, dh Reichweite, Quartilabweichung.,
- Das Maß, das die Variationen in Bezug auf den Durchschnitt der Abweichungen von Beobachtungen wie mittlere Abweichung und Standardabweichung ausdrückt.
(ii) Ein relatives Maß für die Dispersion:
Wir verwenden ein relatives Maß für die Dispersion zum Vergleichen von Verteilungen von zwei oder mehr Datensätzen und zum einheitsfreien Vergleich. Sie sind der Bereichskoeffizient, der Koeffizient der mittleren Abweichung, der Koeffizient der Quartilabweichung, der Variationskoeffizient und der Koeffizient der Standardabweichung.,
Bereich
Ein Bereich ist das gebräuchlichste und leicht verständlichste Maß für die Dispersion. Es ist der Unterschied zwischen zwei extremen Beobachtungen des Datensatzes. Wenn X max und X min die beiden extremen Beobachtungen sind, dann
Range = X max – X min
Verdienste des Bereichs
- Es ist das einfachste Maß der Dispersion
- Einfach zu berechnen
- Leicht zu verstehen
- Unabhängig von der Änderung des Ursprungs
Abweichungen des Bereichs
- Es basiert auf zwei extremen Beobachtungen., Daher werden von Schwankungen beeinflusst
- Ein Bereich ist kein zuverlässiges Maß für die Dispersion
- Abhängig von Skalenänderung
Quartilabweichung
Die Quartile teilen einen Datensatz in Viertel auf. Das erste Quartil (Q1) ist die mittlere Zahl zwischen der kleinsten Zahl und dem Median der Daten. Das zweite Quartil (Q2) ist der median des Datensatzes. Das dritte Quartil (Q3) ist die mittlere Zahl zwischen dem Median und der größten Zahl.,= ½ × (Q3 – Q1)
Verdienste der Quartilabweichung
- Alle Nachteile des Bereichs werden durch Quartilabweichung überwunden
- Es verwendet die Hälfte der Daten
- Unabhängig von der Änderung des Ursprungs
- Das beste Maß für die Dispersion für die Open-End-Klassifizierung
Demerits der Quartilabweichung
- Es ignoriert 50% der Daten
- Abhängig von Skalenänderung
- Kein zuverlässiges Maß für Dispersion
Mittlere Abweichung
Mittlere Abweichung ist das arithmetische Mittel der absoluten Abweichungen der Beobachtungen von einem Maß für zentrale Tendenz., Wenn x1, x2, … , xn der Beobachtungssatz sind, dann ist die mittlere Abweichung von x über den Durchschnitt A (Mittelwert, Median oder Modus)
Mittlere Abweichung vom Durchschnitt A = 1⁄n
Für eine gruppierte Frequenz wird berechnet als:
Mittlere Abweichung vom Durchschnitt A = 1⁄N, N = ∑fi
Hier sind xi und fi jeweils der mittlere Wert und die Häufigkeit der ith Klasse Intervall.,t liefert einen Minimalwert, wenn die Abweichungen vom Median genommen werden
Nachteile der mittleren Abweichung
- Nicht leicht verständlich
- Seine Berechnung ist nicht einfach und zeitaufwendig
- Abhängig von der Änderung der Skala
- Die Unkenntnis des negativen Vorzeichens erzeugt Künstlichkeit und wird für die weitere mathematische Behandlung unbrauchbar
Standardabweichung
Eine Standardabweichung ist die positive Quadratwurzel des arithmetischen Mittels der Quadrate der Abweichungen der gegebenen Werte von ihrem arithmetischen Mittel., Es wird mit einem griechischen Buchstaben sigma, σ bezeichnet. Es wird auch als mittlere quadratische Abweichung bezeichnet. Die Standardabweichung ist gegeben als
σ = ½ = ½
Für eine gruppierte Frequenzverteilung ist es
σ = ½ = ½
Das Quadrat der Standardabweichung ist die Varianz. Es ist auch ein Maß für die Streuung.
σ 2 = ½ =
Für eine gruppierte Frequenzverteilung ist es
σ 2 = ½ = .
Wenn wir anstelle eines Mittelwerts eine andere beliebige Zahl wählen, z. B. A, wird die Standardabweichung zur Grundmittelabweichung.,
Varianz der kombinierten Reihe
Wenn σ1, σ2 zwei Standardabweichungen von zwei Reihen der Größen n1 und n2 mit den Mitteln ȳ1 und ȳ2 sind. Die Varianz der zwei Reihen von Größen n1 + n2 ist:
σ 2 = (1/ n1 + n2) ÷
wo, d1 = ȳ 1 − ȳ , d2 = ȳ 2 − ȳ , und ȳ = (n1 ȳ 1 + n2 ȳ 2) ÷ ( n1 + n2).,e Nachteil des Ignorierens von Zeichen in mittleren Abweichungen
Abweichungen der Standardabweichung
- Nicht einfach zu berechnen
- Für einen Laien schwer zu verstehen
- Abhängig von der Änderung der Skala
Dispersionskoeffizient
Wann immer wir die Variabilität der beiden Reihen vergleichen möchten, die sich in ihren Durchschnitten stark unterscheiden., Auch wenn die Maßeinheit anders ist. Wir müssen die Dispersionskoeffizienten zusammen mit dem Dispersionsmaß berechnen. Die Dispersionskoeffizienten (C. D.), die auf verschiedenen Dispersionsmessungen basieren, sind
Variationskoeffizient
100 mal der Dispersionskoeffizient, der auf Standardabweichung basiert, ist der Variationskoeffizient (C. V.).
C. V. = 100 × (S. D. / Mittelwert) = (σ/ȳ ) × 100.
Gelöstes Beispiel für Dispersionsmaße
Problem: Nachfolgend finden Sie die Tabelle mit den Werten der Ergebnisse für zwei Unternehmen A und B.,
- Welches Unternehmen hat eine größere Lohnrechnung?
- Berechnen Sie die Variationskoeffizienten für beide Unternehmen.
- Berechnen Sie den durchschnittlichen Tageslohn und die Varianz der Lohnverteilung aller Beschäftigten in den Unternehmen A und B zusammen.
Lösung:
Für Firma A
Nr. von Angestellten = n1 = 900 und durchschnittlichen Tageslöhnen = ȳ 1 = Rs. 250
Wir wissen, durchschnittlicher Tageslohn = Gesamtlohn ⁄ Gesamtzahl der Mitarbeiter
oder, Gesamtlohn = Gesamtbeschäftigte × durchschnittlicher Tageslohn = 900 × 250 = Rs., 225000 … (i)
Für Firma B
Nr. von Angestellten = n2 = 1000 und durchschnittlichen Tageslöhnen = ȳ2 = Rs. 220
Also, Gesamtlöhne = Gesamtbeschäftigte × durchschnittlicher Tageslohn = 1000 × 220 = Rs. 220000 … (ii)
Im Vergleich zu (i) und (ii) sehen wir, dass Unternehmen A eine größere Lohnrechnung hat.
Für Unternehmen A
Varianz der Lohnverteilung = σ12 = 100
C. V. der Lohnverteilung = 100 x Standardabweichung der Lohnverteilung / durchschnittliche Tageslöhne
Oder C. V., A = 100 × √100⁄250 = 100 × 10⁄250 = 4 … (i)
Für Unternehmen B
Varianz der Lohnverteilung = σ22 = 144
C. V. B = 100 × √144⁄220 = 100 × 12⁄220 = 5.45 … (ii)
Wenn wir (i) und (ii) vergleichen, sehen wir, dass Unternehmen B eine größere Variabilität aufweist.
Für Unternehmen A und B zusammengenommen
Die durchschnittlichen Tageslöhne beider Unternehmen zusammengenommen