Załóżmy, że otrzymujesz szereg danych. Ktoś prosi cię, abyś opowiedział kilka interesujących faktów na temat tej serii danych. Jak możesz to zrobić? Możesz powiedzieć, że możesz znaleźć średnią, medianę lub tryb tej serii danych i powiedzieć o jej dystrybucji. Ale czy tylko to możesz zrobić? Czy tendencje Centralne są jedynym sposobem, dzięki któremu możemy poznać koncentrację obserwacji? W tej sekcji dowiemy się o innym działaniu, aby dowiedzieć się więcej o danych., Tutaj dowiemy się o miarze dyspersji. Zaczynajmy.,=”3b6554cc1e”>
) no-repeat 50% 50%; background-size: cover”>
miary rozproszenia
jak sama nazwa wskazuje, miara rozproszenia pokazuje rozproszenie danych., Mówi zmienność danych od siebie i daje jasne pojęcie o dystrybucji danych. Miara dyspersji pokazuje jednorodność lub niejednorodność rozkładu obserwacji.,
Przeglądaj więcej tematów pod miarami tendencji centralnej i dyspersji
- średnia arytmetyczna
- Mediana i tryb
- wartości partycji lub fraktale
- Średnia harmoniczna i średnia geometryczna
- zakres i średnie odchylenie
- kwartyle, odchylenie Kwartylowe i Współczynnik odchylenia Kwartylowego
- odchylenie standardowe i współczynnik zmienności
Załóżmy, że masz cztery zbiory danych o tej samej wielkości i średniej są również takie same, powiedzmy, M. we wszystkich przypadkach suma obserwacji będzie taka sama., W tym przypadku miara tendencji centralnej nie daje jasnego i pełnego pojęcia o rozkładzie dla czterech podanych zbiorów.
Czy możemy uzyskać pojęcie o dystrybucji, jeśli dowiemy się o rozproszeniu obserwacji od siebie wewnątrz i między zbiorami danych? Główną ideą dotyczącą miary dyspersji jest poznanie sposobu rozprzestrzeniania się danych. Pokazuje, jak bardzo dane różnią się od ich średniej wartości.,
charakterystyka miar dyspersji
- miara dyspersji powinna być sztywno zdefiniowana
- musi być łatwa do obliczenia i zrozumienia
- nie ma większego wpływu na wahania obserwacji
- na podstawie wszystkich obserwacji
Klasyfikacja miar dyspersji
miara dyspersji jest klasyfikowana jako:
(i) bezwzględna miara dyspersji:
p>
- miary, które wyrażają rozpraszanie obserwacji pod względem odległości, tj. zasięgu, odchylenia kwartylowego.,
- miara, która wyraża wahania pod względem średniej odchyleń obserwacji, takich jak średnie odchylenie i odchylenie standardowe.
(ii) względna miara dyspersji:
używamy względnej miary dyspersji do porównywania dystrybucji dwóch lub więcej zestawów danych i dla porównania jednostkowego. Są to współczynnik zakresu, współczynnik średniego odchylenia, współczynnik odchylenia kwartylowego, współczynnik zmienności i współczynnik odchylenia standardowego.,
zakres
zakres jest najczęstszą i łatwo zrozumiałą miarą dyspersji. Jest to różnica między dwoma skrajnymi obserwacjami zbioru danych. Jeśli X max i X min są dwiema ekstremalnymi obserwacjami, to
Range = X max – X min
zalety zakresu
- jest to najprostsza miara dyspersji
- łatwa do obliczenia
- łatwa do zrozumienia
- niezależna od zmiany pochodzenia
wady zakresu
- opiera się na dwóch ekstremalnych obserwacjach., Stąd wpływ wahań
- zakres nie jest wiarygodną miarą dyspersji
- zależną od zmiany skali
odchylenie kwartyli
kwartyle dzielą zbiór danych na kwartały. Pierwszy kwartyl (Q1) jest liczbą środkową pomiędzy najmniejszą liczbą a medianą danych. Drugi kwartyl (Q2) jest medianą zbioru danych. Trzeci kwartyl, (Q3) jest liczbą środkową między medianą a największą liczbą.,= ½ × (Q3 – Q1)
zalety odchylenia Kwartylowego
- wszystkie wady zakresu są przezwyciężane przez odchylenie kwartylowe
- wykorzystuje połowę danych
- niezależnie od zmiany pochodzenia
- najlepsza miara dyspersji dla klasyfikacji otwartej
wady odchylenia Kwartylowego
- ignoruje 50% odchylenia Kwartylowego
- dane
- zależne od zmiany skali
- nie jest wiarygodną miarą dyspersji
średnie odchylenie
średnie odchylenie jest średnią arytmetyczną bezwzględnych odchyleń obserwacji od Miary tendencji centralnej., Jeśli x1, x2, … , xn są zestawem obserwacji, to średnie odchylenie x o średniej a (średnia, mediana lub tryb) jest
średnie odchylenie od średniej a = 1⁄n
dla zgrupowanej częstotliwości jest obliczane jako:
średnie odchylenie od średniej a = 1⁄N, N = fi fi
tutaj, xi I fi są odpowiednio średnią wartością i częstotliwości i-tego przedziału klasowego.,t podaje minimalną wartość, gdy odchylenia są brane od mediany
- niezależnie od zmiany pochodzenia
wady średniego odchylenia
- nie jest łatwo zrozumiałe
- jego obliczanie nie jest łatwe i czasochłonne
- w zależności od zmiany skali
- nieznajomość znaku ujemnego tworzy sztuczność i staje się bezużyteczna dla dalszego leczenia matematycznego
odchylenie standardowe
odchylenie standardowe jest dodatnim pierwiastkiem kwadratowym średniej arytmetycznej kwadratów odchyleń podanych wartości od ich średniej arytmetycznej., Jest oznaczona grecką literą sigma, σ. Jest również określany jako średnie odchylenie kwadratowe pierwiastka. Odchylenie standardowe jest podane jako
σ = ½ = ½
dla zgrupowanego rozkładu częstotliwości jest to
σ = ½ = ½
kwadratem odchylenia standardowego jest wariancja. Jest też miarą dyspersji.
σ 2 = ½ =
dla zgrupowanego rozkładu częstotliwości jest to
σ 2 = ½ = .
Jeśli zamiast średniej wybierzemy dowolną inną dowolną liczbę, powiedzmy A, odchylenie standardowe staje się średnią główną odchyleniem.,
wariancja szeregu zespolonego
Jeżeli σ1, σ2 są dwoma odchyleniami standardowymi dwóch szeregów wielkości n1 i n2 ze średnimi ȳ1 i ȳ2. Różnica w dwa rzędy wymiary H1 + H2:
σ 2 = (1/ H1 + H2) ÷
gdzie D1 = ȳ 1 − ȳ , D2 = ȳ 2 − ȳ , i ȳ = (H1 ȳ 1 + N2 ȳ 2) ÷ ( H1 + H2).,e wada ignorowania znaków w średnich odchyleniach
wady odchylenia standardowego
- niełatwe do obliczenia
- trudne do zrozumienia dla laika
- zależne od zmiany skali
współczynnik dyspersji
, Również wtedy, gdy jednostka miary jest inna. Musimy obliczyć współczynniki dyspersji wraz z miarą dyspersji. Współczynniki dyspersji (CD) na podstawie różnych miar dyspersji są
współczynnik zmienności
100 razy współczynnik dyspersji na podstawie odchylenia standardowego jest współczynnik zmienności (CV).
C. V. = 100 × (S. D. / Mean) = (σ/σ ) × 100.
rozwiązany przykład pomiaru dyspersji
Problem: Poniżej znajduje się tabela przedstawiająca wartości wyników dla dwóch firm A i B.,
- która z firm ma większy rachunek płacowy?
- Oblicz współczynniki zmian dla obu firm.
- Oblicz średnie dzienne wynagrodzenie i wariancję podziału wynagrodzeń wszystkich pracowników w firmach A i B łącznie.
rozwiązanie:
dla firmy A
nie. pracowników = n1 = 900, a przeciętne wynagrodzenie dzienne = ȳ 1 = Rs. 250
wiemy, przeciętne wynagrodzenie dzienne = wynagrodzenia ogółem ⁄ całkowita liczba pracowników
lub, wynagrodzenie całkowite = pracownicy ogółem × przeciętne wynagrodzenie dzienne = 900 × 250 = Rs., 225000 … (i)
dla firmy B
nr pracowników = n2 = 1000, a przeciętne wynagrodzenie dzienne = ȳ2 = Rs. 220
Tak więc płace ogółem = pracownicy ogółem × przeciętne dzienne wynagrodzenie = 1000 × 220 = Rs. 220000 … (ii)
dla firmy A
wariancja rozkładu płac = σ12 = 100
C. V. rozkładu płac = 100 x odchylenie standardowe rozkładu płac/ przeciętne wynagrodzenie dzienne
lub, C. V., A = 100 × √100⁄250 = 100 × 10⁄250 = 4 … (i)
dla firmy B
wariancja podziału płac = 22 = 144
C. V. B = 100 × √144⁄220 = 100 × 12⁄220 = 5.45 … (ii)
porównując (i) I (ii), widzimy, że Firma B ma większą zmienność.
dla firm A i B, wzięte razem
średnie dzienne wynagrodzenie dla obu firm wzięte razem