Antag att du får en dataserie. Någon ber dig att berätta några intressanta fakta om denna dataserie. Hur kan du göra det? Du kan säga att du kan hitta medelvärdet, medianen eller läget för denna dataserie och berätta om distributionen. Men är det det enda du kan göra? Är de centrala tendenserna det enda sättet att få veta om observationskoncentrationen? I det här avsnittet kommer vi att lära oss om en annan åtgärd för att veta mer om data., Här kommer vi att veta om måttet på spridning. Vi börjar.,=”3b6554cc1e”>
) no-repeat 50% 50%; background-size: cover”>
mått på spridning
som namnet antyder visar måttet på spridning uppgifternas spridning., Det berättar variationen av data från varandra och ger en klar uppfattning om fördelningen av data. Måttet på spridning visar homogenitet eller heterogenitet i fördelningen av observationerna.,
bläddra bland fler ämnen under mått på Central tendens och Dispersion
- aritmetiskt medelvärde
- Median och läge
- Partitionsvärden eller Fraktiler
- harmoniskt medelvärde och geometriskt medelvärde
- intervall och genomsnittlig avvikelse
- kvartiler, Kvartila avvikelse och koefficient för Kvartila avvikelse
- standardavvikelse och variationskoefficient
ar fyra datauppsättningar av samma storlek och medelvärdet är också detsamma, säg m. i alla fall kommer summan av observationerna att vara densamma., Här ger mått på central tendens inte en tydlig och fullständig uppfattning om fördelningen för de fyra givna uppsättningarna.
kan vi få en uppfattning om distributionen om vi får veta om spridningen av observationerna från varandra inom och mellan datauppsättningarna? Huvudidén om måttet på spridning är att lära känna hur data sprids. Det visar hur mycket data varierar från deras genomsnittliga värde.,
egenskaper hos Dispersionsmått
- ett mått på dispersion bör vara strikt definierat
- Det måste vara lätt att beräkna och förstå
- påverkas inte mycket av fluktuationerna i observationer
- baserat på alla observationer
klassificering av Dispersionsmått
dispersionsmåttet kategoriseras som:
(i) ett absolut mått på dispersionsmåttet
(i). dispersion:
- de åtgärder som uttrycker spridningen av observation när det gäller avstånd, dvs intervall, kvartilavvikelse.,
- den åtgärd som uttrycker variationer i termer av genomsnittet av avvikelser av observationer som genomsnittlig avvikelse och standardavvikelse.
(ii) ett relativt mått på dispersion:
vi använder ett relativt mått på dispersion för att jämföra distributioner av två eller flera datamängder och för enhetsfri jämförelse. De är koefficienten för intervallet, koefficienten för genomsnittlig avvikelse, koefficienten för kvartilavvikelse, variationskoefficienten och koefficienten för standardavvikelse.,
intervall
ett intervall är det vanligaste och lättförståeliga måttet på spridning. Det är skillnaden mellan två extrema observationer av datamängden. Om X max och X min är de två extrema observationerna då
Range = X max – X min
meriter intervall
- Det är den enklaste av måttet på spridning
- lätt att beräkna
- lätt att förstå
- oberoende av förändring av ursprung
Demerits intervall
- den är baserad på två extrema observationer., Därför påverkas av fluktuationer
- ett intervall är inte ett tillförlitligt mått på spridning
- beroende av skalförändring
Kvartilavvikelse
kvartilerna delar upp en datauppsättning i kvartaler. Den första kvartilen, (Q1) är mittnumret mellan det minsta antalet och medianen av data. Den andra kvartilen (Q2) är medianen för datamängden. Den tredje kvartilen, (Q3) är mittnumret mellan medianen och det största antalet.,= ½ × (Q3 – Q1)
meriter Kvartilavvikelse
- alla nackdelar med intervallet övervinns genom kvartilavvikelse
- den använder hälften av data
- oberoende av ursprungsändring
- det bästa måttet på spridning för öppen klassificering
demeriter av Kvartilavvikelse
- det ignorerar 50%
- beroende på skalförändring
- inte ett tillförlitligt mått på dispersion
genomsnittlig avvikelse
genomsnittlig avvikelse är det aritmetiska medelvärdet av de absoluta avvikelserna från observationerna från ett mått på central tendens., Om X1, x2, … , xn är observationsuppsättningen, är den genomsnittliga avvikelsen för x om medelvärdet a (medelvärde, median eller läge)
genomsnittlig avvikelse från medelvärdet a = 1 n
för en grupperad frekvens beräknas den som:
genomsnittlig avvikelse från medelvärdet A = 1 N, N = fi
här är xi och fi medelvärdet respektive mellanvärdet och frekvensen för den genomsnittliga ith klass intervall.,t ger ett minimivärde när avvikelserna tas från medianen
demeriter av genomsnittlig avvikelse
- inte lättförståelig
- beräkningen är inte lätt och tidskrävande
- beroende av skalförändringen
- okunnighet om negativt tecken skapar artificitet och blir värdelös för ytterligare matematisk behandling
standardavvikelse
en standardavvikelse är den positiva kvadratroten av det aritmetiska medelvärdet av kvadraterna för avvikelserna för de givna värdena från deras aritmetiska medelvärde., Det betecknas med ett grekiskt brev sigma, σ. Det kallas också root mean square avvikelse. Standardavvikelsen ges som
σ = ½ = ½
för en grupperad frekvensfördelning är det
σ = ½ = ½
kvadraten på standardavvikelsen är variansen. Det är också ett mått på spridning.
σ 2 = ½ =
för en grupperad frekvensfördelning är det
σ 2 = ½ = .
om vi istället för ett medelvärde väljer något annat godtyckligt tal, säg A, blir standardavvikelsen den genomsnittliga avvikelsen.,
variansen i den kombinerade serien
om σ1, σ2 är två standardavvikelser av två serier av storlekar n1 och n2 med means1 och means2. Variationen av två serier av storlekar n1 + n2 är:
σ 2 = (1/ n1 + n2) ÷
där, d1 = ȳ 1 − ȳ , d2 = ȳ 2 − ȳ , och ȳ = (n1 ȳ 1 + n2 ȳ 2) ÷ ( n1 + n2).,e nackdel med att ignorera tecken i genomsnittliga avvikelser
demeriter av standardavvikelse
- inte lätt att beräkna
- svår att förstå för en lekman
- beroende av förändringen av skalan
dispersionskoefficient
När vi vill jämföra variationen i de två serierna som skiljer sig mycket i deras medelvärden., Även när måttenheten är annorlunda. Vi måste beräkna spridningskoefficienterna tillsammans med spridningsmåttet. Dispersionskoefficienterna (C. D.) baserade på olika dispersionsmått är
variationskoefficient
100 gånger dispersionskoefficienten baserad på standardavvikelse är variationskoefficienten (C. V.).
C. V. = 100 × (S. D. / Medelvärdet) = (σ/ȳ ) × 100.
löst exempel på mått på spridning
Problem: nedan är tabellen som visar värdena för resultaten för två företag A och B.,
- vilket av företaget har en större löneräkning?
- beräkna koefficienterna för variationer för båda företagen.
- beräkna den genomsnittliga dagslönen och variansen i lönefördelningen för alla anställda i företagen A och B tillsammans.
lösning:
för företag A
Nej. av anställda = N1 = 900, och genomsnittliga dagslöner = 1 = Rs. 250
vi vet, Genomsnittlig dagslön = totala löner totalt antal anställda
eller, totala löner = totala anställda × Genomsnittlig dagslön = 900 × 250 = Rs., 225000 … (i)
för företag b
Nej. av anställda = N2 = 1000, och genomsnittliga dagslöner = paragraf 2 = Rs. 220
så, totala löner = totala anställda × Genomsnittlig dagslön = 1000 × 220 = Rs. 220000 … (ii)
jämföra (i), och (ii), ser vi att företaget A har en större lönekostnad.
för företag A
varians av fördelning av löner = σ12 = 100
C. V. fördelning av löner = 100 x standardavvikelse för fördelning av löner/ genomsnittliga dagliga löner
eller C. V., A = 100 × √100⁄250 = 100 × 10⁄250 = 4 … (i)
för företag b
varians av lönefördelning = σ22 = 144
C. V. B = 100 × √144⁄220 = 100 × 12⁄220 = 5.45 … (ii)
jämföra (i), och (ii), ser vi att Företag B har större variation.
för företag A och B, tillsammans
den genomsnittliga dagslönen för båda företagen tillsammans