Antag, at du får en dataserie. Nogen beder dig om at fortælle nogle interessante fakta om denne dataserie. Hvordan kan du gøre det? Du kan sige, at du kan finde middelværdien, medianen eller tilstanden for denne dataserie og fortælle om dens distribution. Men er det det eneste, du kan gøre? Er de centrale tendenser den eneste måde, hvorpå vi kan få at vide om koncentrationen af observationen? I dette afsnit lærer vi om en anden foranstaltning for at vide mere om dataene., Her skal vi vide om spredningsmålet. Lad os starte.,=”3b6554cc1e”>
) no-repeat 50% 50%; background-size: cover”>
Foranstaltninger af Spredning
Som navnet antyder, er den foranstaltning for at sprede viser scatterings af data., Det fortæller variationen af data fra hinanden og giver en klar ID.om fordelingen af data. Målingen af dispersion viser homogeniteten eller heterogeniteten af fordelingen af observationerne.,
Gennemse flere Emner i henhold til Foranstaltninger, der er Af Central Tendens Og Spredning
- Aritmetiske Middelværdi
- Median og Mode
- Partition Værdier eller Fractiles
- Harmoniske Middelværdi og Geometrisk Middelværdi
- Rækkevidde og Betyde Afvigelse
- Kvartiler, Kvartil Afvigelse og Koefficienten Kvartil Afvigelse
- standardafvigelse og variationskoefficient
Antag at du har fire datasæt af samme størrelse, og det betyder, er også den samme, sige, m. I alle tilfælde er summen af observationer vil være den samme., Her giver måling af central tendens ikke en klar og komplet ide om fordelingen for de fire givne sæt.
kan vi få en ID?om fordelingen, hvis vi får at vide om spredningen af observationer fra hinanden inden for og mellem datasættene? Hovedid .en om spredningsmålingen er at lære at vide, hvordan dataene spredes. Det viser, hvor meget dataene varierer fra deres gennemsnitlige værdi.,
Egenskaber af Foranstaltninger i form af Spredning
- Et mål for spredningen skal være fast defineret
- Det skal være nemt at beregne og forstå
- Ikke påvirket meget af udsving af iagttagelser
- Baseret på, at alle iagttagelser
Klassifikation af Foranstaltninger i form af Spredning
Mål for spredningen er kategoriseret som:
(jeg) Et absolut mål for spredning:
- De foranstaltninger, der hurtig spredning af observation i form af afstande dvs, udvalg, kvartil afvigelse.,
- den foranstaltning, der udtrykker variationerne i forhold til gennemsnittet af afvigelser fra observationer som middelafvigelse og standardafvigelse.
(ii) en relativ dispersionsmåling:
Vi bruger en relativ dispersionsmåling til sammenligning af distributioner af to eller flere datasæt og til enhedsfri sammenligning. De er den koefficient på området, koefficienten for middelafvigelse, koefficienten for kvartil afvigelse, variationskoefficienten, og koefficienten for standardafvigelse.,
interval
et interval er det mest almindelige og let forståelige mål for dispersion. Det er forskellen mellem to ekstreme observationer af datasættet. Hvis X max og min X er de to ekstreme observationer, så
Range = X max – X min.
Fordele for Rækkevidde
- Det er den enkleste af de mål for spredningen
- Let at beregne
- Let at forstå
- Uafhængige af ændring af oprindelsen
Ulemper for Rækkevidde
- Det er baseret på to ekstreme observationer., Bliv derfor påvirket af udsving
- et interval er ikke et pålideligt mål for dispersion
- afhængig af skalaændring
Kvartilafvigelse
kvartilerne deler et datasæt i kvartaler. Den første kvartil, (Q1) er det midterste tal mellem det mindste tal og medianen af dataene. Den anden kvartil, (Q2) er medianen af datasættet. Den tredje kvartil, (Q3) er det midterste tal mellem medianen og det største antal.,= ½ × (Q3 – Q1)
Fordele af Kvartil Afvigelse
- Alle de ulemper der er for området er overvundet ved kvartil afvigelse
- Det bruger halvdelen af de data
- Uafhængige af ændring af oprindelsen
- Det bedste mål for spredning til open-end-klassifikation
Ulemper af Kvartil Afvigelse
- Det ignorerer 50% af data
- Afhængig af ændring af skala
- Ikke en pålidelig måling af dispersion
Betyde Afvigelse
Betyder afvigelse er det aritmetiske gennemsnit af de absolutte afvigelser af observationer fra et mål for central tendens., Hvis x1, x2, … , xn er de sæt af observation, så er den gennemsnitlige afvigelse for x om den gennemsnitlige A (middelværdi, median, eller-tilstand) er
Betyder afvigelse fra gennemsnit = 1⁄n
For et grupperet frekvens, det er beregnet som:
Betyder afvigelse fra gennemsnit = 1⁄N , N = ∑fi
Her, xi og internetadgang er henholdsvis midten af værdien og hyppigheden af den i ‘ te klasse interval.,t giver en minimum værdi, når de afvigelser, er taget fra medianen
Ulemper Betyde Afvigelse
- Ikke-forståelige
- beregning er ikke let, og tidskrævende
- Afhængig af ændringen af skalaen
- Uvidenhed af negativt fortegn skaber kunstighed og bliver ubrugelig for yderligere matematisk behandling
Standard Afvigelse
En standard afvigelse er den positive kvadratrod af det aritmetiske gennemsnit af kvadraterne på afvigelserne af de givne værdier fra deres aritmetiske gennemsnit., Det er betegnet med et græsk bogstav sigma, σ. Det kaldes også root middel kvadrat afvigelse. Standardafvigelsen er angivet som
==.=.
For en grupperet frekvensfordeling er den
==.=.
kvadratet på standardafvigelsen er variansen. Det er også et mål for spredning.
2 2=. =
For en grupperet frekvensfordeling er den
2 2=.=.
Hvis vi i stedet for et middel vælger et andet vilkårligt tal, siger A, bliver standardafvigelsen den gennemsnitlige afvigelse.,
varians af den kombinerede serie
Hvis IF1 ,22 er to standardafvigelser af to serier af størrelser n1 og n2 med midler11 og22. Variansen af de to serier af størrelser n1 + n2 er:
σ 2 = (1/ n1 + n2) ÷
hvor d1 = ȳ 1 − ȳ , d2 = ȳ 2 − ȳ , og ȳ = (n1 ȳ 1 + n2 ȳ 2) ÷ ( n1 + n2).,e ulempe er at ignorere tegn i den gennemsnitlige afvigelser
Ulemper af Standard Afvigelse
- Ikke let at beregne
- Svært at forstå for en lægmand
- Afhængig af ændringen af skalaen
Koefficient Spredning
Når vi ønsker at sammenligne foranderligheden af de to serier, som er meget forskellige i deres gennemsnit., Også, når måleenheden er anderledes. Vi skal beregne dispersionskoefficienterne sammen med spredningsmålingen. Dispersionskoefficienterne (C. D.) baseret på forskellige dispersionsmål er
variationskoefficient
100 gange dispersionskoefficienten baseret på standardafvigelse er variationskoefficienten (C. V.).
C. V. = 100 × (S. D. / Gennemsnit) = (σ/ȳ ) × 100.
løst eksempel på Dispersionsmål
Problem: nedenfor er tabellen, der viser værdierne for resultaterne for to virksomheder A og B.,
- hvilken af virksomheden har en større lønregning?
- Beregn variationskoefficienterne for begge virksomheder.
- Beregn den gennemsnitlige dagsløn og variansen af lønfordelingen for alle ansatte i virksomhederne A og B tilsammen.
løsning:
for virksomhed a
nr. af medarbejdere = n1 = 900, og gennemsnitlige dagsløn = 1 1 = Rs. 250
Vi ved, gennemsnitlig dagsløn = samlede lønninger ⁄ Samlet antal ansatte
eller, samlede lønninger = samlede ansatte.gennemsnitlig dagsløn = 900. 250 = Rs., 225000 … (i)
for virksomhed B
nr. af medarbejdere = n2 = 1000, og gennemsnitlige dagsløn =22 = Rs. 220
altså samlede lønninger = samlede ansatte average gennemsnitlig dagsløn = 1000 220 220 = Rs. 220000 …(ii)
sammenligning (i) og (ii) ser vi, at Virksomhed A har en større lønregning.
For Virksomhed A
Varians i fordelingen af lønnen = σ12 = 100
C. V. af fordelingen af løn = 100 x standardafvigelsen for fordelingen af lønnen/ gennemsnitlige daglige løn
, Eller, C. V., En = 100 × √100⁄250 = 100 × 10⁄250 = 4 … (i)
For Selskab B
Varians i fordelingen af lønnen = σ22 = 144
C. V. B = 100 × √144⁄220 = 100 × 12⁄220 = 5.45 … (ii)
Sammenligne (i) og (ii), vi kan se, at Virksomhed B har større variation.
for Virksomhed A og B, samlet
den gennemsnitlige dagsløn for begge virksomheder samlet