at Vælge den korrekte bakke bredde
Der er ingen rigtige eller forkerte svar på, hvor bred en bin bør være, men der er tommelfingerregler. Du skal sørge for, at beholderne ikke er for små eller for store., Overveje det histogram, som vi produceret tidligere (se ovenfor): følgende histogrammer, som bruger de samme data, men har enten meget større eller mindre bakker, som vist nedenfor:
Vi kan se på histogrammet til venstre, at bin-bredde er for lille, fordi det viser for meget individuelle data, og ikke tillade, at den underliggende mønster (hyppighed, fordeling) af data til at være let kan ses. I den anden ende af skalaen er diagrammet til højre, hvor beholderne er for store, og igen kan vi ikke finde den underliggende tendens i dataene.,
histogrammer er baseret på Område, ikke højden af søjler
i et histogram er det det område af linjen, der angiver hyppigheden af forekomster for hver bin. Dette betyder, at bjælkens højde ikke nødvendigvis angiver, hvor mange forekomster af scoringer der var inden for hver enkelt bin. Det er produktet af højden ganget med bredden af skraldespanden, der angiver hyppigheden af forekomster inden for denne bin., En af grundene til, at bjælkens højde ofte forkert vurderes som indikatorfrekvens og ikke barens område, skyldes det faktum, at mange histogrammer ofte har lige fordelte bjælker (skraldespande), og under disse omstændigheder afspejler binens højde frekvensen.
hvad er forskellen mellem et søjlediagram og et histogram?
den største forskel er, at et histogram kun bruges til at plotte hyppigheden af scoreforekomster i et kontinuerligt datasæt, der er opdelt i klasser, kaldet skraldespande., Søjlediagrammer, på den anden side, kan bruges til en hel del andre typer variabler, herunder ordinære og nominelle datasæt.