Auswahl der richtigen bin width
Es gibt keine richtige oder falsche Antwort darauf, wie breit ein Bin sein sollte, aber es gibt Faustregeln. Sie müssen sicherstellen, dass die Behälter nicht zu klein oder zu groß sind., Betrachten Sie das Histogramm, das wir zuvor erstellt haben (siehe oben): Die folgenden Histogramme verwenden dieselben Daten, haben jedoch entweder viel kleinere oder größere Behälter, wie unten gezeigt:
Aus dem Histogramm auf der linken Seite können wir sehen, dass die Bin-Breite zu klein ist, da zu viele einzelne Daten angezeigt werden und das zugrunde liegende Muster (Frequenzverteilung) der Daten nicht leicht sichtbar ist. Am anderen Ende der Skala befindet sich das Diagramm rechts, in dem die Behälter zu groß sind, und auch hier können wir den zugrunde liegenden Trend in den Daten nicht finden.,
Histogramme basieren auf der Fläche, nicht auf der Höhe der Balken
In einem Histogramm gibt der Bereich des Balkens die Häufigkeit der Vorkommen für jeden Bin an. Dies bedeutet, dass die Höhe des Balkens nicht unbedingt angibt, wie viele Vorkommen von Punkten in jedem einzelnen Behälter vorhanden waren. Es ist das Produkt der Höhe multipliziert mit der Breite des Behälters, das die Häufigkeit von Vorkommen innerhalb dieses Behälters angibt., Einer der Gründe dafür, dass die Höhe der Balken oft falsch als Frequenz und nicht als Fläche des Balkens eingeschätzt wird, ist die Tatsache, dass viele Histogramme oft gleich große Balken (Behälter) haben und unter diesen Umständen Die Höhe des Behälters spiegelt die Frequenz wider.
Was ist der Unterschied zwischen einem Balkendiagramm und einem Histogramm?
Der Hauptunterschied besteht darin, dass ein Histogramm nur verwendet wird, um die Häufigkeit von Score-Vorkommen in einem kontinuierlichen Datensatz darzustellen, der in Klassen unterteilt wurde, die als Bins bezeichnet werden., Balkendiagramme hingegen können für viele andere Arten von Variablen verwendet werden, einschließlich ordinaler und nominaler Datensätze.