Einleitung

Das Histogramm ist eine Methode in der Statistik, um eine Häufigkeitsverteilung grafisch darzustellen. Es erlaubt sehr schnell einen Rückschluss darauf, ob ein gegebener Datensatz normalverteilt ist oder nicht. Die Häufigkeitsverteilung ist das theoretische Gegenstück zur Wahrscheinlichkeitsverteilung.

Größen und Werte

Klasse
Der Wertebereich eines Datensatzes (z.B. Noten in einer Schularbeit) wird in eine beliebige Anzahl an Intervallen k, so genannte Klassen, aufgeteilt. Es ist nicht zwingend erforderlich, dass diese Intervalle gleich groß sind, dennoch macht dies die Interpretation leichter. Je mehr Klassen man definiert, desto höher wird die Genauigkeit des entstehenden Histogramms.

Häufigkeitsdichte
Als Häufigkeitsdichte bezeichnet man die Werte, die den jeweiligen k’s zugeordnet sind (z.B. Anzahl der Schüler mit einer bestimmten Note).

Klassenhäufigkeit
Die Klassenhäufigkeit errechnet sich aus dem Faktor der Klasse mal der Häufigkeitsdichte, ergo ist sie der Flächeninhalt der jeweiligen Balken. Sie kann entweder einen absoluten Wert darstellen, der der genauen Anzahl an Werten in einer Klasse entspricht, oder einen relativen, der den Prozentsatz der Werte in einer Klasse im Vergleich zum kompletten Datensatz darstellt.

Aufbau

Mithilfe von Histogrammen lassen sich bestimmte Werte visuell schnell erfassen und verstehen.

Mithilfe von Histogrammen lassen sich bestimmte Werte visuell schnell erfassen und verstehen.

Die Breite eines Balkens im Histogramm wird durch die Klassen k bestimmt. Diese Breite ist lediglich relativ zu den anderen k’s zu sehen. Enthält jedes k die gleiche Anzahl an Werten, ist auch jeder Balken gleich groß. Enthält ein k 2 Werte und ein anderes nur einen, ist der erste Balken logischerweise doppelt so breit wie der zweite.

Die Höhe der Balken ist durch die Häufigkeitsdichte definiert. Je mehr Werte einem bestimmten k zugeordnet sind (z.B. Schüler, die die Note 3 haben), desto höher wird der Balken.

Anwendungen

Hauptsächlich verwendet man Histogramme in der beschreibenden Statistik, wenn man nicht nur auf zusammenfassende Daten, wie zum Beispiel den Mittelwert, zurückgreifen möchte.
Weitherhin lässt sich mit Hilfe von Histogrammen die Wahrscheinlichkeitsdichte und Warscheinlichkeitsverteilung von Zufallsvariablen abschätzen.

Anwendungen finden sich auch in der Bildverarbeitung. Hier gibt es Aufschluss über die Belichtungsanteile, also darüber, ob ein Bild eher dunkellastig ist oder in den helleren Abstufungen liegt. Das ist insbesondere als Information interessant, denn hellere Bilder lassen sich leichter bearbeiten als dunklere.