Immer wieder stößt man in öffentlichen Diskussionen rund um Politik, Wirtschaft und Wissenschaft auf den Begriff Clusteranalyse. Doch viele von uns, wissen gar nicht genau, was man darunter versteht. Das Wort Cluster ist einigen zwar aus dem Englischen bekannt (es bedeutet etwa Bündel, Büschel oder Haufen), aber was genau nun eine Clusteranalyse ist, das wissen die meisten von uns nicht.

Bei einer kürzlich durchgeführten Umfrage antworteten 63 Prozent der Befragten, dass sie den Begriff zwar schon einmal gehört hatten, ihn aber nicht definieren könnten. 34 weitere Prozent konnten mit dem Wort Clusteranalyse gar nichts anfangen. Nur etwa 3 Prozent wussten in etwa, worum es sich dabei handelt. Was ist nun eine Clusteranalyse? Wir wollen es Ihnen gerne ein wenig näher erklären.

Die Clusteranalyse kommt in verschiedenen Bereichen der modernen Datenanalyse zum Einsatz, so etwa in der Markt- und Meinungsforschung sowie der empirischen Sozialforschung. Grundlage einer solchen Analyse ist immer ein Datensatz, das heißt eine Sammlung von Daten, die zuvor an verschiedenen Subjekten oder Objekten (zum Beispiel Menschen) über verschiedene Variablen erhoben wurden. Nehmen wir als Beispiel an, eine Marktumfrage hat bei 1000 Personen jeweils ihr Alter, ihr Geschlecht, ihre Einkommenslage, ihre Schulbildung sowie ihre Konsumgewohnheiten erhoben. Anhand einer Clusteranalyse können wir nun die Personen, die sich in diesen fünf Variablen relativ ähnlich sind, zu Gruppen klassifizieren und erkennen, welche Objekte sich ähneln. So könnte sich beispielsweise ergeben, dass ältere Frauen mit hoher Schulbildung und hohem Einkommen ein bestimmtes Produkt häufiger konsumieren als alle anderen Gruppierungen. Die Werbung und das Marketing der entsprechenden Unternehmen können sich dann an diese spezielle Zielgruppe anpassen. Wenn wir uns auf 2 Variablen beschränken, können wir dieses Konzept auch grafisch veranschaulichen. Stellen Sie sich einfach ein zweidimensionales Koordinatensystem vor, auf der x-Achse ist das Alter aufgetragen und auf der y-Achse das Einkommen. Jede Person wird nun mit einem Punkt in diesem Koordinatensystem dargestellt, es ergibt sich ein so genanntes Streudiagramm. Wenn wir nun sehen, dass besonders viele Menschen jungen Alters sich im Bereich des niedrigen Einkommens bewegen, so haben wir einen Cluster gebildet und unsere Clusteranalyse war erfolgreich. So einfach ist das Konzept zu erklären.