Lineare Zusammenhänge und Korrelationskoeffizient

Der Korrelationskoeffizient stellt den linearen Zusammenhang von mindestens zwei Merkmalen innerhalb eines bestimmten Skalenspektrums dar. Das bedeutet zuerst einmal, dass grundsätzlich vorläufig ein lineare Zusammenhang zwischen den Merkmalen unterstellt wird. Im Anschluss wird dann der entsprechende Wert errechnet. Dieser kann auf einer Skala Werte von -1 bis +1 erreichen. Beträgt der Wert -1 oder +1, dann hat dies zu bedeuten, dass zwischen den untersuchten Merkmalen ein stark positiver und linearer Zusammenhang besteht. Beträgt der Wert hingegen 0, so wird daraus ersichtlich  dass keinerlei lineare Abhängigkeit zwischen den untersuchten Variablen besteht.

Um feststellen zu können, wie groß der Wert des Korrelationskoeffizienten ist, ist es daher zwingend erforderlich, dass sämtliche Variablen halbwegs normal verteilt vorliegen und somit nicht in Extrembereichen hineinreichen. Ansonsten macht die Ermittlung keinen Sinn und es besteht keine Möglichkeit, ein schlüssiges Ergebnis zu erzielen.

Probleme bei der Verwendung des Korrelationskoeffizienten

Es ist jedoch zu bedenken, dass der Korrelationskoeffizient keine aussagekräftige Auskunft darüber geben kann, ob die Variablem, was die Wahrscheinlichkeitsverteilung betrifft, von einander abhängig sind. Der Korrelationskoeffizient kann somit immer lediglich eine bloße Schätzung der erwartungsmäßigen Varianz darstellen.

Kovarianz

Aus diesem Grund ist es sinnvoll und geboten, mit Hilfe der Kovarianz zu ermitteln, wie groß der Zusammenhang zwischen den gegebenen Variablen ist. Das ist vor allem deshalb nötig, um so die Wahrscheinlichkeitsverteilung ermitteln zu können. Zusammenfassend ist deshalb zu sagen, dass sich Wahrscheinlichkeitsverhältnisse vor allem mit Hilfe der Stochastik ermitteln lassen. Diese lässt aufgrund ihrer größeren Genauigkeit verlässlichere und umfangreichere Rückschlüsse auf eine bestimmte Wahrscheinlichkeitsverteilung zu, als die bloße Ermittlung des Korrelationskoeffizienten. Dieser kann folglich lediglich einen vorläufigen Anhaltspunkt dafür bieten, ob überhaupt ein linearer Zusammenhang zwischen den gegebenen Variablen besteht und ob diesbezüglich daher eine weitere Untersuchung sinnvoll sein könnte.

Standardabweichung und Erwartungswert

Eine weitere sinnvolle Möglichkeit ist die mathematische Ermittlung der Standardabweichung. Diese bietet schließlich einen Aufschluss darüber, innerhalb welches Spektrums die Werte der untersuchten Merkmale um den Mittelwert herum verteilt sind. Wie hingegen die Verteilung der Werte im Mittel selbst bezüglich der Variablen vorliegt, das lässt sich mit Hilfe des Erwartungswertes feststellen. Mit diesem Wert wird folglich die Lage der Verteilung berechnet und dieser ist daher mit dem arithmetischen Mittel gleichzusetzen.