Die Kovarianz ist eine Maßzahl, welche den Zusammenhang zwischen zwei Merkmalen beschreibt. Es findet sowohl in der Statistik als auch in der Stochastik Anwendung.

Die Grundlagen und der Korrelationskoeffizient

Als Ausgangssituation werden zwei Merkmale X und Y betrachtet. Ziel ist es nun, zu überprüfen, ob zwischen diesen ein Zusammenhang besteht. Die Kovarianz hilft nun diese Abhängigkeit zu erkennen und zu beweisen. Eine lineare Abhängigkeit lässt sich mit Korrelationskoeffizienten, wie z.B. dem Pearsonschen Korrelationskoeffizienten überprüfen. Dieser verwendet neben der Standardabweichung auch das Zusammenhangsmaß zur Berechnung.

Die Berechnung

Die Berechnung des Maßes ist recht simpel, erfordert bei größeren Datenreihen jedoch Rechnereinsatz. Bekannt sein müssen von beiden Datenreihen jeweils der Erwartungswert und die Standardabweichung. Der Wert berechnet sich dann nach folgender Formel: COV(X,Y)= E[(X-E(X))*(Y-E(Y))]. E(X) bezeichne hierbei den Erwartungswert von X. Anschaulich beschrieben bedeutet die Formel, dass man zuerst von jedem X-Wert den Erwartungswert von X abzieht und von jedem y-Wert den Erwartungswert von Y abzieht. Jedes x hat ein dazugehöriges y. Die nun transformierten Daten werden paarweise multipliziert und anschließend wird der Erwartungswert gebildet. Man kann die Kovarianz als den Erwartungswert des Produktes aus den jeweiligen Abweichungen der Daten zu ihrem Mittelwert bezeichnen.

Negative und positive Kovarianz

Der Wert des Zusammenhangmaßes kann auch negativ sein, im Gegensatz zur Varianz einer Variablen. Die klassische Varianz arbeitet mit Quadratur, wodurch alle Werte größer oder gleich null werden. Die Kovarianz hingegen multipliziert zwei Abweichungen miteinander, wodurch auch negative Werte entstehen können. An Hand des Vorzeichens lassen sich Aussagen über die Art des Zusammenhangs treffen: Bei einem Wert größer Null liegt ein positiver monotoner Zusammenhang vor. Das bedeutet, dass ein Anstieg der X-Werte auch einen Anstieg der Y-Werte verursachen. Liegt der Wert unter Null, so handelt es sich um einen negativen monotonen Zusammenhang. Höhere Werte der einen Variablen resultieren in niedrigeren Werten der zweiten Variable und umgekehrt. Erhält man das Ergebnis null, so liegt kein monotoner Zusammenhang vor.

Eigenschaften des Maßes

Es liegt eine positiv semidefinite Bilinearform vor. Das bedeutet, dass sie die Sätze der Bilinearität, der Symmetrie und der positiven Semidefinitheit erfüllt.

Ein Beispiel für die Verwendung

Beispiel für die Anwendung der Kovarianz ist es, den Zusammenhang zwischen konsumierten Salzstangen und Getränken zu bestimmen. Ist dieser dann bekannt, kann man eine Funktionsgleichung aufstellen, mit dessen Hilfe man dann beispielsweise berechnen kann, wie viele Getränke man verkaufen wird, wenn man eine bestimmte Menge an Salzstangen zur Verfügung stellt. Über die Kovarianz wird der Korrelationskoeffizient bestimmt und bei einem geeigneten Ergebnis, also wenn ein Zusammenhang besteht, dann eine Regressionsgleichung aufgestellt.