Die Kovarianz ist ein Maß der bivariaten Deskriptivstatistik. Sie beschreibt den stochastischen Zusammenhang zwischen zwei intervallskalierten Variablen, x und y, und gilt als unstandardisierte Vorstufe der Korrelation. Zwei Variablen können in ihrer Ausprägung positiv oder negativ zusammenhängen. Hängen sie positiv zusammen, gehen hohe Werte von x mit hohen Werten von y, und niedrige Werte von x mit niedrigen Werten von y einher. Kovariieren beide Variablen hingegen negativ, gehen hohe x- mit niedrigen y-Werten einher, und umgekehrt.

Grafische Darstellung

Die Kovarianz zweier Variablen kann innerhalb eines Streudiagramms dargestellt werden; Form und Verlauf der Streuung skizzieren Art und Enge ihres Zusammenhangs. Während bei einer runden Punktwolke kein Zusammenhang zwischen beiden Variablen besteht, lässt eine elliptische Punktanordnung – je nachdem ob sie steigt oder fällt – eine positive bzw. eine negative Kovarianz erkennen.

Berechnung

Um die Kovarianz von beispielsweise Intelligenz (x) und Kreativität (y) zu bestimmen, müsste man eine Stichprobe von ungefähr 100 Probanden ziehen, diese einen Intelligenz- und einen Kreativitätstest absolvieren lassen, und für beide Tests jeweils einen Mittelwert und eine Varianz berechnen. Für die Berechnung der Varianz werden die Abweichungen der Messwerte der einzelnen Probanden von ihrem Mittelwert gebildet, quadriert, aufsummiert, und durch die Anzahl, der in die Berechnung eingegangen Messwerte (n) dividiert. Die so berechnete Varianz kann durch Wurzelziehung in die Standardabweichung überführt werden.

Prinzipiell ist die Kovarianz der Variablen x und y als Produkt ihrer Varianzen zu verstehen. Sie wird berechnet, indem die Abweichungen der individuellen x- und y-Werte von ihrem jeweiligen Mittelwert gebildet, und die korrespondierenden Abweichungen miteinander multipliziert werden. Die Abweichungsprodukte der einzelnen Probanden werden anschließend aufsummiert, und durch n geteilt. Die Kovarianz kann im Gegensatz zur Varianz auch negative Werte annehmen, weil die gebildeten Mittelwertsabweichungen nicht quadriert werden. Soll im Rahmen der induktiven Forschung von der Kovarianz der Stichprobe auf jene der Grundgesamtheit geschlossen werden, wird nicht durch n, sondern durch n-1 dividiert. Eine solche Korrektur ist notwendig, da die Stichprobenkovarianz als schätzungsuntreu gilt, ihr Erwartungswert also nicht der Populationskovarianz entspricht.

Wissenschaftliche Relevanz

Das Aufdecken von kausalen Zusammenhängen zwischen Variablen ist ein wichtiges Ziel empirisch wissenschaftlichen Arbeitens. Kann die Ausprägung einer Variablen kausal auf die Ausprägung einer anderen Variablen zurückgeführt werden, können beide einander erklären und/oder vorhersagen. Da jedoch komplexere Phänomene, wie beispielsweise Intelligenz und Kreativität, multikausal bedingt sind, und die eingesetzten Messinstrumente zu ihrer Erfassung mitunter ungenau messen, können oft nur stochastische Zusammenhänge zwischen ihnen aufgezeigt werden. Dass hohe Intelligenzwerte mit hohen Kreativitätswerten einhergehen, heißt also nicht zwangsläufig, dass Intelligenz kausal durch Kreativität verursacht wird, oder umgekehrt. Möglicherweise gibt es weitere, bei der Messung unberücksichtigt gebliebene Variablen, die die Kovariation beider Größen moderieren oder bedingen.