Stochastik und Erwartungswert

Stochastik oder Wahrscheinlichkeitsrechnung ist ein mathematisches Verfahren zur Vorhersage von Ereignissen basierend auf Wahrscheinlichkeiten. Beispielsweise ist die Wahrscheinlichkeit, mit zwei Würfeln eine 2 zu würfeln 1:36 (2,8 %). Eine sieben zu Würfeln hat hingegen eine Wahrscheinlichkeit von 6:36 (6,7 %). Somit würde bei einem Wurf mit zwei Würfen läge der zu würfelnde Erwartungswert bei einer sieben, denn dieses ist das wahrscheinlichste Ergebnis.

Diese Art der Berechnung ist aber nicht auf alle Gebiete anwendbar.
Soll beispielsweise untersucht werden, wie das durchschnittliche Kaufverhalten in der BRD ist, werden andere Verfahren zur Beschreibung benötigt.
Zum einen wird ermittelt, wie viel Geld eine Generation im Schnitt zur Verfügung hat. Zum anderen ist es notwendig in Erfahrung zu bringen, wie viel Geld im Schnitt von einer Generation ausgegeben wird. Da nicht alle Personen einer Generation gleich viel Geld haben bzw. ausgeben, muss von diesen Werten die Standardabweichung ermittelt werden.

Standardabweichung

Diese ist ein Wert, der die Streuung der Einzelwerte um den Mittelwert herum verdeutlicht, wobei gilt, je geringer die Streuung, desto besser reicht der Mittelwert zur Beschreibung des Phänomens aus. Wird der Mittelwert allerdings nur mit der einfachen Standardabweichung angeben, so liegt die Sicherheit der Aussage bei lediglich 68 %!
Daher ist es notwendig, mit einem vielfachen der Standardabweichung zu rechnen. Wird der Mittelwert mit dem dreifachen der Standardabweichung angegeben, so finden sich 99 % aller Werte in dem Bereich wieder und mit jedem weiteren Vielfachen wächst die Qualität der Aussage. Im Pharmabereich, wie beispielsweise der Dopingkontrolle, wird mit mindestens dem sechsfachen der Standardabweichung gerechnet, was einer Aussagesicherheit von 99,9966% entspricht. Da der Wertebereich mit zunehmendem Erweiterungswert für die Standardabweichung zunimmt, muss die Streuung dementsprechend gering sein.

Kovarianz

Um herauszufinden, ob die beiden ermittelten Datensätze sinnvoll miteinander verknüpft werden können, muss von diesen via abgewandelter Residuenanalyse die Kovarianz gebildet werden. Ist die Kovarianz nicht null, ist dies machbar. Ein Wert größer null beschreibt einen in einer bestimmten Weise proportionalen Zusammenhang, ein negativer Wert einen antiproportionalen Zusammenhang.

Korrelationseffizienz

Nun gilt es, die Daten zu verknüpfen. Dazu werden die Werte graphisch geplottet oder rechnerisch einer Regressionsanalyse unterzogen. Ist der daraufhin ermittelte Wert, der Korrelationskoeffizient, nahe an eins oder Minus eins, so ist die bestimmte Funktion korrekt. Zum Beispiel, wenn jede Generation alle zehn Jahre 100 € mehr erhält, aber nur 50 des Geldes ausgibt, wäre der Wert für eine langsam steigende Funktion nahe an eins. Aufgrund der nun vorhandenen Daten kann das Kaufverhalten von allen Altersklassen inter- und extrapoliert werden.