Zur Hauptnavigation springen [Alt]+[0] Zum Seiteninhalt springen [Alt]+[1]

Korrelation


Daten können dieselbe Ausgleichsgerade haben, aber doch sehr unterschiedlich um diese verteilt sein. Dies zeigt oft schon der Augenschein (siehe Schaubild 1 im Vergleich zu Schaubild 2):

 

Schaubild
Schaubild 1:  r 2 = 0,85, also r = 0,92


Schaubild
Schaubild 2:  r 2 = 0,90, also r = 0,95


Um diesen Unterschied mathematisch eindeutig zu beschreiben, wurde ein so genanntes Bestimmtheitsmaß r 2 bzw. der Korrelationskoeffizient r eingeführt.

  • Der Korrelationskoeffizient r nimmt nur Werte zwischen + 1 und – 1 an. (Er hat das Vorzeichen der Geradensteigung m.)
  • Liegt der Wert nahe bei + 1 oder – 1, so spricht man von einem guten bis sehr guten Zusammenhang der Datenreihen. Beim Schaubild 2 streuen die Punkte demnach weniger.
  • Liegt der Wert nahe bei 0, so spricht man von einem schlechten Zusammenhang der Datenreihen.

Die hierzu entwickelten Formeln sprengen den Rahmen einer manuellen Berechnung. Sie sind in Taschenrechnern und Tabellenkalkulationsprogrammen standardmäßig hinterlegt.

Die von Rechnern ebenfalls angebotenen Trendlinien höherer Ordnung werden durch eine geeignete Transformation auf lineare Regressionen zurückgeführt.

Beispiel:

Aus y = a·x 2 folgt der lineare Zusammenhang ln(y) = 2·ln(x) + ln(a).