Zur Hauptnavigation springen [Alt]+[0] Zum Seiteninhalt springen [Alt]+[1]

Mögliche Fehler beim Testen

Infobox

Diese Seite ist Teil einer Materialiensammlung zum Bildungsplan 2004: Grundlagen der Kompetenzorientierung. Bitte beachten Sie, dass der Bildungsplan fortgeschrieben wurde.


Fehler 1. Art (Irrtumswahrscheinlichkeit a), Zusammenfassung :

    • Die Nullhypothese wird verworfen, obwohl sie zutrifft.
      Wir haben uns blamiert, weil wir etwas Wahres abgelehnt haben.
    • Dieser Fehler ist kontrollierbar.
    • Signifikanzniveau:
      Obere Schranke für die Irrtumswahrscheinlichkeit.
    • Statistische Signifikanz :
      In der Statistik heißen Unterschiede oder Zusammenhänge signifikant , wenn die Wahrscheinlichkeit gering ist, dass sie durch Zufall zustande gekommen sind
      .“

Fehler 2. Art (β):
Der ehemalige Mitarbeiter verrät dem Kommissar, dass die Wahrscheinlichkeit für eine 6 sogar nur 1/8 beträgt.
Der Kommissar kommt ins Grübeln:
Stichprobenumfang: 100;     Stichprobenergebnis:  10 Sechsen
Signifikanzniveau:    5 %;     Ablehnungsbereich:   {0; 1; …; 10}
Entscheidung: Ich halte den Würfel für gefälscht, die Irrtumswahrscheinlichkeit beträgt 4,3%.
Wie groß war die Gefahr, dass ich solch einen gefälschten Würfel nicht entdecke?
Die Anzahl der Sechsen ist bei dem gefälschten Würfel B100;1/8 -verteilt.
Bei einem Stichprobenergebnis 11; 12;…; 100 hätte ich den gefälschten Würfel nicht entdeckt.

Fester Ablehnungsbereich {0; 1; …; 10}!

Fehler 2. Art (ß):

Mit einer Wahrscheinlichkeit von etwa 72 % wird ein gefälschter Würfel nicht entdeckt!
Mit einer Wahrscheinlichkeit von etwa 72 % wird die Nullhypothese nicht abgelehnt, obwohl sie falsch ist! ( Fehler 2. Art )

Rechnerische Bestimmung des Fehlers 2. Art
Die Anzahl der Sechsen ist bei dem gefälschten Würfel B 100;1/8-verteilt.
Bei einem Stichprobenergebnis 11; 12;…; 100 wird der gefälschte Würfel nicht entdeckt.
Nullhypothese clip :                   Der Würfel ist in Ordnung.
Alternativhypothese clip :           Der Würfel ist gefälscht.
Es gelte die Annahme clip .

Gesucht:

Gesucht:

Mit einer Wahrscheinlichkeit von 72 % wird ein gefälschter Würfel nicht entdeckt.
Mit einer Wahrscheinlichkeit von 72 % wird also die Nullhypothese nicht verworfen, obwohl sie falsch ist. Der Fehler 2. Art beträgt 72 %.

Fehler 2. Art ( ß): Die Nullhypothese wird nicht verworfen, obwohl sie falsch ist.

Der Fehler 2. Art hängt ab
a) von der Wahl des Signifikanzniveaus,
b) von der tatsächlichen Trefferwahrscheinlichkeit p’,
c) vom Stichprobenumfang n.

Die Einflüsse von p’ und n sollen im Folgenden näher untersucht werden.

Einfluss der tatsächlichen Trefferwahrscheinlichkeit p’ auf den Fehler 2. Art
Ein stärker verfälschter Würfel müsste zuverlässiger entdeckt werden!

Einfluss der tatsächlichen Trefferwahrscheinlichkeit p’ auf den Fehler 2. Art

Einfluss des Stichprobenumfangs auf den Fehler 2. Art
Mit dem Stichprobenumfang wächst auch die Menge der Information über die Grundgesamtheit.

Einfluss des Stichprobenumfangs auf den Fehler 2. Art

Die Ursache hierfür liegt darin, dass die Trefferzahlen bei größeren Stichprobenumfängen weniger stark um den Erwartungswert streuen:

Die Ursache hierfür liegt darin, dass die Trefferzahlen bei größeren Stichprobenumfängen weniger stark um den Erwartungswert streuen:

Fehler 2. Art ( ß) , Zusammenfassung :

    • Die Nullhypothese wird nicht abgelehnt, obwohl sie falsch ist.
      Wir sind reingefallen, weil wir etwas Falsches akzeptiert haben.
    • ß hängt ab von der Irrtumswahrscheinlichkeit a , von der tatsächlichen Trefferwahrschein­licheit p‘ und vom Stichprobenumfang n .
      • Dieser Fehler ist i.A. nicht kontrollierbar.
    • Eine Beibehaltung der Nullhypothese kann mit einem sehr hohen Fehler behaftet sein.
      • Die Tatsache, dass eine Nullhypothese nicht abgelehnt wird, kann also nicht als Beleg für deren Gültigkeit angesehen werden!
        („ Freispruch aus Mangel an Beweisen “)
    • Aus einer Annahme über p‘ kann β abgeschätzt werden.
      Mit Hilfe des Fehlers 2. Art kann dann entschieden werden, ob ein Test sinnvoll ist (Teststärke).
      (Auch aus diesem Grund ist die Alternativhypothese erforderlich.)

Ein Fehler ist also immer möglich!

    • Bei festem Stichprobenumfang bewirkt ein Verkleinerung von α eine Vergrößerung von β und umgekehrt.
      • Ein Verkleinerung der Summe α + β kann nur durch Vergrößern des Stichprobenumfangs erreicht werden.
    • Nur die Kenntnis beider Fehler erlaubt eine Einschätzung der Konsequenzen bei einer Fehlentscheidung!
      Dies ist bei Wahl der Nullhypothese zu berücksichtigen.
    • (Für Wirksamkeitsstudien medizinischer Behandlungen schlägt Cohen (1969) für β einen 4-mal so hohen Wert vor wie für das Signifikanzniveau α. ( Wikipedia ))

Mögliche Fehler beim Testen: Herunterladen [doc] [103 KB]

Mögliche Fehler beim Testen: Herunterladen [pdf] [153 KB]