Zur Haupt­na­vi­ga­ti­on sprin­gen [Alt]+[0] Zum Sei­ten­in­halt sprin­gen [Alt]+[1]

Mög­li­che Feh­ler beim Tes­ten

In­fo­box

Diese Seite ist Teil einer Ma­te­ria­li­en­samm­lung zum Bil­dungs­plan 2004: Grund­la­gen der Kom­pe­tenz­ori­en­tie­rung. Bitte be­ach­ten Sie, dass der Bil­dungs­plan fort­ge­schrie­ben wurde.


Feh­ler 1. Art (Irr­tums­wahr­schein­lich­keit a), Zu­sam­men­fas­sung :

    • Die Null­hy­po­the­se wird ver­wor­fen, ob­wohl sie zu­trifft.
      Wir haben uns bla­miert, weil wir etwas Wah­res ab­ge­lehnt haben.
    • Die­ser Feh­ler ist kon­trol­lier­bar.
    • Si­gni­fi­k­anz­ni­veau:
      Obere Schran­ke für die Irr­tums­wahr­schein­lich­keit.
    • Sta­tis­ti­sche Si­gni­fi­kanz :
      In der Sta­tis­tik hei­ßen Un­ter­schie­de oder Zu­sam­men­hän­ge si­gni­fi­kant , wenn die Wahr­schein­lich­keit ge­ring ist, dass sie durch Zu­fall zu­stan­de ge­kom­men sind
      .“

Feh­ler 2. Art (β):
Der ehe­ma­li­ge Mit­ar­bei­ter ver­rät dem Kom­mis­sar, dass die Wahr­schein­lich­keit für eine 6 sogar nur 1/8 be­trägt.
Der Kom­mis­sar kommt ins Grü­beln:
Stich­pro­ben­um­fang: 100;     Stich­pro­ben­er­geb­nis:  10 Sech­sen
Si­gni­fi­k­anz­ni­veau:    5 %;     Ab­leh­nungs­be­reich:   {0; 1; …; 10}
Ent­schei­dung: Ich halte den Wür­fel für ge­fälscht, die Irr­tums­wahr­schein­lich­keit be­trägt 4,3%.
Wie groß war die Ge­fahr, dass ich solch einen ge­fälsch­ten Wür­fel nicht ent­de­cke?
Die An­zahl der Sech­sen ist bei dem ge­fälsch­ten Wür­fel B100;1/8 -ver­teilt.
Bei einem Stich­pro­ben­er­geb­nis 11; 12;…; 100 hätte ich den ge­fälsch­ten Wür­fel nicht ent­deckt.

Fes­ter Ab­leh­nungs­be­reich {0; 1; …; 10}!

Fehler 2. Art (ß):

Mit einer Wahr­schein­lich­keit von etwa 72 % wird ein ge­fälsch­ter Wür­fel nicht ent­deckt!
Mit einer Wahr­schein­lich­keit von etwa 72 % wird die Null­hy­po­the­se nicht ab­ge­lehnt, ob­wohl sie falsch ist! ( Feh­ler 2. Art )

Rech­ne­ri­sche Be­stim­mung des Feh­lers 2. Art
Die An­zahl der Sech­sen ist bei dem ge­fälsch­ten Wür­fel B 100;1/8-ver­teilt.
Bei einem Stich­pro­ben­er­geb­nis 11; 12;…; 100 wird der ge­fälsch­te Wür­fel nicht ent­deckt.
Null­hy­po­the­se clip :                   Der Wür­fel ist in Ord­nung.
Al­ter­na­tiv­hy­po­the­se clip :           Der Wür­fel ist ge­fälscht.
Es gelte die An­nah­me clip .

Ge­sucht:

Gesucht:

Mit einer Wahr­schein­lich­keit von 72 % wird ein ge­fälsch­ter Wür­fel nicht ent­deckt.
Mit einer Wahr­schein­lich­keit von 72 % wird also die Null­hy­po­the­se nicht ver­wor­fen, ob­wohl sie falsch ist. Der Feh­ler 2. Art be­trägt 72 %.

Feh­ler 2. Art ( ß): Die Null­hy­po­the­se wird nicht ver­wor­fen, ob­wohl sie falsch ist.

Der Feh­ler 2. Art hängt ab
a) von der Wahl des Si­gni­fi­k­anz­ni­veaus,
b) von der tat­säch­li­chen Tref­fer­wahr­schein­lich­keit p’,
c) vom Stich­pro­ben­um­fang n.

Die Ein­flüs­se von p’ und n sol­len im Fol­gen­den näher un­ter­sucht wer­den.

Ein­fluss der tat­säch­li­chen Tref­fer­wahr­schein­lich­keit p’ auf den Feh­ler 2. Art
Ein stär­ker ver­fälsch­ter Wür­fel müss­te zu­ver­läs­si­ger ent­deckt wer­den!

Einfluss der tatsächlichen Trefferwahrscheinlichkeit p’ auf den Fehler 2. Art

Ein­fluss des Stich­pro­ben­um­fangs auf den Feh­ler 2. Art
Mit dem Stich­pro­ben­um­fang wächst auch die Menge der In­for­ma­ti­on über die Grund­ge­samt­heit.

Einfluss des Stichprobenumfangs auf den Fehler 2. Art

Die Ur­sa­che hier­für liegt darin, dass die Tref­fer­zah­len bei grö­ße­ren Stich­pro­ben­um­fän­gen we­ni­ger stark um den Er­war­tungs­wert streu­en:

Die Ursache hierfür liegt darin, dass die Trefferzahlen bei größeren Stichprobenumfängen weniger stark um den Erwartungswert streuen:

Feh­ler 2. Art ( ß) , Zu­sam­men­fas­sung :

    • Die Null­hy­po­the­se wird nicht ab­ge­lehnt, ob­wohl sie falsch ist.
      Wir sind rein­ge­fal­len, weil wir etwas Fal­sches ak­zep­tiert haben.
    • ß hängt ab von der Irr­tums­wahr­schein­lich­keit a , von der tat­säch­li­chen Trefferwahrschein­licheit p‘ und vom Stich­pro­ben­um­fang n .
      • Die­ser Feh­ler ist i.A. nicht kon­trol­lier­bar.
    • Eine Bei­be­hal­tung der Null­hy­po­the­se kann mit einem sehr hohen Feh­ler be­haf­tet sein.
      • Die Tat­sa­che, dass eine Null­hy­po­the­se nicht ab­ge­lehnt wird, kann also nicht als Beleg für deren Gül­tig­keit an­ge­se­hen wer­den!
        („ Frei­spruch aus Man­gel an Be­wei­sen “)
    • Aus einer An­nah­me über p‘ kann β ab­ge­schätzt wer­den.
      Mit Hilfe des Feh­lers 2. Art kann dann ent­schie­den wer­den, ob ein Test sinn­voll ist (Test­stär­ke).
      (Auch aus die­sem Grund ist die Al­ter­na­tiv­hy­po­the­se er­for­der­lich.)

Ein Feh­ler ist also immer mög­lich!

    • Bei fes­tem Stich­pro­ben­um­fang be­wirkt ein Ver­klei­ne­rung von α eine Ver­grö­ße­rung von β und um­ge­kehrt.
      • Ein Ver­klei­ne­rung der Summe α + β kann nur durch Ver­grö­ßern des Stich­pro­ben­um­fangs er­reicht wer­den.
    • Nur die Kennt­nis bei­der Feh­ler er­laubt eine Ein­schät­zung der Kon­se­quen­zen bei einer Fehl­ent­schei­dung!
      Dies ist bei Wahl der Null­hy­po­the­se zu be­rück­sich­ti­gen.
    • (Für Wirk­sam­keits­stu­di­en me­di­zi­ni­scher Be­hand­lun­gen schlägt Cohen (1969) für β einen 4-mal so hohen Wert vor wie für das Si­gni­fi­k­anz­ni­veau α. ( Wi­ki­pe­dia ))

Mög­li­che Feh­ler beim Tes­ten: Her­un­ter­la­den [doc] [103 KB]

Mög­li­che Feh­ler beim Tes­ten: Her­un­ter­la­den [pdf] [153 KB]