Zur Haupt­na­vi­ga­ti­on sprin­gen [Alt]+[0] Zum Sei­ten­in­halt sprin­gen [Alt]+[1]

Ein­fluss der Stich­pro­ben­grö­ße

In­fo­box

Diese Seite ist Teil einer Ma­te­ria­li­en­samm­lung zum Bil­dungs­plan 2004: Grund­la­gen der Kom­pe­tenz­ori­en­tie­rung. Bitte be­ach­ten Sie, dass der Bil­dungs­plan fort­ge­schrie­ben wurde.

(vgl. Di­dak­tik der Sto­chas­tik, Henn)

Pro­blem: „Den Ge­sund­heits­mi­nis­ter sorgt seit lan­gem die hohe Ver­brei­tung von Krank­hei­ten des Herz-Kreis­lauf-Sys­tems, also der ty­pi­schen Zi­vi­li­sa­ti­ons­krank­heit. Aus lang­jäh­ri­gen Er­fah­run­gen weiß man si­cher, dass be­reits 30% der Be­völ­ke­rung über 40 Jah­ren unter einer sol­chen Er­kran­kung lei­den. Nun be­rich­tet ein jung-dy­na­mi­scher Mi­nis­te­ri­al­be­am­ter von einer neuen em­pi­ri­schen Stu­die mit Per­so­nen über 40, die re­gel­mä­ßig in ihrem Leben eine Aus­dau­er­sport­art wie Jog­ging, Rad­fah­ren o. ä. be­trie­ben haben. Dort habe sich ge­zeigt, dass eine Er­kran­kung des Herz-Kreis­lauf-Sys­tems in die­ser Grup­pe si­gni­fi­kant (bei 5%-Ni­veau) we­ni­ger häu­fig sei als in der Ge­samt­be­völ­ke­rung über 40. Daher schla­ge er eine auf­wen­di­ge Kam­pa­gne zur För­de­rung des Aus­dau­er­spor­tes vor. An­ge­sichts der wie üb­lich knap­pen Haus­halts­mit­tel ei­ner­seits, sei­nen Er­fah­run­gen mit jung-dy­na­mi­schen Mit­ar­bei­tern an­de­rer­seits zö­gert der Mi­nis­ter mit der Ent­schei­dung und fragt statt­des­sen zu­nächst ein­mal nach der Größe der un­ter­such­ten Stich­pro­be. Der Be­am­te ant­wor­tet:

a) n = 20,              b) n = 100,       c) n = 10.000.

In wel­chem der drei Fälle wür­den Sie sich als Mi­nis­ter am ehes­ten für die Kam­pa­gne ent­schei­den?“

Spon­tan nei­gen viele zur Ant­wort c), denn: je grö­ßer die Stich­pro­be, desto si­che­rer die Be­fun­de. In­des­sen: Ist die „Si­cher­heit“ nicht in allen drei Fäl­len gleich, weil ir­gend­wie im glei­chen Si­gni­fi­k­anz­ni­veau aus­ge­drückt?

Und hier be­ginnt das Nach­den­ken: Bei glei­chem Si­gni­fi­k­anz­ni­veau müss­te doch die Größe der Stich­pro­be, die das si­gni­fi­kan­te Er­geb­nis lie­fert, gleich­gül­tig sein. Ist also die Rück­fra­ge des Mi­nis­ters sinn­los? Was in­ter­es­siert den Mi­nis­ter ei­gent­lich? Vor allem doch wohl, ob die Sport­trei­ben­den so er­heb­lich we­ni­ger häu­fig er­kran­ken, dass sich die hohen Kos­ten der Kam­pa­gne recht­fer­ti­gen lie­ßen durch das er­heb­li­che Aus­maß der er­hoff­ten Sen­kung des Er­kran­kungs­ri­si­kos. Be­trü­ge die­ses Ri­si­ko bei den Sport­trei­ben­den immer noch 29,9%, so wäre die auf­wen­di­ge Kam­pa­gne kaum sinn­voll. Diese Frage drängt nun zu einer ge­naue­ren Be­trach­tung des ver­wen­de­ten Si­gni­fi­k­anz­tes­tes, den die Schü­ler selb­stän­dig re­kon­stru­ie­ren:

Ein­sei­ti­ger Test: H0: p = 0,3;  H1: p < 0,3;  X: An­zahl der Sport­trei­ben­den mit Herz-Kreis­lauf-Er­kran­kung; a = 0,05; hier­aus be­rech­net sich der Ab­leh­nungs­sbe­reich {0, 1, ..., k1} mit  a) k1 = 3,   b) k1 = 23,   c) k1 = 2.925. ( Nach­rech­nen! Hier stimmt etwas nicht. )

(Jetzt kann die Ope­ra­ti­ons­cha­rak­te­ris­tik des Tests, die es er­laubt, den ß-Feh­ler zu be­ur­tei­len, mit dem Com­pu­ter punkt­wei­se be­rech­net und gra­phisch dar­ge­stellt wer­den:)

Feh­ler 2. Art in Ab­hän­gig­keit von der Wahr­schein­lich­keit p’ :
Clip
(vgl. Gü­te­funk­ti­on von Tests.​xls )

Einfluss der Stichprobengröße

Einfluss der Stichprobengröße

Trenn­schär­fe von Tests

Die Dis­kus­si­on und In­ter­pre­ta­ti­on die­ser Funk­ti­ons­ver­läu­fe bringt dann die Ein­sicht: Bei n = 10.000 er­gibt sich fast si­cher ein si­gni­fi­kan­tes Er­geb­nis schon dann, wenn der in­ter­es­sie­ren­de Un­ter­schied in der Er­kran­kungs­wahr­schein­lich­keit mi­ni­mal und damit für den Mi­nis­ter prak­tisch ir­re­le­vant ist; bei n = 20 kön­nen wir da­ge­gen nur dann ein si­gni­fi­kan­tes Er­geb­nis er­war­ten, wenn sich beide Grup­pen er­heb­lich von­ein­an­der un­ter­schei­den. Und genau darum geht es dem Mi­nis­ter! Ent­ge­gen dem spon­ta­nen Ein­druck soll­te ihn daher am ehes­ten noch Ant­wort a) zu einer Kam­pa­gne ver­an­las­sen. Fazit: Die Si­gni­fi­kanz eines Un­ter­schie­des al­lein ist häu­fig ir­re­le­vant, wo es auf die ab­so­lu­te Größe des Un­ter­schie­des an­kommt. Die Rück­fra­ge des Mi­nis­ters ist des­halb sinn­voll, in­so­fern sie der be­rech­tig­ten Skep­sis ge­gen­über Si­gni­fi­kanz in sehr gro­ßen Stich­pro­ben ent­springt; noch sinn­vol­ler wäre na­tür­lich die di­rek­te Frage nach der Größe des Un­ter­schie­des.

Ein­fluss der Stich­pro­ben­grö­ße: Her­un­ter­la­den [doc] [4,1 MB]

Ein­fluss der Stich­pro­ben­grö­ße: Her­un­ter­la­den [pdf] [41 KB]