Am 15. Januar 2003 wurden von Stern und RTL Umfrageergebnisse von Forsa zur Sonntagsfrage veröffentlicht, die - richtig gelesen - so aussehen:
CDU/CSU | SPD | Bündnis90/Grüne | FDP | PDS |
44,2 - 49,8 | 28,2 - 33,8 | 8,6 - 11,4 | 3,6 - 6,6 | 2,6 - 5,6 |
Fazit: Die Umfrageergebnisse von Stern und RTL haben keinen Informationswert. Die Union führt zwar haushoch vor der SPD, aber Rotgrün hat möglicherweise die Nase vorn, weil FDP und PDS an der 5%-Hürde scheitern können.
Auch auf der Internetseite von stern wird eine Fehlertoleranz von +/-2,5% eingeräumt. Allerdings nur im Kleingedruckten, in der Darstellung der Umfrageergebnisse und im Kommentar dazu wird dies unter den Teppich gekehrt. Die Fehlertoleranz rührt davon her, daß Forsa für die Umfrage 2502 Telefonnummern von Wahlberechtigten ausloste und dann eine Befragung durchführte. Wären andere Wahlberechtigte ausgelost und befragt worden, dann hätte das Umfrageresultat anders ausgesehen. Die bisherige Praxis von Stern, Umfrageresultate ohne eine Angabe über die Auswirkungen der Zufallsauswahl zu machen, war deshalb hochgradig irreführend. Das Eingeständnis, daß die tatsächlichen Parteistärken um bis zu plus oder minus 2,5% vom Umfrageergebnis abweichen können, hat zur Folge, daß das Umfrage-Ergebnisse im Stern in der folgenden Form
CDU/CSU | SPD | Bündnis90/Grüne | FDP | PDS |
44,5 - 49,5 | 28,5 - 33,5 | 7,5 - 12,5 | 2,5 - 7,5 | 1,5 - 6,5 |
hätte veröffentlicht werden müssen. Das ist natürlich nicht geschehen, denn damit wird die Umfrage zur Lachnummer: Die Union führt zwar haushoch vor der SPD, aber Rotgrün hat möglicherweise die Nase vorn, weil FDP und PDS an der 5%-Hürde scheitern können.
Die in der gelben Tabelle angegeben Fehler, die durch die Zufallsauswahl der
befragten Wahlberechtigten verursacht werden, kann man auch als Laie mit Hilfe
der Mißerfolgs-Statistik von
Umfragen verifizieren. Man gibt in der Input-Spalte (linke Seite der Tabelle)
die von Forsa angeführten Parteistärken (CDU/CSU 47, SPD 31, FDP 5,
Grüne 10 und PDS 4 Prozent) ein. Im Block oben rechts gibt man als "Anzahl
der Wahlberechtigten pro Umfrage" 2502 an - soviele Wahlberechitgte wurden
laut Stern von Forse zwischen dem 30. Dezember und 3. Januar befragt - und setzt
für die Wahlbeteiligung die üblichen 80% ein. Für die Anzahl
der Umfragen wähle man zunächst 1000 - bei größeren Zahlen
kann die Berechnung sehr lange dauern. Mit "LOS" wird die Simulation
gestartet. In der unteren Tabellenzeile "Mißerfolgsstatistik"
kann man das Resultat der Simulation detailliert ablesen. Es zeigt sich, daß
etwa 97% der Umfragen die Toleranzen von +/- 4% für die großen und
+/- 2% für die kleinen Parteien einhalten.
Genauere Ergebnisse kann man der Tabelle unten auf dieser Seite entnehmen: Es
zeigt sich, daß etwa 95% der Umfragen die Toleranzen von +/- 2,8% bzw.
+/- 1,4% einhalten. Aber 5% der Umfragen schaffen nicht einmal das. Mit anderen
Worten: In jeder 20. Umfrage ist der Fehler für eine große Partei
größer als +/- 2,8% oder für eine kleine Partei größer
als +/- 1,4%!
Maximale Abweichung
|
eingehalten von | |
für große Parteien | für kleine Parteien | (in Prozent von 100000 Umfragen) |
1,0% | 0,5% | 20% |
1,2% | 0,6% | 32% |
1,4% | 0,7% | 45% |
1,6% | 0,8% | 57% |
1,8% | 0,9% | 68% |
2,0% | 1,0% | 77% |
2,2% | 1,1% | 84% |
2,4% | 1,2% | 89% |
2,6% | 1,3% | 93% |
2,8% | 1,4% | 95% |
3,0% | 1,5% | 97% |
3,2% | 1,6% | 98,0% |
3,4% | 1,7% | 98,8% |
3,6% | 1,8% | 99,3% |
3,8% | 1,9% | 99,6% |
4,0% | 2,0% | 99,7% |
4,2% | 2,1% | 99,8% |
>4,2% | >2,1% | 0,2% |