Die neueste Forsa-Umfrage - richtig gelesen!

Am 15. Januar 2003 wurden von Stern und RTL Umfrageergebnisse von Forsa zur Sonntagsfrage veröffentlicht, die - richtig gelesen - so aussehen:

CDU/CSU	SPD	Bündnis90/Grüne	FDP	PDS
44,2 - 49,8	28,2 - 33,8	8,6 - 11,4	3,6 - 6,6	2,6 - 5,6

Fazit: Die Umfrageergebnisse von Stern und RTL haben keinen Informationswert. Die Union führt zwar haushoch vor der SPD, aber Rotgrün hat möglicherweise die Nase vorn, weil FDP und PDS an der 5%-Hürde scheitern können.

Auch auf der Internetseite von stern wird eine Fehlertoleranz von +/-2,5% eingeräumt. Allerdings nur im Kleingedruckten, in der Darstellung der Umfrageergebnisse und im Kommentar dazu wird dies unter den Teppich gekehrt. Die Fehlertoleranz rührt davon her, daß Forsa für die Umfrage 2502 Telefonnummern von Wahlberechtigten ausloste und dann eine Befragung durchführte. Wären andere Wahlberechtigte ausgelost und befragt worden, dann hätte das Umfrageresultat anders ausgesehen. Die bisherige Praxis von Stern, Umfrageresultate ohne eine Angabe über die Auswirkungen der Zufallsauswahl zu machen, war deshalb hochgradig irreführend. Das Eingeständnis, daß die tatsächlichen Parteistärken um bis zu plus oder minus 2,5% vom Umfrageergebnis abweichen können, hat zur Folge, daß das Umfrage-Ergebnisse im Stern in der folgenden Form

CDU/CSU	SPD	Bündnis90/Grüne	FDP	PDS
44,5 - 49,5	28,5 - 33,5	7,5 - 12,5	2,5 - 7,5	1,5 - 6,5

hätte veröffentlicht werden müssen. Das ist natürlich nicht geschehen, denn damit wird die Umfrage zur Lachnummer: Die Union führt zwar haushoch vor der SPD, aber Rotgrün hat möglicherweise die Nase vorn, weil FDP und PDS an der 5%-Hürde scheitern können.

Technische Information:

Die in der gelben Tabelle angegeben Fehler, die durch die Zufallsauswahl der befragten Wahlberechtigten verursacht werden, kann man auch als Laie mit Hilfe der Mißerfolgs-Statistik von Umfragen verifizieren. Man gibt in der Input-Spalte (linke Seite der Tabelle) die von Forsa angeführten Parteistärken (CDU/CSU 47, SPD 31, FDP 5, Grüne 10 und PDS 4 Prozent) ein. Im Block oben rechts gibt man als "Anzahl der Wahlberechtigten pro Umfrage" 2502 an - soviele Wahlberechitgte wurden laut Stern von Forse zwischen dem 30. Dezember und 3. Januar befragt - und setzt für die Wahlbeteiligung die üblichen 80% ein. Für die Anzahl der Umfragen wähle man zunächst 1000 - bei größeren Zahlen kann die Berechnung sehr lange dauern. Mit "LOS" wird die Simulation gestartet. In der unteren Tabellenzeile "Mißerfolgsstatistik" kann man das Resultat der Simulation detailliert ablesen. Es zeigt sich, daß etwa 97% der Umfragen die Toleranzen von +/- 4% für die großen und +/- 2% für die kleinen Parteien einhalten.
Genauere Ergebnisse kann man der Tabelle unten auf dieser Seite entnehmen: Es zeigt sich, daß etwa 95% der Umfragen die Toleranzen von +/- 2,8% bzw. +/- 1,4% einhalten. Aber 5% der Umfragen schaffen nicht einmal das. Mit anderen Worten: In jeder 20. Umfrage ist der Fehler für eine große Partei größer als +/- 2,8% oder für eine kleine Partei größer als +/- 1,4%!

Maximale Abweichung		eingehalten von
für große Parteien	für kleine Parteien	(in Prozent von 100000 Umfragen)
1,0%	0,5%	20%
1,2%	0,6%	32%
1,4%	0,7%	45%
1,6%	0,8%	57%
1,8%	0,9%	68%
2,0%	1,0%	77%
2,2%	1,1%	84%
2,4%	1,2%	89%
2,6%	1,3%	93%
2,8%	1,4%	95%
3,0%	1,5%	97%
3,2%	1,6%	98,0%
3,4%	1,7%	98,8%
3,6%	1,8%	99,3%
3,8%	1,9%	99,6%
4,0%	2,0%	99,7%
4,2%	2,1%	99,8%
>4,2%	>2,1%	0,2%

Grundlage der Simulation: 100000 Wiederholungen, Parteistärken laut Forsa, ebenso Stichprobenumfang (2502) und Wahlbeteiligung (80%).