YouGov Wahlmodell: FAQ

 

Hinweis

Bis zum 24. September wird YouGov aktuelle Umfrageergebnisse zur Wahlabsicht, eine Projektion der Sitzverteilung im Bundestag sowie weitere Analysen bereitstellen. Alle Daten werden auf Grundlage des YouGov Modells berechnet – ein Prognosemodell, das in Crunch.io auf Basis einer Hamiltonian Monte-Carlo-Simulation geschätzt wird. Wir möchten an dieser Stelle darauf hinweisen, dass die Güte des Vorhersagemodells u.a. von öffentlich-zugänglichen Daten z.B. aus dem Zensus abhängig ist. Da diese Informationen für YouGov nicht in gleichem Maße wie in UK und den USA verfügbar sind, ist die Aussagekraft des Modells möglicherweise nicht mit den Modellen vorangegangener Wahlen vergleichbar. Nichtsdestotrotz haben wir uns aus Gründen der Transparenz dazu entschieden die Daten zu veröffentlichen.

 

Ist dies die Vorhersage von YouGov für die Wahl?

Nein – dies ist keine Vorhersage. Dies ist unsere Schätzung des Korridors möglicher Ergebnisse, wenn heute gewählt würde und die Wahlabsicht tatsächlich so wäre wie es unsere Daten zeigen. Dies ist keine Vorhersage des Wahlergebnisses am 24. September. Wir wissen nicht, welche Entwicklungen und Veränderungen bis zum Wahltag noch auftreten werden.

Ist dies eine Umfrage?

Nein – dies ist ein statistisches Modell, das auf einer Multilevel Regression mit Post-Stratifizierung (kurz: MRP) basiert. Darin fließen neben Umfragedaten auch öffentlich-zugängliche Datenquellen ein. Im Unterschied zu den Daten aus UK und den USA sind für Deutschland weniger Daten zugänglich. In Umfragen wird eine repräsentative Stichprobe befragt. Man erhält dann, aufgeschlüsselt nach demografischen Faktoren, das Ergebnis zu den Fragen, die man gestellt hat. Ein Modell hingegen beruht auf Berechnungen auf der Basis von Umfragedaten. Es untersucht die Zusammenhänge zwischen Merkmalen von Personen und ihren Antworten in Umfragen, um mit Hilfe dieser Zusammenhänge mögliche Wahlergebnisse zu schätzen. Dieses Modell verwendet außerdem  Informationen, die nicht auf Umfragedaten basieren.

Was genau ist das Modell und wie funktioniert es?

Dieses Modell aggregiert Daten zur Verteilung von Wählertypen (z.B. nach Alter, Geschlecht, Bildung, Wahlverhalten bei der Bundestagswahl 2013) über Wahlkreise und Bundesländer hinweg (basierend auf Zielverteilungen aus unterschiedlichen Informationsquellen und den Ergebnissen der Bundestagswahl 2013). Dabei ist anzumerken, dass die Qualität der zugrundeliegenden Informationen und Daten aus Deutschland im Unterschied zu UK & USA deutlich geringer ausfällt. YouGov führt täglich ca. 1.200 Online-Interviews mit Wahlberechtigten aus dem YouGov Panel durch. Den Befragten wird ein simulierter Wahlzettel gezeigt, auf dem sie genau wie auf einem echten Wahlzettel ihre Erst- und Zweitstimme vergeben können (Wahlabsicht). Diese Befragungsdaten werden verwendet, um zu bestimmen, wie unterschiedliche Wählertypen (basierend auf individuellen Personenmerkmalen und Merkmalen des Wahlkreises) wählen würden. Wir extrapolieren dann diese Muster auf unterschiedliche Wahlkreise. Wenn wir die daraus resultierende Gesamtstimmenanzahl für jede Partei in jedem Wahlkreis und in jedem Bundesland geschätzt haben, berechnen wir auf Basis der Wahlordnung die entsprechende Sitzverteilung im Bundestag.

Wie kommen die Schätzwerte für Wahlkreise und Bundesländer zustande?

Das Modell basiert auf der Annahme, dass es Trends und Muster gibt, anhand derer man die wahrscheinliche Wahlentscheidung von Personen unabhängig von ihrem Wohnort schätzen kann. Das Modell bündelt Daten für ähnliche Wählertypen über Wahlkreise hinweg und liefert so eine bundesweite Sicht auf die aktuelle Lage.

Berücksichtigt das Modell alle regionalen und lokalen Variablen?

Nein. Da der Modell-Fokus auf der Aggregierung von Daten auf Bundesebene liegt, berücksichtigt es nicht alle regionalen oder lokalen Faktoren, die in einem bestimmten Wahlkreis wahlentscheidend sein könnten. Wenn in einem bestimmten Wahlkreis z.B. ein besonders populärer oder unpopulärer Kandidat für eine Partei antritt, können wir dies nicht angemessen abbilden. Es wird daher mit hoher Wahrscheinlichkeit einige Wahlkreise geben, bei denen wir wichtige Faktoren nicht berücksichtigen und für die wir eine nicht zutreffende Schätzung liefern werden.

Sind diese Zahlen 100 Prozent korrekt?

Unsere Schätzung liefert sowohl für die Wahlabsicht bei der Erst- als auch bei der Zweitstimme Intervalle möglicher Wahlergebnisse. Die Wahrscheinlichkeit, dass das Wahlergebnis in dieses Intervall fällt, wenn heute gewählt würde, liegt bei 95 Prozent. Der Wert, den wir berichten, liegt in der Mitte dieses Intervalls. Bei der Interpretation der Daten sollte also berücksichtigt werden, dass sowohl die Schätzung des Erst- als auch des Zweitstimmenanteils sehr gut auch höher oder niedriger als der berichtete Wert (die Mitte des Intervalls) sein kann. Da die Erst- und Zweitstimmenanteile für kleinere Parteien geringer sind, sind auch die Intervalle der Schätzungen enger.

Bei den Schätzungen für einzelne Bundesländer berichten wir für jede Partei den geschätzten Stimmenanteil mit einem Konfidenzintervall (95 Prozent). Dieser Schätzwert und sein Konfidenzintervall sind die bestmögliche Aussage des Modells, welche Ergebnisse eine Umfrage mit einer großen Stichprobe in einem bestimmten Wahlkreis am heutigen Tage liefern würde. Das Konfidenzintervall liefert unsere beste Schätzung der aktuellen Wahlabsicht.

Wird die Wahlbeteiligung berücksichtigt?

Wir bestimmen auf Basis von Daten-Erhebungen zur Bundestagswahl 2013 typische demografische Muster von Wahlberechtigten, die nicht zur Wahl gehen und berücksichtigen dies bei unseren Schätzungen.

Wie viele Personen hat YouGov in meinem Bundesland / Wahlkreis befragt?

Auf Ebene der Bundesländer befragen wir zwischen 150 Befragte in den kleineren Bundesländern und 2.500 Befragte in den größeren Bundesländern. Auf Ebene der Wahlkreise befragen wir im Durchschnitt 50 bis 60 Befragte. Selbstverständlich ist das Modell nicht in der Lage, genauso akkurate Ergebnisse wie eine umfangreiche Befragung in jedem Wahlkreis zu liefern. Da wir aber Informationen über die demografische Struktur jedes Wahlkreises verwenden, um Wählertypen und –muster entsprechend abzubilden, ist die Stichprobengröße in den einzelnen Wahlkreisen nicht der alleinig entscheidende Faktor.

Wann werden die Umfragen durchgeführt?

Jeden Tag – wir führen kontinuierlich Befragungen durch und fügen die neu gewonnenen Daten dem Modell hinzu.

Trifft YouGov eine Aussage darüber, wieviel Prozent Kandidat X in meinem Wahlkreis bekommen wird?

Eine Schätzung der Sitzverteilung im Bundestag ist natürlich nicht möglich, ohne den wahrscheinlichen Ausgang der Wahl in jedem Wahlkreis zu berücksichtigen. Sinn und Zweck des Modells ist jedoch hauptsächlich, eine bundesweite Schätzung der Sitzverteilung zu liefern – die Schätzungen in den einzelnen Wahlkreisen dienen also dazu, das bundesweite Ergebnis der Bundestagswahl zu schätzen. Im Modell müssen nicht alle Wahlkreisschätzungen korrekt sein, um zu einer richtigen Schätzung des Gesamtergebnisses zu kommen. Beim Umgang mit den Ergebnissen des Modells ist es wichtig, die Intervalle zu beachten: Auch wenn der Mittelpunkt des Intervalls nahelegt, dass in einem bestimmten Wahlkreis Kandidat X einen Stimmenanteil von Y Prozent erhält, ist es unwahrscheinlich, dass Kandidat X exakt diesen Stimmenanteil tatsächlich erhalten wird. Dies sollte in allen Wahlkreisen beachtet werden – besonders aber in solchen Wahlkreisen, in denen der Ausgang eng ist.

Warum ändert sich die Anzahl der Sitze, die YouGov vorhersagt, jeden Tag?

Das deutsche Wahlsystem sieht vor, dass der Bundestag mindestens 598 Sitze umfasst (299 Abgeordnete, die über die Direktwahl einziehen + 299 Abgeordnete, die über die Liste einziehen). Allerdings werden bei bestimmten Wahlausgängen Überhangmandate gebildet, um sicherzustellen, dass die Sitzverteilung den Zweitstimmenanteilen der Parteien entspricht. Wir haben die Regelungen zu Überhangmandaten in unserem Modell berücksichtigt. Dies bedeutet, dass sich abhängig von den aktuellen Befragungsdaten die Berechnung der Anzahl der Sitze im Bundestag verändern kann. Genau wie für die Stimmen- und Sitzanteile jeder Partei berichten wir auch für die Gesamtzahl der Sitze im Bundestag ein Intervall möglicher Ergebnisse.

Warum macht YouGov das?

Es wird aus ganz unterschiedlichen Gründen immer schwieriger, verlässliche Aussagen über den Ausgang von Wahlen zu treffen. Zusätzlich zu unserer klassischen Sonntagsfrage suchen wir deshalb neue methodische Ansätze, um dieser Herausforderung gerecht zu werden. Wir sind uns bewusst, dass es ein Risiko darstellt, in der Hochphase des Wahlkampfs so umfangreiche Daten zu veröffentlichen. Wir fühlen uns aber als Data Scientists innovativen Methoden verpflichtet, um sowohl die Genauigkeit als auch den Detailgrad von Analysen zu verbessern.

Wer berechnet das Modell?

Das Modell wurde federführend von Ben Lauderdale (Associate Professor an der London School of Economics) in Zusammenarbeit mit Jack Blumenau (Dozent an der University College London) sowie Doug Rivers (Stanford University) und Delia Bailey vom YouGov Data Science Team entwickelt. Wertvolle Unterstützung bei der Adaption für die Bundestagswahl hat Arndt Leiniger (PhD) von der Johannes Gutenberg-Universität Mainz geleistet. Die Daten werden direkt von den YouGov-Befragungssystemen an seine Crunch Analyse-Datenbank gesendet. Im Anschluss werden die Modelle auf Basis der Hamiltonian Monte-Carlo-Simulation in der Open-Source Software Stan angepasst. Stan wurde an der Columbia University von Andrew Gelman und seinen Kollegen mit der Unterstützung von YouGov und anderen Organisationen entwickelt.

Warum sollte ich YouGov vertrauen?

Wir arbeiten schon seit mehreren Jahren mit und an diesen Methoden. Wir haben vergleichbare Ansätze beim EU-Referendum 2016 in Großbritannien, der Präsidentschaftswahl 2016 in den USA und der Parlamentswahl 2017 in Großbritannien eingesetzt. Bei der Parlamentswahl 2017 in Großbritannien haben wir damit das zentrale Ergebnis der Wahl (ein Parlament ohne klare Mehrheitsverhältnisse) und 93 Prozent der Wahlkreisergebnisse korrekt vorhergesagt. Allerdings stellen die Bundestagswahl, die verfügbare Datenlage zur Beschreibung der Wahlkreise und das deutsche Wahlsystem mit seiner Verbindung von Personen- und Verhältniswahl ganz neue Anforderungen an uns und unser Modell.

Kontakt

Haben Sie Fragen?
Bitte füllen Sie das Formular aus und wir melden uns bei Ihnen.