So funktioniert das YouGov Wahlmodell

 

Hinweis

Bis zum 24. September wird YouGov aktuelle Umfrageergebnisse zur Wahlabsicht, eine Projektion der Sitzverteilung im Bundestag sowie weitere Analysen bereitstellen. Alle Daten werden auf Grundlage des YouGov Modells berechnet – ein Prognosemodell, das in Crunch.io auf Basis einer Hamiltonian Monte-Carlo-Simulation geschätzt wird. Wir möchten an dieser Stelle darauf hinweisen, dass die Güte des Vorhersagemodells u.a. von öffentlich-zugänglichen Daten z.B. aus dem Zensus abhängig ist. Da diese Informationen für YouGov nicht in gleichem Maße wie in UK und den USA verfügbar sind, ist die Aussagekraft des Modells möglicherweise nicht mit den Modellen vorangegangener Wahlen vergleichbar. Nichtsdestotrotz haben wir uns aus Gründen der Transparenz dazu entschieden die Daten zu veröffentlichen.

 

Zum Wahlmodell

Auf Grundlage der Methodik, die wir für das EU Referendum in Großbritannien 2016 , die amerikanische Präsidentschaftswahl 2016 und die britischen Parlamentswahlen 2017 verwendet haben, verwendet YouGov ein entwickeltes Verfahren namens Multilevel Regression und Post-Stratifikation (kurz: MRP), um Schätzungen für die kommende Bundestagswahl durchzuführen.

Täglich befragt YouGov ca. 1.200 Panelmitglieder zu ihrer Wahlabsicht bei der Bundestagswahl 2017. Im Laufe von zwei Wochen werden so Daten von ungefähr 17.000 Panelmitglieder gesammelt. Da diese Stichprobe viel größer ist, als die unserer regulären bundesweiten Umfragen, verfügen wir über eine genügend große Stichprobe, um in jedem der 16 Bundesländer Schätzungen durchführen zu können. Außerdem können wir, obwohl wir im Durchschnitt pro Wahlkreis nur ungefähr 55 Panelmitglieder im Laufe von zwei Wochen befragen,  auch Schätzungen für jeden der 299 Wahlkreise durchführen. Wir haben uns allerdings entschlossen diese nicht zu veröffentlichen, da die Qualität der verfügbaren Daten zur Beschreibung der Wahlkreise im Vergleich zu UK und den USA hierzulande geringer einzuschätzen ist.

Für die Schätzung mittels MRP verwenden wir Umfragedaten der vorherigen vierzehn Tage und setzen Befragungszeitpunkt, Wahlkreis, demografische Merkmale der Wähler, vorheriges Wahlverhalten und weitere Variablen, anhand derer sich Wähler unterscheiden, mit der aktuellen Wahlabsicht in Verbindung.

Dieses Modell wird dann verwendet, um die Wahrscheinlichkeit zu schätzen, mit der ein Wähler mit spezifischen Charakteristika CDU/CSU, SPD oder eine andere Partei wählt. Auf der Basis von Daten aus verschiedenen öffentlichen und gewerblichen Quellen, inklusive vorheriger Wahlergebnisse, hat YouGov die Anzahl jedes Wählertypens in jedem Wahlkreis geschätzt. Dabei ist anzumerken, dass die Qualität der öffentlich-zugänglichen Daten für Deutschland sowohl in Quantität als auch Qualität deutlich geringer ausfällt als in UK und den USA, was Konsequenzen auf die Modellqualität hat. Durch die Verbindung der Wahrscheinlichkeiten aus dem Modell und den geschätzten Zensuswerten ist es YouGov möglich, an jedem Tag die Anzahl der Wähler einer Partei in einem Wahlkreis zu schätzen.

Es ist uns wichtig, auf die methodischen Grenzen und Einschränkungen unseres Modells hinzuweisen. Erstens liefert das Modell Schätzungen der aktuellen Wahlabsichten und keine Prognose des tatsächlichen Wahlverhaltens am 24. September. Panelmitglieder berichten uns ihre Wahlabsicht, aber sie können ihre Meinung noch ändern und wir versuchen nicht, diese Unsicherheit zu quantifizieren. Zweitens sind die Stichproben in den einzelnen Wahlkreisen zu klein, um für sich genommen verlässlich zu sein und unterliegen mehr als nur den Stichprobenfehlern. Um diese geringen Stichprobengrößen zu kompensieren, müssen wir uns darauf verlassen, dass das Modell Muster über alle Wahlkreise hinweg findet. Das Modell verwendet Daten von Panelmitgliedern, die in strukturell ähnlichen Wahlkreisen wohnen, um die geringe Zahl der tatsächlich Befragten in einem bestimmten Wahlkreis zu kompensieren. Dieses Vorgehen basiert auf der Annahme, dass Personen mit ähnlichen Charakteristika unabhängig von ihrem Wohnort dazu neigen, ähnliche (aber nicht identische) Wahlentscheidungen zu treffen. Auch wenn unser Modell in der Vergangenheit überzeugende Ergebnisse geliefert hat (unser MRP-Modell für die britischen Parlamentswahlen 2017 hat frühzeitig ein Parlament ohne klare Mehrheitsverhältnisse und 93 Prozent der Wahlkreise korrekt vorhergesagt), können wir mit dieser Methode keine Schätzungen liefern, die die Präzision einer umfangreichen Umfrage in jedem Wahlkreis hätte. Außerdem ist die Daten-Ausgangslage an öffentlich-verfügbaren Daten zur Beschreibung der Wähler und Wahlkreise geringer einzustufen als in UK und den USA, wodurch die Aussagekraft des Modells begrenzt ist. Deshalb haben wir uns entschieden, keine Vorhersagen auf Ebene der Wahlkreise zu veröffentlichen.

Deutschland hat ein komplizierteres Wahlsystem als die Länder, in denen wir diese Methode bis jetzt benutzt haben. Deswegen haben wir eine Version des MRP entwickelt, die gleichzeitig sowohl die Erst- als auch die Zweitstimme modelliert. Das zentrale Modell ist das für die Zweitstimme, welches dann durch ein Modell für die Erststimme erweitert wird. Basierend auf lokal relevanten Parteien und weiteren Faktoren werden dann Muster identifiziert, nach denen Personen ihre Erststimme einer Partei geben.

Wir haben die kompletten Sitzverteilungsregeln, inklusive der Überhang- und Ausgleichsmandate, implementiert, sodass wir auch eine Aussage über die Größe des Bundestages liefern können. Aktuell erwarten wir, dass der Bundestag (momentane Größe: 598 Mandate + 33 Überhang- und Ausgleichsmandate) aufgrund von gesetzlichen Änderungen, die vor der Wahl 2013 umgesetzt wurden, und dem erwarteten Rückgang des Zweitstimmenanteils der CDU/CSU deutlich größer werden wird. Dies wird deutlich, wenn einzelne Bundesländer wie Bayern oder Baden-Württemberg betrachtet werden. Dort werden die CSU und CDU sehr wahrscheinlich alle Direktmandate gewinnen, aber ihr Zweitstimmenanteil wird deutlicher unter 50 Prozent liegen als noch bei der Bundestagswahl  2013. Deshalb muss eine bedeutende Anzahl an Überhangmandaten gebildet werden, um die Sitzverteilung nach dem Zweitstimmenverhältnis im jeweiligen Bundesland zu wahren. Dies wiederum führt nach den neuen Regelungen von 2013 dazu, dass weitere Ausgleichsmandate in anderen Bundeländern nötig sind, um das bundesweite Zweitstimmenverhältnis zu wahren.

YouGov wird seine Modellschätzungen täglich aktualisieren. Die veröffentlichten Schätzungen beinhalten das bundesweite Zweitstimmverhältnis und die Sitzverteilung sowie das Zweitstimmenverhältnis auf Ebene der Bundesländer. Für jedes Bundesland liefern wir eine Stimmenschätzung inklusive des Konfidenzintervalls (95 Prozent). Diese sind die besten Schätzungen des Modells für die Ergebnisse, die eine umfangreiche Umfrage in einem bestimmten Bundesland an einem bestimmten Tag ergeben würde. Der Leser sollte daher die Konfidenzintervalle miteinbeziehen, um belastbarere Schätzungen der Wahlabsichten zu erhalten. Aufgrund der diskutierten Einschränkungen sind aber auch diese Konfidenzintervalle in einzelnen Fällen nicht versagenssicher.

Das Modell wurde federführend von Ben Lauderdale (Associate Professor an der London School of Economics) in Zusammenarbeit mit Jack Blumenau (Dozent an der University College London) sowie Doug Rivers (Stanford University) und Delia Bailey vom YouGov Data Science Team entwickelt. Wertvolle Unterstützung bei der Adaption für die Bundestagswahl hat Arndt Leiniger (PhD) von der Johannes Gutenberg-Universität Mainz geleistet. Die Daten werden direkt von Befragungssystemen von YouGov an seine Crunch Analyse-Datenbank gesendet. Im Anschluss werden die Modelle auf Basis der Hamiltonian Monte-Carlo-Simulation in der Open-Source Software Stan angepasst. Stan wurde an der Columbia University von Andrew Gelman und seinen Kollegen mit der Unterstützung von YouGov und anderen Organisationen entwickelt.

Kontakt

Haben Sie Fragen?
Bitte füllen Sie das Formular aus und wir melden uns bei Ihnen.