Hvem vinder valget?

Den 5. juni skal vi til valgurnerne, og i den mellemliggende periode bombarderer medierne os med valgprognoser og meningsmålinger. Fra et statistisk synspunkt er prognoserne omkring folketingsvalget i år ekstra spændende, fordi der er tre nye partier på valglisten, som ikke tidligere har været en del af valgene. Det gør det sværere for prognoseinstitutterne, og vi checker, hvor gode de egentlig var til at forudsige resultatet af sidste valg, og om det er muligt at gøre det endnu bedre ved dette valg.

Den 7. februar holdt Mikkel Krogsholm et meget fint foredrag i CopenhagenR Users om at lave “poll of polls” - en sammenvejning af prognoserne fra flere meningsmålinger for at øge den samlede stikprøvestørrelse. Mikkels R-pakke gør det let at hente nye og gamle danske meningsmålinger, så man selv kan være med til at modellere videre på de resultater, som opinionsbureauer leverer. Erik Gahner er en af kilderne, som Mikkels R-pakke kan hente fra, og disse data bliver regelmæssigt opdateret med de seneste meningsmålinger. Det er Gahners data, som vil blive benyttet i det efterfølgende.

Sammenvejning af meningsmålinger

Datasættet fra Gahner indeholder meningsmålinger frem til og med 27 maj fra i alt 7 bureauer: Epinion, Gallup, Greens, Megafon, Norstat, Voxmeter, YouGov. Figuren nedenfor viser de seneste meningsmålinger fra de 7 bureauer.

Figur 1: Den forventede fordeling af stemmerne ved sidste meningsmåling for de 7 meningsmålingsbureauer, der indgår i analysen.

Hver meningsmåling er et forsøg på at estimere den underliggende fordeling af de danske stemmer, og de 7 meningsmålinger viser overvejende samme billede. Variationen mellem prognoserne skyldes variationen mellem stikprøverne, og at de forskellige bureauer benytter forskellige modeller til at komme med prædiktioner for fordelingen.1 Man kan ikke få at oplyst, hvilke modeller, som bureauerne præcis har anvendt, da det er forretningshemmeligheder. Formentlig laver de en justering af de indhentede stemmer på baggrund af deres stikprøvers demografiske sammensætning, så den matcher sammensætningen i befolkningen. Foruden at spørge til, hvad hvad personerne i stikprøven vil stemme, så er det kutyme at spørge til, hvad vælgerne stemte ved sidste valg, så man kan estimere ændringen i procent i forhold til fordelingen fra 2015. Bureauerne har givetvis også en fudge-factor, der forsøger at tage højde for de situationer, hvor de tidligere har skudt forkert. En del af danskerne har endnu ikke besluttet sig, og denne usikkerhed spiller også ind.

Hver meningsmåling er baseret på godt 1000 observationer, og meningsmålingerne kan sammenvejes til en samlet meningsmåling baseret på en meget større stikprøve ved at estimere, hvor mange personer fra hver prognose, som har stemt på hvert parti. Da alle meningsmålingerne forsøger at estimere den samme fordeling kan man opfatte de enkelte prognoser som forskellige stikprøver fra samme population og blot lægge stemmerne sammen. Dette vægtede gennemsnit er ikke helt optimalt, da variationen mellem prognoserne ikke kun skyldes forskellige stikprøver men også skyldes forskellige metoder til at frembringe estimaterne. De tilgængelige data giver desuden kun informationer om stikprøvestørrelsen, men præcisionen kan yderligere være påvirket af bureauernes anvendte model, så sammenvejningen kan udelukkende opfattes som en approksimation.

Tabel 1: Vægtede gennemsnit baseret på de seneste prognoser fra de 7 meningsmålingsbureauer. Vægtningen er baseret på stikprøvestørrelsen af de enkelte prognoser.
Parti Procent Fejlmargin (2 SE) Sidste valg (%)
Socialdemokratiet 27.64 0.94 26.3
Venstre 17.67 0.80 19.5
Dansk Folkeparti 11.40 0.67 21.1
Enhedslisten 8.50 0.59 7.8
Socialistisk Folkeparti 7.96 0.57 4.2
Radikale Venstre 7.50 0.56 4.6
Konservative 5.27 0.47 3.4
Liberal Alliance 3.73 0.40 7.5
Alternativet 3.25 0.37 4.8
Nye Borgerlige 2.74 0.34 0.0
Stram Kurs 2.10 0.30 0.0
Kristendemokraterne 1.48 0.25 0.8
Klaus Riskær Pedersen 0.75 0.18 0.0

Udviklingen af det vægtede gennemsnit for de enkelte partier kan ses i figuren nedenfor, hvor de enkelte underliggende prognoser også er indtegnet. Det ses, at der er nogle svage trends i udviklingen af stemmefordelingen for de enkelte partier, men det er ikke fordi der sker så frygtelig meget for prognoserne for de enkelte partier.

Figur 2: Udviklingen af vægtet gennemsnit for de enkelte partier (tykke linjer) og udviklingen i de bagvedliggende prognoser (tynde linjer).

Det er naturligvis interessant, hvordan prognosen for de enkelte partier udvikler sig, men hvis vælgere skifter parti, så er det mere oplagt, hvis de kun rykker sig en lille smule politisk fremfor hvis deres politiske ståsted ændrer sig markant. Det giver