Så fungerar Botten Ada

Här samlar vi de vanligaste återkommande frågorna om modellen.

Botten Ada är en bayesiansk statistisk modell som försöker svara på två frågor:

  1. Vilket väljarstöd har partierna i dag?
  2. Vilket väljarstöd kan partierna tänkas ha på valdagen?

Modellen bygger på opinionsmätningar sedan 2001 från Sifo, Novus, Ipsos, Demoskop, Sentio och Skop (även nedlagda institut som Yougov och Inizio), samt valresultat och partisympatiundersökningar från SCB sedan 1973.

Hur skiljer sig Botten Ada från andra sammanvägda mätningar?

Det finns en rad sammanvägda mätningar eller “poll of polls”: Svensk väljaropinion (Kantar Sifo / Ekot), Omnipoll (Demoskop / Omni), Mätningarnas mätning (Göteborgs universitet / Data story) och Pollofpolls.se.

Dessa bygger i regel på samma enkla metod. Man räknar ett medeltal på den senaste månadens opinionsmätningar och viktar möjligen instituteten något olika.

Det som skiljer Botten Ada från de flesta traditionella sammanvägda mätningar är bland annat att:

  • Den gör prognoser för valresultat. Syftet med prognoserna är inte primärt att försöka förutsäga exakt hur många procent varje parti kommer att få, utan snarare visa vilka utfall som kan antas vara realistiska och inte.

  • Den beaktar opinionsmätningarnas historiska skevheter sett till valresultaten, så kallad industribias. Opinionsinstituten har till exempel haft svårare att mäta Sverigedemokraterna än Centerpartiet inför val, vilket gör modellen mer osäker på SD:s väljarstöd. Vänsterpartiet och Miljöpartiet är också exempel på två partier som under 2000-talet ofta överskattats inför val.

  • Den bygger på samtliga opinionsmätningar, även ej slumpmässigt utvalda, självrekryterade webbpaneler som en del andra sammanvägda mätningar exkluderar. Däremot ges olika mätinstitut olika vikt. Den här viktningen bygger på hur rätt eller fel instituten har legat inför tidigare val.

  • Den är bayesiansk och genererar simuleringar för dels opinionsläget i dag, dels potentiella resultat på valdagen. Detta innebär att vi också modellerar osäkerheten i opinionen. Att vi inkluderar osäkerhet innebär att vi “bakar in” sannolikheten att något av de små partierna åker ut, samt möjligheterna att valspurta. Med hjälp av simuleringarna kan vi beskriva hur opinionsläget ser ut i termer av sannolikheter. Om vi vill svara på frågan “hur stor är sannolikheten att L och MP åker ur riksdagen?” räknar vi i hur stor andel av alla simuleringar som L och MP får färre än fyra procent av rösterna.

Internationella förebilder finns bland annat i Nate Silvers FiveThirtyEight USA, Aftenposten i Norge under valet 2021, och The Economist och Wer gewinnt die Wahl under valet i Tyskland 2021.

Läs mer om hur prognosmodellen fungerar här.

Tar ni stödröstande i beaktande?

Ja, vi skattar hur mycket mindre partier har ökat sitt stöd från SCB:s majmätning fram till valdagen. Den skattade effekten är som störst när partierna har cirka 3,4 procent i SCBs majmätning. För att se exakt hur vi gör prognoser, se vårt repo med den strukturella prediktionsmodellen.

Däremot gör vår “om det var val i dag”-sammanvägning inte något försök att beakta stödröstande.

Vilka opinionsmätningar ges störst vikt?

Vi använder inte viktning i klassisk bemärkelse av olika institut. Däremot skattar vi olika instituts så kallade husbias per part, det vill säga hur avviker deras skattningar från andra institut.

Utöver detta skattar vi så kallad designbias fångar hur många effektiva observationer varje institut har. Till detta kommer också industribiasen, det vill säga hur fel alla institut ligger jämfört med valresultatet.

Det är svårt att sätta en siffra på hur olika institut viktas. Husbias, designeffekt och industribias är dynamiska och skattas olika under olika perioder. Det innebär att olika institut viktas på olika sätt under olika mandatperioder.

Tar ni i beaktande andra data än opinionsmätningar, till exempel ekonomi?

Nej. Vi har övervägt det, men kommit fram till att det modellen inte blir bättre av det. Två C-uppsatser i statistik har tittat på olika strukturella modeller och bland annat analyserat arbetslöshet, sittande regering, BNP, medieomnämnanden, inflation, partiledarpopularitet och näst bästa parti. Men uppsatserna kom fram till att den bästa modellen endast använder SCB:s majmätning och föregående val för att predicera valresultat. Däremot har vi lagt till stödröstande, vilket visats sig förbättra prediktionerna, framförallt för mindre partier.

Uppsatserna går att läsas här och här.

Kan jag ta del av data och kod?

Modellen vidareutvecklas kontinuerligt under valåret och publiceras med öppen källkod och öppen data för trovärdighet och transparens. Modellen bygger på de idéer som publicerats i den vetenskapliga artikeln “Dynamic Bayesian Forecasting of Presidential Elections in the States” som går att läsa här. Den har sedan anpassats till flerpartisystem och använder en strukturell modell anpassad för Sverige. Mer information om modellen finns också hos Newsworthy.

Vem ligger bakom Botten Ada?

Modellen är utvecklad av Måns Magnusson, som är docent i statistik vid Uppsala universitet och som forskar på bayesianska metoder, beräkningsintensiv statistik och storskalig textanalys, samt Jonas Wallin som är docent i statistik och biträdande programdirektör för masterprogrammet i data analytics och business economics vid Lunds ekonomihögskola. Jonas forskar inom högdimensionell statistik, spatial statistik och beräkningsintensiv statistik.

Sajten och presentationen är utvecklad av Jens Finnäs och Leo Wallentin från Newsworthy och J++ Stockholm. Jens och Leo är pionjärer inom datajournalistik i Sverige.

Projektet drivs inför valet 2022 i samarbete med Svenska Dagbladet.