Hvem vinder VM 2018 og hvem er bedst til at prædiktere det?

Sommeren står i sportens tegn for i år skal vi skal underholdes med både Tour de France og ikke mindst VM i fodbold. Den næste tv-måned bliver rædselsfuld, for man kan ikke tænde for fjernsynet uden at høre om fodbold hele tiden. Fodbold i fjernsynet er dog langtfra så underholdende, som at prædiktere vinderen ved hjælp af statistik, så hvorfor ikke tage forskud på glæderne inden VM sparkes i gang i eftermiddag, og komme med et bud på årets vinder.

Og vinderen er …

Den overordnede introduktion til den anvendte metode er beskrevet i [indlægget fra 2016]({{% relref "2016-06-01-em2016.html" %}}). Som input til modellen bruges enten ELO ranking (indhentet den 12. maj) eller odds for de 32 hold som input til modellen (indhentet fra Bet365 samme dag). Oddsene har allerede inkorporeret, at Rusland spiller på hjemmebane, men det har ELO værdierne ikke, og ligesom ved EM i 2016 øges ELO værdien med 5% for Rusland for at give en hjemmebanefordel.1 Denne hjemmebanefordel inkluderer derfor både gevinsten ved hjemmebanepublikum, effekten af bestikkelser mv. De 5% er - ligesom meget af det andet - grebet lidt ud af luften. Data fremgår af tabellen nedenfor.

Tabel 1: Input til analysen består af odds og ELO ratings hentet på nettet. Ruslands hjemmebanefordel er medrgnet i tallene i tabellen. Den største forskel mellem ELO og odds ses måske for Peru, hvor ELO rating er meget bedre end de odds, som landet er blevet tildelt.
Navn Gruppe odds ELO Navn Gruppe odds ELO
Egypt A 151.0 1646 Brazil E 5.0 2131
Russia A 41.0 1769 Costa Rica E 501.0 1745
Saudi Arabia A 1001.0 1582 Switzerland E 101.0 1879
Uruguay A 34.0 1890 Serbia E 201.0 1770
Iran B 501.0 1793 Germany F 5.5 2092
Morocco B 501.0 1711 South Korea F 751.0 1746
Portugal B 26.0 1975 Mexico F 101.0 1859
Spain B 7.0 2048 Sweden F 151.0 1796
Australia C 301.0 1714 Belgium G 12.0 1931
Denmark C 101.0 1843 England G 19.0 1941
France C 7.5 1984 Panama G 1001.0 1669
Peru C 201.0 1906 Tunisia G 751.0 1649
Argentina D 10.0 1985 Colombia H 41.0 1935
Croatia D 34.0 1853 Japan H 301.0 1693
Iceland D 201.0 1787 Poland H 51.0 1831
Nigeria D 201.0 1699 Senegal H 201.0 1747

Når enten odds eller ELO omregnes til sandsynligheder kan holdene indbyrdes sammenlignes. De parvise sandsynligheder for kampene på baggrund af ELO scores kan ses i figuren nedenfor. Jo rødere farven er, jo større sandsynlighed er der for at holdet angivet ude til venstre vinder (før musen henover for at se de konkrete sandsynligheder). Man kan bemærke, at Brasilien, Spanien og Tyskland alle har gode chancer for at vinde hver af deres kampe (deres rækker er meget røde), mens det står noget værre til med eksempelvis Saudi Arabien.

Når vi simulerer 100000 slutrunder og tæller op, hvem der vinder VM, så tegner der sig et ret klart mønster: Tyskland har suverænt størst chance for at vinde VM (med en samlet sandsynlighed for at vinde på 25.357 %), mens Brasilien har den klart næststørste chance med 20.104 %. Resultaterne ændrer sig stort set ikke om man bruger data fra odds eller ELO rating til at lave simulationerne. Det er måske værd at bemærke, at Danmarks chancer for at vinde VM ikke er for gode: Vi har 0.111 % chance for at hive pokalen hjem!

Ser man på, hvilke hold, der kommer til at spille finalekampen mod hinanden er der en del variation. Tabellen nedenfor viser de 8 hyppigste kombinationer, og i ca. 14% af de simulerede slutrunder har det netop været Tyskland mod Brasilien, der har mødtes.

Tabel 2: Hyppigheder over de lande, der mødes i finalen. Tysklands of Brasiliens store vinderchance er afspejlet i disse tal, da de ofte formår at komme igennem turneringen og frem til finalen. I tabellen er kun vist de 8 hyppigste kombinationer.
Lande Hyppighed
Brazil, Germany 14.037
France, Germany 7.169
Belgium, Germany 5.819
Argentina, Brazil 5.630
Brazil, Spain 5.128
Belgium, Brazil 4.547
Belgium, England 4.308
Brazil, England 4.300

Danmarks chancer i gruppekampene

Danmark starter i samme gruppe som Frankrig, Peru og Australien, og vi går kun videre til resten af turneringen, hvis vi slutter som nummer 1 eller 2 i gruppen. Modellen kan udregne, hvor stor sandsynlighed der er, for at et givent hold ender som nummer 1, 2, 3 eller 4 i gruppen. For Danmarks gruppe estimeres sandsynlighederne til at være:

Tabel 3: Sandsynlighederne for at hvert land ender som nummer 1, 2, 3 eller 4 i gruppe C. Danmark har en hæderlig chance for at gå videre, men vores chancer afhænger måske nok mest af alt af kampen mellem Dan