Falsk negative svar ved antigentest

Falsk negativrate på 47% ved lyntest! Dette tal blev lanceret i en artikel i Politiken den 2. april og er blevet kritikløst kopieret i den øvrige presse efterfølgende.

Oplysningen stammer fra Statens Serum Institut (SSI), som har lavet en tabel over personer der har fået både en antigentest (“lyntest”) og en PCR test højst 24 timer senere. Denne tabel er imidlertid åbenlyst ikke repræsentativ for alle de personer, der tager en lyntest, og den resulterende falsk negativ rate er derfor stærkt tvivlsom. Med andre ord: tallene fra SSI kan ikke bruges til at udlede den falske negativrate på 47%.


Historiske danske vejrdata

Klimadebatten havde en fremtrædende rolle ved sidste folketingsvalg, hvor det lidt overraskende viste sig, at stort set samtlige danske partier var blandt de grønneste i landet. Corona-epidemien har skubbet “klimaspøgelset” i baggrunden her det sidste år, men det har selvfølgelig ikke gjort problemet mindre.


Giver det overhovedet mening at tale om personlig medicin?

Personlig medicin er det nye paradigme i fremtidens patientbehandling. Til forskel fra nu, hvor patienter får en medicinsk behandling, der plejer at virke på lignende patienter, så tilbyder personlig medicin en behandling, der er skræddersyet og dermed helt unikt tilpasset den enkelt patient. Det lyder besnærende, men er det overhovedet realistisk eller muligt at tilbyde ægte personlig medicin?


Tips til læse og afkode statistikken i videnskabelige artikler

Forskere kommunikerer deres forskningsresultater gennem videnskabelige artikler, og derfor er det nødvendigt at kunne læse og forstå disse for at kunne vurdere, diskutere og forstå de nyeste forskningsresultater. Mange videnskabelige artikler er bygget over samme skelet, og når man kender denne opbygning er det lettere at danne sig et overblik over artiklen og vurdere kvaliteten af de statistiske resultater. Artiklerne er struktureret i afsnittene “Abstract”, “Introduction”, “Methods”, “Results” og “Discussion” (AIMRD), og AIMRD-opbygningen svarer mere eller mindre til trinnene i den videnskabelige proces skitseret i figur 1.


Covid-19: Hvornår tænder advarselslampen igen?

Covid-19 har sat et kæmpe aftryk på 2020, men efterhånden er Danmark godt på vej til at være genåbnet. Forretningsliv, restauranter og caféer er tilbage i funktion - dog ikke i normal grad men i hvert fald delvist, og skoler, gymnasier og uddannelsesinstitutionerne er klar til at åbne dørene efter sommerferien.

De seneste måneder har været forbundet med stor usikkerhed, da vi ikke i nyere tid har oplevet noget tilsvarende, og både før og efter lockdown-forløbet har der været tvivl om, hvordan det ville gå. Takket være ekspertgruppen under Statens Serum Institut har der været lavet prognoser og fremskrivninger baseret på matematiske modeller og data fra det danske sundhedssystem, som har guidet os igennem forløbet. Det primære fokus i disse modeller var antallet af indlæggelser, så den nødvendige kapacitet af intensivpladser fremadrettet var sikret for at alle smittede kunne få den bedste behandling. Særligt i starten var disse prognoser baseret på meget lidt data, hvilket vi har skrevet om tidligere.

I øjeblikket er epidemien under kontrol herhjemme, og antallet af indlæggelser har ligget nogenlunde jævnt på under 10 indlæggelser per døgn de sidste mange uger. Det betyder, at fokus nu skifter fra at lave prognoser, der fortæller, hvordan det kommer til at gå på længere sigt til at vurdere, om de daglige antal indlæggelser pludselig er voksende.


Simple metoder til at forstå epidemiudbrud

Det aktuelle udbrud af Coronavirus eller Covid-19 bliver naturligt behandlet intensivt i medierne. Her ser vi på, hvordan en epidemi udvikler sig, så man får en bedre forståelse af om epidemien accelerer eller vi er på vej til at inddæmme den.

I to tidligere artikler er der set på den såkaldte SIR model for epidemiudbrud i en befolkning. Karantæners betydning for spredning af coronavirus beskrev, hvordan man kunne nedsætte smitteraten ved hjælp af karantæne, og hvad det betyder for smittehastigheden i befolkningen. Hvorfor er det svært at forudsige epidemier, lige efter de er gået i udbrud? fortæller i detaljer om de store usikkerheder, der er i estimationen af epidemiers forløb i de tidlige faser, hvor data er usikre.

I dette indlæg vil vi bruge en meget simpel beskrivelse af udviklingen af epidemien ved en eksponentiel udvikling, eller rentesregning, der specielt er god i den første fase af et udbrud. I starten af et udbrud, der er nemlig ikke nogen, der er immune, og alle kan smittes.


Hvorfor er det svært at forudsige epidemier, lige efter de er gået i udbrud?

Covid-19 har lukket Danmark ned, og vi skal alle vænne os til at holde social afstand og til midlertidig frivillig hjemmekarantæne. Epidemien er utrolig fremtrædende i alles bevisthed, og nye historier, kommentarer, tal, modeller og figurer dominerer dagligt de traditionelle og sociale medier. Er der intensivpladser nok på hospitalerne? Hvor længe vil epidemien vare? Hvor mange vil dø?

Den allestedsnærværende interesse har også medført, at mange personer har kastet sig over at analysere de offentliggjorte tal fra Statens Serum Institut for at se, hvordan epidemien vil udvikle sig. Det er positivt, at problemstillingen har vækket så mange personers interesse for at analysere data, men man skal være ekstra varsom med konklusionerne fra disse analyser, for det er desværre ikke let at forudsige forløbet af et nyt virusudbrud.


Det forventede babyboom er aflyst

Den 23. februar 2020 kunne man i flere danske medier høre en beretning om, at “det forventede babyboom er aflyst”. Babyboomet var spået i 2017 i en rapport fra Danske Regioner, men rapportens forfattere forklarer aldrig, hvordan de er kommet frem til deres prognose, men vi kommer med et gæt på, hvordan de kunne skyde så forkert.


Karantæners betydning for spredning af coronavirus

Mens coronavirussen breder sig med hastige skridt i Kina forsøger alle lande at mobilisere et beredskab, der skal stå klar til at begrænse smitten. Et af de tiltag, der anvendes er at sætte smittede eller personer, der muligvis er smittede, i karantæne. Her regner vi på, hvordan sygdommen kan udvikle sig i Danmark fra en enkelt smittebærer, og hvor hurtigt man skal sætte patienter i karantæne for at det er effektivt.


Kritikken af p-værdier

I september blev jeg sammen med Theis Lange bedt om at holde et diskussionsoplæg omkring den kritik, som p-værdier har været under i de seneste år. Hvorfor er kritikken opstået, hvad er problemerne, og hvad skal man mene om de alternativer, der har været foreslået til at vurdere resultaterne af videnskabelige forsøg? Emnet viste sig at være ret populært, så jeg har forsøgt at skrive dele af foredraget sammen her, da det lader til at være en problemstilling, som mange efterhånden har hørt om, og har interesse i.


Hvor vigtigt er det, om man dividerer med n eller n-1 når spredningen udregnes?

I statistiklitteraturen gør man mange steder et stor nummer ud af, at det er vigtigt at dividere med \(n-1\) i stedet for \(n\), når man udregner stikprøvespredningen. Argumentet for dette er baseret på, at variansestimatet så bliver centralt, men dette resultat holder alligevel ikke for spredningsestimatet, og i virkeligheden burde man hellere bekymre sig om direkte at udregne et centralt estimat for spredningen.


Korrelation er ikke transitiv

Hvis X er positivt korreleret med Z og Z er positivt korreleret med Y, hvad kan man så sige om korrelationen mellem X og Y? Umiddelbart skulle man tro, at der så også ville gælde, at X og Y var positivt korrelerede, men som vi viser her, gælder det langtfra altid.


Hvem vinder valget?

Den 5. juni skal vi til valgurnerne, og i den mellemliggende periode bombarderer medierne os med valgprognoser og meningsmålinger. Fra et statistisk synspunkt er prognoserne omkring folketingsvalget i år ekstra spændende, fordi der er tre nye partier på valglisten, som ikke tidligere har været en del af valgene. Det gør det sværere for prognoseinstitutterne, og vi checker, hvor gode de egentlig var til at forudsige resultatet af sidste valg, og om det er muligt at gøre det endnu bedre ved dette valg.


Vurdering af reliabiliteten i de nationale tests

Debatten om de nationale tests blussede igen op i medierne efter at Georg Breddam bemærkede, at de nationale tests gav et skævt billede af nogle af hans elever. Da Jeppe Bundsgaard og Svend Kreiner i en grundig rapport fra marts i år tilmed kunne dokumentere, at de nationale tests ikke bare målte forkert, men også give et bud på årsagen, udsendte Undervisningsministeriet en pressemeddelelse, hvor de understregede, at der var tilfredsstillende høje korrelationer og positiv statistisk signifikans mellem gentagne målinger af en elevs niveau. Problemet med ministeriets argumentation er, at korrelationer ikke giver nogen reel information om, hvorvidt gentagne målinger på samme elev viser det samme.


Hvad kræves der for at undgå en mæslingeepidemi?

Styrelsen for patientsikkerhed har netop advaret landets praktiserende læger om at være særlig opmærksomme på forekomsten af mæslinger efter at to danskere er vendt hjem fra skiferie i Val Thorens med sygdommen. Mæslinger er ret smitsomt og udbruddet har medført, at vaccinedebatten igen er blusset op. Med en lille smule matematisk modellering kan man se konsekvenserne af at vaccinere befolkningen, og udregne, hvor stor en andel af befolkningen, der skal være immune for at sikre, at et udbrud ikke udvikler sig til en epidemi.


Brug Welch' t test og stop med at teste for ens varianser

På det seneste har vi på afdelingen diskuteret undervisning og drøftet de fremgangsmåder, som de studerende lærer. Det kom der en interessant diskussion ud af, som både understregede, at statistiske analyser sjældent kan fuldstændig automatiseres, men skal tilpasses hver enkelt situation, men også at de studerende lærer lidt forskellige fremgangsmåder på vores kurser. Et emne, som vi ikke diskuterede, men ofte dukker til statistikkonsultationerne, er praksis med at først at teste for ens varianser i forbindelse med t test for to uafhængige stikprøver. Mange studerende har lært, at de skal bruge en to-trins procedure, hvor de først tester for ens varianser, og derefter vælger, hvilket t test de vil benytte, men dette er det helt unødvendigt, og faktisk er det sikrere at lade være.


En julehistorie ... eller to ... eller tre

Julen er vel overstået og for mit vedkommende betyder det, at der endelig har været tid til at gøre et lille indhug i stakken af ulæste bøger. Blandt skønlitteratur og fagbøger sniger der sig ofte en række bøger ind, som ikke er deciderede fagbøger i statistik, men som beskæftiger sig med statistik eller statistiske problemstillinger fra en populærvidenskabelig vinkel. I stakken var der fire bøger, der var interessante nok til at de er værd at anbefale til andre.


De fleste stikprøvestørrelsesberegninger er for optimistiske

Stikprøvestørrelse- og styrkeberegninger udgør en vigtig del af et fornuftigt studiedesign. Beregningerne er vigtige, hvis vi skal undgå at søsætte studier, hvor det alligevel ikke er muligt at få belyst den relevante problemstilling. Desuden vil man gerne sikre - hvis forsøgsenhederne er mennesker eller dyr - at der hverken generes for få eller for mange individer. Selvom udregningerne ofte baseres på grove tilnærmelser til de data eller modeller, der i virkeligheden skal analyseres, så gør de fleste sig umage med at komme med fornuftige bud på de relevante inputparametre. På trods af dette er langt de fleste af de stikprøve- og styrkeberegninger, der bliver lavet, underdimensionerede med op til 20%.


Hvem vinder VM 2018 og hvem er bedst til at prædiktere det?

## Warning in library(package, lib.loc = lib.loc, character.only = TRUE,
## logical.return = TRUE, : there is no package called 'kableExtra'

Sommeren står i sportens tegn for i år skal vi skal underholdes med både Tour de France og ikke mindst VM i fodbold. Den næste tv-måned bliver rædselsfuld, for man kan ikke tænde for fjernsynet uden at høre om fodbold hele tiden. Fodbold i fjernsynet er dog langtfra så underholdende, som at prædiktere vinderen ved hjælp af statistik, så hvorfor ikke tage forskud på glæderne inden VM sparkes i gang i eftermiddag, og komme med et bud på årets vinder.


Bekymringsfri analyse af 2x2-tabeller

## Warning in library(package, lib.loc = lib.loc, character.only = TRUE,
## logical.return = TRUE, : there is no package called 'kableExtra'

Studerende introduceres til analyse af 2x2 tabeller ved hjælp af \(\chi^2\) test som noget af det første i statistikundervisningen. Det er der flere gode grunde til: metoden er anvendelig i mange praktiske situationer, metoden er let at forstå, og man kan lave udregningerne i hånden. I undervisningen bliver mange studerende desuden præsenteret for en eller flere tommelfingerregler, som angiver, hvornår antagelserne for analysen er opfyldte. I praksis viser det sig, at man ikke behøver at bekymre sig om disse tommelfingerregler, hvis man bare vurderer \(\chi^2\)-teststørrelsen korrekt.


Hvor præcise er de danske befolkningsprognoser?

## Warning in library(package, lib.loc = lib.loc, character.only = TRUE,
## logical.return = TRUE, : there is no package called 'kableExtra'

Hvert år laver Danmarks Statistik en befolkningsfremskrivning, hvor de kommer med et estimat for befolkningens fremtidige størrelse og sammensætning for hver af de næste 50 år. Disse tal bruges af staten, regionerne og kommunerne, og har stor betydning i forbindelse med at kunne langtidsplanlægge behovet for skoler, sygehusvæsenet, plejehjem og hvorvidt det er nødvendigt af afskaffe efterlønnen. Da tallene kan have en indflydelse på lokal- og nationalpolitik er det vigtigt, at de er så præcise som muligt, men Danmarks Statistik giver ikke nogen opgørelse af nøjagtigheden af deres prognoser. Heldigvis kan man selv sammenligne de gamle fremskrivninger med den faktiske udvikling, hvis man graver de historiske data frem.


Dronningens nytårstaler

‘Sentiment analysis’ og ‘text mining’ dukker op flere og flere steder og tanken bag er besnærende: få en computer til at løbe tekster igennem (politikernes tweets, litterære værker, anmeldelser af produkter på Amazon, osv.), udled indholdet og hvad forfatteren virkelig mener ud fra teksten. Vi giver os i kast med simpel tekstanalyse af noget, der er så dansk som rødgrød med fløde: dronningens nytårstaler.


Jeg drømmer om en 'vid' jul

Mange danskere har stiftet bekendskab med statistik gennem deres uddannelse, og de fleste giver udtryk for, at det var svært og abstrakt. Politikerne har svært ved det, journalister og meningsdannere har svært ved det, og mange studerende har svært ved det.

Derfor er det interessant, når forfattere forsøger at give en populærvidenskabelig forklaring på, hvad statistik er og kan, hvad statistikerne egentlig laver, og hvorfor faget er interessant og spændende. Det er ikke nogen let opgave at formidle, men måske lykkes det for en af forfatterne at finde vej under en masse juletræer, så vi kan få en ‘vid’ jul.


En moderne græsk tragedie om statistikeren, der gjorde sit job

En græsk tragedie ender sørgeligt og har til formål, at give publikum stof til eftertanke, mens de med medlidenhed følger hovedpersonen gå gennem svære prøvelser og valg. De gamle klassiske værker har de fleste været udsat for i gymnasiet, men den nyeste græske tragedie er mere ukendt. Handlingen kan dog opsummeres kort: “Grækenland sminkede i årevis statistikkerne fra deres statistiske bureau, og den eneste person, der efterfølgende er anklaget og dømt, er ham, der rettede op på det”.


Selvfølgelig hedder det et test

Statistikere siger et test (altså test i intetkøn), når de taler om et statistisk test, men for personer uden for miljøet skurrer dette noget i ørerne, fordi man i dansk tale og ifølge dansk retskrivning udelukkende bruger begrebet en test (i fælleskøn). For statistikere er sprogbrugen dog klar - hvis man laver en test, så er det fordi man er til eksamen, får foretaget en dna-test, laver et forsøg eller tilsvarende, men det er ikke et statistisk test man laver. Hvorfor er det sådan?


Giv dit barn en god start: bliv gravid i maj

Alle kan komme på landsholdet, hvis de bare har de rette evner. Det skulle man i det mindste tro var rigtigt, men flere undersøgelser har indikeret, at det måske ikke gælder. I mange sportsgrene - blandt andet fodbold, amerikansk fodbold og ishockey - er der blandt de professionelle spillere en overrepræsentation af sportsudøvere, der er født i årets første måneder, og færre, der er født i årets sidste måneder. Dette fænomen - på engelsk kaldet “Birthday bulge” - er undersøgt i mange andre lande, og her ser vi på, om fænomenet også optræder i Danmark.


Hænger antallet af Nicolas Cage film sammen med drukning?

At antallet af personer, som drukner i en pool, hænger sammen med antallet af film, som Nicolas Cage medvirker i – og andre absurde sammenhænge – finder man på siden Spurious correlations. Men er der overhovedet tale om en sammenhæng, eller er der tale om et sammenfald, som gør sig ud for at være en sammenhæng? Og er det overhovedet vigtigt?


Datapræsentation og 'den store tabel 1'

Ved formidling af forskningsresultater er det kutyme at give en præsentation af karakteristika for den undersøgte studiepopulation. Præsentationen samles ofte i artiklens første tabel, men på trods af, at denne type præsentation er allestedsnærværende i videnskabelige artikler, er der ofte nogen usikkerhed om, hvad den “store tabel 1” skal indeholde.


Statistik i gymnasiet

I forbindelse med den kommende gymnasiereform skal der skrives nye læreplaner for blandt andet matematik, og det betyder også, at det eksisterende statistikpensum i gymnasiet og undervisningen i statistik skal diskuteres. Her giver vi vores bud på, hvad man bør lægge vægt på i forbindelse med undervisningen i og brugen af statistik i gymnasiet, og forhåbentlig kan det fungere som input til eventuelle ændringer i de kommende læreplaner.


Hvorfor individuel procentvis ændring er skidt

I medicinske forsøg beskæftiger man sig ofte med sammenligninger af før- og efter-data for forskellige typer behandlinger, og det er her interessant at sammenligne de gennemsnitlige ændring over tid på tværs af behandlingerne. Ændringer over tid kan både være absolutte (differencer) og relative (procentvise ændringer). Vi illustrerer her, hvorfor det er en dårlig idé at basere sådanne sammenligninger på gennemsnitlige relative forskelle.


Hvem vinder EM 2016?

EM 2016 står for døren, hvilket betyder, at en stor del at juni måneds tv-flade vil blive fyldt af fodboldkampe, optaktsudsendelser til fodboldkampe, og studiedebatter efter hver kamp, hvor fodboldkommentatorer øser af deres lommefilosofiske betragtninger. Personligt er jeg ikke super interesseret i fodbold - og slet ikke, når Danmark ikke spiller med. Alligevel kan det være sjovt at regne på, hvem der vinder slutrunden, så her er mit “bud” på, hvem der bliver de nye europamestre.


Kan det virkelig passe?

Forskningsresultater i mainstream-medier er næsten altid noget med iøjenfaldende overskrifter - specielt hvis resultaterne omhandler forskelle mellem mænd og kvinder, sundhed og helbred, eller sex. Det er positivt, når forskningsresultater vinder konkurrencen om pladsen i mediebilledet over historier om dræbersnegle, royale rober, eller hvorfor man bør tænke sig om en ekstra gang inden man sender penge til en nigeriansk prins, men alligevel sidder jeg ofte tilbage med en lidt blandet følelse, når medierne præsenterer nogle forskningsresultater, der virker lidt for fantastiske. Først tænker man “det lyder spændende”, og umiddelbart efter “kan det virkelig passe?” Ofte er svaret nej.


Polemikken om p-værdier

Nyhedsbreve og sociale medier gik i selvsving efter the American Statistical Association (ASA) i marts 2016 udsendte en pressemeddelelse omkring brugen og ikke mindst fortolkningen af p-værdier. Pressemeddelelsen var ansporet af en videnskabelig (og til tider ret filosofisk) debat om p-værdier, der var blusset op igen efter editors for Basic and Applied Social Psychology i 2015 offentliggjorde, at de ikke længere ville acceptere artikler, der gjorde brug af p-værdier. Hvordan er vi så endt der, at verdens største statistikersammenslutning føler anledning til at understrege, hvad begreberne betyder og ikke betyder her mere end 100 år siden disse begreber blev introduceret?


Hvorfor $R^2$ ikke er så nyttig

\(R^2\) eller ‘forklaringsgraden’ (engelsk: coefficient of determination) bliver ofte nævnt som et mål for, hvor godt en regressionsmodel passer til data. Der er dog mange problemer med \(R^2\), som gør, at \(R^2\) ikke er så anvendelig som man skulle tro: \(R^2\) siger ikke noget om, hvor godt modellen passer til data, det siger \(R^2\) ikke noget om, hvor god modellen er til at prædiktere, \(R^2\) kan ikke sammenlignes på tværs af datasæt, og det giver heller ikke mening at sammenligne \(R^2\)-værdier, når man transformerer sine data. Ingen af disse problemer bliver løst ved at bruge justeret \(R^2\), og her illustrerer vi, hvorfor \(R^2\) ikke bør bruges, og hvilke andre metoder man i stedet kan bruge for at belyse specifikke egenskaber ved sin model.


Post-hoc powerberegninger

Forespørgsler på post-hoc powerberegninger dukker op fra tid til anden fra samarbejdspartnere, reviewers og editors - specielt hvis den statistiske analyse viser sig at være ikke-signifikant. Argumentet for at lave post-hoc powerberegninger er, at de kan bruges til at forklare, hvorfor en statistisk analyse viste sig ikke at give et signifikant resultat: Årsagen til et ikke-signifikant resultat kan enten skyldes at den reelle effektstørelse er lille (for eksempel hvis der er meget lille forskel mellem to grupper) eller at der er en forskel, men at styrken bare har været for lav til at man fandt forskellen. Problemet er bare, at argumentet er helt fejlagtigt, for post-hoc powerberegninger bidrager ikke med nogen form for ekstra information.


Dikotomisering - sjældent en god ide

Dikotomisering af variable er populært og særdeles udbredt indenfor nogle fagområder. Ved dikotomisering inddeles en variabel i 2 grupper, og påstanden er, at dikotomisering simplificerer de statistiske analyser, gør fortolkningen af resultaterne lettere, og generelt stemmer bedre overens med de medicinske/biologiske situationer, som forskerne beskæftiger sig med i dagligdagen. Fra et statistisk synspunkt skal man helst undgå at dikotomisere kontinuerte variable, for dikotomisering resulterer i tab af styrke (power), øget risiko for falske positiver (type I fejl), og dårligere evne til at beskrive den reelle biologiske effekt.


Danskernes fødselsmønstre

“I de gode gamle dage havde danskerne ikke andet at lave om vinteren end at putte sig under dynerne med det resultat, at der blev født flest børn hen på sensommeren. Og sådan er det stadigvæk”. Det er i hvert fald en kommentar, som man ind imellem hører, men kan det nu også passe?


Reproducerbare kæpheste

I mange anvendte videnskabelige artikler lever statistikafsnittet en lidt kummerlig tilværelse, hvor man får fornemmer, at både forfattere - og til tider også editors - ser det som et “nødvendigt onde”. Det er fuldt forståeligt, at forfatternes primære interese er i at præsentere de nye fund indenfor deres pågældende fagområde, og at de statistiske metoder derfor må have en tilbagetrukket rolle i den historie. Men det er altså ikke ensbetydende med at statistikmetodeafsnittet helst skal fylde så lidt som muligt, så artiklen netop kan gå igennem reviewernes og editors nåleøje og blive accepteret til publikation.