Direct naar artikelinhoud
AchtergrondStatistiek

Waarom we de strenge regels voor kerst niet begrijpen: we kennen te weinig van statistiek

Waarom we de strenge regels voor kerst niet begrijpen: we kennen te weinig van statistiek
Beeld Sven Franzen

Verteert u de dagelijkse curves en gemiddeldes ook zo slecht? De pandemie drukt ons met de neus op de cijfers: we bakken weinig van statistiek. ‘Wat meer voeling met cijfers had ons heel wat leed bespaard. Ook onder politici.’

Stel: we leven in een wereld waar spaarboekjes wél iets opbrengen. U begint op de eerste dag van december met één luttele euro en dat bedrag verdubbelt elke dag. Hoeveel hebt u dan de laatste dag van de maand bij elkaar gespaard?

Laat het even bezinken, zeg uw antwoord luidop, en kijk of u het beter doet dan de mensen die recent hetzelfde vraagstuk voorgeschoteld kregen door de Nederlandse NOS. Ergens tussen de 200 en de 2.000 euro, lijkt de consensus op straat bij onze noorderburen, maar het antwoord dat het dichtst in de buurt komt, is: ‘Veel.’ Na één maand bent u namelijk miljardair, luidt de intro van het drukbekeken filmpje.

Om de exponentiële groei van het coronavirus tastbaar te maken zijn de voorbije maanden heel wat van die klassieke voorbeelden gebruikt. Er is de waterlelie in de vijver of het beroemde wiskundige ‘graankorrelvraagstuk’, waarbij een Indische koning zich bij een deal nogal verkijkt op de ene kleine graankorrel die op elk vakje van een schaakbord verdubbelt.

En toch. Terwijl virologen, epidemiologen of biostatistici – getraind in het benaderen van statistieken – een rem zetten op onze kerstdromen, roepen heel wat mensen al luidop ‘ho, ho, ho’ bij het zien van een steil dalende curvende. Die daling verloopt natuurlijk ook exponentieel, maar bij te losse teugels kan de situatie zo weer omslaan.

We lijken soms wel de reïncarnatie van de Indische koning. Alleen: vervang de ene graankorrel door een aantal besmette vakantiegangers die terugkeren uit een skigebied in Italië, en u herinnert zich vast nog wel hoe snel het kan gaan.

Lineair denken

Eerder dan de curve lijkt vooral ons brein een beetje platgeslagen door alle statistieken die ons overspoelen. Elke dag is er wel een nieuw bericht over het reproductiegetal, de ‘cumulatieve incidentie over zeven dagen’ of de beschermingsgraad van een beloftevol vaccin. Het staat in schril contrast met onze relatie met de statistiek. Veel liefde is er niet voor het vakgebied, dat aan de unief de reputatie van buisvak geniet. Zelfs ‘verstandshuwelijk’ lijkt geen gepaste term.

“Dat iets er wiskundig uitziet, is voor bepaalde mensen helaas al genoeg om zich te laten afschrikken”, lacht wiskundig filosoof Jean-Paul Van Bendegem. Dat we ons blijven verkijken op een wiskundig gegeven zoals een exponentiële groeicurve, heeft volgens hem echter nog een andere verklaring: “Ons brein is nu eenmaal sterk geneigd om lineair te denken. Het laat ons toe om heel snel en met heel weinig info tot een conclusie te komen.”

Wetenschapsfilosoof Maarten Boudry. 'Dat een besmettingscurve zo onverwacht door het dak kan gaan, kunnen we moeilijk vatten.'Beeld Wouter Van Vooren

Dat komt deels omdat we in het dagelijkse leven vooral in aanraking komen met lineaire processen. Uw baby groeit niet exponentieel, elke maand krijgt u een bepaald loon binnen, en als u na één avond breien tien centimeter bent gevorderd, weet u dat die kersttrui tegen zondag is afgewerkt. “Als er dan toch exponentiële groei aanwezig is, gaat het vaak traag. Zoals de interest op een spaarrekening”, zegt wetenschapsfilosoof Maarten Boudry (UGent). “Dat een besmettingscurve zo onverwacht door het dak kan gaan, kunnen we daardoor moeilijk vatten.”

Het domein van de statistiek is wellicht de belichaming van onze cijferaversie. Die reputatie heeft het volgens Boudry vooral omdat “andere vormen van wiskunde geen rol spelen in het hoger onderwijs als je er niet voor kiest.” Wel zo voor statistiek dus, dat ook voor psychologen, sociologen of geneeskundestudenten verplicht materiaal is. 

Biostatisticus Geert Molenberghs (UHasselt), die zowel masters in de statistiek als geneeskundestudenten voor zich krijgt, voelt naar eigen zeggen meteen het verschil in een aula. “Laat ons zeggen dat je bij de geneeskundestudenten iets harder moet werken om de aandacht erbij te houden.”

Superverspreiders

Waarvoor dient al die statistiek eigenlijk? “Het leert ons denken in termen van populaties, en niet in termen van individuen”, zegt Jean-Paul Van Bendegem. Handig in tijden van bubbels. Helaas is die denkoefening voor veel mensen lastig. Een extreem voorbeeld is de berg aan statistisch bewijs die aantoont dat roken kankerverwekkend is, maar er is ook ‘de bompa die twee pakskes per dag rookt, maar toch tachtig jaar is geworden’.

“Evolutionair gezien zijn we eigenlijk niet getraind in die statistische denkprocessen, zeker niet als het gaat over grote getallen”, aldus Van Bendegem. “In een bedreigende situatie zien we het individu dat voor ons staat, niet de populatie waar die toe behoort. Wie oog in oog staat met een leeuw, zou kunnen beginnen redeneren dat er misschien ook heel vriendelijke leeuwen bestaan. Dat doe je natuurlijk niet. Het enige wat je denkt, is: lopen!”

'Statistiek leert ons denken in termen van populaties, en niet in termen van individuen', zegt wiskundig filosoof Jean-Paul Van Bendegem.Beeld Thomas Sweertvaegher

Samengevat: ons brein maakt graag shortcuts, en nestelt zich liever bij een stereotype dan te gaan spitten in het grotere verhaal achter de cijfers. Dat verhaal kan nochtans erg belangrijk zijn. Nemen we even het reproductiegetal erbij. Als dat 2 bedraagt, zou je kunnen besluiten dat elke besmette persoon verantwoordelijk is voor twee nieuwe besmettingen. Simpel, toch?

Alleen gaat dat om een gemiddelde. In realiteit lopen de cijfers sterk uiteen: aan het ene uiteinde van de groep besmette mensen zit een meerderheid die niemand aansteekt, aan het andere uiteinde een aantal superverspreiders. Vergelijk het met een straat waarin iedereen 1.000 euro per maand verdient. Als Bill Gates plots zijn intrek neemt in die straat, gaat het gemiddelde inkomen er plotseling als een raket de lucht in, maar de realiteit voor de andere mensen is dat ze nog steeds 1.000 euro verdienen.

Bubbel van vijftien

Dat statistische verhaal zou kunnen wegen op het beleid: zorg voor een goede bronopsporing. Molenberghs hoeft er echter niet lang over te twijfelen. “Wat meer voeling met cijfers had ons tijdens deze crisis heel wat leed bespaard. Ook onder politici. De bubbel van vijftien is daar wellicht het meest treffende voorbeeld van.” Vanuit statistisch oogpunt staat het toelaten van zo’n grote bubbel – en zoveel verschillende netwerkjes tussen mensen – namelijk gelijk aan zeggen: doe maar allemaal jullie goesting. Alleen sijpelt die informatie niet altijd door aan de onderhandelingstafel.

Voor Maggie De Block (ex-minister, Open Vld) zijn er op dat vlak weinig bloemen weggelegd. Boudry: “Als arts heeft ze wellicht feeling met particuliere gevallen, maar ze heeft niet de mentale inspanning geleverd om naar de modellen te kijken.”

Conner-effect

Ook op nieuwsredacties ontbreekt het vaak aan statistische kennis. Er zijn de voorbije maanden heel wat appelen met peren vergeleken, denk maar aan de vele ranglijsten rond de besmettingscijfers. “Mag je wel cijfers vergelijken tussen pakweg België en Denemarken, als ze niet op dezelfde manier tot stand komen?”, vraagt Van Bendegem. “Dat zegt bitter weinig.”

Eerlijk is eerlijk: wanneer Molenberghs tijdens het gesprek dieper in de “wetenschappelijke paradigma’s” van de statistiek duikt, durven onze gedachten ook weleens de andere kant op te zweven. Statistiek kan nu eenmaal best ingewikkeld zijn. “En in tegenstelling tot de meer intuïtieve verwerving van taal, vergt het best veel moeite”, zegt Boudry.

Het vraagt niet alleen moeite om dieper in de cijfers te duiken, maar ook om de onzekerheid die vaak schuilgaat achter die cijfers te benoemen. Heel wat statistiek valt namelijk te herleiden tot verwachtingen en kansen. “Wie op het weerbericht te horen krijgt dat er morgen 20 procent kans is op regen, weet daar eigenlijk niet zoveel mee. Het kan beide kanten uit”, zegt Van Bendegem. Wie die dag echter gaat fietsen zonder regenvestje, zit wellicht met een oncomfortabel gevoel op het zadel.

Het is die onzekerheid waar media mee lijken te worstelen. Na de laatste peiling van Het Laatste Nieuws en VTM werd afgelopen juni stevig gekopt op het Conner-effect omdat de sp.a er een dikke twee procent op ‘vooruit’ ging. Dat de foutenmarge groter is dan die groei, was slechts een kleine kanttekening. Statistisch gezien blijft er een kans dat sp.a het helemaal niet beter doet.

Onzekerheid wordt dan ook weleens als een zwaktebod bekeken, zegt Van Bendegem. “Bij een vaccin dat werkzaam is bij 95 procent van de mensen, kan je zeggen: ‘Je zal maar terechtkomen in de 5 procent.’ Terwijl die mate van bescherming eigenlijk erg hoog is.” Een voldoende hoge vaccinatiegraad zorgt bovendien op zijn beurt voor de nodige groepsimmuniteit, wat die ‘resterende vijf procent’ eveneens bescherming biedt. Dat is denken in termen van populaties.

Complotdenkers

Er is echter hoop, zegt Molenberghs. “Waar ik in het voorjaar nog de term ‘incidentie’ moest uitleggen aan journalisten, vragen diezelfde mensen mij nu: gaat het over de 7-daagse of de 14-daagse incidentie?” Biostatistiek wint blijkbaar zelfs aan populariteit onder studenten, met dank aan de luidspreker van de voorbije maanden: “De instroom steeg dit jaar met ongeveer 50 procent.”

Filip Moons van de vereniging voor wiskundeleraren. 'Als burger wordt het namelijk steeds belangrijker dat je de groeiende stroom aan data kritisch leert te benaderen.'Beeld rv

Ook in de eindtermen voor het middelbaar, die nog steeds afgeklopt moeten worden, zal statistiek meer gewicht krijgen. “Voor het eerst is statistiek verankerd voor iedereen, ook voor beroepsleerlingen”, zegt Filip Moons van de vereniging voor wiskundeleraren (VVWL). “Als burger wordt het namelijk steeds belangrijker dat je de groeiende stroom aan data kritisch leert te benaderen.”

“Iedereen zou eigenlijk een misleidende grafiek moeten kunnen herkennen”, zegt Moons. Dergelijke desinformatie is onder antivaxxers of 5G-complotdenkers vaste kost. Denk aan grafieken die een oorzakelijk verband leggen tussen de locatie van 5G-masten en een hoog aantal besmettingen. “Terwijl 5G-masten natuurlijk gewoon op drukbevolkte plaatsen staan, waar het virus van nature meer circuleert”, aldus Moons. “Het een heeft verder niets met het andere te maken.”

Hilarische grafiek

Correlatie, geen causaliteit dus. Zo bestaat er eveneens een vrij hilarische grafiek die aantoont: hoe meer films met Nicolas Cage in een bepaald kalenderjaar, hoe meer mensen er datzelfde jaar verdronken in een zwembad. Het toont vooral aan dat je met statistieken kan goochelen naar eigen believen.

Het verkrijgen van statistische inzichten, levert echter waardevolle inzichten op. Van Bendegem: “Op een lezing tonen mensen zich altijd erg verbaasd over het functioneren van de lotto. ‘De kans dat jullie overlijden op de weg naar huis, is groter dan op het winnen van de jackpot.’ Maar daar durven ze geen weddenschap over af te sluiten.”

Al blijft ook Van Bendegem positief over ons huwelijk met de statistiek. “Vergeet niet dat statistiek eigenlijk een piepjong vakgebied is, met een Belg (Adolphe Quetelet, MIM) die er in het begin van de 18de eeuw aan de grondslag van lag”, zegt hij. “Tegelijk zorgt het er nu al voor dat eeuwenlang vastgeroeste ideeën onder druk komen te staan. Zoals het feit dat vrouwen minder goed zouden zijn in wiskunde.” Voor dit stuk dacht ondergetekendes brein er blijkbaar niet aan om een vrouw te bellen.