Cum hoc ergo propter hoc.

Over hoe je wel en niet conclusies mag trekken uit statistische uitkomsten van een onderzoek.

Cum hoc ergo propter hoc betekent - letterlijk vertaald - "met dit, dus vanwege dit". Deze uitspraak verwijst naar het incorrect interpreteren van correlaties: omdat er een samenhang is, denkt men aan een oorzaak - gevolg. 

 

Bekend is de verkeerde conclusie die men zou kunnen trekken op basis van een correlatie tussen ijs-consumptie en verdrinkingdood: de consumptie van ijsjes op het strand zou leiden tot meer verdrinking. Dat er een andere oorzaak is voor beide verschijnselen, namelijk de temperatuur van de dag (hoe warmer, hoe meer strandbezoek, waar mensen ijsjes eten èn in de zee zwemmen), zou je zomaar over het hoofd kunnen zien....

 


Er zijn tal van voorbeelden waarin er sprake is van het verkeerd toekennen van causaliteit (oorzaak en gevolg). Ik kom deze interpretatiefout helaas regelmatig tegen: in de media, in rapporten van collega-onderzoekers en zelfs in publicaties van universiteiten.

 

Een goed voorbeeld van verkeerde interpretatie van correlaties vind ik ook altijd de "hype-diëten": diëten waarbij geadviseerd wordt om veel van een bepaald product te eten of bijvoorbeeld bepaalde voedingsmiddelen niet te combineren. De reden dat mensen die dergelijke diëten volgen afvallen, wordt waarschijnlijk veroorzaakt doordat zij - bewust of onbewust - toch meer letten op wat zij dagelijks eten en daardoor minder calorieën consumeren dan tevoren. 

 

Er is overigens een geweldige website die een aantal van deze bizarre correlaties op een rijtje heeft gezet, de link vindt u onderaan dit artikel. 

 

Hoe stel je causaliteit vast?


Bij statistisch significante correlaties is het niet mogelijk om te bewijzen waaròm bepaalde factoren samenhangen. Alleen op basis van gezond verstand kun je redeneren dat het één (regen) het ander (aantal paraplu's op straat) veroorzaakt. 

Daarom stel ik in mijn rapporten bijvoorbeeld nóóit dat een lagere klanttevredenheid veroorzaakt is door het nieuwe beleid. Wel kun je concluderen dat de tevredenheid sinds het nieuwe beleid gedaald is. Voor een lezer misschien een klein verschil, maar voor mij als onderzoeker doet dat verschil ertoe.... Soms is er immers geen oorzakelijk verband tussen de twee factoren maar zou de oorzaak ergens anders kunnen liggen. Misschien is die lagere tevredenheid wel ontstaan omdat men in de tussentijd ervaring heeft opgedaan met een andere organisatie die veel betere service biedt. Misschien zijn er veel negatieve berichten geweest over dat nieuwe beleid, waardoor men kritischer geworden is. Of men heeft weerstand tegen veranderingen... 


Experimenteel of longitudinaal onderzoek.

Om echt een oorzaak en een gevolg vast te stellen, is het nodig om langdurig onderzoek uit te voeren (longitudinaal onderzoek) waarbij je bij voorkeur zelf de omstandigheden controleert. 

Dan zou je bijvoorbeeld drie jaar lang twee gelijke groepen mensen op twee identieke stranden met identieke weersomstandigheden moeten laten bezoeken, eentje met ijsjes en eentje zonder. En dan vervolgens drie jaar later tellen: hoeveel mensen zijn er in de afgelopen drie jaar verdronken? 

 

U voelt het al: helaas zijn dergelijke onderzoeken niet altijd even uitvoerbaar. Om die reden is het geen verkeerd idee om terug te grijpen naar sociaal wetenschappelijke theorieën ter verklaring van bepaalde verschijnselen. Daarnaast hebben we natuurlijk ons gezonde verstand. Wanneer mensen die een bepaalde reclame-uiting wél gezien hebben, zich anders gedragen dan mensen die die uiting niet gezien hebben, zou je mogen concluderen dat de reclame de oorzaak is. Toch is het goed om ook in zo'n geval open te staan voor een alternatieve verklaring: misschien hebben de mensen die zich de reclame herinneren, wel meer interesse in het onderwerp? In zó'n geval is het goed dit om al bij de ontwikkeling van een vragenlijst te voorzien en deze vraag op tijd te stellen!