Hoofdstuk 7 Causaliteit

In dit hoofdstuk wordt besproken:
  • De definitie van causaliteit
  • Correlatie impliceert geen causatie
  • Het pure experiment
  • Causaliteit plus: moderatie en mediatie
  • Als een experiment onmogelijk is
Deze stof wordt behandeld in de volgende Open Universiteitscursus(sen):
  • Onderzoekspractium cross-sectioneel onderzoek (PB0812)
  • Onderzoekspractium experimenteel onderzoek (PB0412)

7.1 De definitie van causaliteit

Causaliteit is de naam voor het verband tussen een oorzaak (ook wel “causaal antecedent”) en een gevolg (ook wel “causaal consequent”). In de praktijk wordt er concreet het volgende mee bedoeld:

  • De oorzaak gaat in de tijd vooraf aan het gevolg;
  • De oorzaak hangt samen met het gevolg;
  • De samenhang tussen de oorzaak en het gevolg kan niet worden verklaard door iets anders

Begrip van causaliteit is waardevol omdat dat begrip het mogelijk maakt de wereld om ons heen te veranderen. Een simpel voorbeeld is het causale verband tussen het opeten van een appel en een verminderd hongergevoel. Een complexer voorbeeld is het causale verband tussen vaccinatie en de kans op besmetting met een virus.

Omdat causaliteit zo waardevol is, wordt het binnen onderzoek vaak gezien als een soort heilige graal. Veel psychologische theorieën beschrijven bijvoorbeeld hoe een psychologisch proces leidt tot een ander psychologisch proces, of welke psychologische constructen een causale rol spelen bij het veroorzaken van gedrag.

Tegelijkertijd geldt voor kennis over causaliteit, net als voor veel andere waardevolle zaken, dat die niet makkelijk te verkrijgen is. Dat komt door de voorwaarden waaraan moet worden voldaan voordat van causaliteit gesproken kan worden.

7.2 Correlatie impliceert geen causatie

Een eerste complicatie heeft zelfs een eigen slogan: “correlatie is geen causatie” of “correlatie impliceert geen causatie”. Correlatie wordt hier gebruikt als synoniem voor “verband”, maar het is ook een statistische grootheid: zie hoofdstuk Correlaties.

De tweede versie van deze slogan is het meest bruikbaar, omdat hij expliciet maakt dat als twee dingen samenhangen, dat meestal niet causaal is, oftewel, dat het meestal niet is omdat de een de ander veroorzaakt. Sterker nog, maar een fractie van alle verbanden is causaal. Als twee dingen samenhangen, dan hebben ze vaak niets met elkaar te maken; heel soms worden ze beiden veroorzaakt door een derde variabele, of meestal zelfs een hele set andere variabelen; en maar heel zelden is de ene variabele echt de veroorzaker van de andere variabele. Als je een verband ziet, weet je dus al bijna zeker dat het niet causaal is, en je zou dus ook kunnen zeggen: “correlatie impliceert dat er geen causaliteit is”.

Als je dus een studie doet waarin je allerlei mensen een vragenlijst geeft waarin je een aantal psychologische constructen meet (zie hoofdstuk Constructen Meten), en je berekent vervolgens verbanden tussen de variabelen in je dataset die als het goed is informatief zijn over die constructen, dan weet je twee dingen bijna zeker:

  1. Je gaat tussen alle constructen verbanden vinden (zie ook Orben & Lakens, 2020);
  2. Geen van die verbanden is causaal.

Dat is jammer, want dergelijk onderzoek (ook wel cross-sectioneel, observationeel onderzoek genoemd; zie hoofdstuk Ontwerpen) is relatief goedkoop en eenvoudig uit te voeren. Dat de verbanden die in zulk onderzoek worden gevonden meestal niet indicatief zijn voor causale verbanden betekent dat vaak een andere studie-opzet nodig is: het pure experiment.

7.3 Het pure experiment

Het pure experiment (hierna: “experiment”) is een studie-ontwerp dat uitspraken over causaliteit mogelijk maakt. Bij een experiment worden er twee of meer “behandelingen” geselecteerd of geproduceerd, waarbij die behandelingen uitsluitend verschillen met betrekking tot de (vermeende) oorzaak. De variabele die die behandelingen onderscheidt wordt vaak de onafhankelijke variabele genoemd. De ene behandeling kan bijvoorbeeld de procedure zijn om een psychologisch construct te manipuleren, terwijl de andere behandeling de corresponderende controle-procedure is (zie hoofdstuk Manipulaties).

Vervolgens krijgen de onderzoekseenheden (in psychologisch onderzoek zijn dit vaak deelnemers) willekeurig een behandeling toegewezen. Die willekeur is cruciaal: die voorkomt dat er iets samenhangt met die toewijzing. Tot slot, nadat de behandeling is toegepast, wordt het (vermeende) gevolg gemeten. Die variabele wordt vaak de afhankelijke variabele genoemd.

Zoals aangegeven is de willekeur in toewijzing van de behandeling cruciaal. Alleen als die behandelingen puur door toeval worden toegewezen, en als de behandelingen echt alleen verschillen met betrekking tot het vermeende causale antecedent, is het mogelijk om, als er een verband wordt vastgesteld tussen de onafhankelijke variabele en de afhankelijke variabele, af te leiden dat de onafhankelijke variabele de afhankelijke variabele veroorzaakt. Die willekeurige toewijzing heet randomisatie.

Vaak gebeurt dit met computerprogramma’s die algoritmen gebruiken die willekeurige patronen zo goed nabootsen, dat ze in bijna alle gevallen volstaan. Als echt willekeurige data nodig zijn kan gebruik worden gemaakt van bijvoorbeeld https://random.org. De kwaliteit van de randomisatie is een van de factoren die de interne validiteit van een experimenteel ontwerp bepaalt (zie hoofdstuk Validiteit van Ontwerpen).

7.3.1 Randomisatie

Hoewel randomisatie in principe het willekeurig toewijzen van behandelingen betreft, wordt het in de praktijk vaak besproken in termen van het willekeurig toewijzen van deelnemers aan groepen (die dan vaak condities worden genoemd).

Het gegeven dat randomisatie garandeert dat niets samenhangt met de toewijzing van de behandelingen, of met de toewijzing van deelnemers, manifesteert zich dan als groepen die niet systematisch verschillen. Het is belangrijk om te beseffen dat dit een eigenschap is van het proces van randomisatie, maar niet van elke individuele toepassing van het proces.

Als je oneindig vaak 1000 mensen neemt en in willekeurig in twee groepen indeelt, dan weet je zeker dat die randomisatie garandeert dat gemiddeld over al die oneindige exercities beide groepen 500 mensen bevatten; en dat de mensen in elk groep exact even oud zijn; dat hetzelfde percentage zal identificeren als vrouw; en dat de IQ-scores in beide groepen exact gelijk zijn. Dit moet wel, want de toewijzing van mensen in groepen was volledig willekeurig.

Echter, in een bepaalde studie waarin je randomisatie toepast, doe je dat eenmalig en niet oneindig vaak. Dus als je van die oneindig exercities er eentje pakt, dan kan het best zijn dat in die ene exercitie je 513 mensen aan de ene groep toewees en 487 mensen aan de andere groep. Het is ook prima mogelijk dat in de ene groep toevallig drie zeer oude mensen zijn ingedeeld, waardoor de gemiddelde leeftijd daar iets hoger is.

Dit kun je zelf ook uitproberen. Als je zes keer met een dobbelsteen gooit, is de kans dat die toevallig precies een keer op elke zijde belandt relatief klein; maar als je vaker gooit en uitrekent in welk percentage van de gevallen de dobbelsteen op elke zijde belandt, zul je zien dat dat precies even vaak is. De uitkomsten van een toevalsproces worden steeds betrouwbaarder naarmate er meer herhalingen zijn, en zijn onbetrouwbaar bij weinig herhalingen.

Dit mechanisme is ook van kracht bij een experiment. Randomisatie garandeert dat gemiddeld genomen, over oneindig veel herhalingen, de groepen waarin je deelnemers indeelt equivalent zijn. Dat betekent echter niet dat de groepen in één enkel experiment ook gelijk zijn. In één experiment kan het best zijn dat de ene groep bijvoorbeeld toevallig een hoger IQ heeft, of meer uithoudingsvermogen heeft, of ouder is, of toevallig chagrijnig is.

In zo’n geval kan een verschil tussen groepen op de afhankelijke variabele komen door die randomisatie. Over meerdere studies verdwijnt zo’n effect noodzakelijkerwijs. Dit is een van de redenen waarom resultaten uit een enkele studie nooit als definitief moeten worden beschouwd.

7.4 Causaliteit plus: moderatie en mediatie

Als er eenmaal in meerdere experimentele studies data zijn verzameld waaruit geconcludeerd kan worden dat een gegeven causaal verband bestaat, kan dat verband meer in detail worden bestudeerd. Er zijn twee van zulke variaties waar onderzoekers in geïnteresseerd zijn: moderatie en mediatie.

Moderatie en mediatie gaan niet over of een gegeven causaal verband bestaat: die aanname is, op basis van eerder onderzoek, immers het uitganspunt van de studie. Onderzoeksvragen over moderatie en mediatie betreffen altijd nuancering van het oorspronkelijke causale verband. Daarom zijn onderzoeksvragen over moderatie en mediatie nóg zwaardere onderzoeksvragen dan onderzoeksvragen over causaliteit. Je leert er nog meer van, maar je moet dus ook een nog zwaardere prijs betalen om die kennis te verwerven: je hebt altijd een factorieel experiment nodig.

7.4.1 Moderatie en causaliteit

Moderatie betekent dat een verband wordt veranderd door iets anders. Een voorbeeld hiervan is angstaanjagende communicatie. Dit is een gedragsveranderingsmethode waarbij het doel is om de risicoperceptie van mensen te verhogen door ze bedreigende stimuli te presenteren over een bepaald gevolg van het doelgedrag (Hoog et al., 2007; Kok et al., 2018; Peters et al., 2013; Witte, 1992). Het onderliggende causale model is dat er een causaal effect is van de presentatie van die stimulus op het psychologische construct risicoperceptie (en dat er een causaal verband is tussen risicoperceptie en gedrag).

Het blijkt echter dat dat causale verband uitsluitend bestaat als mensen al overtuigd zijn dat ze succesvol dat doelgedrag kunnen uitvoeren. Dat moet in hun beleving dus gedrag zijn waar ze goed in zijn, of wat in elk geval voldoende makkelijk is dat ze het goed kunnen uitvoeren. Als mensen hier geen vertrouwen in hebben, is het causale verband tussen de presentatie van de stimulus en risicoperceptie afwezig.

Dit is een vorm van moderatie: of mensen een hoge zogenaamde eigen-effectiviteit hebben (met andere woorden: als ze er vertrouwen in hebben dat ze het doelgedrag succesvol kunnen uitvoeren), bepaalt of het betreffende causale verband er is. Eigen-effectiviteit is in dit voorbeeld de moderator.

Een andere vorm van moderatie is wanneer een causaal verband niet helemaal verdwijnt, maar zwakker of sterker wordt afhankelijk van de moderator. Het kan zelfs dat de moderator zorgt dat de aard van het verband verandert: dat er bijvoorbeeld in afwezigheid van de moderator een positief causaal verband is, maar dat dat een negatief causaal verband wordt als de moderator aanwezig is.

Een onderzoeksvraag naar moderatie betreft een causaal verband waarbij een proces wordt beinvloedt: eigenlijk een verband waarbij de afhankelijke variabele zelf een causaal verband is. Je onderzoekt dus twee causale verbanden tegelijk: het oorspronkelijke causale verband, en het causale verband dat dat oorspronkelijke verband modereert.

Om die reden vereist het beantwoorden van een onderzoeksvraag naar moderatie altijd een factorieel ontwerp (zie hoofdstuk Ontwerpen. Dit betekent dat er twee onafhankelijke variabelen moeten worden gemanipuleerd: zowel de oorspronkelijke onafhankelijke variabele als de moderator. Het antwoord op de onderzoeksvraag wordt dan gezocht in het zogenaamde interactie-effect.

Deze sectie moet nog worden uitgebreid. Dit zal (uiterlijk) gebeuren als de betreffende stof wordt gebruikt in een cursus; dit is waarschijnlijk de volgende revisie van Onderzoekspracticum experimenteel onderzoek.

7.4.1.1 Interactie-effecten

Dat interactie-effect wordt daarom vaak verward met moderatie. Een interactie-effect is het fenomeen als het verband tussen twee variabelen afhangt van de waarde van een andere variabele. Als twee van die variabelen zijn gemanipuleerd in een factorieel ontwerp, is dit hoe moderatie zich manifesteert. Echter, dat patroon kan ook optreden zonder dat er sprake is van moderatie. Interactie wordt dus gebruikt om moderatie te onderzoeken: maar alleen als een studie-ontwerp een factorieel experiment is, kan er uit aan- of afwezigheid van interactie iets worden afgeleid over moderatie.

Moderatie is altijd een uitspraak over causaliteit, terwijl interactie slechts de beschrijving is van een patroon in de data.

7.4.2 Mediatie en causaliteit

Deze sectie moet nog worden geschreven. Dit zal (uiterlijk) gebeuren als de betreffende stof wordt gebruikt in een cursus; dit is waarschijnlijk de volgende revisie van Onderzoekspracticum experimenteel onderzoek.

7.4.3 Combinaties van moderatie en mediatie

Deze sectie moet nog worden geschreven. Dit zal (uiterlijk) gebeuren als de betreffende stof wordt gebruikt in een cursus; dit is waarschijnlijk de volgende revisie van Onderzoekspracticum experimenteel onderzoek.

7.5 Als een experiment onmogelijk is

Als een experiment niet mogelijk is, is het heel moeilijk om een uitspraak te doen over causaliteit. Vaststellen dat roken longkanker veroorzaakt heeft bijvoorbeeld decennia aan onderzoek gekost in veel verschillende velden. Echter, de decennia aan tijd en miljarden aan financiering die dit kost zijn in de praktijk vaak niet beschikbaar.

In zulke situatie blijkt vaak, na grondige analyse, dat een experiment wel degelijk mogelijk is, maar middelen vereist die niet beschikbaar zijn. Het benodigde experiment kan bijvoorbeeld vereisen dat er zeer veel deelnemende scholen of ziekenhuizen worden geworven; dat een dure manipulatie wordt ontwikkeld; dat mensen gedurende lange tijd worden gevolgd; of dat met een grote groep onderzoekers wordt samengewerkt. In zulke situaties is een experiment dus wel mogelijk, maar misschien niet voor de onderzoekers die op dat moment een experiment nodig hebben om hun onderzoeksvraag te beantwoorden. Dit is bijvoorbeeld vaak de situatie waarin studenten zich bevinden als ze een studie ontwerpen voor hun bachelor- of masterthese: onderzoeksvragen over causaliteit zijn immers vaak heel interessant, maar tegelijkertijd zijn zowel de middelen als de beschikbare tijd voor bachelor- en masterthese trajecten vaak te beperkt voor een experiment dat het mogelijk maakt zulke onderzoeksvragen te beantwoorden.

Dan is het vaak beter om af te zien van het onderzoeken van de betreffende onderzoeksvraag. Het is beter om een minder zware onderzoeksvraag te onderzoeken, maar dat te doen met het juiste studie-ontwerp, dan een studie-ontwerp te gebruiken dat niet in staat is om een antwoord op de onderzoeksvraag te geven. Daarmee voorkomen de onderzoekers dat ze in een situatie komen waar ze bijvoorbeeld een verband hebben gevonden in een niet-experimenteel ontwerp, en graag willen concluderen dat dat het waarschijnlijk maakt dat er een causaal verband is, maar dat niet kunnen zonder de Gedragscode Wetenschappelijke Integriteit te schenden.

Overigens zie je soms in artikelen dat mensen toch het verkeerde studie-ontwerp gebruiken (bijvoorbeeld een ontwerp dat observationeel is, of cross-sectioneel, maar in elk geval geen experiment, om onderzoeksvragen te onderzoeken over causaliteit, moderatie, of mediatie) en dit dan benoemen in de “Beperkingen” paragraaf van de discussie-sectie van het artikel of verslag. Dit schendt nog steeds de Gedragscode Wetenschappelijke Integriteit, die stelt dat wetenschappers Zorgvuldig, Onafhankelijk, Verantwoordelijk, Eerlijk, en Transparant dienen te werken. Het is niet zorgvuldig om het verkeerde studie-ontwerp te kiezen, en niet eerlijk om dat fatale probleem te bagatalliseren als slechts een beperking. Dat suggereert ten onrechte dat in die studie geldt dat correlatie wel degelijk causatie impliceert, en dat slechts nog een verificatie met een sterker studie-ontwerp nodig is om echt zekerheid te krijgen. Bovendien suggereert het impliciet dat andere onderzoekers ook kunnen volstaan met een ontoereikend studie-ontwerp.

Het besluit om zo’n onderzoeksvraag met betrekking tot causaliteit, moderatie, of mediatie niet te onderzoeken als geen passend (dus experimenteel) studie-ontwerp gebruikt kan worden, hoeft niet per se een beperking te zijn voor het onderzoek naar die onderzoeksvraag in breder verband. Door die originele onderzoeksvraag over causaliteit iets langer te laten rusten ontstaat er ruimte om eerst de middelen te verwerven die nodig zijn om een studie uit te voeren met een ontwerp dat ook conclusies over de onderzoeksvraag mogelijk maakt.

In sommige gevallen zijn er voldoende zwaarwegende redenen om toch te proberen een onderzoeksvraag over causaliteit te onderzoeken zonder dat een experiment wordt uitgevoerd. De volgende secties geven meer informatie over hoe dit kan worden gedaan.

7.5.1 Observationele longitudinale ontwerpen

Als een experiment niet mogelijk is wordt gebruik gemaakt van een observationeel ontwerp: er worden uitsluitend variabelen geobserveerd, maar er vindt geen randomisatie plaats en er wordt niets gemanipuleerd (als er wel iets wordt gemanipuleerd, maar er is geen randomisatie, is er sprake van een quasi-experiment: zie de betreffende sectie hieronder).

In zulke gevallen verschuift de nadruk vaak naar het bestuderen van de wijze waarop processen zich ontplooien over de tijd. Het meten van een fenomeen gedurende een (soms lange) periode in de tijd geburt in zogenaamde longitudinale studies. In het vakgebied van de epidemiologie, dat zich bezighoudt met het bestuderen van de verspreiding van ziektes, vormen longitudinale studies het belangrijkse onderzoeksmiddel om zo dicht mogelijk bij causale antwoorden te komen. Ook binnen de psychologie zijn longitudinale studies erg belangrijk om zicht te krijgen op psychologische processen en de daarbij onderliggende mogelijke causaliteit.

Net als in de epidemiologie vereist het trekken van conclusies over causaliteit op basis van observationele data een stevige grip op de mogelijke causale invloeden. Een belangrijk hulpmiddel om deze inzichtelijk te maken, waardoor het juiste studie-ontwerp voor de longitudinale studie kan worden gekozen, en het correcte statistische model kan worden geselecteerd, zijn zogenaamde Directed Acyclic Graphs.

Deze sectie moet nog worden uitgebreid. Dit zal (uiterlijk) gebeuren als de betreffende stof wordt gebruikt in een cursus; dit is waarschijnlijk de volgende revisie van Onderzoekspracticum longitudinaal onderzoek.

7.5.2 Directed Acyclic Graphs

Om toch over causaliteit en mogelijke confounding te kunnen redeneren, kunnen soms zogenaamde Directed Acyclic Graphs (DAGs) worden gebruikt. Dit zijn visualisaties van bekende en veronderstelde causale relaties, die kunnen helpen om een studie zo te ontwerpen dat geprobeerd kan worden om toch iets te zeggen over een bepaald verondersteld causaal pad.

DAGs vallen buiten het curriculum, maar voor er mee aan de slag wil zijn Rohrer (2018) en http://www.dagitty.net/learn goed startpunten.

Deze sectie moet nog worden uitgebreid. Dit zal (uiterlijk) gebeuren als de betreffende stof wordt gebruikt in een cursus; dit is waarschijnlijk de volgende revisie van Onderzoekspracticum longitudinaal onderzoek.

7.5.3 Quasi-experimenten

Deze sectie moet nog worden geschreven. Dit zal (uiterlijk) gebeuren als de betreffende stof wordt gebruikt in een cursus; dit is waarschijnlijk de volgende revisie van Onderzoekspracticum experimenteel onderzoek.

7.5.4 Granger causaliteit

Deze sectie moet nog worden geschreven. Dit zal (uiterlijk) gebeuren als de betreffende stof wordt gebruikt in een cursus; dit is waarschijnlijk de volgende revisie van Onderzoekspracticum experimenteel onderzoek.

Referenties

Hoog, N. D., Stroebe, W., & Wit, J. B. F. de. (2007). The impact of vulnerability to and severity of a health risk on processing and acceptance of fear-arousing communications: A meta-analysis. Review of General Psychology, 11(3), 258.
Kok, G., Peters, G.-J. Y., Kessels, L. T. E., Hoor, G. A. ten, & Ruiter, R. A. C. (2018). Ignoring theory and misinterpreting evidence: The false belief in fear appeals. Health Psychology Review, 12. https://doi.org/10.1080/17437199.2017.1415767
Orben, A., & Lakens, D. (2020). Crud (Re)Defined. Advances in Methods and Practices in Psychological Science, 3(2), 238–247. https://doi.org/10.1177/2515245920917961
Peters, G.-J. Y., Ruiter, R. A. C., & Kok, G. (2013). Threatening communication: A critical re-analysis and a revised meta-analytic test of fear appeal theory. Health Psychology Review, 7(Suppl 1), S8–S31. https://doi.org/10.1080/17437199.2012.703527
Rohrer, J. M. (2018). Thinking Clearly About Correlations and Causation: Graphical Causal Models for Observational Data. Advances in Methods and Practices in Psychological Science, 1(1), 27–42. https://doi.org/10.1177/2515245917745629
Witte, K. (1992). Putting the fear back into fear appeals: The extended parallel process model. Communication Monographs, 59(4), 329–349. https://doi.org/10.1080/03637759209376276