Hoofdstuk 22 Multivariate Regressie

22.1 Intro

Multivariate regressieanalyse kan nuttig zijn om een model te verkrijgen om de afhankelijke variabele te voorspellen als een functie van twee of meer voorspellende variabelen en om te schatten welk deel van de variantie van die afhankelijke variabele kan worden begrepen met behulp van de voorspellende variabelen. De voorspellende variabelen kunnen numeriek zijn of categorisch, of te wel, een interval of een nominaal niveau hebben.

22.1.1 Voorbeeld data

In dit voorbeeld wordt de schoolsucces dataset gebruikt. De afhankelijke variabele is schoolsucces gemeten met een schoolcijfer. Deze variabele wordt onder andere voorspeld door intelligentie (IQ) en het inkomen van de ouders (drie categorieen: hoog, middel, laag).

22.2 jamovi

Klik in het tabblad “Analyse” op de knop “Regressie” en selecteer “Linear regression” in het menu dat verschijnt. Selecteer in het vak aan de linkerkant de afhankelijke variabele (cijfer) en verplaats deze naar het vak met het label “Afhankelijke variabele” met behulp van de knop met het naar rechts wijzende pijltje. Selecteer in het vak aan de linkerkant de numerieke voorspellers (hier: IQ) en verplaats ze naar het vak met het label “Covariaten” met behulp van de knop met het naar rechts wijzende pijltje. Categorische voorspellers (hier: inkomen) worden verplaatst naar het vak met het label “Factoren”. Je kunt naar beneden scrollen om aanvullende analyses te specificeren, bijvoorbeeld om meer details over de coëfficiënten op te vragen door de sectie “Modelcoëfficiënten” te openen. Als je bijvoorbeeld het betrouwbaarheidsinterval voor de coëfficiënt en de gestandaardiseerde (geschaalde) coëfficiënten wilt opvragen, vink je de bijbehorende selectievakjes aan.

Hieronder kunt u zien hoe een regressie er volgens de jamovi syntax uitziet.

jmv::linReg(
  data = data,
  dep = cijfer,
  covs = IQ,
  factors = inkomen,
  blocks = list(
    list(
      "IQ",
      "inkomen")),
  refLevels = list(
    list(
      var="inkomen",
      ref="laag")))

Een regressie waarbij aanvullende analyses zijn gespecificeerd kan er zo uitzien. Hier is bijvoorbeeld de F test voor het gehele model aangevraagd, en het betrouwbaarheidsinterval voor de coëfficiënten. Je zult zien dat het eerste stuk van de syntax hetzelfde is als van het simpele model. Zo kun je dus gemakkelijk dezelfde code kopiëren en uitbreiden om de gegevens te verkrijgen die je wilt.

jmv::linReg(
  data = data,
  dep = cijfer,
  covs = IQ,
  factors = inkomen,
  blocks = list(
    list(
      "IQ",
      "inkomen")),
  refLevels = list(
    list(
      var="inkomen",
      ref="laag")),
  modelTest = TRUE,
  ci = TRUE)

22.3 R

In base R, de lm (lineair model) functie kan worden gecombineerd met de summary functie om de meest belangrijke resultaten te tonen. R beschouwt variabelen die factoren zijn automatisch als categorisch.

In het rosetta package, de regr functie maakt gebruik van R’s lm functie, maar geeft de resultaten wat anders weer.

rosetta::regr(cijfer ~ IQ + inkomen,
       data=schoolsucces)

Net als lm in basis R, is het commando hetzelfde voor een continue voorspeller als voor een categorische voorspeller. Extra output kan worden opgevraagd met bijvoorbeeld het argument collineariteit = TRUE. Via de notatie “:” tussen twee variabelen, wordt de interactie tussen deze twee meegenomen.

rosetta::regr(cijfer ~ IQ + inkomen + leeftijd + IQ:leeftijd,
       data=schoolsucces,
       collinearity=TRUE)

22.4 SPSS

In SPSS, wordt het REGRESSION commando gebruikt.

REGRESSION 
 /STATISTICS COEFF OUTS CI(95) R ANOVA 
 /DEPENDENT cijfer 
 /METHOD=ENTER IQ inkomen.

22.5 APA style report

Voor het rapporteren van een regressie zijn standaarden opgesteld. Hier worden de APA-7 regels toegepast. Bij complexe analyses wordt aangeraden om gebruik te maken van tabellen om het overzicht te bewaren, zodat je in de tekst minder statistische resultaten hoeft te verwerken. Enkele voorbeelden van het rapporteren van de resultaten staan hieronder:

We hebben geprobeerd uitgaansgedrag te voorspellen aan de hand van een viertal variabelen. Het gehele model verklaarde 43.2% van de variantie, R^2 = 0.432, F(3,165) = 36.4, p < .001, 95% CI [.31, .55]. Extraversie was een significante voorspeller van uitgaansgedrag, b = 2.76, p < .001, evenals leeftijd, b = -0.58, p = .021.

Multipele regressie is gebruikt om te onderzoeken of zelfvertrouwen en sociale steun de scores op mentaal welzijn van de participanten kon voorspellen. De resultaten van de regressie lieten zien dat het model 41.8% van de variantie verklaarde, en dat het model een significante voorspeller was van mentaal welzijn, F(2,26) = 9.34, p = .001. Sociale steun droeg significant bij aan het model, b = 0.668, p < .001, maar zelfvertrouwen niet, b = 0.295, p = .071.