Hoofdstuk 8 Variabelen Standaardiseren

8.1 Intro

Een variabele standaardiseren betekent het gemiddelde aftrekken van elke score in de gegevensreeks en de resulterende getallen delen door de standaarddeviatie van de variabele. Het resultaat is een variabele met een gemiddelde van 0 en een standaarddeviatie van 1. Centreren van een variabele betekent dat alleen het gemiddelde (of een andere waarde) van de de scores wordt afgetrokken.

8.1.1 Voorbeeld data

Dit voorbeeld gebruikt de variabele xtcUsePillHigh uit de voorbeeldddataset “pp15” (zie Hoofdstuk 3 en Hoofdstuk 4.

8.2 jamovi

Ga naar de Data tabblad en klik daar op Compute. Hiermee kan er een nieuwe variabele worden berekend, die u een zelf gekozen naam kunt geven en waaraan u een beschrijving kunt toevoegen. Klik vervolgens op het functie-symbool \(f_x\) en scroll in de linkerkolom naar de functie Z onder het kopje “Statistical”. Dubbelklik hierop, waarna er \(= Z()\) verschijnt in het venster. Scroll nu in de rechterkolom naar de variabele waarvan u de Z-score wil berekenen (bv xtcUsePillHigh) en dubbelklik daarop. In het venster staat nu \(= Z(xtcUsePillHigh)\). Als u nu weer naar bijvoorbeeld het analyses tabblad gaat, dan is de nieuwe gestandaardiseerde variabele verschenen in het databestand. In deze instructievideo wordt de procedure ook uitgelegd.

Wanneer een variabele alleen gecentreerd moet worden, bijvoorbeeld rondom om het gemiddelde, dan moet ook weer Compute worden gebruikt. Geef weer een naam (b.v. xtcUsePillHigh_centered) en dubbelklik op het functie-symbool \(f_x\). Selecteer in de rechterkolom de naam van de variabele die gecentreerd moet worden. Deze verschijnt dan in het venster. Type nu zelf een minteken achter deze naam en klik dan weer op het functie-symbool \(f_x\). Selecteer nu in de linkerkolom de functie VMEAN (die het gemiddelde van een variabele berekent), dubbelklik en kies vervolgens in de rechterkolom weer de naam van de variabele. In het venster staat nu: \(=xtcUsePillHigh - VMEAN(xtcUsePillHigh)\). Gaat u nu weer terug naar de analyses dan is de nieuwe gecentreerde variabele in het databestand verschenen.

8.3 R

Deze code slaat de gestandaardiseerde waarden op in een variabele genaamd xtcUsePillHigh_standardized:

dat$xtcUsePillHigh_standardized <-
  scale(dat$xtcUsePillHigh);

In R is het ook gemakkelijk om een variabele rond zijn gemiddelde te centreren (d.w.z. laat de deling door de standaarddeviatie uit de standaardisatieprocedure weg). De volgende opdracht slaat de gecentreerde waarden op in een variabele met de naam xtcUsePillHigh_centered:

dat$xtcUsePillHigh_centered <-
  scale(dat$xtcUsePillHigh, scale = FALSE);

8.4 SPSS

Dit commando vraagt om variabelebeschrijvingen, maar het /SAVE subcommando slaat ook de gestandaardiseerde waarden op. Deze krijgen dan de originele variabelenaam, voorafgegaan door ‘Z’, dus in dit geval ‘ZxtcUsePillHigh’, die automatisch wordt toegevoegd aan het databestand:

DESCRIPTIVES VARIABLES = xtcUsePillHigh
 /SAVE.