Open Methodologie en Statistiek
Over dit boek
Software voor onderzoek
Andere bronnen
Licentie en colofon
Nonlineair
In ontwikkeling
I Introductie
1
Wetenschap
1.1
Samenvatting en verdieping
1.2
Wetenschap
1.3
Ontologie en epistemologie
1.4
Empirie en theorie
1.5
Fundamenteel en toegepast onderzoek
1.6
Technologie
2
Psychologie
2.1
Inleiding
2.2
Nadenken over mensen
2.3
Abstracte patronen herkennen
2.4
De complexe mens in een complexe wereld
2.5
Psychologische technologie
2.6
Wetenschappelijk onderzoek in de psychologie
3
Stimuli
3.1
Samenvatting en verdieping
3.2
Waarneming
3.3
Stimuli
3.4
Verstoringen in de waarneming
3.5
Stimuli ontwerpen of selecteren
3.6
Teksten, taal, en taalgebruik
4
Constructen
4.1
Inleiding
4.2
Neuronen en constructen
4.3
Soorten: vier perspectieven op constructen
4.4
Wat zijn psychologische constructen?
4.5
Een metafoor om over constructen na te denken
5
Modellen
5.1
Inleiding
5.2
Bouwstenen van een model
5.3
Soorten modellen
5.3.1
Conceptuele modellen (theoretisch)
5.3.2
Structurele modellen (statistisch)
5.3.3
Meetmodellen
5.3.4
DAGs: directed acylic graphs
II Methodologie
6
Constructen meten
6.1
Inleiding
6.2
Operationaliseren versus meten
6.3
Een item
6.4
Validiteit en betrouwbaarheid
6.5
Meerdere items: meetmodellen
6.6
Meetmodellen en aggregeren
6.7
Betrouwbaarheid en validiteit schatten en verhogen
7
Causaliteit
7.1
De definitie van causaliteit
7.2
Correlatie impliceert geen causatie
7.3
Het pure experiment
7.3.1
Randomisatie
7.4
Causaliteit plus: moderatie en mediatie
7.4.1
Moderatie en causaliteit
7.4.2
Mediatie en causaliteit
7.4.3
Combinaties van moderatie en mediatie
7.5
Als een experiment onmogelijk is
7.5.1
Observationele longitudinale ontwerpen
7.5.2
Directed Acyclic Graphs
7.5.3
Quasi-experimenten
7.5.4
Granger causaliteit
8
Ontwerpen
8.1
Inleiding
8.2
Steekproeven
8.3
Kwalitatief onderzoek
8.4
Cross-sectioneel onderzoek
8.5
Experimenteel onderzoek
8.6
Longitudinaal onderzoek
8.7
Pilot studies
8.7.1
Benodigde steekproef voor een pilot-studie
8.7.2
Pilot-studies om effectgroottes te schatten
9
Betrouwbaarheid
9.1
Betrouwbaarheid
9.2
Test-hertest betrouwbaarheid
9.2.1
Mensen veranderen continu
9.2.2
Mensen herinneren zich dingen
9.2.3
Transient error
9.2.4
Termijn tussen metingen
9.2.5
Meetfout onderschatten
9.2.6
Test-hertest betrouwbaarheid berekenen
9.2.7
Uitdagingen bij test-hertest betrouwbaarheid
9.3
Interne consistentie
9.3.1
Split-half betrouwbaarheid
9.3.2
Coëfficiënt Alpha
9.3.3
Coëfficiënt H
9.3.4
Greatest Lower Bound
9.3.5
Omega
9.4
Welke maat moet je gebruiken?
9.5
Wanneer is betrouwbaarheid goed genoeg?
9.5.1
Tijdens de ontwikkeling van een meetinstrument
9.5.2
Bij het gebruik van een meetinstrument
9.5.3
Wat als een meetinstrument niet bruikbaar is?
9.6
Betrouwbaarheid van een item
10
Validiteit van Meetinstrumenten
10.1
Inleiding
10.2
Validiteit van meetinstrumenten
10.3
Cognitieve validiteit
10.4
Definitie van validiteit van meetinstrumenten
10.5
Het responsmodel
10.6
Responspatronen
10.6.1
Verdelingsvormen van items zonder responsmodel
10.7
Verbanden tussen items en interne consistentie
10.7.1
Instructies voor toepassing
10.8
Latente constructen
10.9
Convergentie en divergentie
10.9.1
Overlap in items bij convergentie
10.9.2
Instructies voor toepassing
10.10
Geschiedenis: criterium, content, en construct-validiteit
10.11
Validiteit gaat over één studie
11
Validiteit van Manipulaties
11.1
Validiteit van manipulaties
12
Validiteit van Ontwerpen
12.1
Validiteit van een studie-ontwerp
12.1.1
De werving van deelnemers
12.1.2
Eventuele randomisatie
12.1.3
Eventuele blindering
12.1.4
De procedure
13
Onderzoeksvraag Bepaalt Methode
13.1
Van wetenschapsfilosofie naar methodologie
13.2
Pragmatische overwegingen
13.2.1
Een andere onderzoeksvraag of hypothese onderzoeken
13.2.2
Een ander studie-ontwerp kiezen
III Kwantitatieve data
14
Datasets
14.1
Datapunten
14.2
Datareeksen
14.3
Datatypen en meetniveaus
14.4
Metadata
14.5
Datasets
14.6
Variabelenamen
14.6.1
Karakters in variabelenamen
14.6.2
Kamelen en slangen
14.6.3
Machine-readability
14.7
Bestandsformaten en -namen
14.7.1
Open bestandsformaten
14.7.2
Deels open bestandsformaten
14.7.3
Gesloten bestandsformaten
14.7.4
Bestandsnamen
15
Verdelingen
15.1
Samenvatting en verdieping
15.2
Inleiding
15.3
Verdelingsvormen
15.4
Verdelingsvormen in steekproeven bekijken
15.5
Beschrijvingsmaten
15.5.1
Centrummaten
15.5.2
Spreidingsmaten
15.5.3
Verdelingsmaten
15.6
Verdelingsvormen van steekproevenverdelingen
15.6.1
De
\(t\)
-verdeling
15.6.2
De
\(F\)
-verdeling
16
Steekproevenverdelingen
17
Betrouwbaarheidsintervallen
18
Samenhang in data
18.1
Inleiding
18.2
Twee variabelen
18.3
Een scatterplot
18.3.1
Een positief verband
18.3.2
Een negatief verband
18.3.3
Positieve en negatieve verbanden onderscheiden
19
Nulhypothese-significantietoetsing
19.1
Inleiding
19.2
De nulhypothese
19.3
De p-waarde
19.4
Significantietoetsing
19.4.1
Type 1-fouten
19.4.2
Type 2-fouten
19.4.3
Samenvatting Nulhypothese-significantietoetsing
19.5
Power
19.6
Multiple testing
19.7
Problemen van NHST
19.8
Eenzijdige toetsing
IV Instrumentarium
20
Meetinstrumenten
20.1
Het ESM Item Repository
20.2
De International Personality Item Pool (IPIP)
21
Betrouwbaarheid schatten en verhogen
22
Validiteit schatten en verhogen
22.1
Inleiding
22.2
Validiteit van Meetinstrumenten
22.2.1
Operationalisatie
22.2.2
Items
22.2.3
Richtlijnen bij het formuleren van vragen en antwoordopties
22.2.4
Het responsmodel
22.2.5
Verwachte verdeling per item
22.2.6
Verwachte verbanden tussen items
22.2.7
Verwachte verbanden met andere constructen
22.2.8
Vergelijking tussen groepen
22.3
Validiteit van Manipulaties
22.4
Validiteit van het Studie-ontwerp
22.4.1
Steekproef
22.4.2
Procedure
22.4.3
Randomisatie
22.5
Studieplanning: verificatie van validiteit
22.6
Check-list
22.7
Externe validiteit
23
Factor-analyse
23.1
Inleiding
23.2
Covarianties en correlaties
23.3
PCA: Principale Componenten-Analyse
23.3.1
Componenten kiezen
23.3.2
PCA met Openheid
23.3.3
Componenten bestaan uit ladingen
23.3.4
Communaliteit
23.3.5
Eigenwaarden: de verklaarde variantie per component
23.3.6
Het Kaiser criterium
23.3.7
De scree plot
23.3.8
Uniciteit
23.3.9
PCA met Openheid en Extraversie
23.3.10
Rotatie
23.3.11
Andere rotaties
23.3.12
De covariantiematrix reproduceren
23.3.13
Puntschattingen en betrouwbaarheidsintervallen
23.4
Soorten en meetmodellen
23.5
EFA: Exploratieve Factor-Analyse
23.5.1
Alleen communaliteiten
23.5.2
EFA met Openheid en Extraversie
23.6
Het aantal factoren kiezen
23.7
Steekproefomvang voor factor-analyse
23.7.1
Ontwikkeling van meetinstrumenten
23.7.2
Verificatie van validiteit
23.8
CFA: Confirmatieve Factor-Analyse
23.9
Netwerk-meetmodellen
24
Respons Proces Evaluatie
24.1
Inleiding
24.2
Responsprocessen
24.3
Respons Proces Evaluatie
24.4
Respons Proces Evaluatie versus Cognitieve Interviews
V Vooranalyses
25
Verificatie van data-integriteit
25.1
Verificatie van data-integriteit
25.1.1
Onmogelijke waarden
25.1.2
Verdelingen
25.1.3
Uitbijters
25.1.4
Deelnemerfouten
25.1.5
Studieplanning: verificatie van data-integriteit
25.1.6
Check-list
25.2
Verificatie van voorwaarden
25.2.1
Alle inferentiele analyses
25.2.2
Univariate analyses
25.2.3
Bivariate analyses
25.2.4
Multivariate analyses
26
Verificatie van validiteit
26.1
De validiteit van een meetinstrument verifiëren
VI Bivariate analyses
27
Kruistabellen
27.1
Inleiding
27.2
Associatiematen
27.2.1
Chi-kwadraattoets
27.3
Visualiseren van de afhankelijkheid: correspondentieanalyse
27.4
Verdieping: hoek tussen vectoren symboliseert samenhang
28
Correlaties
28.1
Samenvatting en verdieping
28.1.1
Inleiding
28.2
De berekening van de correlatie
28.3
Interpretatie: mogelijke waarden
28.4
Interpretatie: effectgroottes en vuistregels
28.5
De steekproevenverdeling van de correlatie
28.6
Het betrouwbaarheidsinterval van de correlatie
28.7
Benodigde steekproefomvang
28.8
De proportie verklaarde variantie
28.9
De standaardfout van Pearson’s
\(r\)
28.10
Pearson’s
\(r\)
en normaliteit
29
Regressie
29.1
Inleiding
29.2
De regressielijn
29.3
Het intercept
29.4
De hellingscoëfficiënt
29.5
Dichotome voorspellers
29.6
Het statistische structurele model
29.7
De proportie verklaarde variantie
29.8
Steekproevenverdelingen
29.9
Betrouwbaarheidsintervallen
29.10
Nulhypothese-significantietoetsing en
\(p\)
-waarden
29.11
Praktijkvoorbeeld: schoolcijfer en IQ
29.12
Een voorbeeld van resultaten
29.12.1
De regressieanalyse
29.12.2
Het model
29.12.3
De regressiecoëfficiënten
29.12.4
Voorspellingen doen
29.13
De gestandaardiseerde coëfficiënten
29.14
Centreren in regressie-analyse
29.15
Asymmetrie in regressie-analyse
29.15.1
Geen causaliteit
29.15.2
Onrealistische aanname
29.16
Aannames van regressie-analyse
29.17
Synoniemen
29.18
Met de hand regressiecoëfficiënten berekenen
30
Twee groepen vergelijken
30.1
Een verschil tussen twee gemiddelden
30.2
De steekproevenverdeling en het betrouwbaarheidsinterval voor het verschil tussen gemiddelden
30.3
Cohen’s
\(d\)
30.3.1
Steekproevenverdeling van Cohen’s
\(d\)
30.3.2
Betrouwbaarheidsintervallen voor Cohen’s
\(d\)
30.3.3
Interpretatie Cohen’s
\(d\)
: mogelijke waarden en richtlijnen
30.4
De onafhankelijke
\(t\)
-toets
30.5
Levene’s toets voor gelijkheid van varianties
30.5.1
Wat is de Levene’s toets
30.5.2
Drie soorten Levene’s toetsen
30.5.3
Hoe de Levene’s toets te gebruiken?
30.6
De gepaarde t-toets
30.6.1
Voordelen van gepaarde
\(t\)
-toetsen
30.6.2
Verschillende berekeningen bij gepaarde
\(t\)
-toetsen
30.6.3
Referenties
31
Variantieanalyse
31.1
Inleiding
31.2
De logica achter ANOVA
31.2.1
Verschil uitdrukken in een
\(t\)
-toets
31.2.2
Verschil uitdrukken in ANOVA
31.2.3
De
\(F\)
-waarde als ratio
31.3
Aannames bij ANOVA
31.3.1
Welch’s
\(F\)
31.4
Effectmaten bij ANOVA
31.5
Specifieke groepsverschillen toetsen: contrasten versus post-hoc
31.5.1
Contrasten: paarsgewijze vergelijkingen van tevoren bedenken
31.5.2
Post-hoc: achteraf alsnog alles vergelijken, maar voorzichtiger
31.6
Analyse met one-way ANOVA
31.6.1
Voorbeeld
VII Multivariate analyses
32
Multipele regressie
32.1
Inleiding
32.2
De regressievergelijking
32.3
De multipele correlatie en de proportie verklaarde variantie
32.4
Steekproevenverdelingen
32.5
Een voorbeeld
32.5.1
De variabelen
32.5.2
Correlaties
32.5.3
De regressie-analyses
32.5.4
De voorspellingen
32.6
Aannames van multipele regressie-analyse
32.6.1
Multicollineariteit onderzoeken
32.7
Overlap in voorspellers
32.8
Categorische voorspellers: dummycodering
32.8.1
Dichotome voorspellers
32.8.2
Voorspellers met meer categorieën
32.8.3
Dummycodering
32.9
Situaties waarin multipele regressie wordt gebruikt
33
Moderatie-analyse
33.1
Inleiding
33.2
Moderatie met dichotome variabelen
33.3
Moderatieanalyse met predictor op intervalniveau
33.3.1
Interactieterm toevoegen
33.4
Moderatie met interval variabelen
33.5
Stappenplan voor een moderatieanalyse
33.6
Conditioneel hoofdeffect
33.7
Verdieping: Toetsen van de “simple slopes”
33.8
Moderatiemodellen met drieweginteracties
34
Mediatieanalyse
34.1
Inleiding
34.1.1
Wat is mediatie?
34.2
Het uitvoeren van een mediatieanalyse
34.2.1
De CS-methode
34.2.2
De PC-methode
34.2.3
Voorbeeld: analyse van contraproductief gedrag
34.2.4
Voorbeeld van de CS-methode
34.3
Meerdere mediatoren
34.3.1
Voorbeeld met twee mediatoren
34.3.2
Uitbreiding van het mediatiemodel
34.4
Effectgrootte bij mediatieanalyse
35
Logistische regressie
35.1
Inleiding
35.2
Waarom lineaire regressie niet werkt
35.3
Het logistisch regressie model
35.4
De odds-ratio bij logistische regressie
35.5
Een voorbeeld: schoolsucces
35.6
Kwaliteit van het model
35.7
Aannames bij logistische regressie
35.7.1
Lineariteit van de logit
35.7.2
Afwezigheid van multicollineariteit
35.7.3
Afwezigheid van ‘influential cases’
35.7.4
Onafhankelijkheid van residuen
36
Multilevel-analyse
36.1
Inleiding
36.2
Wat zijn multileveldata?
36.3
Een illustratie van multileveldata met gewone regressieanalyse
36.4
Fixed en random effecten
36.5
Eenvoudige multilevel modellen
36.5.1
Voorbeeld van multileveldata
36.5.2
Centreren van de variabelen
36.5.3
Model A: een predictor en een groepsvariabele
36.5.4
Model A1: predictor IQ en random intercept
36.5.5
Model A2: predictor IQ en random intercept en random slope
36.6
Covariaat op het eerste niveau
36.7
Covariaat op het tweede niveau
36.8
Interactie-effect tussen eerste en tweede niveau
36.9
Verdieping: model D afgeleid
36.10
Verdieping: Toetsen van geneste modellen
37
Multilevel-analyse-2
37.1
Inleiding
37.2
Model B: covariaat op niveau 1
37.3
Model C: covariaat op niveau 2
37.4
Model D: Een interactie-effect tussen niveau 1 en 2
37.5
Verdieping: model D afgeleid
38
multilevel-analyse-longitudinaal
38.1
Inleiding
38.1.1
Voorbeeld data: zin in roken
38.2
Analyse
38.2.1
Modellen vergelijken
VIII Publiceren
39
Teksten
39.1
Academisch schrijven
39.1.1
Triviale waarheden
39.1.2
Onderbouwde beweringen
39.1.3
Logisch afgeleid
39.1.4
Rapportage
39.2
Teksten structureren
39.2.1
Outline
39.3
Alles heeft een functie
39.4
Vorm
39.4.1
Achter de schermen en op het podium
39.4.2
Figuren
39.4.3
Tabellen
39.4.4
Stijl
40
Secties
40.1
Inleiding
40.1.1
Problematisering
40.1.2
Theorieën
40.1.3
Empirische evidentie
40.1.4
Huidige studie
40.2
Methode
40.3
Intermezzo: preregs, registered reports, en dataverzameling
40.4
Resultaten
40.5
Discussie
40.6
Zandloper
IX Steekproefomvang berekenen
41
Correlaties en steekproefomvang
41.1
Correlaties schatten
41.2
Nulhypothese-significantietoetsing
42
Power voor t-toetsen
42.1
Power van de onafhankelijke t-toets
42.2
Power voor gepaarde t-toetsen
43
Power voor variantieanalyse
X Kaders
44
Wetenschappelijke integriteit
44.1
Wetenschappelijke integriteit
44.2
Ethiek en ethische commissies
44.2.1
WMO, METC en cETO
44.2.2
Informed consent
44.2.3
Datamanagement
44.2.4
Full disclosure
44.2.5
Referenties
45
Plagiaat
45.1
Inleiding
45.2
Concrete richtlijnen
45.2.1
Wat mag nooit?
45.2.2
Wat is geen plagiaat maar wel bijna altijd fout?
45.2.3
Wat mag wel?
45.2.4
Wat is het probleem?
45.2.5
Verklaringen
XI Appendices & referenties
46
Colofon
46.1
Auteurs
46.2
Datasets
46.3
Figuren
46.4
R packages
47
Referenties
PDF
EPUB
Open Methodologie en Statistiek (OpenMenS)
Hoofdstuk 21
Betrouwbaarheid schatten en verhogen
Dit hoofdstuk moet nog worden geschreven.