Confirmatieve factoranalyse
- Gepubliceerd in Gezondheid
- Lees 4050 keer
Confirmatieve factoranalyse (CFA) wordt uitgevoerd volgens een aantal belangrijke stappen:
1. Model specification: een model (pijldiagram of stelsel van vergelijkingen) maken.
2. Model identification: bepalen of je model een unieke oplossing heeft.
3. Model estimation: een (voorlopige) aanname doen dat je model klopt. Je moet schattingen maken van alle vrije parameters in het model (zoals factorladingen en errorvarianties).
4. Model evaluation: bereken de teruggeschatte covariantiematrix. Om deze te vergelijken met de oorspronkelijke covariantiematrix, moet je de chikwadraattoets en de fitmaten berekenen.
5. Model respecification: wanneer bij (4.) blijkt dat het model niet klopt (dit is het geval wanneer de chikwadraattoets significant is en/of als de fit-maten te laag zijn), moet je het model bijstellen. Hierna kun je verder vanaf (2.).
1. Trimmen versus fit verhogen
Je kunt een model bij stap (5.) op twee manieren verbeteren: trimmen of de fit verhogen. Bij het trimmen zet je de vrije parameters vast. Zelfs wanneer je een model hebt met een goede fit, kun je het model nog verbeteren vanwege de spaarzaamheid (wanneer een eenvoudige en ingewikkelde versie beiden even goed werken, heeft de eenvoudige versie de voorkeur).
Bij CFA moet je dus bij twee even goede modellen, het model kiezen dat de minste vrije parameters heeft. Je kunt het aantal vrije parameters verminderen door de factorladingen op nul te zetten of door de correlaties tussen de factoren op nul te zetten. Dit is trimmen. De fit kan hiervan nooit verbeteren, maar wel verslechteren of gelijk blijven.
Bij het verhogen van de fit maak je vaste parameters vrij. Dit betekent dat je pijlen in het paddiagram toevoegt:
- Factorladingen: je laat een manifeste variabele ook op een andere factor laden.
- Correlaties tussen factoren: je staat toe dat er twee factoren gecorreleerd zijn.
- Correlaties tussen errors: je staat toe dat twee variabelen iets gemeenschappelijk hebben dat je niet kunt herleiden tot de factoren.
- Meer factoren: hierdoor wordt het model minder spaarzaam, maar wordt de fit wel groter.
2. Modificatie-indices en residuen
Om te bepalen welke parameters je moet vrijmaken voor een betere fit, kun je gebruik maken van modificatie-indices en van residuen. Een modificatie-index geeft aan in hoeverre het trimmen leidt tot een slechtere fit en in hoeverre het verhogen van de fit leidt tot een verbetering van de fit.
Een residu is het verschil tussen de werkelijke en de teruggeschatte waarde van een element uit de variantie-covariantie matrix. Wanneer een model een perfecte fit heeft, zijn alle errors gelijk aan nul. Bij echte data komt dit nagenoeg nooit voor. In dit geval geldt: hoe dichter het residu de nul nadert, hoe beter het model erin slaagt om de betreffende covariantie of correlatie te verklaren. Om een model bij te stellen, gebruik je de volgende formule: Dit is het gestandaardiseerde residu. Bij een standaardmodel met een goede fit zijn de residuen klein (tussen de -.10 en .10). Er zijn dan ook ongeveer evenveel positieve als negatieve residuen.
3. Analyse van de residuen
Je kunt uit residuen afleiden welke parameters er voor een goede fit moeten worden vrijgemaakt:
- Gecorreleerde factoren: wanneer twee factoren in werkelijkheid positief gecorreleerd zijn, maar deze in het model op nul staat, dan zullen de terugvoorspelde correlaties stelselmatig lager dan de werkelijke correlaties. Wanneer je in een blok residuen van variabelen uit twee verschillende factoren bijna alleen hoog positieve waarden vindt, moet je de factoren correleren waardoor je waarschijnlijk een betere fit krijgt.
- Extra factorlading: wanneer een variabele zowel op de eigen factor als op een andere factor in de werkelijkheid goed laadt, maar de lading op de andere factor in het model op nul is gezet, ontstaat dezelfde situatie als bij de gecorreleerde factoren.
- Gecorreleerde errors: wanneer je een duidelijk van nul afwijkend residu hebt dat geen onderdeel is van een breder patroon, zou je de correlatie tussen de errors van de betrokken variabelen schatten. Gecorreleerde errors zijn echter meestal niet heel bevorderlijk voor de begrijpelijkheid van een model.