Multipele regressieanalyse
- Gepubliceerd in Sociologie
- Lees 1560 keer
- De situatie waarin niet één onafhankelijke variabele of voorspeller is voor Y, maar meerdere. We houden ons nu niet meer bezig met bivariate analyse, maar met multivariate analyse.
- Iedere X variabele krijgt zijn eigen regressie gewicht. Het is belangrijk om bij analyse van deze gewichten in het achterhoofd te houden dat het gewichten zijn, ze geven het relatieve belang aan van de desbetreffende X variabele bij de voorspelling van Y.
- Een veelgemaakte fout is dat men resultaten interpreteert als X1 heeft veel met Y te maken en X2 heeft weinig verband met Y. Dit is onjuist, de resultaten betekenen alleen dat X1 zijn werk heeft gedaan in de voorspelling Y, de variabele X2 lijkt op X1 en heeft daar weinig aan toe te voegen.
- De b-gewichten zijn schaalafhankelijk; een onafhankelijke X variabele door 2 delen maakt het regressiegewicht navenant groter. Vaak zet men de scores om in standaardscores en voert de regressie op de gestandaardiseerde variabelen uit. De b gewichten die daaruit komen heten dan βi.
- De maat voor de voorspelling is R^2 en is de correlatie tussen de waargenomen scores Y en de op basis van het multivariate regressiemodel voorspelde scores Ў, R^2 is dus maximaal 1.
- Het is ook mogelijk diverse regressiemodellen uit te rekenen en te toetsen of de R^2 waarden van de diverse modellen significant verschillen.
- Vergelijking van verschillende sets van predicatoren kan op twee manieren:
- Met weinig voorspellers beginnen en voorspellers toevoegen tot de voorspelling niet meer verbetert (forward methode)
- Of met veel voorspellers beginnen en er telkens een verwijderen tot de voorspelling niet meer dramatisch omlaag gaat. (backward methode)
- Als we echter niet zozeer geïnteresseerd zijn in het verschil tussen een beperkt aantal groepen, maar in het effect van continue varabele op de overlevingsduur, of wals we geïnteresseerd zijn in het effect van diverse onafhankelijke variabelen op de afhankelijke variabele, dan zijn andere modellen geboden en kunnen we een regressiemodel opstellen. Een dergelijk model wordt de Cox-regressie genoemd.
- De afhankelijke variabele bij Cox-regressie si de hazard h(t). De baseline hazard is de hazard voor een individu als de waarden van alle onafhankelijke variabelen nul zijn.
- Aangezien de afhankelijke varaibele de hazard is, betkeent een positief regressiegewicht dat een hogere score op de desbetreffende onafhankelijke variable het risico op recidive doet toenemen.