Structural equation modeling

Hoewel elke techniek in de SEM-familie verschillend is, hebben veel SEM-methoden de volgende aspecten gemeen.

ModelspecificatieEdit

Bij SEM worden twee hoofdcomponenten van modellen onderscheiden: het structurele model dat de potentiële causale afhankelijkheden tussen endogene en exogene variabelen weergeeft, en het meetmodel dat de relaties tussen latente variabelen en hun indicatoren weergeeft. Exploratieve en confirmatieve factoranalysemodellen bevatten bijvoorbeeld alleen het meetgedeelte, terwijl paddiagrammen kunnen worden gezien als SEM’s die alleen het structurele gedeelte bevatten.

Bij het specificeren van paden in een model kan de modelleerder twee soorten relaties poneren: (1) vrije trajecten, waarbij veronderstelde causale (in feite counterfactual) relaties tussen variabelen worden getoetst, en dus ‘vrij’ worden gelaten om te variëren, en (2) relaties tussen variabelen die al een geschatte relatie hebben, meestal op basis van eerdere studies, die ‘gefixeerd’ zijn in het model.

Een modelleur zal vaak een reeks theoretisch plausibele modellen specificeren om te kunnen beoordelen of het voorgestelde model het beste is van de reeks mogelijke modellen. De modelleerder moet niet alleen rekening houden met de theoretische redenen om het model te bouwen zoals het is, maar hij moet ook rekening houden met het aantal datapunten en het aantal parameters dat het model moet schatten om het model te identificeren. Een geïdentificeerd model is een model waarbij een specifieke parameterwaarde het model op unieke wijze identificeert (recursieve definitie), en geen andere equivalente formulering kan worden gegeven door een andere parameterwaarde. Een gegevenspunt is een variabele met waargenomen scores, zoals een variabele met de scores op een vraag of het aantal keren dat respondenten een auto kopen. De parameter is de waarde van belang, die een regressiecoëfficiënt tussen de exogene en de endogene variabele kan zijn, of de factorlading (regressiecoëfficiënt tussen een indicator en zijn factor). Indien er minder gegevenspunten zijn dan het aantal geschatte parameters, is het resulterende model “ongeïdentificeerd”, aangezien er te weinig referentiepunten zijn om alle variantie in het model te kunnen verklaren. De oplossing is een van de paden tot nul te beperken, wat betekent dat het geen deel meer uitmaakt van het model.

Raming van vrije parametersEdit

Parameterschatting wordt gedaan door de werkelijke covariantiematrices die de relaties tussen variabelen weergeven, te vergelijken met de geschatte covariantiematrices van het best passende model. Dit wordt verkregen door numerieke maximalisatie via verwachtingsmaximalisatie van een geschiktheidscriterium zoals bepaald door maximale waarschijnlijkheidsschatting, quasi-maximale waarschijnlijkheidsschatting, gewogen kleinste kwadraten of asymptotisch verdelingsvrije methoden. Dit wordt vaak gedaan met behulp van een gespecialiseerd SEM analyseprogramma, waarvan er verschillende bestaan.

Beoordeling van model en model fitEdit

Deze sectie heeft extra citaties nodig voor verificatie. Help a.u.b. dit artikel te verbeteren door citaten naar betrouwbare bronnen toe te voegen. Materiaal zonder bronvermelding kan worden aangevochten en verwijderd. (Februari 2019) (Leer hoe en wanneer u dit sjabloonbericht verwijdert)

Als een model is geschat, zullen analisten het model willen interpreteren. De geschatte paden kunnen in tabelvorm worden weergegeven en/of grafisch worden gepresenteerd als een padmodel. De invloed van variabelen wordt beoordeeld met behulp van regels voor het traceren van paden (zie padanalyse).

Het is belangrijk om de “fit” van een geschat model te onderzoeken om te bepalen hoe goed het de gegevens modelleert. Dit is een basistaak bij SEM-modellering, die de basis vormt voor het aanvaarden of verwerpen van modellen en, meer gebruikelijk, het aanvaarden van een concurrerend model boven een ander. De output van SEM-programma’s omvat matrices van de geschatte relaties tussen variabelen in het model. Bij de beoordeling van de geschiktheid wordt in wezen berekend in hoeverre de voorspelde gegevens lijken op de matrices met de relaties in de werkelijke gegevens.

Voor deze doeleinden zijn formele statistische tests en geschiktheidsindices ontwikkeld. Afzonderlijke parameters van het model kunnen ook worden onderzocht binnen het geschatte model om na te gaan hoe goed het voorgestelde model aansluit bij de rijtheorie. De meeste, zij het niet alle, schattingsmethoden maken dergelijke tests van het model mogelijk.

Zoals bij alle statistische hypothesetests zijn SEM-modeltests natuurlijk gebaseerd op de veronderstelling dat de juiste en volledige relevante gegevens zijn gemodelleerd. In de SEM-literatuur heeft de discussie over fit geleid tot uiteenlopende aanbevelingen over de precieze toepassing van de diverse fit-indices en hypothesetoetsen.

Er zijn verschillende benaderingen om de fit te beoordelen. Traditionele benaderingen van modellering gaan uit van een nulhypothese en belonen parsimonieuzere modellen (d.w.z. die met minder vrije parameters), tot andere, zoals AIC, die zich toespitsen op hoe weinig de ingepaste waarden afwijken van een verzadigd model (d.w.z. hoe goed zij de gemeten waarden reproduceren), waarbij rekening wordt gehouden met het aantal gebruikte vrije parameters. Omdat verschillende geschiktheidsmaten verschillende elementen van de geschiktheid van het model weergeven, is het passend een selectie van verschillende geschiktheidsmaten te rapporteren. Over de richtlijnen (d.w.z. “cutoff-scores”) voor de interpretatie van fit-maatstaven, waaronder de hieronder genoemde, wordt door SEM-onderzoekers veel gediscussieerd.

Een aantal van de meest gebruikte fit-maatstaven zijn:

Chi-kwadraat
- Een fundamentele maatstaf voor fit die bij de berekening van veel andere fit-maatstaven wordt gebruikt. Conceptueel is het een functie van de steekproefgrootte en het verschil tussen de waargenomen covariantiematrix en de covariantiematrix van het model.
Akaike-informatiecriterium (AIC)
- Een test van de relatieve modelgeschiktheid: Het voorkeursmodel is het model met de laagste AIC-waarde.
- A I C = 2 k – 2 ln ( L ) {{\displaystyle {AIC}=2k-2\ln(L)},}
  ${\mathit {AIC}}=2k-2\ln(L)},$
- waarbij k het aantal parameters in het statistische model is, en L de gemaximaliseerde waarde van de waarschijnlijkheid van het model.

Root Mean Square Error of Approximation (RMSEA)

Fit-index waarbij een waarde van nul wijst op de beste fit. Hoewel de richtlijn voor het bepalen van een “close fit” met behulp van RMSEA zeer omstreden is, zijn de meeste onderzoekers het erover eens dat een RMSEA van .1 of meer wijst op een slechte fit.

Standardized Root Mean Residual (SRMR)
- De SRMR is een populaire absolute fit-indicator. Hu en Bentler (1999) stelden .08 of kleiner voor als richtlijn voor een goede fit. Kline (2011) stelde .1 of kleiner voor als richtlijn voor een goede fit.
Comparative Fit Index (CFI)
- Bij het onderzoeken van basislijnvergelijkingen hangt de CFI voor een groot deel af van de gemiddelde grootte van de correlaties in de gegevens. Als de gemiddelde correlatie tussen variabelen niet hoog is, zal de CFI niet erg hoog zijn. Een CFI-waarde van .95 of hoger is wenselijk.

Voor elke fit-maatstaf moet bij de beslissing over wat een voldoende goede fit tussen het model en de gegevens is, rekening worden gehouden met andere contextuele factoren, zoals steekproefgrootte, de verhouding tussen indicatoren en factoren, en de algehele complexiteit van het model. Zeer grote steekproeven maken de Chi-kwadraattoets bijvoorbeeld overgevoelig en wijzen eerder op een gebrekkige model-data fit.

ModelmodificatieEdit

Het kan nodig zijn het model te modificeren om de fit te verbeteren en zo de meest waarschijnlijke relaties tussen variabelen te schatten. Veel programma’s bieden modificatie-indices die kleine modificaties kunnen begeleiden. Modificatie-indices geven de verandering in χ² aan die het gevolg is van het vrijmaken van vaste parameters: meestal betekent dit dat een pad wordt toegevoegd aan een model dat momenteel op nul is gezet. Wijzigingen die de geschiktheid van het model verbeteren, kunnen worden gemarkeerd als potentiële wijzigingen die in het model kunnen worden aangebracht. Wijzigingen in een model, vooral in een structureel model, zijn wijzigingen in de theorie waarvan wordt beweerd dat zij waar is. Wijzigingen moeten derhalve zinvol zijn in termen van de getoetste theorie, of erkend worden als beperkingen van die theorie. Wijzigingen in het meetmodel zijn in feite beweringen dat de items/gegevens onzuivere indicatoren zijn van de latente variabelen die door de theorie worden gespecificeerd.

Modellen moeten niet worden geleid door MI, zoals Maccallum (1986) aantoonde: “even under favorable conditions, models arising from specification searches must be viewed with caution.”

Sample size and powerEdit

While researchers agree that large sample sizes are required to provide sufficient statistical power and precise estimates using SEM, there is no general consensus on the appropriate method for determining adequate sample size. In het algemeen omvatten de overwegingen voor het bepalen van de steekproefgrootte het aantal waarnemingen per parameter, het aantal waarnemingen dat nodig is om fit-indexen adequaat te laten presteren, en het aantal waarnemingen per vrijheidsgraad. Onderzoekers hebben richtlijnen voorgesteld op basis van simulatiestudies, beroepservaring en wiskundige formules.

De steekproefgrootte-eisen om een bepaalde significantie en power te bereiken bij SEM-hypothesetests zijn vergelijkbaar voor hetzelfde model wanneer een van de drie algoritmen (PLS-PA, LISREL of systemen van regressievergelijkingen) wordt gebruikt voor het testen.

Interpretatie en communicatieEdit

De reeks modellen wordt vervolgens geïnterpreteerd, zodat beweringen over de constructen kunnen worden gedaan, op basis van het best passende model.

Voorzichtigheid is altijd geboden bij het doen van beweringen over causaliteit, zelfs wanneer experimenten of in de tijd geordende studies zijn gedaan. Onder causaal model moet worden verstaan “een model dat causale veronderstellingen weergeeft”, niet noodzakelijkerwijs een model dat gevalideerde causale conclusies oplevert. Het verzamelen van gegevens op meerdere tijdstippen en het gebruik van een experimentele of quasi-experimentele opzet kan helpen bepaalde rivaliserende hypothesen uit te sluiten, maar zelfs een gerandomiseerd experiment kan niet al deze bedreigingen voor causale gevolgtrekkingen uitsluiten. Een model dat consistent is met één causale hypothese, past altijd even goed bij een ander model dat consistent is met een tegengestelde causale hypothese. Geen enkele onderzoeksopzet, hoe slim ook, kan helpen dergelijke rivaliserende hypothesen te onderscheiden, met uitzondering van interventie-experimenten.

Zoals in elke wetenschap zullen latere replicatie en misschien wijziging voortkomen uit de aanvankelijke bevinding.