Structural equation modeling

Anche se ogni tecnica della famiglia SEM è diversa, i seguenti aspetti sono comuni a molti metodi SEM.

Specificazione del modelloModifica

Nel SEM si distinguono due componenti principali dei modelli: il modello strutturale che mostra le potenziali dipendenze causali tra variabili endogene ed esogene, e il modello di misurazione che mostra le relazioni tra le variabili latenti e i loro indicatori. I modelli di analisi fattoriale esplorativa e confermativa, per esempio, contengono solo la parte di misurazione, mentre i diagrammi di percorso possono essere visti come SEM che contengono solo la parte strutturale.

Nella specificazione dei percorsi in un modello, il modellatore può porre due tipi di relazioni: (1) percorsi liberi, in cui le relazioni causali ipotizzate (in realtà controfattuali) tra le variabili sono testate, e quindi sono lasciate ‘libere’ di variare, e (2) relazioni tra le variabili che hanno già una relazione stimata, di solito basata su studi precedenti, che sono ‘fissate’ nel modello.

Un modellatore spesso specifica un insieme di modelli teoricamente plausibili al fine di valutare se il modello proposto è il migliore dell’insieme dei modelli possibili. Non solo il modellatore deve tener conto delle ragioni teoriche per costruire il modello così com’è, ma deve anche prendere in considerazione il numero di punti dati e il numero di parametri che il modello deve stimare per identificare il modello. Un modello identificato è un modello in cui uno specifico valore di parametro identifica univocamente il modello (definizione ricorsiva), e nessun’altra formulazione equivalente può essere data da un diverso valore di parametro. Un punto dati è una variabile con punteggi osservati, come una variabile contenente i punteggi su una domanda o il numero di volte che gli intervistati comprano un’auto. Il parametro è il valore di interesse, che potrebbe essere un coefficiente di regressione tra la variabile esogena e quella endogena o il carico del fattore (coefficiente di regressione tra un indicatore e il suo fattore). Se ci sono meno punti di dati rispetto al numero di parametri stimati, il modello risultante è “non identificato”, poiché ci sono troppo pochi punti di riferimento per rappresentare tutta la varianza del modello. La soluzione è quella di vincolare uno dei percorsi a zero, il che significa che non fa più parte del modello.

Stima dei parametri liberiModifica

La stima dei parametri viene fatta confrontando le matrici di covarianza reali che rappresentano le relazioni tra le variabili e le matrici di covarianza stimate del modello più adatto. Questo è ottenuto attraverso la massimizzazione numerica tramite la massimizzazione delle aspettative di un criterio di adattamento come previsto dalla stima della massima verosimiglianza, dalla stima della quasi-massima verosimiglianza, dai minimi quadrati ponderati o dai metodi asintoticamente privi di distribuzione. Questo è spesso realizzato utilizzando un programma specializzato di analisi SEM, di cui esistono diversi.

Valutazione del modello e del modello fitEdit

Questa sezione ha bisogno di ulteriori citazioni per la verifica. Si prega di aiutare a migliorare questo articolo aggiungendo citazioni a fonti affidabili. Il materiale privo di fonti può essere contestato e rimosso. (Febbraio 2019) (Impara come e quando rimuovere questo messaggio template)

Avendo stimato un modello, gli analisti vorranno interpretare il modello. I percorsi stimati possono essere tabulati e/o presentati graficamente come un modello di percorso. L’impatto delle variabili è valutato usando le regole di tracciatura del percorso (vedi analisi del percorso).

È importante esaminare il “fit” di un modello stimato per determinare quanto bene modella i dati. Questo è un compito fondamentale nella modellazione SEM, che costituisce la base per accettare o rifiutare i modelli e, più di solito, accettare un modello concorrente piuttosto che un altro. L’output dei programmi SEM include matrici delle relazioni stimate tra le variabili nel modello. La valutazione dell’adattamento calcola essenzialmente quanto siano simili i dati predetti alle matrici contenenti le relazioni nei dati reali.

Sono stati sviluppati test statistici formali e indici di adattamento per questi scopi. I singoli parametri del modello possono anche essere esaminati all’interno del modello stimato per vedere quanto bene il modello proposto si adatti alla teoria di guida. La maggior parte dei metodi di stima, anche se non tutti, rendono possibili tali test del modello.

Naturalmente, come in tutti i test di ipotesi statistica, i test del modello SEM si basano sul presupposto che i dati rilevanti corretti e completi siano stati modellati. Nella letteratura SEM, la discussione sul fit ha portato a una varietà di raccomandazioni diverse sull’applicazione precisa dei vari indici di fit e dei test di ipotesi.

Ci sono diversi approcci per valutare il fit. Gli approcci tradizionali alla modellazione partono da un’ipotesi nulla, premiando i modelli più parsimoniosi (cioè quelli con meno parametri liberi), ad altri come l’AIC che si concentrano su quanto poco i valori montati deviano da un modello saturo (cioè quanto bene riproducono i valori misurati), tenendo conto del numero di parametri liberi utilizzati. Poiché diverse misure di adattamento catturano diversi elementi dell’adattamento del modello, è opportuno riportare una selezione di diverse misure di adattamento. Le linee guida (cioè i “punteggi di cutoff”) per interpretare le misure di adattamento, comprese quelle elencate di seguito, sono oggetto di molti dibattiti tra i ricercatori SEM.

Alcune delle misure di adattamento più comunemente usate includono:

Chi-quadrato
- Una misura fondamentale di adattamento usata nel calcolo di molte altre misure di adattamento. Concettualmente è una funzione della dimensione del campione e della differenza tra la matrice di covarianza osservata e la matrice di covarianza del modello.
Criterio di informazione di Akaike (AIC)
- Un test di adattamento relativo del modello: Il modello preferito è quello con il valore AIC più basso.
- A I C = 2 k – 2 ln ( L ) {\displaystyle {\mathit {AIC}}=2k-2\ln(L)\,}
  ${\mathit {AIC}}=2k-2\ln(L)\,$
- dove k è il numero di parametri nel modello statistico, e L è il valore massimizzato della probabilità del modello.
Root Mean Square Error of Approximation (RMSEA)
- Indice di adattamento dove un valore di zero indica il miglior adattamento. Mentre la linea guida per determinare un “close fit” usando RMSEA è molto contestata, la maggior parte dei ricercatori concorda che un RMSEA di .1 o più indica un cattivo adattamento.
Residuo medio radicale standardizzato (SRMR)
- L’SRMR è un popolare indicatore di adattamento assoluto. Hu e Bentler (1999) hanno suggerito .08 o inferiore come linea guida per un buon adattamento. Kline (2011) ha suggerito .1 o meno come linea guida per un buon adattamento.
Comparative Fit Index (CFI)
- Nell’esaminare i confronti di base, il CFI dipende in gran parte dalla dimensione media delle correlazioni nei dati. Se la correlazione media tra le variabili non è alta, allora il CFI non sarà molto alto. Un valore CFI di .95 o superiore è auspicabile.

Per ogni misura di adattamento, una decisione su cosa rappresenta un adattamento abbastanza buono tra il modello e i dati deve riflettere altri fattori contestuali come la dimensione del campione, il rapporto tra indicatori e fattori e la complessità generale del modello. Per esempio, campioni molto grandi rendono il test del Chi-quadrato eccessivamente sensibile e più probabile che indichi una mancanza di adattamento modello-dati.

Modifica del modello

Il modello potrebbe aver bisogno di essere modificato per migliorare l’adattamento, stimando così le relazioni più probabili tra le variabili. Molti programmi forniscono indici di modifica che possono guidare piccole modifiche. Gli indici di modifica riportano il cambiamento nel χ² che risulta dalla liberazione di parametri fissi: di solito, quindi l’aggiunta di un percorso a un modello che è attualmente impostato a zero. Le modifiche che migliorano l’adattamento del modello possono essere segnalate come potenziali modifiche che possono essere apportate al modello. Le modifiche a un modello, specialmente il modello strutturale, sono cambiamenti alla teoria che si sostiene essere vera. Le modifiche devono quindi avere un senso in termini di teoria da testare, o essere riconosciute come limitazioni di quella teoria. Le modifiche al modello di misurazione sono effettivamente affermazioni che gli item/dati sono indicatori impuri delle variabili latenti specificate dalla teoria.

I modelli non dovrebbero essere guidati da MI, come ha dimostrato Maccallum (1986): “

Dimensione del campione e potenza

Mentre i ricercatori concordano sul fatto che sono necessarie grandi dimensioni del campione per fornire una sufficiente potenza statistica e stime precise usando il SEM, non c’è un consenso generale sul metodo appropriato per determinare un’adeguata dimensione del campione. In generale, le considerazioni per determinare la dimensione del campione includono il numero di osservazioni per parametro, il numero di osservazioni richiesto per gli indici di adattamento per funzionare adeguatamente, e il numero di osservazioni per grado di libertà. I ricercatori hanno proposto delle linee guida basate su studi di simulazione, sull’esperienza professionale e su formule matematiche.

I requisiti di dimensione del campione per raggiungere una particolare significatività e potenza nel test di ipotesi SEM sono simili per lo stesso modello quando uno qualsiasi dei tre algoritmi (PLS-PA, LISREL o sistemi di equazioni di regressione) sono usati per il test.

Interpretazione e comunicazione

L’insieme dei modelli viene poi interpretato in modo da poter fare affermazioni sui costrutti, sulla base del modello che meglio si adatta.

Si dovrebbe sempre fare attenzione quando si fanno affermazioni di causalità anche quando sono stati fatti studi di sperimentazione o ordinati nel tempo. Il termine modello causale deve essere inteso come “un modello che trasmette ipotesi causali”, non necessariamente un modello che produce conclusioni causali convalidate. La raccolta di dati in punti temporali multipli e l’utilizzo di un disegno sperimentale o quasi-sperimentale possono aiutare ad escludere alcune ipotesi rivali, ma anche un esperimento randomizzato non può escludere tutte queste minacce all’inferenza causale. Un buon adattamento di un modello coerente con un’ipotesi causale comporta invariabilmente un altrettanto buon adattamento di un altro modello coerente con un’ipotesi causale opposta. Nessun disegno di ricerca, per quanto intelligente, può aiutare a distinguere tali ipotesi rivali, ad eccezione degli esperimenti interventistici.

Come in ogni scienza, la successiva replica e forse la modifica procederanno dalla scoperta iniziale.