Bien que chaque technique de la famille SEM soit différente, les aspects suivants sont communs à de nombreuses méthodes SEM.
Spécification du modèleEdit
Deux composantes principales des modèles sont distinguées dans SEM : le modèle structurel montrant les dépendances causales potentielles entre les variables endogènes et exogènes, et le modèle de mesure montrant les relations entre les variables latentes et leurs indicateurs. Les modèles d’analyse factorielle exploratoire et confirmatoire, par exemple, ne contiennent que la partie mesure, tandis que les diagrammes de chemin peuvent être considérés comme des SEM qui ne contiennent que la partie structurelle.
En spécifiant les chemins dans un modèle, le modélisateur peut poser deux types de relations : (1) les chemins libres, dans lesquels les relations causales hypothétiques (en fait contrefactuelles) entre les variables sont testées, et sont donc laissées » libres » de varier, et (2) les relations entre les variables qui ont déjà une relation estimée, généralement basée sur des études précédentes, qui sont » fixées » dans le modèle.
Un modélisateur spécifiera souvent un ensemble de modèles théoriquement plausibles afin d’évaluer si le modèle proposé est le meilleur de l’ensemble des modèles possibles. Non seulement le modélisateur doit tenir compte des raisons théoriques de construire le modèle tel qu’il est, mais il doit également prendre en compte le nombre de points de données et le nombre de paramètres que le modèle doit estimer pour identifier le modèle. Un modèle identifié est un modèle où une valeur de paramètre spécifique identifie de manière unique le modèle (définition récursive), et aucune autre formulation équivalente ne peut être donnée par une valeur de paramètre différente. Un point de données est une variable avec des scores observés, comme une variable contenant les scores à une question ou le nombre de fois que les répondants achètent une voiture. Le paramètre est la valeur d’intérêt, qui peut être un coefficient de régression entre la variable exogène et la variable endogène ou la charge factorielle (coefficient de régression entre un indicateur et son facteur). S’il y a moins de points de données que le nombre de paramètres estimés, le modèle résultant est « non identifié », car il y a trop peu de points de référence pour rendre compte de toute la variance du modèle. La solution consiste à contraindre l’un des chemins à zéro, ce qui signifie qu’il ne fait plus partie du modèle.
Estimation des paramètres libresEdit
L’estimation des paramètres se fait en comparant les matrices de covariance réelles représentant les relations entre les variables et les matrices de covariance estimées du modèle le mieux ajusté. Ceci est obtenu par maximisation numérique via la maximisation de l’espérance d’un critère d’ajustement tel que fourni par l’estimation du maximum de vraisemblance, l’estimation du quasi-maximum de vraisemblance, les moindres carrés pondérés ou les méthodes asymptotiquement sans distribution. Ceci est souvent accompli en utilisant un programme d’analyse SEM spécialisé, dont plusieurs existent.
Évaluation du modèle et de l’ajustement du modèleEdit
Après avoir estimé un modèle, les analystes voudront l’interpréter. Les chemins estimés peuvent être tabulés et/ou présentés graphiquement comme un modèle de chemin. L’impact des variables est évalué à l’aide de règles de traçage des chemins (voir analyse des chemins).
Il est important d’examiner l' »ajustement » d’un modèle estimé pour déterminer dans quelle mesure il modélise les données. Il s’agit d’une tâche de base dans la modélisation SEM, formant la base de l’acceptation ou du rejet des modèles et, plus généralement, de l’acceptation d’un modèle concurrent par rapport à un autre. Les résultats des programmes SEM comprennent des matrices des relations estimées entre les variables du modèle. L’évaluation de l’ajustement calcule essentiellement la similarité entre les données prédites et les matrices contenant les relations dans les données réelles.
Des tests statistiques formels et des indices d’ajustement ont été développés à ces fins. Les paramètres individuels du modèle peuvent également être examinés au sein du modèle estimé afin de voir dans quelle mesure le modèle proposé correspond à la théorie de la conduite. La plupart des méthodes d’estimation, mais pas toutes, rendent possibles de tels tests du modèle.
Bien sûr, comme dans tous les tests d’hypothèses statistiques, les tests du modèle SEM sont basés sur l’hypothèse que les données pertinentes correctes et complètes ont été modélisées. Dans la littérature SEM, la discussion de l’ajustement a conduit à une variété de recommandations différentes sur l’application précise des divers indices d’ajustement et tests d’hypothèse.
Il existe différentes approches pour évaluer l’ajustement. Les approches traditionnelles de la modélisation partent d’une hypothèse nulle, récompensant les modèles les plus parcimonieux (c’est-à-dire ceux qui ont moins de paramètres libres), jusqu’à d’autres comme l’AIC qui se concentrent sur le peu d’écart entre les valeurs ajustées et un modèle saturé (c’est-à-dire la façon dont elles reproduisent les valeurs mesurées), en tenant compte du nombre de paramètres libres utilisés. Étant donné que différentes mesures d’ajustement saisissent différents éléments de l’ajustement du modèle, il est approprié de présenter une sélection de différentes mesures d’ajustement. Les lignes directrices (c’est-à-dire les « scores de coupure ») pour l’interprétation des mesures d’ajustement, y compris celles énumérées ci-dessous, font l’objet de nombreux débats parmi les chercheurs en SEM.
Certaines des mesures d’ajustement les plus couramment utilisées comprennent :
- Le chi carré
- Une mesure d’ajustement fondamentale utilisée dans le calcul de nombreuses autres mesures d’ajustement. Conceptuellement, c’est une fonction de la taille de l’échantillon et de la différence entre la matrice de covariance observée et la matrice de covariance du modèle.
- Critère d’information d’Akaike (AIC)
- Un test d’ajustement relatif du modèle : Le modèle préféré est celui qui présente la valeur AIC la plus faible.
- A I C = 2 k – 2 ln ( L ) {\displaystyle {\mathit {AIC}}=2k-2\ln(L)\,}
- où k est le nombre de paramètres du modèle statistique, et L est la valeur maximisée de la vraisemblance du modèle.
- Erreur quadratique moyenne d’approximation (RMSEA)
- Indice d’ajustement où une valeur de zéro indique le meilleur ajustement. Bien que la ligne directrice pour déterminer un » ajustement étroit » en utilisant la RMSEA soit très contestée, la plupart des chercheurs s’accordent à dire qu’une RMSEA de 0,1 ou plus indique un mauvais ajustement.
- Résiduel moyen normalisé (RMSE)
- Le RMSE est un indicateur d’ajustement absolu populaire. Hu et Bentler (1999) ont suggéré 0,08 ou moins comme ligne directrice pour un bon ajustement. Kline (2011) a suggéré 0,1 ou moins comme ligne directrice pour un bon ajustement.
- Index d’ajustement comparatif (CFI)
- Lors de l’examen des comparaisons de base, le CFI dépend en grande partie de la taille moyenne des corrélations dans les données. Si la corrélation moyenne entre les variables n’est pas élevée, alors le CFI ne sera pas très élevé. Une valeur CFI de 0,95 ou plus est souhaitable.
Pour chaque mesure d’ajustement, la décision de savoir ce qui représente un ajustement suffisant entre le modèle et les données doit refléter d’autres facteurs contextuels tels que la taille de l’échantillon, le rapport entre les indicateurs et les facteurs, et la complexité globale du modèle. Par exemple, de très grands échantillons rendent le test du Khi-deux trop sensible et plus susceptible d’indiquer un manque d’adéquation modèle-données.
Modification du modèleModification
Le modèle peut avoir besoin d’être modifié afin d’améliorer l’ajustement, estimant ainsi les relations les plus probables entre les variables. De nombreux programmes fournissent des indices de modification qui peuvent guider les modifications mineures. Les indices de modification rapportent le changement du χ² qui résulte de la libération de paramètres fixes : généralement, donc l’ajout d’un chemin à un modèle qui est actuellement fixé à zéro. Les modifications qui améliorent l’ajustement du modèle peuvent être signalées comme des changements potentiels pouvant être apportés au modèle. Les modifications apportées à un modèle, en particulier le modèle structurel, sont des modifications de la théorie prétendue vraie. Les modifications doivent donc avoir un sens en termes de la théorie testée, ou être reconnues comme des limites de cette théorie. Les modifications du modèle de mesure sont effectivement des affirmations selon lesquelles les items/données sont des indicateurs impurs des variables latentes spécifiées par la théorie.
Les modèles ne doivent pas être dirigés par l’IM, comme l’a démontré Maccallum (1986) : « même dans des conditions favorables, les modèles découlant des recherches de spécification doivent être considérés avec prudence. »
Taille de l’échantillon et puissanceEdit
Bien que les chercheurs s’accordent à dire que de grandes tailles d’échantillon sont nécessaires pour fournir une puissance statistique suffisante et des estimations précises en utilisant le SEM, il n’y a pas de consensus général sur la méthode appropriée pour déterminer une taille d’échantillon adéquate. En général, les considérations pour déterminer la taille de l’échantillon incluent le nombre d’observations par paramètre, le nombre d’observations requises pour que les indices d’ajustement soient performants, et le nombre d’observations par degré de liberté. Les chercheurs ont proposé des lignes directrices basées sur des études de simulation, l’expérience professionnelle et des formules mathématiques.
Les exigences en matière de taille d’échantillon pour atteindre une signification et une puissance particulières dans les tests d’hypothèses SEM sont similaires pour le même modèle lorsque l’un des trois algorithmes (PLS-PA, LISREL ou systèmes d’équations de régression) est utilisé pour les tests.
Interprétation et communicationModification
L’ensemble des modèles est ensuite interprété de manière à ce que des affirmations sur les constructions puissent être faites, sur la base du modèle le mieux ajusté.
Il faut toujours être prudent lorsqu’on fait des affirmations de causalité, même lorsque des expérimentations ou des études temporelles ont été faites. Le terme de modèle causal doit être compris comme signifiant « un modèle qui véhicule des hypothèses causales », et pas nécessairement un modèle qui produit des conclusions causales validées. La collecte de données à plusieurs moments et l’utilisation d’un plan expérimental ou quasi-expérimental peuvent contribuer à écarter certaines hypothèses rivales, mais même une expérience randomisée ne peut écarter toutes ces menaces à l’inférence causale. La bonne adéquation d’un modèle compatible avec une hypothèse causale implique invariablement une bonne adéquation d’un autre modèle compatible avec une hypothèse causale opposée. Aucune conception de recherche, aussi intelligente soit-elle, ne peut aider à distinguer de telles hypothèses rivales, à l’exception des expériences interventionnelles.
Comme dans toute science, la réplication ultérieure et peut-être la modification se feront à partir de la constatation initiale.