Modelado de ecuaciones estructurales

Aunque cada técnica de la familia SEM es diferente, los siguientes aspectos son comunes a muchos métodos SEM.

Especificación del modeloEditar

En el SEM se distinguen dos componentes principales de los modelos: el modelo estructural que muestra las posibles dependencias causales entre las variables endógenas y exógenas, y el modelo de medición que muestra las relaciones entre las variables latentes y sus indicadores. Los modelos de análisis factorial exploratorio y confirmatorio, por ejemplo, contienen sólo la parte de medición, mientras que los diagramas de trayectorias pueden considerarse como SEM que contienen sólo la parte estructural.

Al especificar las trayectorias en un modelo, el modelador puede plantear dos tipos de relaciones: (1) vías libres, en las que se prueban las relaciones causales hipotetizadas (de hecho, contrafactuales) entre las variables y, por lo tanto, se dejan «libres» para que varíen, y (2) relaciones entre las variables que ya tienen una relación estimada, normalmente basada en estudios anteriores, que se «fijan» en el modelo.

Un modelador a menudo especificará un conjunto de modelos teóricamente plausibles para evaluar si el modelo propuesto es el mejor del conjunto de modelos posibles. El modelizador no sólo debe tener en cuenta las razones teóricas para construir el modelo tal y como es, sino que también debe tener en cuenta el número de puntos de datos y el número de parámetros que el modelo debe estimar para identificar el modelo. Un modelo identificado es un modelo en el que el valor de un parámetro específico identifica de forma única el modelo (definición recursiva), y no puede darse ninguna otra formulación equivalente mediante un valor de parámetro diferente. Un punto de datos es una variable con puntuaciones observadas, como una variable que contiene las puntuaciones en una pregunta o el número de veces que los encuestados compran un coche. El parámetro es el valor de interés, que puede ser un coeficiente de regresión entre la variable exógena y la endógena o la carga del factor (coeficiente de regresión entre un indicador y su factor). Si hay menos puntos de datos que el número de parámetros estimados, el modelo resultante es «no identificado», ya que hay muy pocos puntos de referencia para explicar toda la varianza del modelo. La solución es restringir una de las trayectorias a cero, lo que significa que ya no forma parte del modelo.

Estimación de parámetros libresEditar

La estimación de los parámetros se realiza comparando las matrices de covarianza reales que representan las relaciones entre las variables y las matrices de covarianza estimadas del modelo que mejor se ajusta. Esto se obtiene mediante la maximización numérica a través de la maximización de la expectativa de un criterio de ajuste, tal y como lo proporciona la estimación de máxima verosimilitud, la estimación de cuasi-máxima verosimilitud, los mínimos cuadrados ponderados o los métodos asintóticamente libres de distribución. Esto a menudo se logra mediante el uso de un programa de análisis SEM especializado, de los cuales existen varios.

Evaluación del modelo y ajuste del modeloEditar

Esta sección necesita citas adicionales para su verificación. Por favor, ayude a mejorar este artículo añadiendo citas de fuentes fiables. El material sin fuente puede ser cuestionado y eliminado. (Febrero de 2019) (Aprenda cómo y cuándo eliminar este mensaje de plantilla)

Habiendo estimado un modelo, los analistas querrán interpretar el modelo. Las trayectorias estimadas pueden tabularse y/o presentarse gráficamente como un modelo de trayectoria. El impacto de las variables se evalúa mediante reglas de trazado de trayectorias (véase análisis de trayectorias).

Es importante examinar el «ajuste» de un modelo estimado para determinar lo bien que modela los datos. Se trata de una tarea básica en la modelización SEM, que constituye la base para aceptar o rechazar modelos y, más habitualmente, para aceptar un modelo que compite con otro. El resultado de los programas SEM incluye matrices de las relaciones estimadas entre las variables del modelo. La evaluación del ajuste calcula esencialmente la similitud de los datos predichos con las matrices que contienen las relaciones en los datos reales.

Se han desarrollado pruebas estadísticas formales e índices de ajuste para estos fines. Los parámetros individuales del modelo también pueden examinarse dentro del modelo estimado para ver hasta qué punto el modelo propuesto se ajusta a la teoría de la conducción. La mayoría de los métodos de estimación, aunque no todos, hacen posible estas pruebas del modelo.

Por supuesto, como en todas las pruebas de hipótesis estadísticas, las pruebas del modelo SEM se basan en la suposición de que se han modelado los datos relevantes correctos y completos. En la literatura del SEM, la discusión sobre el ajuste ha llevado a una variedad de recomendaciones diferentes sobre la aplicación precisa de los diversos índices de ajuste y pruebas de hipótesis.

Hay diferentes enfoques para evaluar el ajuste. Los enfoques tradicionales de modelización parten de una hipótesis nula, premiando los modelos más parsimoniosos (es decir, los que tienen menos parámetros libres), hasta otros como el AIC que se centran en lo poco que se desvían los valores ajustados de un modelo saturado (es decir, lo bien que reproducen los valores medidos), teniendo en cuenta el número de parámetros libres utilizados. Dado que las diferentes medidas de ajuste capturan diferentes elementos del ajuste del modelo, es conveniente informar de una selección de diferentes medidas de ajuste. Las directrices (es decir, las «puntuaciones de corte») para interpretar las medidas de ajuste, incluidas las que se enumeran a continuación, son objeto de un gran debate entre los investigadores de SEM.

Algunas de las medidas de ajuste más utilizadas son:

  • Chi-cuadrado
    • Una medida de ajuste fundamental utilizada en el cálculo de muchas otras medidas de ajuste. Conceptualmente es una función del tamaño de la muestra y la diferencia entre la matriz de covarianza observada y la matriz de covarianza del modelo.
  • Criterio de información de Akaike (AIC)
    • Una prueba de ajuste relativo del modelo: El modelo preferido es el que tiene el valor AIC más bajo.
    • A I C = 2 k – 2 ln ( L ) {\displaystyle {\mathit {AIC}=2k-2\ln(L)\},
      {\mathit {AIC}=2k-2\ln(L)\},
    • donde k es el número de parámetros del modelo estadístico, y L es el valor maximizado de la verosimilitud del modelo.
  • Error cuadrático medio de aproximación (RMSEA)
    • Índice de ajuste donde un valor de cero indica el mejor ajuste. Aunque la pauta para determinar un «ajuste estrecho» utilizando el RMSEA es muy discutida, la mayoría de los investigadores coinciden en que un RMSEA de 0,1 o más indica un mal ajuste.
  • Raíz media residual estandarizada (SRMR)
    • El SRMR es un indicador de ajuste absoluto muy popular. Hu y Bentler (1999) sugirieron 0,08 o menos como pauta para un buen ajuste. Kline (2011) sugirió .1 o menos como pauta para un buen ajuste.
  • Índice de ajuste comparativo (CFI)
    • Al examinar las comparaciones de la línea de base, el CFI depende en gran parte del tamaño promedio de las correlaciones en los datos. Si la correlación media entre las variables no es alta, entonces el CFI no será muy alto. Un valor de CFI de 0,95 o superior es deseable.
  • Para cada medida de ajuste, la decisión sobre lo que representa un ajuste suficientemente bueno entre el modelo y los datos debe reflejar otros factores contextuales, como el tamaño de la muestra, la relación entre los indicadores y los factores, y la complejidad general del modelo. Por ejemplo, las muestras muy grandes hacen que la prueba de Chi-cuadrado sea demasiado sensible y más probable que indique una falta de ajuste entre el modelo y los datos.

    Modificación del modeloEditar

    El modelo puede necesitar ser modificado para mejorar el ajuste, estimando así las relaciones más probables entre las variables. Muchos programas proporcionan índices de modificación que pueden guiar las modificaciones menores. Los índices de modificación informan del cambio en χ² que resulta de liberar parámetros fijos: normalmente, por lo tanto, añadiendo un camino a un modelo que actualmente está fijado en cero. Las modificaciones que mejoran el ajuste del modelo pueden ser marcadas como cambios potenciales que pueden hacerse al modelo. Las modificaciones de un modelo, especialmente del modelo estructural, son cambios en la teoría que se pretende que sea verdadera. Por lo tanto, las modificaciones deben tener sentido en términos de la teoría que se está probando, o ser reconocidas como limitaciones de esa teoría. Los cambios en el modelo de medición son efectivamente afirmaciones de que los ítems/datos son indicadores impuros de las variables latentes especificadas por la teoría.

    Los modelos no deben ser dirigidos por el IM, como demostró Maccallum (1986): «incluso en condiciones favorables, los modelos que surgen de la búsqueda de especificaciones deben considerarse con precaución.»

    Tamaño de la muestra y potenciaEditar

    Aunque los investigadores están de acuerdo en que se requieren tamaños de muestra grandes para proporcionar una potencia estadística suficiente y estimaciones precisas utilizando el SEM, no existe un consenso general sobre el método apropiado para determinar el tamaño de muestra adecuado. En general, las consideraciones para determinar el tamaño de la muestra incluyen el número de observaciones por parámetro, el número de observaciones necesarias para que los índices de ajuste funcionen adecuadamente y el número de observaciones por grado de libertad. Los investigadores han propuesto directrices basadas en estudios de simulación, en la experiencia profesional y en fórmulas matemáticas.

    Los requisitos de tamaño de la muestra para alcanzar una determinada significación y potencia en las pruebas de hipótesis del SEM son similares para el mismo modelo cuando se utiliza cualquiera de los tres algoritmos (PLS-PA, LISREL o sistemas de ecuaciones de regresión) para las pruebas.

    Interpretación y comunicaciónEditar

    El conjunto de modelos se interpreta entonces para poder hacer afirmaciones sobre los constructos, basándose en el modelo que mejor se ajuste.

    Siempre hay que tener precaución al hacer afirmaciones de causalidad, incluso cuando se han hecho estudios de experimentación o de orden temporal. El término modelo causal debe entenderse como «un modelo que transmite supuestos causales», no necesariamente un modelo que produce conclusiones causales validadas. La recogida de datos en múltiples puntos temporales y el uso de un diseño experimental o cuasi-experimental pueden ayudar a descartar ciertas hipótesis rivales, pero incluso un experimento aleatorio no puede descartar todas esas amenazas a la inferencia causal. Un buen ajuste de un modelo consistente con una hipótesis causal implica invariablemente un ajuste igualmente bueno de otro modelo consistente con una hipótesis causal opuesta. Ningún diseño de investigación, por muy inteligente que sea, puede ayudar a distinguir tales hipótesis rivales, salvo los experimentos de intervención.

    Como en cualquier ciencia, la replicación posterior y quizás la modificación procederán del hallazgo inicial.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *