Strukturgleichungsmodellierung

Obwohl jede Technik in der SEM-Familie unterschiedlich ist, sind die folgenden Aspekte vielen SEM-Methoden gemeinsam.

ModellspezifikationBearbeiten

In der SEM werden zwei Hauptkomponenten von Modellen unterschieden: das Strukturmodell, das mögliche kausale Abhängigkeiten zwischen endogenen und exogenen Variablen zeigt, und das Messmodell, das die Beziehungen zwischen latenten Variablen und ihren Indikatoren darstellt. Explorative und konfirmatorische Faktorenanalysemodelle enthalten z. B. nur den Messteil, während Pfaddiagramme als SEMs angesehen werden können, die nur den strukturellen Teil enthalten.

Bei der Spezifikation von Pfaden in einem Modell kann der Modellierer zwei Arten von Beziehungen postulieren: (1) freie Pfade, in denen hypothetische kausale (eigentlich kontrafaktische) Beziehungen zwischen Variablen getestet werden und daher „frei“ variiert werden können, und (2) Beziehungen zwischen Variablen, die bereits eine geschätzte Beziehung haben, normalerweise basierend auf früheren Studien, die im Modell „fixiert“ sind.

Ein Modellierer wird oft eine Reihe von theoretisch plausiblen Modellen spezifizieren, um zu beurteilen, ob das vorgeschlagene Modell das beste aus der Menge der möglichen Modelle ist. Der Modellierer muss nicht nur die theoretischen Gründe für die Erstellung des Modells so berücksichtigen, wie es ist, sondern auch die Anzahl der Datenpunkte und die Anzahl der Parameter, die das Modell schätzen muss, um das Modell zu identifizieren. Ein identifiziertes Modell ist ein Modell, bei dem ein bestimmter Parameterwert das Modell eindeutig identifiziert (rekursive Definition), und keine andere äquivalente Formulierung durch einen anderen Parameterwert gegeben werden kann. Ein Datenpunkt ist eine Variable mit beobachteten Werten, wie z. B. eine Variable, die die Werte bei einer Frage enthält oder die Anzahl, wie oft die Befragten ein Auto kaufen. Der Parameter ist der interessierende Wert, der ein Regressionskoeffizient zwischen der exogenen und der endogenen Variable oder die Faktorladung (Regressionskoeffizient zwischen einem Indikator und seinem Faktor) sein kann. Wenn es weniger Datenpunkte als die Anzahl der geschätzten Parameter gibt, ist das resultierende Modell „unidentifiziert“, da es zu wenige Bezugspunkte gibt, um die gesamte Varianz im Modell zu berücksichtigen. Die Lösung besteht darin, einen der Pfade auf Null zu beschränken, was bedeutet, dass er nicht mehr Teil des Modells ist.

Schätzung der freien ParameterBearbeiten

Die Schätzung der Parameter erfolgt durch den Vergleich der tatsächlichen Kovarianzmatrizen, die die Beziehungen zwischen den Variablen darstellen, mit den geschätzten Kovarianzmatrizen des am besten passenden Modells. Dies wird durch numerische Maximierung über Erwartungsmaximierung eines Anpassungskriteriums erreicht, wie es durch Maximum-Likelihood-Schätzung, Quasi-Maximum-Likelihood-Schätzung, gewichtete kleinste Quadrate oder asymptotisch verteilungsfreie Methoden bereitgestellt wird. Dies wird oft durch die Verwendung eines speziellen SEM-Analyseprogramms erreicht, von denen es mehrere gibt.

Bewertung des Modells und der Modellanpassung

Dieser Abschnitt benötigt zusätzliche Zitate zur Verifizierung. Bitte helfen Sie, diesen Artikel zu verbessern, indem Sie Zitate zu zuverlässigen Quellen hinzufügen. Nicht quellifiziertes Material kann angefochten und entfernt werden. (Februar 2019) (Erfahren Sie, wie und wann Sie diese Vorlage entfernen können)

Nachdem ein Modell geschätzt wurde, möchten Analysten das Modell interpretieren. Geschätzte Pfade können tabellarisch und/oder grafisch als Pfadmodell dargestellt werden. Der Einfluss von Variablen wird mit Hilfe von Pfadverfolgungsregeln beurteilt (siehe Pfadanalyse).

Es ist wichtig, den „Fit“ eines geschätzten Modells zu untersuchen, um festzustellen, wie gut es die Daten modelliert. Dies ist eine grundlegende Aufgabe bei der SEM-Modellierung und bildet die Grundlage für die Annahme oder Ablehnung von Modellen und, was üblicherweise der Fall ist, für die Annahme eines konkurrierenden Modells gegenüber einem anderen. Die Ausgabe von SEM-Programmen enthält Matrizen der geschätzten Beziehungen zwischen den Variablen im Modell. Die Bewertung der Passung berechnet im Wesentlichen, wie ähnlich die vorhergesagten Daten den Matrizen sind, die die Beziehungen in den tatsächlichen Daten enthalten.

Für diese Zwecke wurden formale statistische Tests und Passungsindizes entwickelt. Einzelne Parameter des Modells können auch innerhalb des geschätzten Modells untersucht werden, um zu sehen, wie gut das vorgeschlagene Modell mit der Fahrtheorie übereinstimmt. Die meisten, wenn auch nicht alle, Schätzverfahren ermöglichen solche Tests des Modells.

Natürlich basieren SEM-Modelltests wie alle statistischen Hypothesentests auf der Annahme, dass die richtigen und vollständigen relevanten Daten modelliert wurden. In der SEM-Literatur hat die Diskussion über den Fit zu einer Vielzahl unterschiedlicher Empfehlungen über die genaue Anwendung der verschiedenen Fit-Indizes und Hypothesentests geführt.

Es gibt unterschiedliche Ansätze zur Beurteilung des Fit. Traditionelle Ansätze gehen von einer Nullhypothese aus und belohnen einfachere Modelle (d.h. solche mit weniger freien Parametern), bis hin zu anderen Ansätzen wie AIC, die sich darauf konzentrieren, wie wenig die angepassten Werte von einem gesättigten Modell abweichen (d.h. wie gut sie die Messwerte reproduzieren), wobei die Anzahl der verwendeten freien Parameter berücksichtigt wird. Da verschiedene Anpassungsmaße unterschiedliche Elemente der Modellanpassung erfassen, ist es sinnvoll, eine Auswahl verschiedener Anpassungsmaße anzugeben. Richtlinien (d.h. „Cutoff-Scores“) für die Interpretation von Fit-Maßen, einschließlich der unten aufgeführten, sind Gegenstand vieler Diskussionen unter SEM-Forschern.

Zu den am häufigsten verwendeten Fit-Maßen gehören:

  • Chi-Quadrat
    • Ein grundlegendes Fit-Maß, das bei der Berechnung vieler anderer Fit-Maße verwendet wird. Konzeptionell ist es eine Funktion des Stichprobenumfangs und der Differenz zwischen der beobachteten Kovarianzmatrix und der Modell-Kovarianzmatrix.
  • Akaike Informationskriterium (AIC)
    • Ein Test der relativen Modellanpassung: Das bevorzugte Modell ist dasjenige mit dem niedrigsten AIC-Wert.
    • A I C = 2 k – 2 ln ( L ) {\displaystyle {\mathit {AIC}}=2k-2\ln(L)\,}
      {\mathit {AIC}}=2k-2\ln(L)\,
    • wobei k die Anzahl der Parameter im statistischen Modell ist und L der maximierte Wert der Wahrscheinlichkeit des Modells ist.
  • Root Mean Square Error of Approximation (RMSEA)
    • Fit-Index, wobei ein Wert von Null die beste Anpassung anzeigt. Während die Richtlinie zur Bestimmung einer „engen Passung“ unter Verwendung des RMSEA sehr umstritten ist, stimmen die meisten Forscher darin überein, dass ein RMSEA von 0,1 oder mehr eine schlechte Passung anzeigt.
  • Standardized Root Mean Residual (SRMR)
    • Die SRMR ist ein beliebter Indikator für die absolute Anpassung. Hu und Bentler (1999) schlugen .08 oder kleiner als Richtwert für eine gute Passung vor. Kline (2011) schlug .1 oder kleiner als Richtwert für guten Fit vor.
  • Comparative Fit Index (CFI)
    • Bei der Untersuchung von Basislinienvergleichen hängt der CFI zu einem großen Teil von der durchschnittlichen Größe der Korrelationen in den Daten ab. Wenn die durchschnittliche Korrelation zwischen den Variablen nicht hoch ist, dann wird der CFI nicht sehr hoch sein. Ein CFI-Wert von .95 oder höher ist wünschenswert.

Für jedes Anpassungsmaß muss eine Entscheidung darüber, was eine ausreichend gute Anpassung zwischen dem Modell und den Daten darstellt, andere kontextbezogene Faktoren wie die Stichprobengröße, das Verhältnis von Indikatoren zu Faktoren und die Gesamtkomplexität des Modells berücksichtigen. Zum Beispiel machen sehr große Stichproben den Chi-Quadrat-Test übermäßig empfindlich und zeigen eher eine mangelnde Anpassung des Modells an die Daten an.

ModellmodifikationBearbeiten

Das Modell muss möglicherweise modifiziert werden, um die Passung zu verbessern und damit die wahrscheinlichsten Beziehungen zwischen den Variablen zu schätzen. Viele Programme stellen Modifikationsindizes zur Verfügung, die kleinere Modifikationen anleiten können. Modifikationsindizes geben die Änderung in χ² an, die sich aus dem Freigeben fester Parameter ergibt: in der Regel also das Hinzufügen eines Pfades zu einem Modell, der derzeit auf Null gesetzt ist. Modifikationen, die die Modellanpassung verbessern, können als potenzielle Änderungen, die am Modell vorgenommen werden können, gekennzeichnet werden. Änderungen an einem Modell, insbesondere am Strukturmodell, sind Änderungen an der Theorie, die als wahr behauptet wird. Änderungen müssen daher im Hinblick auf die getestete Theorie sinnvoll sein oder als Einschränkungen dieser Theorie anerkannt werden. Änderungen am Messmodell sind effektiv Behauptungen, dass die Items/Daten unreine Indikatoren für die von der Theorie spezifizierten latenten Variablen sind.

Modelle sollten nicht von MI geleitet werden, wie Maccallum (1986) zeigte: „Selbst unter günstigen Bedingungen müssen Modelle, die aus Spezifikationssuchen hervorgehen, mit Vorsicht betrachtet werden.“

Stichprobengröße und PowerEdit

Während sich die Forscher einig sind, dass große Stichprobengrößen erforderlich sind, um eine ausreichende statistische Power und präzise Schätzungen mittels SEM zu erhalten, gibt es keinen allgemeinen Konsens über die geeignete Methode zur Bestimmung einer angemessenen Stichprobengröße. Im Allgemeinen umfassen die Überlegungen zur Bestimmung des Stichprobenumfangs die Anzahl der Beobachtungen pro Parameter, die Anzahl der Beobachtungen, die erforderlich sind, damit die Anpassungsindizes eine angemessene Leistung erbringen, und die Anzahl der Beobachtungen pro Freiheitsgrad. Forscher haben Richtlinien vorgeschlagen, die auf Simulationsstudien, beruflicher Erfahrung und mathematischen Formeln basieren.

Die Anforderungen an die Stichprobengröße, um eine bestimmte Signifikanz und Power beim SEM-Hypothesentest zu erreichen, sind für dasselbe Modell ähnlich, wenn einer der drei Algorithmen (PLS-PA, LISREL oder Systeme von Regressionsgleichungen) zum Testen verwendet wird.

Interpretation und Kommunikation

Der Satz von Modellen wird dann interpretiert, so dass auf der Grundlage des am besten passenden Modells Aussagen über die Konstrukte gemacht werden können.

Bei Kausalitätsaussagen ist immer Vorsicht geboten, auch wenn Experimente oder zeitlich geordnete Studien durchgeführt wurden. Der Begriff Kausalmodell muss als „ein Modell, das kausale Annahmen vermittelt“ verstanden werden, nicht notwendigerweise als ein Modell, das validierte kausale Schlussfolgerungen liefert. Das Sammeln von Daten zu mehreren Zeitpunkten und die Verwendung eines experimentellen oder quasi-experimentellen Designs kann helfen, bestimmte konkurrierende Hypothesen auszuschließen, aber selbst ein randomisiertes Experiment kann nicht alle derartigen Bedrohungen für die kausale Inferenz ausschließen. Eine gute Anpassung eines Modells, das mit einer Kausalhypothese übereinstimmt, zieht unweigerlich eine ebenso gute Anpassung eines anderen Modells nach sich, das mit einer entgegengesetzten Kausalhypothese übereinstimmt. Kein noch so ausgeklügeltes Forschungsdesign kann helfen, solche rivalisierenden Hypothesen zu unterscheiden, mit Ausnahme von Interventionsexperimenten.

Wie in jeder Wissenschaft wird eine spätere Replikation und vielleicht eine Modifikation von dem ursprünglichen Ergebnis ausgehen.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.