Mimo że każda technika z rodziny SEM jest inna, następujące aspekty są wspólne dla wielu metod SEM.
Specyfikacja modeluEdit
W SEM wyróżnia się dwa główne składniki modeli: model strukturalny pokazujący potencjalne zależności przyczynowe między zmiennymi endogenicznymi i egzogenicznymi oraz model pomiaru pokazujący relacje między zmiennymi ukrytymi i ich wskaźnikami. Na przykład, modele eksploracyjnej i konfirmacyjnej analizy czynnikowej zawierają tylko część pomiarową, podczas gdy diagramy ścieżek mogą być postrzegane jako SEM, które zawierają tylko część strukturalną.
W określaniu ścieżek w modelu, modeler może wprowadzić dwa rodzaje relacji: (1) ścieżki swobodne, w których testowane są hipotetyczne związki przyczynowe (w rzeczywistości kontrfaktyczne) między zmiennymi, a zatem pozostawia się je „swobodnie” do zmiany, oraz (2) związki między zmiennymi, które mają już oszacowany związek, zwykle na podstawie wcześniejszych badań, które są „ustalone” w modelu.
Modelarz często określa zbiór teoretycznie prawdopodobnych modeli, aby ocenić, czy zaproponowany model jest najlepszy ze zbioru możliwych modeli. Modelarz musi nie tylko uwzględnić teoretyczne powody zbudowania modelu w taki sposób, jak jest, ale musi również wziąć pod uwagę liczbę punktów danych i liczbę parametrów, które model musi oszacować, aby zidentyfikować model. Model zidentyfikowany to model, w którym określona wartość parametru jednoznacznie identyfikuje model (definicja rekurencyjna), a żadna inna równoważna formuła nie może być podana przez inną wartość parametru. Punkt danych jest zmienną z obserwowanymi wynikami, jak zmienna zawierająca wyniki na pytanie lub liczbę razy, kiedy respondenci kupują samochód. Parametr jest wartością zainteresowania, którą może być współczynnik regresji pomiędzy zmienną egzogeniczną i endogeniczną lub ładunek czynnika (współczynnik regresji pomiędzy wskaźnikiem i jego czynnikiem). Jeżeli liczba punktów danych jest mniejsza niż liczba oszacowanych parametrów, model wynikowy jest „niezidentyfikowany”, ponieważ jest zbyt mało punktów odniesienia, aby objąć całą wariancję w modelu. Rozwiązaniem jest ograniczenie jednej ze ścieżek do zera, co oznacza, że nie jest ona już częścią modelu.
Oszacowanie wolnych parametrówEdit
Oszacowanie parametrów odbywa się poprzez porównanie rzeczywistych macierzy kowariancji reprezentujących zależności między zmiennymi i oszacowanych macierzy kowariancji najlepiej dopasowanego modelu. Jest to uzyskiwane poprzez numeryczną maksymalizację poprzez maksymalizację oczekiwaną kryterium dopasowania, jak przewidziano w estymacji maksymalnej wiarygodności, estymacji quasi-maksymalnej wiarygodności, ważonych najmniejszych kwadratów lub metod asymptotycznie wolnych od rozkładu. Jest to często osiągane przy użyciu specjalistycznego programu do analizy SEM, których jest kilka.
Ocena dopasowania modelu i modeluEdit
Oszacowawszy model, analitycy będą chcieli go zinterpretować. Oszacowane ścieżki mogą być tabelaryczne i/lub przedstawione graficznie jako model ścieżkowy. Wpływ zmiennych jest oceniany przy użyciu reguł śledzenia ścieżek (patrz analiza ścieżek).
Ważne jest zbadanie „dopasowania” oszacowanego modelu, aby określić, jak dobrze modeluje on dane. Jest to podstawowe zadanie w modelowaniu SEM, stanowiące podstawę do akceptowania lub odrzucania modeli, a częściej do akceptowania jednego konkurencyjnego modelu nad innym. Wyjściem programów SEM są macierze szacowanych zależności pomiędzy zmiennymi w modelu. Ocena dopasowania zasadniczo oblicza, jak podobne są przewidywane dane do macierzy zawierających zależności w danych rzeczywistych.
Do tych celów opracowano formalne testy statystyczne i indeksy dopasowania. Poszczególne parametry modelu mogą być również badane w ramach modelu szacunkowego w celu sprawdzenia, jak dobrze proponowany model pasuje do teorii jazdy. Większość metod estymacji, choć nie wszystkie, umożliwia takie testy modelu.
Oczywiście, jak w przypadku wszystkich testów hipotez statystycznych, testy modeli SEM opierają się na założeniu, że prawidłowe i kompletne odpowiednie dane zostały wymodelowane. W literaturze dotyczącej SEM, dyskusja na temat dopasowania doprowadziła do wielu różnych zaleceń dotyczących dokładnego zastosowania różnych wskaźników dopasowania i testów hipotez.
Istnieją różne podejścia do oceny dopasowania. Tradycyjne podejścia do modelowania rozpoczynają się od hipotezy zerowej, nagradzając bardziej oszczędne modele (tj. te z mniejszą liczbą wolnych parametrów), do innych, takich jak AIC, które koncentrują się na tym, jak mało dopasowane wartości odbiegają od modelu nasyconego (tj. jak dobrze odtwarzają zmierzone wartości), biorąc pod uwagę liczbę użytych wolnych parametrów. Ponieważ różne miary dopasowania wychwytują różne elementy dopasowania modelu, właściwe jest zgłaszanie wyboru różnych miar dopasowania. Wytyczne (tj. „wyniki odcięcia”) dotyczące interpretacji miar dopasowania, w tym tych wymienionych poniżej, są przedmiotem wielu debat wśród badaczy SEM.
Kilka z częściej stosowanych miar dopasowania obejmuje:
- Chi-kwadrat
- Podstawowa miara dopasowania używana do obliczania wielu innych miar dopasowania. Konceptualnie jest to funkcja wielkości próby i różnicy pomiędzy obserwowaną macierzą kowariancji a macierzą kowariancji modelu.
- Kryterium informacyjne Akaike (AIC)
- Test względnego dopasowania modelu: Preferowany model to ten, który ma najniższą wartość AIC.
- A I C = 2 k – 2 ln ( L ) {{displaystyle {{mathit {AIC}}=2k-2ln(L)},}
- gdzie k jest liczbą parametrów w modelu statystycznym, a L jest zmaksymalizowaną wartością prawdopodobieństwa modelu.
- Root Mean Square Error of Approximation (RMSEA)
- Wskaźnik dopasowania, gdzie wartość zero oznacza najlepsze dopasowanie. Chociaż wytyczne dotyczące określania „bliskiego dopasowania” przy użyciu RMSEA są wysoce sporne, większość badaczy zgadza się, że RMSEA równa .1 lub więcej wskazuje na słabe dopasowanie.
- Standardized Root Mean Residual (SRMR)
- SRMR jest popularnym wskaźnikiem dopasowania bezwzględnego. Hu i Bentler (1999) zasugerowali wartość .08 lub mniejszą jako wskazówkę dla dobrego dopasowania. Kline (2011) zasugerował wartość .1 lub mniejszą jako wskazówkę dla dobrego dopasowania.
- Wskaźnik dopasowania porównawczego (CFI)
- W badaniu porównań bazowych, CFI zależy w dużej mierze od średniej wielkości korelacji w danych. Jeśli średnia korelacja między zmiennymi nie jest wysoka, wówczas współczynnik CFI nie będzie bardzo wysoki. Pożądana jest wartość CFI równa .95 lub wyższa.
Dla każdej miary dopasowania, decyzja, co stanowi dobre-dostateczne dopasowanie między modelem a danymi musi odzwierciedlać inne czynniki kontekstowe, takie jak wielkość próby, stosunek wskaźników do czynników oraz ogólną złożoność modelu. Na przykład, bardzo duże próby sprawiają, że test Chi-kwadrat jest zbyt czuły i bardziej prawdopodobne jest, że wskaże brak dopasowania modelu do danych.
Modyfikacja modeluEdit
Model może wymagać modyfikacji w celu poprawy dopasowania, a tym samym oszacowania najbardziej prawdopodobnych zależności między zmiennymi. Wiele programów udostępnia wskaźniki modyfikacji, które mogą być wskazówką dla drobnych modyfikacji. Wskaźniki modyfikacji informują o zmianie χ², która wynika z uwolnienia stałych parametrów: zazwyczaj jest to dodanie ścieżki do modelu, która obecnie jest ustawiona na zero. Modyfikacje, które poprawiają dopasowanie modelu mogą być oznaczone jako potencjalne zmiany, które mogą być wprowadzone do modelu. Modyfikacje modelu, zwłaszcza modelu strukturalnego, są zmianami w teorii, która ma być prawdziwa. Modyfikacje muszą więc mieć sens z punktu widzenia testowanej teorii lub być uznane za jej ograniczenia. Zmiany w modelu pomiaru są w rzeczywistości twierdzeniami, że pozycje/dane są nieczystymi wskaźnikami zmiennych ukrytych określonych przez teorię.
Modele nie powinny być prowadzone przez MI, jak wykazał Maccallum (1986): „nawet w sprzyjających warunkach, modele wynikające z przeszukiwania specyfikacji muszą być postrzegane z ostrożnością.”
Wielkość próby i mocEdit
Choć badacze zgadzają się, że duże liczebności prób są wymagane do zapewnienia wystarczającej mocy statystycznej i precyzyjnych oszacowań przy użyciu SEM, nie ma ogólnej zgody co do właściwej metody określania odpowiedniej wielkości próby. Ogólnie rzecz biorąc, rozważania dotyczące określenia wielkości próby obejmują liczbę obserwacji na parametr, liczbę obserwacji wymaganą, aby indeksy dopasowania działały odpowiednio, oraz liczbę obserwacji na stopień swobody. Naukowcy zaproponowali wytyczne oparte na badaniach symulacyjnych, doświadczeniu zawodowym i wzorach matematycznych.
Wymagania dotyczące wielkości próby w celu osiągnięcia określonej istotności i mocy w testowaniu hipotez SEM są podobne dla tego samego modelu, gdy do testowania używany jest którykolwiek z trzech algorytmów (PLS-PA, LISREL lub układy równań regresji).
Interpretacja i komunikacjaEdit
Zestaw modeli jest następnie interpretowany tak, aby można było wysunąć twierdzenia dotyczące konstruktów, w oparciu o najlepiej dopasowany model.
Zawsze należy zachować ostrożność przy wysuwaniu twierdzeń o przyczynowości, nawet jeśli przeprowadzono eksperymenty lub badania uporządkowane w czasie. Termin model przyczynowy należy rozumieć jako „model, który przekazuje założenia przyczynowe”, niekoniecznie jako model, który daje potwierdzone wnioski przyczynowe. Zbieranie danych w wielu punktach czasowych i stosowanie eksperymentalnego lub quasi-eksperymentalnego projektu może pomóc wykluczyć pewne rywalizujące hipotezy, ale nawet randomizowany eksperyment nie może wykluczyć wszystkich takich zagrożeń dla wnioskowania przyczynowego. Dobre dopasowanie modelu zgodnego z jedną hipotezą przyczynową niezmiennie pociąga za sobą równie dobre dopasowanie innego modelu zgodnego z przeciwstawną hipotezą przyczynową. Żaden projekt badawczy, nieważne jak sprytny, nie może pomóc w rozróżnieniu takich rywalizujących hipotez, z wyjątkiem eksperymentów interwencyjnych.
Jak w każdej nauce, kolejne replikacje i być może modyfikacje będą wynikać z początkowego odkrycia.