Goodness of Fit Test: Wat is het?

Delen op

Statistiekdefinities > Goodness of Fit Tests

De goodness of fit test wordt gebruikt om te testen of steekproefgegevens passen bij een verdeling uit een bepaalde populatie (d.w.z.d.w.z. een populatie met een normale verdeling of een met een Weibull-verdeling). Met andere woorden, het vertelt u of uw steekproefgegevens de gegevens vertegenwoordigen die u zou verwachten te vinden in de werkelijke populatie. Veelgebruikte goodness of fit-tests in de statistiek zijn:

  • De chi-kwadraat.
  • Kolmogorov-Smirnov.
  • Anderson-Darling.
  • Shipiro-Wilk.

De Chi Square Goodness of Fit Test

goodness of fit

De chi-kwadraatformule.

De chi-kwadraattoets is de meest gebruikelijke van de goodness of fit-toetsen en is degene die je zult tegenkomen in AP-statistiek of elementaire statistiek. De chi-kwadraat kan worden gebruikt voor discrete verdelingen zoals de binomiale verdeling en de Poisson verdeling, terwijl de Kolmogorov-Smirnov en Anderson-Darling goodness of fit tests alleen kunnen worden gebruikt voor continue verdelingen.

Twee mogelijke nadelen van chi-kwadraat zijn:

  1. De chi-kwadraat test kan alleen worden gebruikt voor gegevens die in klassen (bins) zijn ingedeeld. Als je gegevens hebt die niet in bins zijn ingedeeld, moet je een frequentietabel of histogram maken voordat je de test uitvoert.
  2. Een ander nadeel van de chi-kwadraattoets is dat er een voldoende grote steekproef nodig is om de chi-kwadraatbenadering geldig te laten zijn.

Er is nog een ander type chi-kwadraattoets, de chi-kwadraattoets voor onafhankelijkheid genoemd. De twee worden soms verward, maar ze zijn heel verschillend.

  • De chi-kwadraattoets voor onafhankelijkheid vergelijkt twee reeksen gegevens om te zien of er een verband is.
  • De chi-kwadraattoets voor goodness of fit is het inpassen van één categorische variabele in een verdeling.

Beide tests maken gebruik van de chi-kwadraat statistiek en de verdeling. Voor meer informatie over het berekenen van de chi kwadraat statistiek, zie:
De chi kwadraat test statistiek (inclusief berekeningen): Wat is een chi kwadraat statistiek?

Uitvoeren van de test

Typisch wordt deze test uitgevoerd met behulp van software. De nulhypothese voor de chi-kwadraat goodness of fit test is dat de gegevens afkomstig zijn van een bepaalde verdeling. De alternatieve hypothese is dat de gegevens niet uit een bepaalde verdeling komen.

Om de test te interpreteren, moet u een alfa-niveau kiezen (1%, 5% en 10% zijn gebruikelijk). De chi-kwadraat toets zal een p-waarde opleveren. Als de p-waarde klein is (kleiner dan het significantieniveau), kunt u de nulhypothese verwerpen dat de gegevens afkomstig zijn van de gespecificeerde verdeling.

Minder gebruikelijke goodness of fit-tests gebruikt in elementaire statistiek

Kolmogorov-Smirnov

Hoewel dit een normaliteitstest wordt genoemd, vertelt hij u eigenlijk niet of een bepaald monster waarschijnlijk afkomstig is van een normale populatie. In plaats daarvan vertelt hij je wanneer het onwaarschijnlijk is dat er sprake is van een normale verdeling. Een voordeel van deze test is dat hij geen veronderstellingen maakt over de verdeling van de gegevens. Een steekproef kan worden vergeleken met een verdeling met behulp van een one-sample K-S test of two-sample K-S test. De test wordt meestal uitgevoerd met behulp van software (zoals SPSS), omdat voor elke verdeling kritische waarden moeten worden berekend en het vinden van de tabellen met kritische waarden geen gemakkelijke opgave is. De test wordt gewoonlijk aanbevolen voor grote steekproeven van meer dan 2000. Voor kleinere steekproeven gebruikt u Shapiro-Wilk.

Anderson-Darling

Deze test is een modificatie van Kolmogorov-Smirnov. Hij is gevoeliger voor afwijkingen in de staarten van een verdeling. Net als de Kolmogorov-Smirnov vertelt deze test u wanneer het onwaarschijnlijk is dat u een normale verdeling hebt en hij wordt normaal uitgevoerd met statistische software.

Shapiro-Wilk

Deze test berekent een W-waarde die u vertelt of een willekeurige steekproef afkomstig is van een normaal verdeelde populatie. De test wordt aanbevolen voor steekproeven tot n=2000.

Beyer, W. H. CRC Standard Mathematical Tables, 31st ed. Boca Raton, FL: CRC Press, pp. 536 en 571, 2002.
Dodge, Y. (2008). De Beknopte Encyclopedie van de Statistiek. Springer.
Gonick, L. (1993). The Cartoon Guide to Statistics. HarperPerennial.
Vogt, W.P. (2005). Woordenboek van de Statistiek & Methodologie: A Nontechnical Guide for the Social Sciences. SAGE.


CITE THIS AS:
Stephanie Glen. “Goodness of Fit Test: Wat is het?” Van StatisticsHowTo.com: Elementaire Statistiek voor de rest van ons! https://www.statisticshowto.com/goodness-of-fit-test/

——————————————————————————

Heb je hulp nodig bij een huiswerk of toetsvraag? Met Chegg Study kunt u stap-voor-stap oplossingen voor uw vragen krijgen van een expert op dit gebied. Uw eerste 30 minuten met een Chegg-leraar zijn gratis!

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *