Chi-kwadraat  
 

Met behulp van de Chi-kwadraat verdeling kan je statistisch verantwoord kijken of twee verschijnselen afhankelijk of onafhankelijk van elkaar zijn. Je gaat altijd uit van onafhankelijkheid tussen de twee aspecten ( de zogenaamde H0 hyphothese). Dan toets je met een foutmarge ( vaak α= 0,05) of de hyphothese op basis van de steekproef kan worden aangenomen of worden verworpen.
Voorbeeld opgave
Een leerling wilt weten of er samenhang is tussen geslacht en collegebezoek.  Hij heeft de volgende frequenties waargenomen:

  man vrouw totaal
minder dan 60% 8 4 12
60 tot 70 % 22 12 34
70 tot 80 % 28 34 62
80 tot 90 % 26 31 57
90 tot 100 % 11 11 22
totaal 95 92 187

Tabel 1: observed frequencies


Om deze opgave op te lossen, maken we eerst de hypotheses:

Ho: Geslacht en aanwezigheidspercentage bij colleges zijn onafhankelijk
H1: Geslacht en aanwezigheidspercentage bij colleges zijn afhankelijk

Nu begin je met het maken van de theoretische frequeties. Neem het bovenstaande tabel over en laat alleen de totalen staan. Dit gaat er als volgt uitzien:

 

man

vrouw

totaal

minder dan 60%

 

 

12

60 tot 70 %

 

 

34

70 tot 80 %

 

 

62

80 tot 90 %

 

 

57

90 tot 100 %

 

 

22

totaal

95

92

187

Tabel 2


De theoretische frequeties, of terwijl de verwachtte frequeties, zijn als volgt te berekenen. Hoeveel mannen volgen minder dan 60% les? De kans op een man is 95/187
De kans dat je iemand treft die minder dan 60% les volgt is 12/187
Dus de kans luidt als volgt: 95/187 x 12/187= 0,0326
De kans dat we iemand tegen komen die minder dan 60% lessen volgt en man is, is dus:
0,0326 x 187 =6,096
Dit kan gemakkelijker berekend worden door:  95 x 12 / 187 = 6,096
Dit doe je vervolgens met alle lege vakjes en vul je het tabel geheel in. Dat ziet er dan als volgt uit:

 

man

vrouw

totaal

minder dan 60%

6,096

5,904

12

60 tot 70 %

17,273

16,727

34

70 tot 80 %

31,497

30,503

62

80 tot 90 %

28,957

28,043

57

90 tot 100 %

11,176

10,824

22

totaal

95

92

187

Tabel 3: expected frequencies

We gaan nu met de chi-kwadraat-toets toetsen of geslacht en aanwezigheid onafhankelijk of afhankelijk zijn. De foutmarge is a=0,05

De chi-kwadraat wordt als volgt berekent:

Hierbij staat c voor: observed x( tabel 1) en d staat voor expected x( tabel 3)

r r wq

w 5,828

Door afronding kan je iets anders uitkomen.  Om te onderzoeken of dit getal te veel of te weinig is, heb je de chi-kwadraat verdeling nodig. Deze is te vinden onder ‘tabellen’. De grenswaarde tussen accepteren van H0( onafhankelijkheid) en verwerpen van H0 kan je vinden in dit tabel. De rechteroverschreidingskans is α=0,05
Het aantal vrijheidsgraden kan je berekenen: (aantal rijen – 1) x (aantal kolommen -1)
In dit geval hebben zijn er dus 5 vrijheidsgraden.
Dan kun je aflezen in het tabel hgrens= 11,070
5,828<11,070 dus verwerpen we H0 niet!

 
     
     
     
     
     
     
     
     
     
     
     
 
Copyright © 2011 Andreas Pohan Simandjuntak