| |
Met behulp van de Chi-kwadraat verdeling kan je statistisch verantwoord kijken of twee verschijnselen afhankelijk of onafhankelijk van elkaar zijn. Je gaat altijd uit van onafhankelijkheid tussen de twee aspecten ( de zogenaamde H0 hyphothese). Dan toets je met een foutmarge ( vaak α= 0,05) of de hyphothese op basis van de steekproef kan worden aangenomen of worden verworpen.
Voorbeeld opgave
Een leerling wilt weten of er samenhang is tussen geslacht en collegebezoek. Hij heeft de volgende frequenties waargenomen:
| |
man |
vrouw |
totaal |
| minder dan 60% |
8 |
4 |
12 |
| 60 tot 70 % |
22 |
12 |
34 |
| 70 tot 80 % |
28 |
34 |
62 |
| 80 tot 90 % |
26 |
31 |
57 |
| 90 tot 100 % |
11 |
11 |
22 |
| totaal |
95 |
92 |
187 |
Tabel 1: observed frequencies
Om deze opgave op te lossen, maken we eerst de hypotheses:
Ho: Geslacht en aanwezigheidspercentage bij colleges zijn onafhankelijk
H1: Geslacht en aanwezigheidspercentage bij colleges zijn afhankelijk
Nu begin je met het maken van de theoretische frequeties. Neem het bovenstaande tabel over en laat alleen de totalen staan. Dit gaat er als volgt uitzien:
|
man |
vrouw |
totaal |
minder dan 60% |
|
|
12 |
60 tot 70 % |
|
|
34 |
70 tot 80 % |
|
|
62 |
80 tot 90 % |
|
|
57 |
90 tot 100 % |
|
|
22 |
totaal |
95 |
92 |
187 |
Tabel 2
De theoretische frequeties, of terwijl de verwachtte frequeties, zijn als volgt te berekenen. Hoeveel mannen volgen minder dan 60% les? De kans op een man is 95/187
De kans dat je iemand treft die minder dan 60% les volgt is 12/187
Dus de kans luidt als volgt: 95/187 x 12/187= 0,0326
De kans dat we iemand tegen komen die minder dan 60% lessen volgt en man is, is dus:
0,0326 x 187 =6,096
Dit kan gemakkelijker berekend worden door: 95 x 12 / 187 = 6,096
Dit doe je vervolgens met alle lege vakjes en vul je het tabel geheel in. Dat ziet er dan als volgt uit:
|
man |
vrouw |
totaal |
minder dan 60% |
6,096 |
5,904 |
12 |
60 tot 70 % |
17,273 |
16,727 |
34 |
70 tot 80 % |
31,497 |
30,503 |
62 |
80 tot 90 % |
28,957 |
28,043 |
57 |
90 tot 100 % |
11,176 |
10,824 |
22 |
totaal |
95 |
92 |
187 |
Tabel 3: expected frequencies
We gaan nu met de chi-kwadraat-toets toetsen of geslacht en aanwezigheid onafhankelijk of afhankelijk zijn. De foutmarge is =0,05
De chi-kwadraat wordt als volgt berekent:

Hierbij staat voor: observed x( tabel 1) en staat voor expected x( tabel 3)
 
5,828
Door afronding kan je iets anders uitkomen. Om te onderzoeken of dit getal te veel of te weinig is, heb je de chi-kwadraat verdeling nodig. Deze is te vinden onder ‘tabellen’. De grenswaarde tussen accepteren van H0( onafhankelijkheid) en verwerpen van H0 kan je vinden in dit tabel. De rechteroverschreidingskans is α=0,05
Het aantal vrijheidsgraden kan je berekenen: (aantal rijen – 1) x (aantal kolommen -1)
In dit geval hebben zijn er dus 5 vrijheidsgraden.
Dan kun je aflezen in het tabel grens= 11,070
5,828<11,070 dus verwerpen we H0 niet! |
|