$$\chi^2$$-test i Geogebra
Vi skal nu se, hvordan man lynhurtigt kan lave $$\chi^2$$-test i Geogebra.
Goodness-of-fit
Vi kigger på det samme eksempel, som vi brugte til at introducere goodness-of-fit. Vi husker at vi kastede en terning 120 gange og afgøre om det var en fair terning ($$H_0$$). Signifikansniveauet var $$\alpha=5%$$. Nedenunder ses det forventede:
Antal øjne | Forventet hyppighed |
---|---|
1 | 20 |
2 | 20 |
3 | 20 |
4 | 20 |
5 | 20 |
6 | 20 |
Og her var hvad vi fik da vi kastede terningen.
Antal øjne | Observeret Hyppighed |
---|---|
1 | 30 |
2 | 15 |
3 | 17 |
4 | 23 |
5 | 19 |
6 | 16 |
Vi åbner nu sandsynlighedslommeregneren i Geogebra og vælger "Goodness of Fit Test" under "statistik"
Vi taster vælger 6 rækker (der er 6 udfald på terningen) og taster de observerede og forventede værdier ind (vi kan se nederst at vi har tastet rigtigt da summen er 120):
Nederst i sandsynlighedslommeregneren kan vi se følgende:
Vi kan altså se antallet af frihedsgrader "df", vi kan se teststørrelsen og vi kan se signifikanssandsynligheden (p-værdien) som er 15,62% som jo er større en $$\alpha$$. Altså forkaster vi ikke vi $$H_0$$ og terningen kan ikke vises at være skæv.
Test for uafhængighed
Det er også meget nemt at lave en test for uafhængighed. Vi vender tilbage til eksemplet med kagevalg som vi brugte til at indtroducere uafhængighedstests med. Ville ville på et 5% signifikansniveau undersøge om der var forskel på mænd og kvinder når der skulle spises kage slurp!. Nulhypotesen var er der ikke var forskel. Vi havde følgende observationer:
Vi åbner sandsynlighedslommeregneren i Geogebra og vælger "statistik" og "Chi_i_anden Test":
Da vi har 2 vandrette kategorier og 3 lodrette vælger vi 3 rækker og 2 søjler:
og vi taster vores værdier ind:
og vi kan aflæse signifikanssandsynligheden:
Da $$0{,}4092>0{,}05$$ forkaster vi ikke $$H_0$$, og vi kan ikke konstatere nogle forskel på mænd og kvinder når det kommer til kagevalg.
Så skal vi lave en uafhængighedstest i Geogebra er det eneste vi skal bruge et signifikansniveau og de observerede hyppigheder og så regner den resten ud. Illuminati!
Øvelse 1
En lærer på Niels Brock kører et helt modul med tavleundervisning. Han stiller 30 spørgsmål og det er de samme tre elever som rækker hånden op hver gang. Skemaet nedenunder viser hvor mange gange hver elev for lov at svare:
Elev | Antal gange eleven fik lov at svare |
---|---|
Lars | 14 |
Helle | 7 |
Pia | 9 |
Helle er sur på læreren fordi hun synes at læreren ikke spørge hende nok. Læreren siger at det helt tilfældigt, hvem han spørger. Ved hjælp en goodness-of-fit test skal du på et 10% signifikansniveau afgøre om læreren har ret. Du skal:
-
Lav en tabel der viser hvor mange gange hver elev kan forvente at bliver spurgt, hvis læreren har ret.
ev Antal gange kan forvente at få lov at svare Lars 10 Helle 10 Pia 10 -
Bestem ved hjælp af Geogebra antallet af frihedsgrader, teststørrelsen og signifikanssandsynligheden.
Antallet af frihedsgrader er 2, teststørrelsen er 2,6 og signifikanssandsynligheden er 27,25%.
-
Afgøre om læreren har ret.
Det har han selvfølgelig. Han er jo lærer.
Øvelse 2
Vi konstruerer en snydemønt som vi laver på en måde så der gerne skulle være dobbelt så stor sandsynlighed for plat som for krone. Vi kaster mønten 200 gange og får:
Plat | 119 |
Krone | 81 |
-
Bestem de forventede værdier.
at 133,33 Krone 66,67 -
Bestem ved hjælp af Geogebra antallet af frihedsgrader, teststørrelsen og signifikanssandsynligheden.
Antallet af frihedsgrader er 1, teststørrelsen er 4,62 og signifikanssandsynligheden er 3,16%.
-
Afgør om vi med et 5% signifikansniveau kan tro på at mønten virker som den planlagt.
Mønten virker ikke som den skal. Det er nok også meget godt da man ikke må snyde jo.
Øvelse 3
Når man laver test for uafhængighed i Geogebra kan man sætte flueben i følgende bokse:
Ved at prøve dig frem skal du forklare, hvad disse bokse gør.
- Ved at sætte flueben i "Række%" kan man se, hvor stor en procentdel af rækkens samlede hyppighed de enkelte hyppigheder udgør.
- Ved at sætte flueben i "Søjle%" kan man se, hvor stor en procentdel af kolonnens samlede hyppighed de enkelte hyppigheder udgør.
- Forventet antal giver de forventede værdier. Surprise!
- $$\chi^2$$-bidrag viser: $$$\frac{(\textrm{observeret} - \textrm{forventet})^2}{\textrm{forventet}}$$$ for hver værdi.