$$\chi^2$$-test i Geogebra

Vi skal nu se, hvordan man lynhurtigt kan lave $$\chi^2$$-test i Geogebra.

Goodness-of-fit

Vi kigger på det samme eksempel, som vi brugte til at introducere goodness-of-fit. Vi husker at vi kastede en terning 120 gange og afgøre om det var en fair terning ($$H_0$$). Signifikansniveauet var $$\alpha=5%$$. Nedenunder ses det forventede:

Antal øjne Forventet hyppighed
1 20
2 20
3 20
4 20
5 20
6 20

Og her var hvad vi fik da vi kastede terningen.

Antal øjne Observeret Hyppighed
1 30
2 15
3 17
4 23
5 19
6 16

Vi åbner nu sandsynlighedslommeregneren i Geogebra og vælger "Goodness of Fit Test" under "statistik"

Screenshot

Vi taster vælger 6 rækker (der er 6 udfald på terningen) og taster de observerede og forventede værdier ind (vi kan se nederst at vi har tastet rigtigt da summen er 120):

Screenshot

Nederst i sandsynlighedslommeregneren kan vi se følgende:

Screenshot

Vi kan altså se antallet af frihedsgrader "df", vi kan se teststørrelsen og vi kan se signifikanssandsynligheden (p-værdien) som er 15,62% som jo er større en $$\alpha$$. Altså forkaster vi ikke vi $$H_0$$ og terningen kan ikke vises at være skæv.

Test for uafhængighed

Det er også meget nemt at lave en test for uafhængighed. Vi vender tilbage til eksemplet med kagevalg som vi brugte til at indtroducere uafhængighedstests med. Ville ville på et 5% signifikansniveau undersøge om der var forskel på mænd og kvinder når der skulle spises kage slurp!. Nulhypotesen var er der ikke var forskel. Vi havde følgende observationer:

Screenshot

Vi åbner sandsynlighedslommeregneren i Geogebra og vælger "statistik" og "Chi_i_anden Test":

Screenshot

Da vi har 2 vandrette kategorier og 3 lodrette vælger vi 3 rækker og 2 søjler:

Screenshot

og vi taster vores værdier ind:

Screenshot

og vi kan aflæse signifikanssandsynligheden:

Screenshot

Da $$0{,}4092>0{,}05$$ forkaster vi ikke $$H_0$$, og vi kan ikke konstatere nogle forskel på mænd og kvinder når det kommer til kagevalg.

Så skal vi lave en uafhængighedstest i Geogebra er det eneste vi skal bruge et signifikansniveau og de observerede hyppigheder og så regner den resten ud. Illuminati!

Øvelse 1

📌

En lærer på Niels Brock kører et helt modul med tavleundervisning. Han stiller 30 spørgsmål og det er de samme tre elever som rækker hånden op hver gang. Skemaet nedenunder viser hvor mange gange hver elev for lov at svare:

Elev Antal gange eleven fik lov at svare
Lars 14
Helle 7
Pia 9

Helle er sur på læreren fordi hun synes at læreren ikke spørge hende nok. Læreren siger at det helt tilfældigt, hvem han spørger. Ved hjælp en goodness-of-fit test skal du på et 10% signifikansniveau afgøre om læreren har ret. Du skal:

  1. Lav en tabel der viser hvor mange gange hver elev kan forvente at bliver spurgt, hvis læreren har ret.
    ev Antal gange kan forvente at få lov at svare
    Lars 10
    Helle 10
    Pia 10
  2. Bestem ved hjælp af Geogebra antallet af frihedsgrader, teststørrelsen og signifikanssandsynligheden.

    Antallet af frihedsgrader er 2, teststørrelsen er 2,6 og signifikanssandsynligheden er 27,25%.

  3. Afgøre om læreren har ret.

    Det har han selvfølgelig. Han er jo lærer.

Øvelse 2

📌

Vi konstruerer en snydemønt som vi laver på en måde så der gerne skulle være dobbelt så stor sandsynlighed for plat som for krone. Vi kaster mønten 200 gange og får:

Plat 119
Krone 81
  1. Bestem de forventede værdier.
    at 133,33
    Krone 66,67
  2. Bestem ved hjælp af Geogebra antallet af frihedsgrader, teststørrelsen og signifikanssandsynligheden.

    Antallet af frihedsgrader er 1, teststørrelsen er 4,62 og signifikanssandsynligheden er 3,16%.

  3. Afgør om vi med et 5% signifikansniveau kan tro på at mønten virker som den planlagt.

    Mønten virker ikke som den skal. Det er nok også meget godt da man ikke må snyde jo.

Øvelse 3

📌

Når man laver test for uafhængighed i Geogebra kan man sætte flueben i følgende bokse:

Screenshot

Ved at prøve dig frem skal du forklare, hvad disse bokse gør.
  • Ved at sætte flueben i "Række%" kan man se, hvor stor en procentdel af rækkens samlede hyppighed de enkelte hyppigheder udgør.
  • Ved at sætte flueben i "Søjle%" kan man se, hvor stor en procentdel af kolonnens samlede hyppighed de enkelte hyppigheder udgør.
  • Forventet antal giver de forventede værdier. Surprise!
  • $$\chi^2$$-bidrag viser: $$$\frac{(\textrm{observeret} - \textrm{forventet})^2}{\textrm{forventet}}$$$ for hver værdi.

Øvelse 4

📌

Rideskolen Ponyklubben havde fået en ny hoppe og den skulle have en navn. Efter ivrig diskussion nåede de frem til fire navne, men de kunne ikke blive enige om, hvilket af de 4 navne de skulle vælge. En ridelærer ville nu undersøge om der var nogen sammenhæng mellem medlemmernes alder (junior, ungdom og senior) og hvilke navn de foretrak, så hun lavede denne liste. Du skal nu hjælpe den flinke ridelærer med at lave en $$\chi^2$$-test i Geogebra så hun kan finde ud af om der er sammenhæng mellem medlemmernes alder og hvilket navn de foretrak. Brug 5% som signifikanssniveau.

  1. Opstil $$H_0$$ og $$H_1$$

    $$H_0$$: der er uafhængihed mellem alder og navn.
    $$H_1$$: Der er sammehæng mellem alder og navn.

  2. Lav en pivottabel

    Screenshot

  3. Bestem de forvende værdier.

    Screenshot

  4. Bestem antallet af frihedsgrader og teststørrelsen.

    Antallet af frihedsgrader er 6 og $$\chi^2=18{,}6684$$

  5. Bestem signifikanssandsynligheden.

    Signifikanssandsynligheden er $$p=0{,}48\%$$

  6. Afgør om der er sammenhæng mellem alder og navn.

    Yes sir, der er sammenhæng!