Vi vil først se på, hvordan man beregner konfidensintervaller for middelværdien normalfordeling. Vi kan ikke undgå GeoGebra helt, men vi vil regne så meget som muligt i hånden. Vi starter med at kigge på den bestemte situation,
hvor vi kender standardafvigelsen for vores population. I praksis vil man sjældent gøre det, men det er en god optakt til at lave konfidensintervaller, hvor standardafvigelsen er ukendt (som det har været indtil videre i dette afsnit).
Normalfordeling med kendt standardafvigelse
Inden vi kan opskrive formelen for konfidensintervaller er vi nødt til at indføre nogle begreber.
Signifikansniveau
Signifikansniveauet \(\alpha \) er givet ved:
\[100\% - \textrm {konfidensniveau}\]
Eksempel 16.3.1 For et \(87\%\)-konfidensinterval finder vi signifikansniveauet:
\[\alpha =100\%-87\%=13\%.\]
Øvelse 16.3.1
Bestem signifikansniveauet for følgende typer af konfidensintervaller:
a) Et \(90\%\)-konfidensinterval.
b) Et \(99\%\)-konfidensinterval.
c) Et \(99{,}9\%\)-konfidensinterval.
Løsning 16.3.1
a) \(\alpha = 10\%\)
b) \(\alpha = 1\%\)
c) \(\alpha = 0{,}1\%\)
Fraktiler i standardnormalfordelingen
En \(p\)-fraktil for en stokastisk variabel \(X\) er et tal \(x_p\) sådan at
\[P(X\leq x_p)=p\]
Det er nemmest at forstå ved at se på et eksempel.
Eksempel 16.3.2 Vi vil bestemme \(0{,}95\)-fraktilen for standardnormalfordelingen \(Z\sim N(0;1)\). Vi åbner GeoGebra og laver en normalfordeling med \(\mu
=0\) og \(\sigma = 1\) (sådan står den vist allerede når man åbner den). Vi skriver nu de \(0{,}95\) ind:
Vi kan nu se at \(0{,}95\)-fraktilen er \(1{,}6449\). Vi betegner denne fraktil med \(z_{0{,}95}\). Vi bruger bogstavet \(z\) fordi det er standardnormalfordelingen. Vi konkluderer altså at
\[z_{0{,}95}=1{,}645\]
Øvelse 16.3.2
a) Bestem \(z_{0{,}975}\).
Løsning 16.3.2
a) \(z_{0{,}975}=1{,}96\)
Vi kommer til at støde på fraktiler på formen \(z_{1-\frac {\alpha }{2}}\), hvor \(\alpha \) er signifikansniveauet.
Eksempel 16.3.3 Vi vil bestemme fraktilen \(z_{1-\frac {\alpha }{2}}\) når \(\alpha =10\%\). Vi regner først \(1-\frac {\alpha }{2}\):
Vi skal altså bestemme \(z_{0{,}95}\), men den fandt vi jo i eksempel 16.3.2 til at være \(1{,}645\). Vi konkluderer at for
\(\alpha =10\%\) er
\[z_{1-\frac {\alpha }{2}}=1{,}645\]
Vi kan nu lave en tabel der viser sammenhængen mellem \(\alpha \) og \(z_{1-\frac {\alpha }{2}}\):
Øvelse 16.3.3
I eksempel 16.3.3 regnede vi sidste værdi for \(z_{1-\frac {\alpha }{2}}\) i tabellen – altså at \(z_{1-\frac {\alpha
}{2}}=1{,}645\) når \(\alpha =10\%\).
a) Regn efter at tabellen også har ret mht. de to første værdier for \(z_{1-\frac {\alpha }{2}}\) (når \(\alpha =5\%\) og \(\alpha =1\%\)).
Løsning 16.3.3
a) Der står ikke noget her din nysgerrige lille satan.
Vi er nu endelig klar til at præsentere den sætning, vi skal bruge til at regne konfidensintervallerne.
Sætning 16.3.1 Hvis standardafvigelsen er kendt, bestemmes et konfidensinterval \(I\) for middelværdien i en normalfordeling ved formlen:
\(\left (1-\frac {\alpha }{2}\right )\)-fraktilen i standardnormalfordelingen.
Vi regner et eksempel:
Eksempel 16.3.4 Vi vil bestemme et \(95\%\)-konfidensinterval for en stikprøve med kendt standardafvigelse. Stikprøven har en størrelse på \(200\), et gennemsnit på \(1000\) og en standardafvigelse på
\(30\). Vi har altså:
Vi taster hele pivetøjet ind på en lommeregner og får:
\[I=[996;1004]\]
Øvelse 16.3.4
Vi ser på en stikprøve fra en normalfordelt population. Vi har 500 observationer, et gennemsnit på 20 og en standardafvigelse på 5.
a) Bestem uden Geogebra et \(90\%\)-konfidensinterval for middelværdien.
Løsning 16.3.4
a) \([19{,}6;20{,}4]\)
Øvelse 16.3.5
a) Regn med formel et \(80\%\) konfidensinterval for middelværdien i en normalfordeling, hvor stikprøvestørrelsen er \(150\), gennemsnittet er \(50\) og
standardafvigelsen er \(10\).
Løsning 16.3.5
a) \([49;51]\)
Normalfordeling med ukendt standardafvigelse
Vi kan bestemme et konfidensinterval for middelværdien i en normalfordeling med ukendt standardafvigelse på næsten samme måde:
Sætning 16.3.2 Hvis standardafvigelsen er ukendt, bestemmes et konfidensinterval \(I\) ved formlen:
\(\left (1-\frac {\alpha }{2}\right )\)-fraktilen i \(t\)-fordeling med \(n-1\) frihedsgrader (jaja jeg skal nok forklare hvad det betyder).
Vi kan se at den ligner sætning 1 meget. Den eneste forskel er at der står \(t_{1-\frac {\alpha }{2}}\) i stedet for \(z_{1-\frac {\alpha }{2}}\). Det betyder at vi ikke længere skal finde fraktilerne i
standardnormalfordelingen i men i stedet skal vi have fat i en fordeling der hedder \(t\)-fordelingen – eller faktisk – vi skal have fat i en bestemt \(t\)-fordeling. Der findes nemlig uendelig mange \(t\)-fordelinger – en for hver
frihedsgrad. Vi skal ikke komme nærmere ind på hvad frihedsgrader er, men det er et begreb vi også vil støde på senere. Indtil videre er det nok at vide, at en frihedsgrad er et helt positivt tal (1,2,3,4...) og at der til
enhver frihedsgrad er knyttet en \(t\)-fordeling.
Vi finder\(t\)-fordelingen i Geogebra. Frihedsgraderne betegnes ”df” (degrees of freedom). Her et eksempel med med 1 frihedsgrad:
Øvelse 16.3.6
Åben en \(t\)-fordeling med en frihedsgrad i GeoGebra (som i screenshottet oven over). Prøv at skift rundt mellem den fordeling og så standardnormalfordelingen.
a) Hvad ser anderledes ud i t-fordelingen forhold til standardnormalfordelingen?
b) Prøv at skrive 100 som frihedsgrader. Kommer den tættere på standardnormalfordelingen?
Løsning 16.3.6
a) Den er mere spids i toppen og den er langsommere om at flade ud
b) Det gør den. Den ligner fuldstændig standardnormalfordelingen.
Øvelse 16.3.7
Vi vil bestemme et \(90\%\)-konfidensinterval for middelværdien i en normalfordeling, hvor vi ikke kender standardafvigelsen. Stikprøvestørrelsen er \(50\), et estimat af standardafvigelsen er \(800\) og gennemsnittet er \(5000\).
a) Bestem \(t_{1-\frac {\alpha }{2}}\) i Geogebra
b) Bestem konfidensintervallet ved at bruge resultatet fra a), men ellers uden at bruge computeren (selvfølgelig må I gerne bruge den som lommeregner).
Løsning 16.3.7
a) \(1{,}6766\)
b) \([4810;5190]\)
Øvelse 16.3.8
Vi har set at når vi har høje frihedsgrader ligner t-fordelingen standardnormalfordelingen. Brug dette til at argumentere for:
a) Hvis stikprøven er meget stor kan vi bruge formlen for kendt standardafvigelse selvom vi ikke kender standardafvigelsen.
b) At dette ikke er så overaskende.
Løsning 16.3.8
a) Den eneste forskel i formlerne er fraktilerne, og når stikprøvestørrelsen (og dermed antallet af frihedsgrader) er stor, så ligner \(t\)-fordelingen
standardnormalfordelingen og vi får derfor samme værdi for fraktilerne uanset om vi bruger t-fordeling eller standardnormalfordeling. Så de to formler giver samme resultat.
b) Det er ikke overraskende, da estimatet af standardafvigelsen vil komme tættere på populationens standardafvigelse, jo større stikprøven er.
Konfidensintervaller for sandsynlighedsparameteren i en binomialfordeling
Der er også en formel for konfidensintervaller for \(p\) i en binomialfordeling:
Sætning 16.3.3 Hvis \(p\) opfylder at \(n\cdot \hat {p}\cdot (1-\hat {p})>9\) kan et konfidensinterval \(I\) for sandsynlighedsparameteren \(p\) i en
binomialfordeling bestemmes ved formlen:
Eksempel 16.3.5 Vi køber en snydeterning og vil gerne bestemme sandsynligheden for at den slår en 6’er. Vi slår 100 gange med terningen og i 21 tilfælde får vi en 6’er. Derfor er:
Man kan undre sig over hvad fraktiler for en normalfordeling laver i en formel for konfidensintervaller for en binomialfordeling. De dukker op fordi binomialfordelingen nærmer sig en normalfordeling under når \(n\) er stor og \(p\)
ikke er meget stor eller meget lille. Måske har du lagt mærke til at binomialfordeling i visse tilfælde ligner en normalfordeling når du bruger sandsynlighedsregneren i Geogebra?
Øvelse 16.3.9
Mor Jette laver en mønt ud af ler og kaster den 80 gange. Hun får 34 plat. Hun vil nu gerne bestemme et konfidensinterval for sandsynligheden for at slå plat.
a) Bestem \(\hat {p}\).
b) Bestem ved beregning et \(95\%\)-konfidensinterval for \(p\).
c) Mor Jette mener at mønten er fair, men Jessica Priscilla tror ikke på hende. De bliver enige om at spørge dig. Hvad siger du til dem?
Løsning 16.3.9
a) \(\hat {p}=0{,}=425\).
b) \([0{,}32;0{,}53]\)
c) Det er ikke til at vide hvem der har ret, men da \(0{,}5\in [0{,}32;0{,}53]\) kan vi ikke afvise at mønten er fair.