Introduktion til normalfordeling
Hvis vi nu var gode til matematik ville vi definere en normalfordeling på følgende måde:
Definition 1 (for svær)
En normalfordeling er en sandsynlighedsfordeling givet ved tæthedsfunktionen: $$$f(x) = \frac{1}{\sigma\sqrt{2\pi}} e^{ -\frac{(x-\mu)^2}{2\sigma^2} },$$$ hvor $$\mu$$ er middelværdien og $$\sigma$$ er standardafvigelsen.
Ud fra definitionen kan vi se, at normalfordelingen kun afhænger af $$\sigma$$ og $$\mu$$, da det er de to eneste parametrer i funktionen ud over $$x$$. Der er dog to problemer.
- Det en meget vanskelig funktionsforskrift.
- Det er først på A-niveau man lærer hvordan man regner arealer under grafer og det har vi jo brug for, hvis vi vil bestemme sandsynligheder (som vi lærte i sidste afsnit).
Vores løsning til disse problemer er at glemme forskriften og i stedet tænke på en normalfordeling som:
Definition 2 (nemmere men upræcis)
En normalfordeling er en sandsynlighedsfordeling kendetegnet ved en klokkeformet tæthedsfunktion.
Normalfordelingen er fastlagt ved middelværdien $$\mu$$ og standardafvigelsen $$\sigma$$.
Middelværdien er $$X$$-værdien til det punkt hvor tæhedsfunktionen har sit maksimum og tæhedsfunktionen er symmetrisk omkring middelværdien.
Har vi sådan en sandsynlighedsfordeling siger vi at $$X$$ er en normalfordelt stokastisk variabel med middelværdi $$\mu$$ og standardafvigelsen $$\sigma$$ skriver vi $$X\sim N(\mu,\sigma)$$.
Nedenunder ses en normalfordeling. Træk i skyderne for $$\mu$$ og $$\sigma$$ og du kan se, hvordan tæthedsfunktionen ser ud for forskellige normalfordelinger.
Øvelse 1
Ved at trække i skyderne ovenover skal du undersøge hvad det betyder for tæthedsfunktionens udseende når:
-
Standardafvigelsen er stor.
Tæthedsfunktionen er flad
-
Standardafvigelsen er lille.
Tæthedsfunktionen er smal
-
Middelværdien er stor.
Tæthedsfunktionen forskydes til højre.
-
Middelværdien er lille.
Tæthedsfunktionen forskydes til venstre.
Øvelse 2
Forklar hvorfor resultaterne i øvelse 1 ikke er overraskende.
Vi ved, at middelværdien er ved tæthedsfunktionens maksimum, og når middelværdien gøres større/mindre vil grafen selvfølgelig forskydes til højre/venstre. Standardafvigelsen er et mål for hvor stor en spredning man kan forvente og derfor er det klart at en stor standardvigelse giver en bred tæthedsfunktion i forhold til en lille standardafvigelse.
Øvelse 3
Afgør hvilke af følgende sandsynlighedsfordelinger som kunne være normalfordelinger:
-
Normalfordeling
-
Normalfordeling
-
Ikke normalfordeling
-
Ikke normalfordeling
-
Normalfordeling
Øvelse 4
Betragt følgende tæthedsfunktion for en normalfordeling:
Vurder følgende sandsynligheder (dvs. du skal bare have et ca. tal):
-
$$P(X\leq 2)$$
$$P(X\leq 2)=0{,}5$$
-
$$P(X\geq 2)$$
$$P(X\geq 2)=0{,}5$$
-
$$P(1{,}5\leq X\leq 3)$$
$$P(1{,}5\leq X\leq 3)=0{,}8$$
-
$$P(1\leq X\leq 1{,}7)$$
$$P(1\leq X\leq 1{,}7)=0{,}25$$