MATHHXA|Gå til Mat-B|Download PDF|Info

MATHHX A

\(\newcommand{\footnotename}{footnote}\) \(\def \LWRfootnote {1}\) \(\newcommand {\footnote }[2][\LWRfootnote ]{{}^{\mathrm {#1}}}\) \(\newcommand {\footnotemark }[1][\LWRfootnote ]{{}^{\mathrm {#1}}}\) \(\let \LWRorighspace \hspace \) \(\renewcommand {\hspace }{\ifstar \LWRorighspace \LWRorighspace }\) \(\newcommand {\mathnormal }[1]{{#1}}\) \(\newcommand \ensuremath [1]{#1}\) \(\newcommand {\LWRframebox }[2][]{\fbox {#2}} \newcommand {\framebox }[1][]{\LWRframebox } \) \(\newcommand {\setlength }[2]{}\) \(\newcommand {\addtolength }[2]{}\) \(\newcommand {\setcounter }[2]{}\) \(\newcommand {\addtocounter }[2]{}\) \(\newcommand {\arabic }[1]{}\) \(\newcommand {\number }[1]{}\) \(\newcommand {\noalign }[1]{\text {#1}\notag \\}\) \(\newcommand {\cline }[1]{}\) \(\newcommand {\directlua }[1]{\text {(directlua)}}\) \(\newcommand {\luatexdirectlua }[1]{\text {(directlua)}}\) \(\newcommand {\protect }{}\) \(\def \LWRabsorbnumber #1 {}\) \(\def \LWRabsorbquotenumber "#1 {}\) \(\newcommand {\LWRabsorboption }[1][]{}\) \(\newcommand {\LWRabsorbtwooptions }[1][]{\LWRabsorboption }\) \(\def \mathchar {\ifnextchar "\LWRabsorbquotenumber \LWRabsorbnumber }\) \(\def \mathcode #1={\mathchar }\) \(\let \delcode \mathcode \) \(\let \delimiter \mathchar \) \(\def \oe {\unicode {x0153}}\) \(\def \OE {\unicode {x0152}}\) \(\def \ae {\unicode {x00E6}}\) \(\def \AE {\unicode {x00C6}}\) \(\def \aa {\unicode {x00E5}}\) \(\def \AA {\unicode {x00C5}}\) \(\def \o {\unicode {x00F8}}\) \(\def \O {\unicode {x00D8}}\) \(\def \l {\unicode {x0142}}\) \(\def \L {\unicode {x0141}}\) \(\def \ss {\unicode {x00DF}}\) \(\def \SS {\unicode {x1E9E}}\) \(\def \dag {\unicode {x2020}}\) \(\def \ddag {\unicode {x2021}}\) \(\def \P {\unicode {x00B6}}\) \(\def \copyright {\unicode {x00A9}}\) \(\def \pounds {\unicode {x00A3}}\) \(\let \LWRref \ref \) \(\renewcommand {\ref }{\ifstar \LWRref \LWRref }\) \( \newcommand {\multicolumn }[3]{#3}\) \(\require {textcomp}\) \(\require {colortbl}\) \(\let \LWRorigcolumncolor \columncolor \) \(\renewcommand {\columncolor }[2][named]{\LWRorigcolumncolor [#1]{#2}\LWRabsorbtwooptions }\) \(\let \LWRorigrowcolor \rowcolor \) \(\renewcommand {\rowcolor }[2][named]{\LWRorigrowcolor [#1]{#2}\LWRabsorbtwooptions }\) \(\let \LWRorigcellcolor \cellcolor \) \(\renewcommand {\cellcolor }[2][named]{\LWRorigcellcolor [#1]{#2}\LWRabsorbtwooptions }\) \(\newcommand {\tothe }[1]{^{#1}}\) \(\newcommand {\raiseto }[2]{{#2}^{#1}}\) \(\newcommand {\LWRsiunitxEND }{}\) \(\def \LWRsiunitxang #1;#2;#3;#4\LWRsiunitxEND {\ifblank {#1}{}{\num {#1}\degree }\ifblank {#2}{}{\num {#2}^{\unicode {x2032}}}\ifblank {#3}{}{\num {#3}^{\unicode {x2033}}}}\) \(\newcommand {\ang }[2][]{\LWRsiunitxang #2;;;\LWRsiunitxEND }\) \(\def \LWRsiunitxdistribunit {}\) \(\newcommand {\LWRsiunitxENDTWO }{}\) \(\def \LWRsiunitxprintdecimalsubtwo #1,#2,#3\LWRsiunitxENDTWO {\ifblank {#1}{0}{\mathrm {#1}}\ifblank {#2}{}{{\LWRsiunitxdecimal }\mathrm {#2}}}\) \(\def \LWRsiunitxprintdecimalsub #1.#2.#3\LWRsiunitxEND {\LWRsiunitxprintdecimalsubtwo #1,,\LWRsiunitxENDTWO \ifblank {#2}{}{{\LWRsiunitxdecimal }\LWRsiunitxprintdecimalsubtwo #2,,\LWRsiunitxENDTWO }}\) \(\newcommand {\LWRsiunitxprintdecimal }[1]{\LWRsiunitxprintdecimalsub #1...\LWRsiunitxEND }\) \(\def \LWRsiunitxnumplus #1+#2+#3\LWRsiunitxEND {\ifblank {#2}{\LWRsiunitxprintdecimal {#1}}{\ifblank {#1}{\LWRsiunitxprintdecimal {#2}}{\LWRsiunitxprintdecimal {#1}\unicode {x02B}\LWRsiunitxprintdecimal {#2}}}\LWRsiunitxdistribunit }\) \(\def \LWRsiunitxnumminus #1-#2-#3\LWRsiunitxEND {\ifblank {#2}{\LWRsiunitxnumplus #1+++\LWRsiunitxEND }{\ifblank {#1}{}{\LWRsiunitxprintdecimal {#1}}\unicode {x02212}\LWRsiunitxprintdecimal {#2}\LWRsiunitxdistribunit }}\) \(\def \LWRsiunitxnumpmmacro #1\pm #2\pm #3\LWRsiunitxEND {\ifblank {#2}{\LWRsiunitxnumminus #1---\LWRsiunitxEND }{\LWRsiunitxprintdecimal {#1}\unicode {x0B1}\LWRsiunitxprintdecimal {#2}\LWRsiunitxdistribunit }}\) \(\def \LWRsiunitxnumpm #1+-#2+-#3\LWRsiunitxEND {\ifblank {#2}{\LWRsiunitxnumpmmacro #1\pm \pm \pm \LWRsiunitxEND }{\LWRsiunitxprintdecimal {#1}\unicode {x0B1}\LWRsiunitxprintdecimal {#2}\LWRsiunitxdistribunit }}\) \(\newcommand {\LWRsiunitxnumscientific }[2]{\ifblank {#1}{}{\ifstrequal {#1}{-}{-}{\LWRsiunitxprintdecimal {#1}\times }}10^{\LWRsiunitxprintdecimal {#2}}\LWRsiunitxdistribunit }\) \(\def \LWRsiunitxnumD #1D#2D#3\LWRsiunitxEND {\ifblank {#2}{\LWRsiunitxnumpm #1+-+-\LWRsiunitxEND }{\mathrm {\LWRsiunitxnumscientific {#1}{#2}}}}\) \(\def \LWRsiunitxnumd #1d#2d#3\LWRsiunitxEND {\ifblank {#2}{\LWRsiunitxnumD #1DDD\LWRsiunitxEND }{\mathrm {\LWRsiunitxnumscientific {#1}{#2}}}}\) \(\def \LWRsiunitxnumE #1E#2E#3\LWRsiunitxEND {\ifblank {#2}{\LWRsiunitxnumd #1ddd\LWRsiunitxEND }{\mathrm {\LWRsiunitxnumscientific {#1}{#2}}}}\) \(\def \LWRsiunitxnume #1e#2e#3\LWRsiunitxEND {\ifblank {#2}{\LWRsiunitxnumE #1EEE\LWRsiunitxEND }{\mathrm {\LWRsiunitxnumscientific {#1}{#2}}}}\) \(\def \LWRsiunitxnumx #1x#2x#3x#4\LWRsiunitxEND {\ifblank {#2}{\LWRsiunitxnume #1eee\LWRsiunitxEND }{\ifblank {#3}{\LWRsiunitxnume #1eee\LWRsiunitxEND \times \LWRsiunitxnume #2eee\LWRsiunitxEND }{\LWRsiunitxnume #1eee\LWRsiunitxEND \times \LWRsiunitxnume #2eee\LWRsiunitxEND \times \LWRsiunitxnume #3eee\LWRsiunitxEND }}}\) \(\newcommand {\num }[2][]{\LWRsiunitxnumx #2xxxxx\LWRsiunitxEND }\) \(\newcommand {\si }[2][]{\mathrm {\gsubstitute {#2}{~}{\,}}}\) \(\def \LWRsiunitxSIopt #1[#2]#3{\def \LWRsiunitxdistribunit {\,\si {#3}}{#2}\num {#1}\def \LWRsiunitxdistribunit {}}\) \(\newcommand {\LWRsiunitxSI }[2]{\def \LWRsiunitxdistribunit {\,\si {#2}}\num {#1}\def \LWRsiunitxdistribunit {}}\) \(\newcommand {\SI }[2][]{\ifnextchar [{\LWRsiunitxSIopt {#2}}{\LWRsiunitxSI {#2}}}\) \(\newcommand {\numlist }[2][]{\text {#2}}\) \(\newcommand {\numrange }[3][]{\num {#2}\ \LWRsiunitxrangephrase \ \num {#3}}\) \(\newcommand {\SIlist }[3][]{\text {#2}\,\si {#3}}\) \(\newcommand {\SIrange }[4][]{\num {#2}\,#4\ \LWRsiunitxrangephrase \ \num {#3}\,#4}\) \(\newcommand {\tablenum }[2][]{\mathrm {#2}}\) \(\newcommand {\ampere }{\mathrm {A}}\) \(\newcommand {\candela }{\mathrm {cd}}\) \(\newcommand {\kelvin }{\mathrm {K}}\) \(\newcommand {\kilogram }{\mathrm {kg}}\) \(\newcommand {\metre }{\mathrm {m}}\) \(\newcommand {\mole }{\mathrm {mol}}\) \(\newcommand {\second }{\mathrm {s}}\) \(\newcommand {\becquerel }{\mathrm {Bq}}\) \(\newcommand {\degreeCelsius }{\unicode {x2103}}\) \(\newcommand {\coulomb }{\mathrm {C}}\) \(\newcommand {\farad }{\mathrm {F}}\) \(\newcommand {\gray }{\mathrm {Gy}}\) \(\newcommand {\hertz }{\mathrm {Hz}}\) \(\newcommand {\henry }{\mathrm {H}}\) \(\newcommand {\joule }{\mathrm {J}}\) \(\newcommand {\katal }{\mathrm {kat}}\) \(\newcommand {\lumen }{\mathrm {lm}}\) \(\newcommand {\lux }{\mathrm {lx}}\) \(\newcommand {\newton }{\mathrm {N}}\) \(\newcommand {\ohm }{\mathrm {\Omega }}\) \(\newcommand {\pascal }{\mathrm {Pa}}\) \(\newcommand {\radian }{\mathrm {rad}}\) \(\newcommand {\siemens }{\mathrm {S}}\) \(\newcommand {\sievert }{\mathrm {Sv}}\) \(\newcommand {\steradian }{\mathrm {sr}}\) \(\newcommand {\tesla }{\mathrm {T}}\) \(\newcommand {\volt }{\mathrm {V}}\) \(\newcommand {\watt }{\mathrm {W}}\) \(\newcommand {\weber }{\mathrm {Wb}}\) \(\newcommand {\day }{\mathrm {d}}\) \(\newcommand {\degree }{\mathrm {^\circ }}\) \(\newcommand {\hectare }{\mathrm {ha}}\) \(\newcommand {\hour }{\mathrm {h}}\) \(\newcommand {\litre }{\mathrm {l}}\) \(\newcommand {\liter }{\mathrm {L}}\) \(\newcommand {\arcminute }{^\prime }\) \(\newcommand {\minute }{\mathrm {min}}\) \(\newcommand {\arcsecond }{^{\prime \prime }}\) \(\newcommand {\tonne }{\mathrm {t}}\) \(\newcommand {\astronomicalunit }{au}\) \(\newcommand {\atomicmassunit }{u}\) \(\newcommand {\bohr }{\mathit {a}_0}\) \(\newcommand {\clight }{\mathit {c}_0}\) \(\newcommand {\dalton }{\mathrm {D}_\mathrm {a}}\) \(\newcommand {\electronmass }{\mathit {m}_{\mathrm {e}}}\) \(\newcommand {\electronvolt }{\mathrm {eV}}\) \(\newcommand {\elementarycharge }{\mathit {e}}\) \(\newcommand {\hartree }{\mathit {E}_{\mathrm {h}}}\) \(\newcommand {\planckbar }{\mathit {\unicode {x210F}}}\) \(\newcommand {\angstrom }{\mathrm {\unicode {x212B}}}\) \(\let \LWRorigbar \bar \) \(\newcommand {\barn }{\mathrm {b}}\) \(\newcommand {\bel }{\mathrm {B}}\) \(\newcommand {\decibel }{\mathrm {dB}}\) \(\newcommand {\knot }{\mathrm {kn}}\) \(\newcommand {\mmHg }{\mathrm {mmHg}}\) \(\newcommand {\nauticalmile }{\mathrm {M}}\) \(\newcommand {\neper }{\mathrm {Np}}\) \(\newcommand {\yocto }{\mathrm {y}}\) \(\newcommand {\zepto }{\mathrm {z}}\) \(\newcommand {\atto }{\mathrm {a}}\) \(\newcommand {\femto }{\mathrm {f}}\) \(\newcommand {\pico }{\mathrm {p}}\) \(\newcommand {\nano }{\mathrm {n}}\) \(\newcommand {\micro }{\mathrm {\unicode {x00B5}}}\) \(\newcommand {\milli }{\mathrm {m}}\) \(\newcommand {\centi }{\mathrm {c}}\) \(\newcommand {\deci }{\mathrm {d}}\) \(\newcommand {\deca }{\mathrm {da}}\) \(\newcommand {\hecto }{\mathrm {h}}\) \(\newcommand {\kilo }{\mathrm {k}}\) \(\newcommand {\mega }{\mathrm {M}}\) \(\newcommand {\giga }{\mathrm {G}}\) \(\newcommand {\tera }{\mathrm {T}}\) \(\newcommand {\peta }{\mathrm {P}}\) \(\newcommand {\exa }{\mathrm {E}}\) \(\newcommand {\zetta }{\mathrm {Z}}\) \(\newcommand {\yotta }{\mathrm {Y}}\) \(\newcommand {\percent }{\mathrm {\%}}\) \(\newcommand {\meter }{\mathrm {m}}\) \(\newcommand {\metre }{\mathrm {m}}\) \(\newcommand {\gram }{\mathrm {g}}\) \(\newcommand {\kg }{\kilo \gram }\) \(\newcommand {\of }[1]{_{\mathrm {#1}}}\) \(\newcommand {\squared }{^2}\) \(\newcommand {\square }[1]{\mathrm {#1}^2}\) \(\newcommand {\cubed }{^3}\) \(\newcommand {\cubic }[1]{\mathrm {#1}^3}\) \(\newcommand {\per }{\,\mathrm {/}}\) \(\newcommand {\celsius }{\unicode {x2103}}\) \(\newcommand {\fg }{\femto \gram }\) \(\newcommand {\pg }{\pico \gram }\) \(\newcommand {\ng }{\nano \gram }\) \(\newcommand {\ug }{\micro \gram }\) \(\newcommand {\mg }{\milli \gram }\) \(\newcommand {\g }{\gram }\) \(\newcommand {\kg }{\kilo \gram }\) \(\newcommand {\amu }{\mathrm {u}}\) \(\newcommand {\nm }{\nano \metre }\) \(\newcommand {\um }{\micro \metre }\) \(\newcommand {\mm }{\milli \metre }\) \(\newcommand {\cm }{\centi \metre }\) \(\newcommand {\dm }{\deci \metre }\) \(\newcommand {\m }{\metre }\) \(\newcommand {\km }{\kilo \metre }\) \(\newcommand {\as }{\atto \second }\) \(\newcommand {\fs }{\femto \second }\) \(\newcommand {\ps }{\pico \second }\) \(\newcommand {\ns }{\nano \second }\) \(\newcommand {\us }{\micro \second }\) \(\newcommand {\ms }{\milli \second }\) \(\newcommand {\s }{\second }\) \(\newcommand {\fmol }{\femto \mol }\) \(\newcommand {\pmol }{\pico \mol }\) \(\newcommand {\nmol }{\nano \mol }\) \(\newcommand {\umol }{\micro \mol }\) \(\newcommand {\mmol }{\milli \mol }\) \(\newcommand {\mol }{\mol }\) \(\newcommand {\kmol }{\kilo \mol }\) \(\newcommand {\pA }{\pico \ampere }\) \(\newcommand {\nA }{\nano \ampere }\) \(\newcommand {\uA }{\micro \ampere }\) \(\newcommand {\mA }{\milli \ampere }\) \(\newcommand {\A }{\ampere }\) \(\newcommand {\kA }{\kilo \ampere }\) \(\newcommand {\ul }{\micro \litre }\) \(\newcommand {\ml }{\milli \litre }\) \(\newcommand {\l }{\litre }\) \(\newcommand {\hl }{\hecto \litre }\) \(\newcommand {\uL }{\micro \liter }\) \(\newcommand {\mL }{\milli \liter }\) \(\newcommand {\L }{\liter }\) \(\newcommand {\hL }{\hecto \liter }\) \(\newcommand {\mHz }{\milli \hertz }\) \(\newcommand {\Hz }{\hertz }\) \(\newcommand {\kHz }{\kilo \hertz }\) \(\newcommand {\MHz }{\mega \hertz }\) \(\newcommand {\GHz }{\giga \hertz }\) \(\newcommand {\THz }{\tera \hertz }\) \(\newcommand {\mN }{\milli \newton }\) \(\newcommand {\N }{\newton }\) \(\newcommand {\kN }{\kilo \newton }\) \(\newcommand {\MN }{\mega \newton }\) \(\newcommand {\Pa }{\pascal }\) \(\newcommand {\kPa }{\kilo \pascal }\) \(\newcommand {\MPa }{\mega \pascal }\) \(\newcommand {\GPa }{\giga \pascal }\) \(\newcommand {\mohm }{\milli \ohm }\) \(\newcommand {\kohm }{\kilo \ohm }\) \(\newcommand {\Mohm }{\mega \ohm }\) \(\newcommand {\pV }{\pico \volt }\) \(\newcommand {\nV }{\nano \volt }\) \(\newcommand {\uV }{\micro \volt }\) \(\newcommand {\mV }{\milli \volt }\) \(\newcommand {\V }{\volt }\) \(\newcommand {\kV }{\kilo \volt }\) \(\newcommand {\W }{\watt }\) \(\newcommand {\uW }{\micro \watt }\) \(\newcommand {\mW }{\milli \watt }\) \(\newcommand {\kW }{\kilo \watt }\) \(\newcommand {\MW }{\mega \watt }\) \(\newcommand {\GW }{\giga \watt }\) \(\newcommand {\J }{\joule }\) \(\newcommand {\uJ }{\micro \joule }\) \(\newcommand {\mJ }{\milli \joule }\) \(\newcommand {\kJ }{\kilo \joule }\) \(\newcommand {\eV }{\electronvolt }\) \(\newcommand {\meV }{\milli \electronvolt }\) \(\newcommand {\keV }{\kilo \electronvolt }\) \(\newcommand {\MeV }{\mega \electronvolt }\) \(\newcommand {\GeV }{\giga \electronvolt }\) \(\newcommand {\TeV }{\tera \electronvolt }\) \(\newcommand {\kWh }{\kilo \watt \hour }\) \(\newcommand {\F }{\farad }\) \(\newcommand {\fF }{\femto \farad }\) \(\newcommand {\pF }{\pico \farad }\) \(\newcommand {\K }{\mathrm {K}}\) \(\newcommand {\dB }{\mathrm {dB}}\) \(\newcommand {\kibi }{\mathrm {Ki}}\) \(\newcommand {\mebi }{\mathrm {Mi}}\) \(\newcommand {\gibi }{\mathrm {Gi}}\) \(\newcommand {\tebi }{\mathrm {Ti}}\) \(\newcommand {\pebi }{\mathrm {Pi}}\) \(\newcommand {\exbi }{\mathrm {Ei}}\) \(\newcommand {\zebi }{\mathrm {Zi}}\) \(\newcommand {\yobi }{\mathrm {Yi}}\) \(\let \unit \si \) \(\let \qty \SI \) \(\let \qtylist \SIlist \) \(\let \qtyrange \SIrange \) \(\let \numproduct \num \) \(\let \qtyproduct \SI \) \(\let \complexnum \num \) \(\newcommand {\complexqty }[3][]{(\complexnum {#2})\si {#3}}\) \(\newcommand {\mleft }{\left }\) \(\newcommand {\mright }{\right }\) \(\newcommand {\mleftright }{}\) \(\newcommand {\mleftrightrestore }{}\) \(\require {gensymb}\) \(\newcommand {\intertext }[1]{\text {#1}\notag \\}\) \(\let \Hat \hat \) \(\let \Check \check \) \(\let \Tilde \tilde \) \(\let \Acute \acute \) \(\let \Grave \grave \) \(\let \Dot \dot \) \(\let \Ddot \ddot \) \(\let \Breve \breve \) \(\let \Bar \bar \) \(\let \Vec \vec \) \(\require {cancel}\) \(\newcommand {\Dm }{\operatorname {Dm}}\) \(\newcommand {\Vm }{\operatorname {Vm}}\) \(\newcommand {\Var }{\operatorname {Var}}\) \(\newcommand {\tcbset }[1]{}\) \(\newcommand {\tcbsetforeverylayer }[1]{}\) \(\newcommand {\tcbox }[2][]{\boxed {\text {#2}}}\) \(\newcommand {\tcboxfit }[2][]{\boxed {#2}}\) \(\newcommand {\tcblower }{}\) \(\newcommand {\tcbline }{}\) \(\newcommand {\tcbtitle }{}\) \(\newcommand {\tcbsubtitle [2][]{\mathrm {#2}}}\) \(\newcommand {\tcboxmath }[2][]{\boxed {#2}}\) \(\newcommand {\tcbhighmath }[2][]{\boxed {#2}}\) \(\newcommand {\toprule }[1][]{\hline }\) \(\let \midrule \toprule \) \(\let \bottomrule \toprule \) \(\def \LWRbooktabscmidruleparen (#1)#2{}\) \(\newcommand {\LWRbooktabscmidrulenoparen }[1]{}\) \(\newcommand {\cmidrule }[1][]{\ifnextchar (\LWRbooktabscmidruleparen \LWRbooktabscmidrulenoparen }\) \(\newcommand {\morecmidrules }{}\) \(\newcommand {\specialrule }[3]{\hline }\) \(\newcommand {\addlinespace }[1][]{}\) \(\def \LWRsiunitxrangephrase { \protect \mbox {to (numerical range)} }\) \(\def \LWRsiunitxdecimal {.}\)

4.8 Determinationskoefficienten

Determinationskoefficienten \(R^2\) viser løst sagt, hvor langt data ligger fra modellen. Er \(R^2\) tæt på \(1\), betyder det at data ligger tæt på modellen. Vi skal i det følgende se hvordan \(R^2\) beregnes, hvorefter vi skal kigge mere præcist på dens betydning.

Formlen for \(R^2\) er

\[R^2 = 1-\frac {\textcolor {blue}{\Sigma _{i=1}^{n}e_i^2}}{\textcolor {red}{\Sigma _{i=1}^{n}(y_i-\overline {y})^2}}\]

Her er:
\(e_i\) det i’te residual,
\(y_i\) den i’te \(y\)-værdi,
\(\overline {y}\) gennemsnittet af \(y\)-værdierne.

Vi vender tilbage til vores datasæt for at forstå hvad formlen udtrykker:

\(\begin {array}{ | c | c |} \hline x_i & y_i \\ \hline 1 & 2 \\ 3 & 5 \\ 5 & 4 \\ \hline \end {array}\)

Vi starter med at forklare \(\textcolor {blue}{\Sigma _{i=1}^{n}e_i^2}\) i formlen. Vi tegner først data, model og residualer:

(-tikz- diagram)

I udtrykket \(\textcolor {blue}{\Sigma _{i=1}^{n}e_i^2}\) står residualerne i anden. Størrelserne af \(\textcolor {blue}{e_i^2}\) kan derfor vises med kvadrater som her:

(-tikz- diagram)

Udtrykket \(\textcolor {blue}{\Sigma _{i=1}^{n}e_i^2}\) viser altså det samlede areal af de blå kvadrater. Vi kan se, at jo mindre residualer, jo mindre kvadrater, og derfor er \(\textcolor {blue}{\Sigma _{i=1}^{n}e_i^2}\) tæt på nul når punkterne ligger tæt på linjen.

Vi vender nu blikket mod nævneren i brøken i formlen for \(R^2\):

\[\textcolor {red}{\Sigma _{i=1}^{n}(y_i-\overline {y})^2}\]

Vi kan se at dette udtryk også er en sum af kvadratiske afvigelser. Men denne gang er det afvigelserne fra \(y\)-værdierne til gennemsnittet af \(y\)-værdierne \(\overline {y}\). Vi kan tegne dem på tilsvarende måde som vi tegnede de kvadratiske residualer (blå kvadrater), bortset fra at vi skal tage udgangspunkt i linjen \(y=\overline {y}\) i stedet for regressionslinjen.

(-tikz- diagram)

Denne sum af kvadratiske afvigelser er lille, når punkterne ligger tæt på linjen gennem \(\overline {y}\). Dvs. når alle \(y\)-værdierne ligger tæt på hinanden.

Vi kan nu forklare hvorfor \(R^2\) er tæt på \(1\) når punkterne ligger tæt på linjen. Formlen var:

\[R^2 = 1-\frac {\textcolor {blue}{\Sigma _{i=1}^{n}e_i^2}}{\textcolor {red}{\Sigma _{i=1}^{n}(y_i-\overline {y})^2}}\]

Hvis punkterne ligger tæt på linjen bliver tælleren i brøken tæt på nul, hvilket gør brøken tæt på nul (medmindre nævnerne er tæt på nul også, hvilket jeg kommer tilbage til) og derfor bliver hele udtrykket tæt på \(1\).

Vi kan også forklare, hvorfor \(0\leq R^2\leq 1\). Da både tælleren og nævneren i brøken er ikke-negative, må selve brøken være ikke-negativ. Trækker man noget ikke-negativt fra \(1\), er det højeste man kan få \(1\). Så \(R^2\leq 1\). At \(R^2\geq 0\), skyldes at regressionslinjen er den linje, som giver de mindste kvadratiske afvigelser, og derfor må tælleren i brøken være mindre end eller lig med nævneren (som jo er de kvadratiske afvigelser fra linjen \(y=\hat {y}\)). Dvs. brøken er mindre end eller lig med \(1\). Altså konkluderer vi:

\[0\leq R^2\leq 1\]

Nåh, men vi mangler lige at kigge på situationen, hvor nævneren også er tæt på nul. Det vil den være, hvis punkterne ligger tæt på linjen gennen gennemsnittet, altså hvis alle \(y\)-værdierne er næste ens. I det tilfælde vil der typisk ikke være så meget forskel på tæller og nævner i brøken (relativt set), og derfor vil \(R^2\) være lille. Her er et eksempel:

(-tikz- diagram)

Ovenstående regressionslinje har \(R^2=0{,}25\) på trods af at punkterne ligger super tæt på linjen. Så det med at \(R^2\) er tæt på \(1\) når punkterne er tæt på linjen er lidt upræcist. I stedet kunne man sige at \(R^2\) er tæt på \(1\), når punkterne ligger meget tættere på regressionsmodellen end på gennemsnittet af \(y\)-værdierne.

  • Eksempel 4.8.1
    Antag at vi har et xy-plot der beskriver udviklingen i arbejdsløshed over en periode. Den simpleste beskrivelse af arbejdsløsheden gennem perioden fås ved at beregne den gennemsnitlige arbejdsløshed. Vil man have en bedre beskrivelse, kunne man regne en lineær model for udviklingen. Antag nu at \(R^2=0{,}1\) for sådan en model. Fordi \(R^2\) er så lav, er der noget der tyder på, at modellen ikke giver en væsentlig bedre beskrivelse af udviklingen end gennemsnittet.

Man kunne godt blive fristet til at tro \(R^2\) udtrykker, om man har fat i den rigtige model for ens data. Har man f.eks. \(R^2=0{,}97\) kunne man tænke at ens data var rigtigt godt beskrevet med en lineær model. Som vi skal se i den efterfølgende øvelse er dette dog ikke korrekt.

Øvelse 4.8.1

Læs følgende Wikipedia-artikel:

https://en.wikipedia.org/wiki/Anscombe’s_quartet.

  • a) Forklar, hvor det er problematisk at bruge \(R^2\) til at afgøre om data beskrives godt med den lineære model.

  • b) Forklar, hvorfor man I nogle tilfælde vil acceptere modeller med en lav \(R^2\) værdi.

Løsning 4.8.1

  • a) Følgende regressionsmodeller har ifølge artiklen samme \(R^2\):
    (image)
    Vi ser at data i det øverste højre hjørne følger en parabel, og beskrives derfor dårligt med den lineære model. Data øverst til venstre er til gengæld godt beskrevet med en lineær model. De har samme \(R^2\) og det må betyde at vi har brug for mere end \(R^2\) til at vurdere om vi har fat i den rigtige model.

  • b) Selvom \(R^2\) er lav kan der godt være en klar lineær tendens. Data fra artiklen har \(R^2=0{,}67\), hvilket jo ikke er super højt, men der er en klar lineær tendens i modellen øverst til venstre og derfor er det rimeligt at beskrive data med den lineære model.
    (image)

Øvelse 4.8.2

I øvelse 4.7.1 regnede du modellen \(y=0{,}5x+2{,}5\) for følgende data.

\(\begin {array}{ | c | c |} \hline x_i & y_i \\ \hline 1 & 4 \\ 2 & 2 \\ 4 & 5 \\ \hline \end {array}\)

  • a) Beregn (i hånden) \(R^2\) og fortolk den.

Løsning 4.8.2

  • a) \(R^2=0{,}25\), hvilket betyder at \(25\%\) af variationen i \(y\)-værdierne kan forklares ved hjælp af modellen.

Ekstra

En almindelig fortolkning af \(R^2\) er:

Andelen af den totale variation i \(y\)-værdier som er forklaret af modellen.

Vi skal nu se hvad det betyder. Vi starter med vores xy-plot:

(-tikz- diagram)

Vi vil nu regne den totale variation i \(y\)-værdierne. Der er flere måde at udtrykke variationen, men vi regner den som de kvadratiske afvigelser fra gennemsnittet. I første omgang tegner vi dog kun selve afvigelse ind:

(-tikz- diagram)

Vi vil nu se om vi kan slippe af med noget af den variation ved at tegne en regressionslinje:

(-tikz- diagram)

Vi kan se at vi med modellen kommer tætter på punktet og vi er sluppet af med noget af variationen. Den grønne streg viser hvor stor en del af variationen, som modellen har forklaret og den blå viser den variation der stadig er tilbage. Som sagt regner vi variationen som kvadratiske afvigelser, så vi skal tegne kvadrater:

(-tikz- diagram)

Vi forstiller os nu at vi tegner tilsvarende kvadrater for de andre punkter og indfører følgende betegnelser.

\(\textcolor {red}{SS_\text {tot}}\): Summen af de røde kvadrater, som udtrykker den totale variation.

\(\textcolor {green}{SS_\text {reg}}\): Summen af de grønne kvadrater, som udtrykker den forklarede variation.

\(\textcolor {blue}{SS_\text {reg}}\): Summen af blå kvadrater, som udtrykker den variation modellen ikke kan forklare.

Med de betegnelser får vi at

\[R^2=1-\frac {\textcolor {blue}{SS_\text {res}}}{\textcolor {red}{SS_\text {tot}}} \]

Man kan bevise (vil vil ikke gøre det), at når man bruger mindste kvadraters metode til at finde modellen, så er

\[\textcolor {red}{SS_\text {tot}}=\textcolor {green}{SS_\text {reg}}+\textcolor {blue}{SS_\text {res}}\]

Vi vi dividere med \(\textcolor {red}{SS_\text {tot}}\) på begge sider.

\[\frac {\textcolor {red}{SS_\text {tot}}}{\textcolor {red}{SS_\text {tot}}}=\frac {\textcolor {blue}{SS_\text {res}}}{\textcolor {red}{SS_\text {tot}}} + \frac {\textcolor {green}{SS_\text {reg}}}{\textcolor {red}{SS_\text {tot}}}\]

Vi forkorter og omskriver:

\[1-\frac {\textcolor {blue}{SS_\text {res}}}{\textcolor {red}{SS_\text {tot}}} = \frac {\textcolor {green}{SS_\text {reg}}}{\textcolor {red}{SS_\text {tot}}}\]

Vi genkender venstresiden som \(R^2\). Vi husker at \(\textcolor {green}{SS_\text {reg}}\) udtrykker den del af den totale variation som modellen kan forklare og dermed er \(\frac {\textcolor {green}{SS_\text {reg}}}{\textcolor {red}{SS_\text {tot}}}\) andelen af den totale variation som modellen kan forklare. Vi har altså:

\[R^2 = \text {''andelen af den totale variation, som modellen kan forklare''}\]

På grund af dette kaldes \(R^2\) også for forklaringsgraden, da \(R^2\) udtrykker i hvilken grad regressionslinjen forklarer variationen.