6 Konkrete vektorer

Kommentarer/spørgsmål?

6.1 Konkrete vektorrum

Vi vil indføre (konkrete) vektorrum over $F$ , hvor $F$ enten er de reelle tal $\mathbb{R}$ eller de komplekse $\mathbb{C}$ . Sjovt nok afhænger rammen eller beviserne ikke af om $F$ er netop $\mathbb{R}$ eller $\mathbb{C}$ og det er da også en af grundene til at indføre vektorrum som abstrakt begreb senere. Faktisk kan $F$ helt generelt være det man i matematikken kalder et legeme (engelsk: field) - et algebraisk system, hvor det er muligt at dividere med alle elementer $\neq 0$ .

6.1.1 De reelle tal $\mathbb{R}$

En helt naturlig generalisering af vektorer i planen $\mathbb{R}^2$ er søjlevektorer af længde $n$ med indgange i $\mathbb{R}$ :

$\mathbb{R}^n = \left\{ \begin{pmatrix} x_1 \\ \vdots \\ x_n\end{pmatrix} \middle|\, x_1, \ldots, x_n\in \mathbb{R}\right\}.$ To vektorer

$\mathbf u = \begin{pmatrix} u_1 \\ \vdots \\ u_n\end{pmatrix}\qquad\mathrm{og}\qquad \mathbf v = \begin{pmatrix} v_1 \\ \vdots \\ v_n\end{pmatrix}$ kan adderes plads for plads som

$\mathbf u + \mathbf v = \begin{pmatrix} u_1 + v_1 \\ \vdots \\ u_n + v_n \end{pmatrix} \tag{6.1}$ og vektoren $\mathbf u$ kan ganges med et tal $\lambda\in \mathbb{R}$ som

$\lambda \mathbf u = \begin{pmatrix} \lambda u_1 \\ \vdots \\ \lambda u_n\end{pmatrix}. \tag{6.2}$ Vi vil ofte bruge følgende notation: Hvis

$\mathbf u = \begin{pmatrix} u_1 \\ \vdots \\ u_n\end{pmatrix}$ er en søjlevektor, så er $(\mathbf u)_i=u_i$ den indgang i $\mathbf u$ som står i række nummer $i$ .

6.1.2 Geometri, linear algebra og vektorer i rummet.

Det er ofte en god hjælp for forståelsen at forestille sig vektorer i rummet. Vi plejer jo at visualisere $\mathbb{R}^3$ som det rum vi allesammen lever i. Metoden har visse ulemper som vi vil diskutere løbende alt efter at vi opdager dem. Den første ulempe er at vi har brug for et punkt. I $\mathbb{R}^3$ er der en vektor der er speciel, nemlig nulvektoren $\mathbf 0 =(0,0,0)^T$ , fordi den er den eneste vektor der opfylder at $\mathbf v+\mathbf 0 =\mathbf v$ for alle vektorer $\mathbf v$ . Men i det rum vi lever i findes der ikke et punkt som er verdens centrum. Marcels kat ville sige at det punkt findes, og at det er den selv, men nabokatten Alfred ville ikke være enig deri. Så det første vi skal gøre er at vælge et punkt i rummet som vi kalder for $\mathbf 0$ , nulvektoren eller ''origo''. Det er ligegyldigt hvad for et punkt vi vælger, men når vi først har valgt et punkt, så er vi nødt til at holde fast i det valg.

$\phantom{phantom}$ Det næste valg vi gør er at vælge et koordinatsystem med origo i det punkt vi har valgt. Når vi har gjort alt dette, kan vi sige at en søjlevektor $(x,y,z)^T$ svarer til nøjagtig et punkt i rummet. Men husk det nu og glem det ikke - det punkt vil også afhænge af valget af origo og af valget af koordinatsystem. Noget man skal bide mærke i er at skalering med et tal og addition af to vektorer ikke behøver referere til valget af koordinatsystem, det kan beskrives helt geometrisk! En anden måde at udtrykke det på, er at sige at hvis vi udstyrer vores fysiske rum med et origo (for eksempel en kat), så danner det et abstrakt vektorrum.

Aksiomer for et abstrakt vektorrum

At $V$ er et abstrakt vektorrum over et legeme $F$ betyder:

Givet $\mathbf v,\mathbf u\in V$ og $\lambda\in F$ kan vi definere $\mathbf u+\mathbf v$ og $\lambda \mathbf v$ .
$\mathbf u+\mathbf v=\mathbf v+\mathbf u$ .
$(\mathbf u+\mathbf v)+\mathbf w=\mathbf u+(\mathbf v+\mathbf w)$
Der findes en vektor $\mathbf 0\in V$ så at $\mathbf u+\mathbf 0=\mathbf u$ for alle $\mathbf u\in V$ .
For $\lambda\in F$ og $\mathbf u\mathbf v\in V$ er $\lambda(\mathbf u+\mathbf v)=\lambda\mathbf u+\lambda\mathbf v$ .
For $\lambda,\mu\in F$ og $\mathbf u\in V$ er $(\lambda+\mu)\mathbf u=\lambda\mathbf u+\mu\mathbf u$ .
For $\lambda,\mu\in F$ og $\mathbf u\in V$ er $\lambda(\mu\mathbf u)=(\lambda\mu)\mathbf u$ .
For $\mathbf v\in V$ er $1\cdot \mathbf v=\mathbf v$ .

Abstrakte vektorrum forekommer meget ofte både i matematikken og i anvendelser. Vi vil ikke diskutere dem videre i disse noter, men de underrum af $F^n$ som vi kommer at beskæftige os en del med er fortræffelige eksempler på abstrakte vektorrum. Hvis man forstår dem, så er man også meget tæt på at forstå abstrakte vektorrum generelt.

$\phantom{phantom}$ Vi anbefaler i øvrigt meget stærkt at tage et kig på Essence of linear algebra af 3Blue1Brown.

6.1.3 De komplekse tal $\mathbb{C}$

På analog vis definerer vi for de komplekse tal

$\mathbb{C}^n = \left\{ \begin{pmatrix} x_1 \\ \vdots \\ x_n\end{pmatrix} \middle|\, x_1, \ldots, x_n\in \mathbb{C}\right\},$ hvor addition af vektorer defineres som i (6.1) og talmultiplikation som i (6.2), men nu med komplekse tal i stedet for reelle tal.

Hvordan ser det ud i rummet?

Marcel beklager det dybt, men der er ikke en god måde at visualisere $\mathbb{C}^n$ for $n\geq 2$ . For $n=1$ har vi allerede diskuteret en geometrisk beskrivelse af $\mathbb{C}^1=\mathbb{C}$ til bevidstløshed i kapitlet ''De komplekse tal''.

6.2 Underrum

Lad nu $F$ betegne enten $\mathbb{R}$ eller $\mathbb{C}$ . Bemærk at $F^n$ ligesom $\mathbb{R}^3$ indeholder nulvektoren $\mathbf 0$ , som består af $0$ på alle indgangene og at

$\mathbf 0 + \mathbf v = \mathbf v$ for alle $\mathbf v\in F^n$ .

Lad $n>0$ være et naturligt tal. Et underrum af $F^n$ er en ikke tom delmængde

$V \subseteq F^n,$ som opfylder at

$\mathbf u + \mathbf v\in V$ , hvis $\mathbf u, \mathbf v\in V$ .
$\lambda \mathbf u\in V$ , hvis $\lambda\in F$ og $\mathbf u\in V$

Hvordan ser det ud i rummet?

Et underrum af $\mathbb{R}^3$ kan være af fire forskellige slags.

Det kan bestå af kun origo.
Det kan være en linje der indeholder origo.
Det kan være en plan der indeholder origo.
Det kan være hele $\mathbb{R}^3$ (som selvfølgelig automatisk indeholder origo).

Quiz

Hvilke af nedenstående udsagn er rigtige?

Punkterne på linjen i $\mathbb{R}^2$ givet ved $y = 2x + 1$ er et underrum af $\mathbb{R}^2$ .

Et underrum af $F^n$ indeholder altid $\mathbf 0$ .

Hvis $\lambda, \mu\in F$ og $\mathbf u, \mathbf v\in V$ , hvor $V$ er et underrum af $F^n$ så vil

$\lambda \mathbf u + \mu \mathbf v \in V.$

Punkterne på parablen $y = x^2$ i $\mathbb{R}^2$ er et underrum af $\mathbb{R}^2$ .

Quiz

Betragt delmængden $W = \{(x, y, z) \mid x + y - z = a\}$ af $\mathbb{R}^3$ . For hvilke $a$ er $W$ et underrum af $\mathbb{R}^3$ ?

$a=1$ .

$a=-1$ .

$a=0$ .

6.2.1 Linearkombinationer og span af vektorer

Lad $\mathbf v_1, \ldots, \mathbf v_m\in F^n$ . En vektor på formen

$\lambda_1 \mathbf v_1 + \cdots + \lambda_m \mathbf v_m$ med $\lambda_1, \ldots, \lambda_m\in F$ kaldes en linearkombination af $\mathbf v_1, \ldots, \mathbf v_m$ . Mængden

$\mathrm{span}(\mathbf v_1, \ldots, \mathbf v_m):=\{\lambda_1 \mathbf v_1 + \cdots + \lambda_m \mathbf v_m \mid \lambda_1, \ldots, \lambda_m\in F\}$ af alle mulige linearkombinationer af $\mathbf v_1, \ldots, \mathbf v_m$ er et underrum af $F^n$ og kaldes for span af vektorerne $\mathbf v_1, \ldots, \mathbf v_m$ .

Hvordan ser det ud i rummet?

Vi ved i hvert fald at span af nogle vektorer i rummet er et underrum, så det må være en af de fire typer af underrum: punkt, linje, plan eller hele rummet. Hvis vi har en mængde af vektorer i $\mathbb{R}^3$ , hvad for type underrum vil vi de udspænde? Ja, det er et godt spørgmål, tak for at I stillede det. Vi skal lige tænke os om, og når vi har tænkt os om så vender vi tilbage til det.

Quiz

Betragt ligningen

$\lambda_1 \begin{pmatrix} 1 \\ 0 \\ 1 \end{pmatrix} + \lambda_2 \begin{pmatrix} 0 \\ 1 \\ 1 \end{pmatrix} + \lambda_3 \begin{pmatrix} 1 \\ 2 \\ 1 \end{pmatrix} + \lambda_4 \begin{pmatrix} 4 \\ 0 \\ 1 \end{pmatrix} = \begin{pmatrix} 0 \\ 0 \\ 0 \end{pmatrix},$ hvor $\lambda_1, \lambda_2, \lambda_3, \lambda_4 \in \mathbb{R}$ . Denne ligning er opfyldt for?

$\begin{aligned} &\lambda_1 = -6,\quad \lambda_2 = -2,\quad \lambda_3 = 3\\ &\lambda_4 = 5. \end{aligned}$

$\begin{aligned} &2\lambda_1 = -5 \lambda_4,\quad \lambda_2 = 3 \lambda_4\\ &2 \lambda_3 = - 3\lambda_4. \end{aligned}$

$\begin{aligned} &\lambda_1 = -2,\quad \lambda_2 = -1,\quad \lambda_3 = 3\\ &\lambda_4 = 7. \end{aligned}$

$\begin{aligned} &\lambda_1 = 5,\quad \lambda_2 = -6,\quad \lambda_3 = 3\\ &\lambda_4 = -2. \end{aligned}$

Der er her tale om en relativt abstrakt definition og det er en rigtig god ide at forbinde den til de konkrete forhold i den følgende opgave.

Opgave

Lad

$\mathbf v_1 = \begin{pmatrix} 1\\ 0\\ 0\end{pmatrix},\quad \mathbf v_2 = \begin{pmatrix} 0\\ 1\\ 0\end{pmatrix}\quad\mathrm{og}\quad \mathbf v_3 = \begin{pmatrix} 0\\ 0\\ 1\end{pmatrix}$ være vektorer i $\mathbb{R}^3$ . Forklar hvorfor

$\mathrm{span}(\mathbf v_1, \mathbf v_2, \mathbf v_3) = \mathbb{R}^3$ det vil sige hvorfor alle vektorer i $\mathbb{R}^3$ er linearkombinationer af $\mathbf v_1, \mathbf v_2$ og $\mathbf v_3$ . Lad nu

$\mathbf v_1 = \begin{pmatrix} 3\\ 2\end{pmatrix}\quad\mathrm{og}\quad \mathbf v_2 = \begin{pmatrix} 2\\ 3\end{pmatrix}$ være vektorer i $\mathbb{R}^2$ . Hvordan afgør man om $\mathrm{span}(\mathbf v_1, \mathbf v_2) = \mathbb{R}^2$ i dette tilfælde?

Opgave

Lad $\mathbf v_1, \ldots, \mathbf v_m\in V$ være vektorer i et underrum $V$ af $F^n$ . Forklar hvorfor

$\mathrm{span}(\mathbf v_1, \ldots, \mathbf v_m) \subseteq V.$

En helt fundamental observation er at span ikke ændrer sig ved operationer svarende til rækkeoperationerne for en matrix. Læg også mærke til (δ) i Proposition 6.7, som forklarer at span blot er en ramme for løsning af ligninger.

Lad $\mathbf v_1, \ldots, \mathbf v_m\in F^n$ og

$V = \mathrm{span}(\mathbf v_1, \ldots, \mathbf v_i, \ldots, \mathbf v_j, \ldots, \mathbf v_m),$ hvor $1 \leq i < j \leq m$ . Så gælder

(Ombytning af vektorer)
$V = \mathrm{span}(\mathbf v_1, \ldots, \mathbf v_j, \ldots, \mathbf v_i, \ldots, \mathbf v_m).$
(Multiplikation af en vektor med et tal $\neq 0$ )
$V = \mathrm{span}(\mathbf v_1, \ldots, \lambda \mathbf v_i, \ldots, \mathbf v_m)$ for $\lambda\neq 0$ .
(Addition af et multiplum af en vektor til en anden vektor)
$V = \mathrm{span}(\mathbf v_1, \ldots, \mathbf v_i, \ldots, \mathbf v_j + \lambda \mathbf v_i, \ldots, \mathbf v_m)$ for alle $\lambda$ .
Lad $A$ være matricen med søjler $A^1 = \mathbf v_1, \ldots, A^m = \mathbf v_m$ . Vektoren $\mathbf b\in F^n$ ligger i $V$ hvis og kun hvis ligningssystemet
$A \mathbf x = \mathbf b$ har en løsning $\mathbf x\in F^m$ .

Bevis

Vi beviser kun (γ) og (δ) her. Lad

$V' = \mathrm{span}(\mathbf v_1, \ldots, \mathbf v_i, \ldots, \mathbf v_j + \lambda \mathbf v_i, \ldots, \mathbf v_m).$ Vi skal bevise at $V = V'$ . Hvis en vektor $\mathbf v\in V'$ så er

$\mathbf v = \lambda_1 \mathbf v_1 + \cdots + \lambda_i \mathbf v_i + \cdots +\lambda_j (\mathbf v_j + \lambda \mathbf v_i) + \cdots + \lambda_m \mathbf v_m$ for passende $\lambda_1, \ldots, \lambda_m\in F$ . En omskrivning giver

$\mathbf v= \lambda_1 \mathbf v_1 + \cdots + (\lambda_i + \lambda_j \lambda) \mathbf v_i + \cdots +\lambda_j \mathbf v_j + + \cdots + \lambda_m \mathbf v_m,$ hvilket viser at $\mathbf v\in V$ . Modsat hvis nu $\mathbf v\in V$ , så er

$\mathbf v = \lambda_1 \mathbf v_1 + \cdots + \lambda_i \mathbf v_i + \cdots +\lambda_j \mathbf v_j + \cdots + \lambda_m \mathbf v_m$ for passende $\lambda_1, \ldots, \lambda_m\in F$ . Her giver en lidt mere indviklet omskrivning at

$\mathbf v = \lambda_1 \mathbf v_1 + \cdots + (\lambda_i - \lambda_j \lambda) \mathbf v_i + \cdots +\lambda_j (\mathbf v_j + \lambda \mathbf v_i) + \cdots + \lambda_m \mathbf v_m,$ hvilket viser at $\mathbf v\in V'$ . Derfor er $V = V'$ . Den sidste påstand (δ) følger naturligt af definitionen af matrixmultiplikation, idet

$A \mathbf x = \lambda_1 A^1 + \cdots + \lambda _m A^m = \lambda_1 \mathbf v_1 + \cdots + \lambda _m \mathbf v_m,$ hvor

$\mathbf x = \begin{pmatrix} \lambda_1 \\ \vdots \\ \lambda_m \end{pmatrix}.$

Opgave

Giv et alternativt bevis for 6.7(γ) på følgende måde. Vis først at enhver af vektorerne $\mathbf v_1,\ldots,\mathbf v_j+\lambda \mathbf v_i,\ldots$ er indeholdt i $\mathrm{span}(\mathbf v_1,\ldots,\mathbf v_m)$ . Brug opgave 6.6 for at konkludere at $\mathrm{span}(\mathbf v_1,\ldots,\mathbf v_j+\lambda \mathbf v_i,\ldots,\mathbf v_m)\subseteq \mathrm{span}(\mathbf v_1,\ldots,\mathbf v_m)$ Vis omvendt at enhver af vektorerne $\mathbf v_1,\ldots,\mathbf v_m$ er indholdt i $\mathrm{span}(\mathbf v_1,\ldots,\mathbf v_j+\lambda \mathbf v_i,\ldots,\mathbf v_m)$ . Overvej at det nu følger at

$\mathrm{span}(\mathbf v_1, \ldots, \mathbf v_i, \ldots, \mathbf v_j + \lambda \mathbf v_i, \ldots, \mathbf v_m)= \mathrm{span}(\mathbf v_1, \ldots, \mathbf v_i, \ldots, \mathbf v_j, \ldots, \mathbf v_m)$ For en ekstra stjerne, overvej at man med densamme metode også kan bevise 6.7(α) og 6.7(β).

Eksempel

Betragt nu vektorerne

$\mathbf v_1 = \begin{pmatrix} 1 \\ 1 \\ 0 \end{pmatrix}\qquad\mathrm{og}\qquad \mathbf v_2 = \begin{pmatrix} 0 \\ 1 \\ 1 \end{pmatrix}$ i $\mathbb{R}^3$ . Lad os undersøge om

$\mathbf b = \begin{pmatrix} 1 \\ 2 \\ 3 \end{pmatrix}\in \mathrm{span}(\mathbf v_1, \mathbf v_2).$ Her bruger vi Proposition 6.7(δ) og opstiller ligningssystemet $A \mathbf x = \mathbf b$ , hvor $A$ er matricen med søjler $\mathbf v_1$ og $\mathbf v_2$ . Da

$\begin{pmatrix} 1 & 0 & 1\\ 1 & 1 & 2\\ 0 & 1 & 3 \end{pmatrix}\sim \begin{pmatrix} 1 & 0 & 1\\ 0 & 1 & 1\\ 0 & 0 & 2 \end{pmatrix},$ hvor sidste række indikerer $0 = 2$ (hvad sker der her? hvorfor gør den det?), ses at ligningssystemet ikke har en løsning og dermed at $\mathbf b\notin\mathrm{span}(\mathbf v_1, \mathbf v_2)$ .

6.2.2 Nulrum, søjlerum og rækkerum for matricer

Tre helt fundamentale eksempler på underrum er knyttet til en matrix.

Lad $A$ være en $m\times n$ matrix $A$ med indgange i $F$ .

$N(A) = \{\mathbf v\in F^n \mid A \mathbf v = 0\}$ er et underrum af $F^n$ .
{ $C(A)$ }
$C(A) = \{A \mathbf v \mid \mathbf v\in F^n\}$ er et underrum af $F^m$ .
{ $R(A)$ }
$R(A) = \{A^T \mathbf v \mid \mathbf v\in F^m\}$ er et underrum af $F^n$ .

Bevis

Det følger at $N(A)$ er et underrum af $F^n$ , fordi

$A(\mathbf u +\mathbf v) = A\mathbf u + A\mathbf v = 0\qquad\mathrm{og}\qquad A(\lambda \mathbf u) = \lambda A \mathbf u = 0,$ hvis $\mathbf u, \mathbf v\in N(A)$ og $\lambda\in F$ . På næsten samme måde vises at $C(A)$ er et underrum af $F^m$ : Hvis $\mathbf u', \mathbf v'\in C(A)$ og $\lambda\in F$ skal vi vise at $\mathbf u'+\mathbf v'\in C(A)$ og $\lambda \mathbf u'\in C(A)$ . Men $\mathbf u', \mathbf v'\in C(A)$ betyder at $\mathbf u' = A\mathbf u, \mathbf v' = A\mathbf v$ for passende $\mathbf u, \mathbf v\in F^n$ . Derfor gælder

$\mathbf u' + \mathbf v' = A \mathbf u + A \mathbf v = A (\mathbf u + \mathbf v)\in C(A)$ og

$\lambda \mathbf u' = \lambda A \mathbf u = A (\lambda \mathbf u)\in C(A).$ Ved at sammenligne definitionerne af rækkerum og søjlerum ser vi at $R(A)=C(A^T)$ . Ved at bruge (β) på $n\times m$ matricen $A^T$ indser vi at $C(A^T)$ er et underrum af $F^n$ . Men da $R(A)=C(A^T)$ er $R(A)$ er et underrum af $F^n$ .

Underrummet $N(A)$ kaldes for nulrummet for $A$ , $C(A)$ kaldes for søjlerummet for $A$ og $R(A)$ rækkerummet for $A$ .

Hvordan ser det ud i rummet?

Der er virkeligt gode geometriske beskrivelser af disse tre underrum, men det er nemmere at forstå dette efter at vi har forklaret hvad en lineær transformation er. Vi vender tilbage.

Disse definitioner kan være svære at forstå uden et konkret eksempel.

Eksempel

Lad os se på matricen

$A = \begin{pmatrix} 1 & 2 & 3\\ 4 & 5 & 6 \end{pmatrix}.$ Her er søjlerummet

$\begin{aligned} C(A) &= \left\{\begin{pmatrix} 1 & 2 & 3\\ 4 & 5 & 6 \end{pmatrix}\begin{pmatrix} x_1 \\ x_2 \\ x_3\end{pmatrix} \middle|\, x_1, x_2, x_3\in F\right\} = \left\{\begin{pmatrix} x_1 + 2 x_2 + 3 x_3\\ 4 x_1 + 5 x_2 + 6 x_3 \end{pmatrix} \middle|\, x_1, x_2, x_3\in F\right\} \\ &= \left\{ x_1 \begin{pmatrix} 1 \\ 4\end{pmatrix} + x_2 \begin{pmatrix} 2 \\ 5\end{pmatrix} + x_3 \begin{pmatrix} 3 \\ 6 \end{pmatrix} \middle|\, x_1, x_2, x_3\in F\right\}. \end{aligned}$ På samme måde ses rækkerummet at være

$R(A) = \left\{\begin{pmatrix} 1 & 4\\ 2 & 5\\ 3 & 6 \end{pmatrix} \begin{pmatrix} y_1 \\ y_2\end{pmatrix} \middle|\, y_1, y_2\in F\right\} = \left\{y_1 \begin{pmatrix} 1 \\ 2 \\ 3\end{pmatrix} + y_2 \begin{pmatrix} 4 \\ 5 \\ 6\end{pmatrix} \middle|\, y_1, y_2\in F\right\}.$ Nulrummet $N(A)$ er løsningerne til det homogene ligningssystem $A x = 0$ det vil sige

$\begin{aligned} N(A) &= \left\{\begin{pmatrix} x_1 \\ x_2 \\ x_3 \end{pmatrix}\in F^3\, \middle| \begin{pmatrix} 1 & 2 & 3\\ 4 & 5 & 6 \end{pmatrix} \begin{pmatrix} x_1 \\ x_2 \\ x_3 \end{pmatrix} = \begin{pmatrix} 0 \\ 0 \end{pmatrix}\right\}\\ \\ &=\left\{\begin{pmatrix} x_1 \\ x_2 \\ x_3 \end{pmatrix}\in F^3\, \middle|\, \begin{matrix} &x_1 + &2 x_2 + &3 x_3 &= &0\\ &4 x_1 + &5 x_2 + &6 x_3 &= &0 \end{matrix} \right\}. \end{aligned}$ I Eksempel 6.13 giver vi et eksempel på hvordan man udregner $N(A)$ via RREF. Ikke overraskende er der tale om at løse det homogene ligningssystem ved hjælp af af bundne og frie variable.

Eksempel 6.11 viser at $R(A)$ er span af rækkevektorerne (transponeret) og $C(A)$ span af søjlevektorerne for en matrix $A$ .

En særdeles vigtig observation er at nulrummet og rækkerummet ikke ændres ved rækkeoperationer på matricen. Desuden er søjlerummet relateret til pivotrækkerne i matricens RREF.

Lad $A$ være en $m\times n$ matrix og $B$ dens RREF. Så er

$N(A) = N(B)\qquad\mathrm{og}\qquad R(A) = R(B).$ Søjlerummet $C(A)$ er span af søjlerne i $A$ svarende til pivotsøjlerne i $B$ det vil sige de søjler eller søjlenumre i $B$ , som indeholder pivotelementerne.

Bevis

Der findes en invertibel matrix $E$ så $B = E A$ . Da $E$ er invertibel ses at $A \mathbf x = \mathbf 0$ holder hvis og kun hvis $B \mathbf x = (E A) \mathbf x = E (A \mathbf x) = \mathbf 0$ . Dette oversættes umiddelbart til at $N(A) = N(B)$ . På samme måde får vi at $A^T \mathbf x = (E A)^T\mathbf y=B^T\mathbf y$ , hvor $\mathbf y = (E^T)^{-1} \mathbf x$ og dermed er $R(A)=C(A^T)=C(B^T)= R(B)$ .

$\phantom{phantom}$ Det var nemt nok. Det er lidt mere indviklet at vise påstanden om søjlerummet $C(A)$ . Da $B$ er på RREF så er pivotsøjlerne i $B$ er simpelthen vores standard basisvektorer $\mathbf e_1,\mathbf e_2,\ldots \mathbf e_m$ hvor

$\mathbf e_1= \begin{pmatrix} 1\\ 0\\ 0\\ \vdots\\0 \end{pmatrix} \mathbf e_2= \begin{pmatrix} 0\\ 1\\ 0\\ \vdots\\0 \end{pmatrix} \ldots \mathbf e_m= \begin{pmatrix} 0\\ 0 \\ \vdots \\ 0 \\ 1\\ 0 \\ \vdots\\0 \end{pmatrix}$ Span af disse pivotsøjler er altså alle vektorer $\mathbf v$ på formen

$\mathbf v= \begin{pmatrix} v_1\\ v_2 \\ \vdots \\ v_{m-1}\\v_m \\ 0 \\ \vdots \\ 0 \end{pmatrix}$ Søjlerummet af $B$ er åbenbart span af pivotsøjlerne (hvorfor er dette egentlig så åbenbart? ).

Vink

Hvis $B$ er på RREF kunne den for eksempel se sådan ud:

$\begin{pmatrix} 0 & 1 & 0 & 1 & 0& 0 & 0\\ 0 & 0 & 1 & 1 & 0& 0 & 0.01\\ 0 & 0 & 0 & 0 & 1& 3.2 & 0\\ 0 & 0 & 0 & 0 & 0& 0 & 0 \end{pmatrix},$

Nu overvejer vi følgende. Antag at $\mathbf v_1,\ldots \mathbf v_r$ er en mængde af vektorer, og at $\mathbf w_1,\ldots \mathbf w_s$ er en anden mængde af vektorer. Hvis det nu er så heldigt at

$\mathrm{span}(\mathbf v_1,\ldots \mathbf v_r)=\mathrm{span}(\mathbf w_1,\ldots \mathbf w_s)$ og $E$ er en invertibel matrix, så er også

$\mathrm{span}(E^{-1}\mathbf v_1,\ldots E^{-1}\mathbf v_r)=\mathrm{span}(E^{-1}\mathbf w_1,\ldots E^{-1}\mathbf w_s).$ Hvis nu $(\mathbf v_1,\ldots \mathbf v_r)$ er pivotsøjlerne i $B$ og $(\mathbf w_1,\ldots \mathbf w_n)$ er alle søjler i $B$ så er ifølge det vi lige har overvejet $\mathrm{span}(\mathbf v_1,\ldots \mathbf v_r)=\mathrm{span}(\mathbf w_1,\ldots \mathbf w_n)$ og dermed $\mathrm{span}(E^{-1}\mathbf v_1,\ldots E^{-1}\mathbf v_r)=\mathrm{span}(E^{-1}\mathbf w_1,\ldots E^{-1}\mathbf w_n).$ Men da $E^{-1}B=A$ er $E^{-1}\mathbf w_i$ jo netop den søjle i $A$ der har søjlenummer $i$ (overvej også det!), og vektorerne $E^{-1}\mathbf v_i$ er de søjler i $A$ der har de samme søjlenummer som pivotsøjlerne i $B$ .

Vi giver et eksempel på hvordan nulrummet $N(A)$ , rækkerummet $R(A)$ og søjlerummet $C(A)$ udregnes for en matrix $A$ .

Eksempel

Lad

$A = \begin{pmatrix} \phantom{-}1 & -1 & 1 & -2\\ -1 & \phantom{-}2 & 1 & \phantom{-}1\\ \phantom{-}1 & -1 & 1 & -2\\ -1 & \phantom{-}2 & 1 & \phantom{-}1 \end{pmatrix}$ Først rækkereducerer vi $A$ til RREF:

$A \sim \begin{pmatrix} 1 & -1 & 1 & -2\\ 0 & \phantom{-}1 & 2 & -1\\ 0 & \phantom{-}0 & 0 & \phantom{-}0\\ 0 & \phantom{-}1 & 2 & -1 \end{pmatrix} \sim \begin{pmatrix} 1 & -1 & 1 & -2\\ 0 & \phantom{-}1 & 2 & -1\\ 0 & \phantom{-}0 & 0 & \phantom{-}0\\ 0 & \phantom{-}0 & 0 & \phantom{-}0 \end{pmatrix}\sim \begin{pmatrix} 1 & 0 & 3 & -3\\ 0 & 1 & 2 & -1\\ 0 & 0 & 0 & \phantom{-}0\\ 0 & 0 & 0 & \phantom{-}0 \end{pmatrix}$ I første $\sim$ adderes første række til anden række, trækkes fra tredie række og adderes til fjerde række. I anden $\sim$ trækkes anden række fra fjerde række. I tredje $\sim$ adderes anden række til første række. Sidste matrix er på RREF. Lad os kalde den $B$ . Nu ved vi fra Proposition 6.12 at $N(A) = N(B)$ og $R(A) = R(B)$ . De bundne variable er $x_1, x_2$ . De frie er $x_3, x_4$ . Det vil sige et typisk element i $N(A)$ har formen

$\begin{pmatrix} -3x_3 + 3x_4 \\ -2x_3 + x_4 \\ x_3 \\ x_4 \end{pmatrix} = x_3 \begin{pmatrix} -3\\ -2\\ \phantom{-}1 \\ \phantom{-}0 \end{pmatrix} + x_4 \begin{pmatrix} 3 \\ 1\\ 0 \\ 1\end{pmatrix}.$ Heraf fremgår det at

$N(A) = \mathrm{span}\left( \begin{pmatrix} -3 \\ -2 \\ \phantom{-}1 \\ \phantom{-}0 \end{pmatrix}, \begin{pmatrix} 3 \\ 1 \\ 0 \\ 1 \end{pmatrix} \right)$ samt

$R(A) = \mathrm{span}\left( \begin{pmatrix} \phantom{-}1 \\ \phantom{-}0 \\ \phantom{-}3 \\ -3 \end{pmatrix}, \begin{pmatrix} \phantom{-}0 \\ \phantom{-}1 \\ \phantom{-}2 \\ -1 \end{pmatrix} \right).$ Læg mærke til at vi gik fra at have rækkerummet som span af $4$ vektorer (de $4$ rækker (transponeret) i $A$ ) til et span af kun $2$ vektorer. Svarende til pivotsøjlerne i $B$ bliver

$C(A) = \mathrm{span}\left( \begin{pmatrix} \phantom{-}1 \\ -1 \\ \phantom{-}1 \\ -1 \end{pmatrix}, \begin{pmatrix} -1 \\ \phantom{-}2 \\ -1 \\ \phantom{-}2 \end{pmatrix} \right).$ svarende til de to første søjler i $A$ igen i følgende Proposition 6.12.

6.3 Lineær uafhængighed

De to vektorer

$\begin{pmatrix} 1 \\ 0 \end{pmatrix}\qquad\mathrm{og}\qquad \begin{pmatrix} 0 \\ 1 \end{pmatrix}$ er specielle i og med at ingen af dem kan udelades fra

$V = \mathrm{span}\left(\begin{pmatrix} 1 \\ 0 \end{pmatrix}, \begin{pmatrix} 0 \\ 1 \end{pmatrix} \right)$ uden at $V$ bliver mindre eller ændres (fra $\mathbb{R}^2$ til $x$ -aksen eller $y$ -aksen). Det er helt anderledes med for eksempel vektorerne

$\begin{pmatrix} 1 \\ 1 \end{pmatrix}\qquad\mathrm{og}\qquad \begin{pmatrix} 2 \\ 2 \end{pmatrix}.$ Her ændres

$V = \mathrm{span}\left(\begin{pmatrix} 1 \\ 1 \end{pmatrix}, \begin{pmatrix} 2 \\ 2 \end{pmatrix} \right)$ ikke hvis en af dem udelades.

Vektorerne $\mathbf v_1, \ldots, \mathbf v_m\in F^n$ kaldes lineært uafhængige hvis de er minimale i den forstand at ingen af dem kan udelades fra

$V = \mathrm{span}(\mathbf v_1, \ldots, \mathbf v_m)$ uden at $V$ ændres. Vektorerne kaldes for lineært afhængige, hvis de ikke er lineært uafhængige.

Definition 6.14 er ækvivalent med at

$\mathbf v_i\notin\mathrm{span}(\mathbf v_1, \ldots, \mathbf v_{i-1}, \mathbf v_{i+1}, \ldots, \mathbf v_m)$ for $i=1, \ldots, m$ . Faktisk gælder følgende.

Vektorerne $\mathbf v_1, \ldots, \mathbf v_m\in F^n$ er lineært uafhængige hvis og kun hvis man af $\lambda_1 \mathbf v_1 + \cdots + \lambda_m \mathbf v_m = \mathbf 0$ for $\lambda_1, \ldots, \lambda_m\in F$ kan slutte at
$\lambda_1 = \cdots = \lambda_m = 0.$
Lad $\mathbf v_1, \ldots, \mathbf v_n\in F^m$ og lad $A$ betegne $m\times n$ matricen med søjler
$A^1 = \mathbf v_1, \ldots, A^n = \mathbf v_n.$ Så er $\mathbf v_1, \ldots, \mathbf v_n\in F^m$ lineært uafhængige hvis og kun hvis ligningssystemet
$A \mathbf x = \mathbf 0$ kun har løsningen $\mathbf x = \mathbf 0$ .

Bevis

Del 1: Antag først at $\mathbf v_1, \ldots, \mathbf v_n\in F^m$ lineært uafhængige. Hvis $\lambda_1 \mathbf v_1 + \cdots + \lambda_m \mathbf v_m = \mathbf 0$ skal vi vise at $\lambda_i=0$ for alle $i$ . Vi argumenterer ved modstrid. Antag er der skulle findes et $i$ så at $\lambda_i\neq 0$ . Da kan vi dividere med $\lambda_i$ (Men I må aldrig dividere med 0!!!), så at

$\mathbf v_i = -(\lambda_1/\lambda_i)\mathbf v_1-\cdots -(\lambda_{i-1}/\lambda_i)\mathbf v_{i-1}-(\lambda_{i+1}/\lambda_{i})\mathbf v_{i+1} \cdots$ Dermed er jo $\mathbf v_i\in \mathrm{span}(\mathbf v_1,\ldots, \mathbf v_{i-1},\mathbf v_{i+1},\ldots,\mathbf v_m)$ , hvad der ikke måtte ske fordi vi har antaget at $\mathbf v_1,\ldots,\mathbf v_m$ et lineært uafhængige. Vi har opnået en modstrid, det vil sige, vi ved nu at $\lambda_i=0$ for alle $i$ .

$\phantom{phantom}$ Del 2: Antag nu omvendt at $\mathbf v_1,\ldots, \mathbf v_m$ ikke er lineært uafhængige. Vi skal finde $\lambda_i\in F$ , ikke alle lige med 0, så at $\lambda_1 \mathbf v_1 + \cdots + \lambda_m \mathbf v_m = \mathbf 0.$ Men da vektorerne ikke er linært uafhængige så findes der et $j$ så at $\mathbf v_j\in \mathrm{span}(\mathbf v_1,\ldots, \mathbf v_{j-1},\mathbf v_{j+1},\ldots,\mathbf v_m)$ . Det vil sige, der findes $\lambda_1,\ldots, \lambda_{j-1},\lambda_{j+1},\ldots,\lambda_m$ så at

$\mathbf v_j=\lambda_1\mathbf v_1+\cdots \lambda_{j-1}\mathbf v_{j-1}+\lambda_{j+1}\mathbf v_{j+1},\cdots,\lambda_m\mathbf v_m.$ For så vidt kunne $\lambda_i=0$ for alle $i\neq j$ . Men hvis vi definerer $\lambda_j=-1$ så er i hvert fald $\lambda_j\neq 0$ , og på den anden side er nu

$\lambda_1 \mathbf v_1 + \cdots + \lambda_m \mathbf v_m = \mathbf 0.$ Del 3: Sidste påstand følger helt naturligt af definitionen af matrixmultiplikation, idet

$A \mathbf x = \lambda_1 A^1 + \cdots + \lambda _m A^m = \lambda_1 \mathbf v_1 + \cdots + \lambda _m \mathbf v_m,$ hvor

$\mathbf x = \begin{pmatrix} \lambda_1 \\ \vdots \\ \lambda_m \end{pmatrix}.$

Det er på høje tid med en quiz.

Quiz

Hvilke af nedenstående påstande er rigtige?

Vektorerne $\begin{pmatrix} 0 \\ 0 \end{pmatrix}$ og $\begin{pmatrix} 1 \\ 0 \end{pmatrix}$ i $\mathbb{R}^2$ er lineært uafhængige.

Vektorerne $\begin{pmatrix} 1 \\ 0 \end{pmatrix}$ og $\begin{pmatrix} 0 \\ 1 \end{pmatrix}$ i $\mathbb{R}^2$ er lineært uafhængige.

Vektorerne $\begin{pmatrix} 2 \\ 3 \end{pmatrix}$ og $\begin{pmatrix} 1 \\ 2 \end{pmatrix}$ i $\mathbb{R}^2$ er lineært uafhængige.

Vektorerne $\begin{pmatrix} 2 \\ 3 \end{pmatrix}, \begin{pmatrix} 1 \\ 2 \end{pmatrix}$ og $\begin{pmatrix} 1 \\ 1 \end{pmatrix}$ i $\mathbb{R}^2$ er lineært uafhængige.

Vektoren $\begin{pmatrix} 2 \\ 3 \end{pmatrix}$ i $\mathbb{R}^2$ ligger i $\mathrm{span}\left(\begin{pmatrix} 1 \\ 1\end{pmatrix}\right).$

Vektoren $\begin{pmatrix} 1 \\ -1 \end{pmatrix}$ i $\mathbb{C}^2$ ligger i $\mathrm{span}\left(\begin{pmatrix} -i \\ i\end{pmatrix}\right).$

Eksempel

Betragt vektorerne

$\begin{pmatrix} 2 \\ 3 \end{pmatrix},\qquad \begin{pmatrix} 1 \\ 2 \end{pmatrix}\qquad\mathrm{og}\qquad \begin{pmatrix} 1 \\ 1 \end{pmatrix}$ i $\mathbb{R}^2$ . For at afgøre om de er lineært uafhængige skal vi ifølge Proposition 6.15(β) undersøge ligningssystemet

$\begin{pmatrix} 2 & 1 & 1\\ 3 & 2 & 1 \end{pmatrix} \begin{pmatrix} \lambda_1\\ \lambda_2\\ \lambda_3 \end{pmatrix} = \begin{pmatrix} 0\\ 0 \end{pmatrix}.$ Vi kan ret hurtigt se at RREF for koefficientmatricen er

$\begin{pmatrix} 1 & 0 & 1\\ 0 & 1 & -1 \end{pmatrix}.$ Derfor er $\lambda_3$ en fri variabel og med $\lambda_3 = 1$ bliver $\lambda_1 = -1$ og $\lambda_2=1$ i fin overensstemmelse med at

$(-1)\cdot \begin{pmatrix} 2 \\ 3 \end{pmatrix} + 1\cdot \begin{pmatrix} 1 \\ 2 \end{pmatrix} + 1\cdot \begin{pmatrix} 1 \\ 1 \end{pmatrix} = \begin{pmatrix} 0\\ 0 \end{pmatrix}.$ Derfor er vektorerne ikke lineært uafhængige.

Ved et nærmere kig på Proposition 6.15(β) antydes et helt centralt resultat i lineær algebra, som går tilbage til et helt centralt resultat om løsning af ligninger. Der er nemlig en meget naturlig øvre grænse på hvor mange lineært uafhængige vektorer man kan have i $F^n$ .

Lad $\mathbf v_1, \ldots, \mathbf v_m\in F^n$ . Hvis $m>n$ , så er $\mathbf v_1, \ldots, \mathbf v_m$ lineært afhængige.

Bevis

Vi skriver søjlevektoren $\mathbf v_i$ som

$\mathbf v_i=\begin{pmatrix} v_{i1}\\ v_{i2}\\ \vdots\\ v_{in} \end{pmatrix}.$ Vi skal vise at vi kan finde tal $\lambda_i$ , ikke alle nul, så at

$\lambda_1\mathbf v_1+\lambda_2\mathbf v_2+\cdots+\lambda_m\mathbf v_m=\mathbf 0.$ Vi skriver dette helt ud i en formel: vektorerne er lineært afhængige hvis og kun hvis vi kan finde tal $\lambda_m$ som ikke alle er 0, så at

$\lambda_1 \begin{pmatrix} v_{11}\\ v_{12}\\ \vdots\\ v_{1n} \end{pmatrix} + \lambda_2 \begin{pmatrix} v_{21}\\ v_{22}\\ \vdots\\ v_{2n} \end{pmatrix} + \cdots + \lambda_m \begin{pmatrix} v_{m1}\\ v_{m2}\\ \vdots\\ v_{mn} \end{pmatrix} =\mathbf 0.$ Det kan vi også skrive som

$\begin{aligned} \lambda_1v_{11}+\lambda_2v_{12}+\cdots +\lambda_mv_{1m}&=0\\ \lambda_1v_{21}+\lambda_2v_{22}+\cdots +\lambda_mv_{2m}&=0\\ \ldots\\ \lambda_1v_{n1}+\lambda_2v_{n2}+\cdots +\lambda_mv_{nm}&=0.\\ \end{aligned}$ Fordi vi har antaget at $m>n$ , så har dette system altid en løsning forskellig fra nulløsningen. Derfor er vektorerne lineært afhængige.

Hvordan ser det ud i rummet?

En enkelt vektor $\mathbf v_1$ er lineært uafhængig hvis og kun hvis den er forskellig fra nulvektoren. Da er $\mathrm{span}(\mathbf v_1)$ en linje gennem origo. To vektorer $\mathbf v_1,\mathbf v_2$ er lineært uafhængige hvis de ikke ligger i forlængelse af hindanden, det vil sige, hvis de ikke ligger på den samme linje gennem origo. I dette tilfælde er $\mathrm{span}(\mathbf v_1,\mathbf v_2)$ en plan der indeholder origo. De tre vektorer $\mathbf v_1,\mathbf v_2,\mathbf v_3$ er lineært uafhængige hvis de to vektorer $\mathbf v_1,\mathbf v_2$ er lineært uafhængige, og samtidigt $\mathbf v_3$ ikke ligger i den plan der er udspændt af $\mathbf v_1$ og $\mathbf v_2$ . Hvis $\mathbf v_1,\mathbf v_2,\mathbf v_3$ er lineær uafhængige, så er $\mathrm{span}(\mathbf v_1,\mathbf v_2,\mathbf v_3)$ hele det tredimensionelle rum.

6.4 Basis for og dimension af underrum

Lad $V$ være et underrum af $F^n$ . Et ordnet sæt $(\mathbf v_1, \ldots, \mathbf v_m)$ med $\mathbf v_1, \ldots, \mathbf v_m\in V$ kaldes en basis for $V$ , hvis vektorerne $\mathbf v_1, \ldots, \mathbf v_m$ er lineært uafhængige og $V = \mathrm{span}(\mathbf v_1, \ldots, \mathbf v_m)$ .

Det vil sige: en basis for et underrum er en minimal udspændende mængde, hvor ingen vektorer kan udelades. Det kan ikke undstreges nok at man for at forstå hvad en basis er, bliver nødt til at se på adskillige konkrete eksempler. Som et absolut minimum bør du løse følgende opgave.

Opgave

Forklar helt præcist hvorfor

$B = \left(\begin{pmatrix} 1 \\ 0\end{pmatrix}, \begin{pmatrix} 0 \\ 1 \end{pmatrix}\right)$ er en basis for $\mathbb{R}^2$ .

Sætning 6.18 medfører følgende centrale resultat, som siger at ethvert underrum har en basis og at antallet af vektorer i en basis er entydigt bestemt. Bemærk dog at et underrum har tonsvis af baser. Vi siger ikke at basen er entydigt bestemt, kun antallet af vektorer i den. Begrebet basis er helt basalt for lineær algebra, så brug tid på at forstå det. I de fleste anvendelser vil man få brug for at lave konkrete udregninger, og de vil ofte afhænge af at man har valgt en basis for et underrum. I mere teoretiske overvejelser er det mange gange bedre at ikke lægge sig fast på en bestemt basis, med mindre denne basis er specielt egnet for netop det problem man betragter.

En matematikers tre regler for valg af basis

Regel 1 : Vælg aldrig en basis.

Regel 2 :

Seriøst - vælg aldrig en basis.

Regel 3 :

Hvis du alligevel kommer til at vælge en basis, gør det på en ekstremt snedig måde.

Til ethvert underrum $V\subseteq F^r$ findes en basis med $n$ elementer, hvor $n\leq r$ . Hvis $(\mathbf v_1, \ldots, \mathbf v_n)$ og $(\mathbf u_1, \ldots, \mathbf u_{m})$ er to baser for $V$ , så er $m = n$ .

Bevis*

Vi kan lige så godt antage at $V$ ikke kun består af nulvektoren. Vælg $\mathbf v\in V$ så $\mathbf v\neq \mathbf 0$ . Sæt $\mathbf v_1 = \mathbf v$ . Hvis $V = \mathrm{span}(\mathbf v_1)$ er vi færdige. Hvis ikke findes der et $\mathbf v_2\in V$ så at $\mathbf v_2\notin \mathrm{span}(\mathbf v_1)$ . Det betyder at $\mathbf v_1$ og $\mathbf v_2$ er lineært uafhængige. Denne proces fortsættes. Hvis vi har fundet $\mathbf v_1,\ldots,\mathbf v_{n-1}$ som er lineært uafhængige, og hvis $\mathbf v_n\notin \mathrm{span}(\mathbf v_1,\ldots \mathbf v_{n-1})$ så er $\mathbf v_1,\ldots,\mathbf v_n$ lineært uafhængige, fordi hvis

$\lambda_1\mathbf v_1+\lambda_2\mathbf v_2+\cdots \lambda_n\mathbf v_n=\mathbf 0,$ så er

$\lambda_1\mathbf v_1+\lambda_2\mathbf v_2+\cdots \lambda_{n-1}\mathbf v_{n-1}=-\lambda_n\mathbf v_n.$ Hvis nu $\lambda_n\neq 0$ kunne man bruge denne ligning til at skrive $\mathbf v_n$ som linearkombination af $\mathbf v_1,\ldots,\mathbf v_{n-1}$ , men det kan vi jo ikke, fordi $\mathbf v_n$ ikke ligger i $\mathrm{span}$ af de andre vektorer. Derfor må $\lambda_n=0$ , og altså

$\lambda_1\mathbf v_1+\lambda_2\mathbf v_2+\cdots \lambda_{n-1}\mathbf v_{n-1}=\mathbf 0.$ Fordi $\mathbf v_1,\ldots,\mathbf v_{n-1}$ er lineært uafhængige er nu $\lambda_i=0$ for alle $i$ . Vi kan dermed slå fast at $\mathbf v_1,\ldots,\mathbf v_{n}$ er lineært uafhængige. Et stykke tid kan vi blive ved med at finde nye $\mathbf v_i$ , men denne leg må nødvendigvis stoppe med $n$ lineært uafhængige vektorer $\mathbf v_1, \ldots, \mathbf v_n$ med $V = \mathrm{span}(\mathbf v_1, \ldots, \mathbf v_n)$ og $n\leq r$ på grund af Sætning 6.18.

$\phantom{phantom}$ Hvis $(\mathbf u_1, \ldots, \mathbf u_{m})$ er en anden basis for $V$ , skal vi vise at $m=n$ . Det er nok at vise at $m\leq n$ (fordi på den samme måde kan vi også vise at $n\leq m$ ). Vi argumenterer ved modstrid. Det vil sige, vi antager at $m>n$ , og viser at dette fører til en modstrid mod forudsætningen at $(\mathbf v_1, \ldots, \mathbf v_n)$ og $(\mathbf u_1, \ldots, \mathbf u_{m})$ begge er baser for $V$ . Til at begynde med bruger vi at vektorerne $(\mathbf v_1,\ldots, \mathbf v_n)$ danner en basis, så at vi kan skrive

$\begin{aligned} \mathbf u_1&=a_{11}\mathbf v_1+a_{21}\mathbf v_2+\ldots +a_{n1}\mathbf v_n\\ \mathbf u_2&=a_{12}\mathbf v_1+a_{22}\mathbf v_2+\ldots +a_{n2}\mathbf v_n\\ \vdots\\ \mathbf u_m&=a_{1m}\mathbf v_1+a_{2m}\mathbf v_2+\ldots +a_{nm}\mathbf v_n. \end{aligned}$ Nu opstiller vi et ligningssystem med $m$ ubekendte og $n$ ligninger.

$\begin{aligned} a_{11}\lambda_1+a_{12}\lambda_2+\ldots+a_{1m}\lambda_m&=0\\ a_{21}\lambda_1+a_{22}\lambda_2+\ldots+a_{2m}\lambda_m&=0\\ \vdots\\ a_{n1}\lambda_1+a_{n2}\lambda_2+\ldots+a_{nm}\lambda_m&=0. \end{aligned}$ Da $m>n$ findes der en løsning til dette ligningssystem som ikke er nulløsningen. Lad $\lambda_1,\ldots,\lambda_m$ være en sådan løsning. Vi definerer en vektor $\mathbf \Lambda=\lambda_1\mathbf u_1+\cdots+\lambda_m\mathbf u_m$ . Nu er tiden kommet til at bruge at $(\mathbf u_1,\ldots,\mathbf u_m)$ også er en basis, fordi det betyder jo at $\mathbf \Lambda\neq \mathbf 0$ . På den anden side er

$\begin{aligned} \mathbf \Lambda =&\left(a_{11}\lambda_1+a_{12}\lambda_2+\ldots+a_{1m}\lambda_m\right) \mathbf v_1\\ &+\cdots+\\ &\left(a_{n1}\lambda_1+a_{n2}\lambda_2+\ldots+a_{nm}\lambda_m\right) \mathbf v_n=\mathbf 0. \end{aligned}$ Dette giver en modstrid mod antagelsen at såvel $(\mathbf u_1,\ldots,\mathbf u_m)$ som $(\mathbf v_1,\ldots,\mathbf v_n)$ er en basis. Sætningen er bevist.

Med entydigheden af antallet af elementer i en basis for et underrum har vi nu et veldefineret mål for størrelsen eller omfanget af et underrum kaldet dimensionen.

Lad $V$ være et underrum af $F^n$ . Dimensionen af $V$ er antal vektorer i en basis for $V$ og betegnes $\dim(V)$ .

Hvordan ser det ud i rummet?

Det skulle helst ikke chokere nogen der har fulgt med hertil, at dimensionen af origo er 0, dimensionen af en linje der indeholder origo er 1, dimensionen af et plan der indeholder origo er 2 og dimensionen af hele rummet er 3.

Hvordan finder vi så dimensionen af et underrum? Igen kommer den reducerede række echelon form til hjælp.

Lad

$V = \mathrm{span}(\mathbf v_1, \ldots, \mathbf v_m)$ være et underrum af $F^n$ . En basis for $V$ fås ud fra rækkerne $\neq \mathbf 0$ i den reducerede række echelon form $B$ for $A$ , hvor $A$ er matricen med rækker

$A_1 = \mathbf v_1^T, \ldots, A_m = \mathbf v_m^T.$ Dimensionen, $\dim(V)$ , er lig med antal pivotelementer i $B$ .

Bevis

Ifølge definitionen af $A$ og definitionen af rækkerummet $R(A)$ er $V=R(A)$ . Da rækkerummet ikke ændres ved rækkeoperationer er $R(A)=R(B)$ . Så vi skal vise, at hvis $B$ er på RREF, så har $R(B)$ basis der består af alle rækker i $B$ , som ikke er nulrækker. Vi kan nu glemme alt om matricen $A$ som måske ikke var på RREF, og koncentrere os om $B$ . Hvis vi lader alle nulrækker i $B$ helt væk, så får vi en ny matrix $C$ på RREF med det samme rækkerum. Forskellen er kun at $C$ ikke har nulrækker, og åbenbart er $R(B)=R(C)$ . For at give et fuldstændigt bevis for sætningen er det altså nok at vise at hvis $C$ er en matrix på RREF, som ikke indeholder nulrækker, så danner rækkerne i $C$ en basis for $R(C)$ . Ifølge definitionen af hvad det vil sige at være en basis, skal vi vise, at rækkerne i $C$ er lineært uafhængige.

$\phantom{phantom}$ Hver række $\mathbf u_i$ i $C$ indeholder et pivotelement. Lad $k_i$ være nummeret på den søjle, der indeholder pivotelementet i række nummer $i$ . Da er $(\mathbf u_i)_{k_i}=1$ , fordi det er et pivotelement, og hvis $j\neq i$ er $(\mathbf u_j)_{k_i}=0$ , da pivotelementet er den eneste indgang i sin søjle der er forskelligt fra 0. Lad

$\mathbf w=\lambda_1\mathbf u_1+\lambda_2\mathbf u_2+\cdots+\lambda_m\mathbf u_m.$ Hvis vi skriver $\mathbf w=(w_1,\ldots,w_n)$ , så er altså $w_{k_i}=\lambda_i$ . For at vise at $\mathbf u_1,\ldots,\mathbf u_m$ er lineært uafhængige, skal vi vise: hvis $\mathbf w=\mathbf 0$ , så er $\lambda_i=0$ for alle $i$ . Men hvis $\mathbf w=0$ , så er specielt $w_{k_i}=0$ , så at $\lambda_i=w_{k_i}=0$ .

Eksempel

Vi gennefører udregningerne i beviset ovenfor på et eksempel. Lad

$V = \mathrm{span}\left( \mathbf v_1, \mathbf v_2, \mathbf v_3 \right) = \mathrm{span}\left( \begin{pmatrix} 1 \\ 2 \\ 3 \end{pmatrix}, \begin{pmatrix} 4 \\ 5 \\ 6 \end{pmatrix}, \begin{pmatrix} 7 \\ 8 \\ 9 \end{pmatrix} \right)$ være et underrum i $\mathbb{R}^3$ . Vi transponerer søjlevektorerne $\mathbf v_i$ , og bruger rækkevektorerne $\mathbf v_i^T$ som rækker i en matrix $A$ . Det vi sige, vi opstiller matricen

$A = \begin{pmatrix} 1 & 2 & 3\\ 4 & 5 & 6\\ 7 & 8 & 9 \end{pmatrix},$ som så rækkereduceres til $B$ .

$A \sim \begin{pmatrix} 1 & 2 & 3\\ 0 & -3 & -6\\ 0 & -6 & -12 \end{pmatrix}\sim \begin{pmatrix} 1 & 2 & 3\\ 0 & -3 & -6\\ 0 & 0 & 0 \end{pmatrix}\sim \begin{pmatrix} 1 & 2 & 3\\ 0 & 1 & -2\\ 0 & 0 & 0 \end{pmatrix}\sim \begin{pmatrix} 1 & 0 & 7\\ 0 & 1 & -2\\ 0 & 0 & 0 \end{pmatrix} =B.$ Vi ved at $R(A)=R(B)$ , så for at bestemme $R(A)$ er det nok at bestemme $R(B)$ . $R(B)$ er udspændt af de tre vektorer $(1,0,7),(0,1,-2),(0,0,0)$ . Den sidste nul vektor gør hverken fra eller til, så $R(A)=R(B)$ er span af de to første vektorer $(1,0,7),(0,1,-2)$ . Det betyder at $R(B)=R(C)$ , hvor

$C= \begin{pmatrix} 1 & 0 & 7\\ 0 & 1 & -2 \end{pmatrix},$ Vi påstår at $(u_1,u_2)=((1,0,7),(0,1,-2))$ er en basis for $R(C)=\mathrm{span}(u_1,u_2)$ . Men det er det samme som at sige at de to vektorer er lineært uafhængige. Så lad os antage at $\lambda_1u_1+\lambda_2u_2=0$ . Vi regner:

$(0,0,0)=\lambda_1(1,0,7)+\lambda_2(0,1,-2)=(\lambda_1,\lambda_2,7\lambda_1-2\lambda_2)$ Det følger at $\lambda_1=\lambda_2=0$ , så at $u_1,u_2$ faktisk er lineært uafhængige. Altså er $\dim(V) = 2$ og

$(u_1^T,u_2^T)= \left( \begin{pmatrix} 1 \\ 0 \\ 7 \end{pmatrix}, \begin{pmatrix} 0 \\ 1 \\ -2 \end{pmatrix} \right)$ er en basis for $V$ .

Selvom jeg har set det mange gange før, synes jeg stadig at Sætning 6.25(α) nedenfor er ekstremt overraskende. Hvem skulle på forhånd tro at dimensionerne af række- og søjlerummene for en matrix havde noget med hinanden at gøre? Hvorfor skulle for eksempel dimensionerne af

$\mathrm{span}\left( \begin{pmatrix} 1 \\ 5 \\ 9 \end{pmatrix}, \begin{pmatrix} 2 \\ 6 \\ 10 \end{pmatrix}, \begin{pmatrix} 3 \\ 7 \\ 11 \end{pmatrix}, \begin{pmatrix} 4 \\ 8 \\ 12 \end{pmatrix} \right)$ og

$\mathrm{span}\left( \begin{pmatrix} 1 \\ 2 \\ 3 \\ 4 \end{pmatrix}, \begin{pmatrix} 5 \\ 6 \\ 7 \\ 8 \end{pmatrix}, \begin{pmatrix} 9 \\ 10 \\ 11\\ 12 \end{pmatrix} \right)$ være identiske? Sætning 6.25(β) kaldes dimensionssætningen og giver en meget stærk og nyttig sammenhæng mellem dimensionerne af nulrummet og søjlerummet for en matrix.

Lad $A$ være en $m\times n$ matrix. Så gælder

$\dim C(A) = \dim R(A)$
$n = \dim N(A) + \dim C(A)$

Før vi går i gang med beviset for denne sætning, skal vi i anslutning til eksempel 6.13 kigge lidt nærmere på på nulrummet for en matrix $A$ der er på RREF. Det er en god idé at genopfriske dette eksempel før man læser beviset for lemmaet.

Antag at $A$ er en $m\times n$ matrix på RREF. Da er dimensionen af nulrummet $N(A)$ det samme som antallet af søjler i $A$ som ikke er pivotsøjler.

Et lemma? Hvad er nu det for noget? Skal vi også kunne lemmaer til eksamen?

Et lemma eller en hjælpesætning er en sætning som ikke er så vigtig i sig selv, men som skal bruges lige om lidt i et bevis for en mere vigtig sætning. Til eksamen bliver der desværre ikke stillet opgaver til beviset for dette lemma.

Bevis *

At $\mathbf v\in N(A)$ betyder det samme som at $\mathbf v$ er en løsning til ligningen $A\mathbf v=\mathbf 0$ . I afsnit ''Løsning af ligninger via RREF'' beskrev vi hvordan man kan finde alle løsninger til dette system når $B$ er på RREF. Vi betragter de $n$ variable $x_i$ , og inddeler disse variable $x_i$ i to grupper, de frie variable $x_i$ for en mængde af indekser $i\in F$ , og de bundne variable $x_j$ for en anden mængde af indekser $j\in B$ . Enhver variabel $x_i$ er enten fri eller bunden, så at tilsammen udgører $F$ og $B$ mængden af alle indekser $\{1,2.\ldots,n\}$ . De bundne variable svarer til pivotsøjlerne, det vil sige at der er lige så mange bundne variable som der er pivotsøjler. De frie variable svarer til de søjler som ikke er pivotsøjler. Resultatet af vores overvejelser var at hvis man angiver værdiene $\lambda_i$ for hver af de frie variable, så findes der netop en løsning til ligningen $B\mathbf x=\mathbf 0$ så at $x_i=\lambda_i$ for alle frie variable, det vil sige, for $i\in B$ .

$\phantom{phantom}$ Nu definerer vi følgende vektorer. For hvert $k\in F$ lader vi $\mathbf v_k$ være den eneste ene løsning til $A\mathbf v=\mathbf 0$ hvor den frie variabel $v_{ki}=(\mathbf v_k)_i$ med $i\in F$ antager værdien 1, og alle andre frie variable $v_{ki'}$ med $i'\in F, i'\neq i$ antager værdien $0$ . Vi påstår at $N(A)$ er udspændt af vektorerne $\mathbf v_i$ for $i\in F$ . Vi skal altså vise at enhver vektor $\mathbf u=(u_1,u_2,\ldots,u_n)$ der opfylder at $A\mathbf u=\mathbf 0$ er en linearkombination af vektorerne $\mathbf v_i$ . Til dette formål definerer vi nu vektoren

$\mathbf u' = \cdots +u_k\mathbf v_k+\cdots,$ hvor vi bruger alle frie variable $k\in F$ . I denne sum forekommer altså ikke nogen $j$ med $j\in B$ . I mange kloge bøger ville denne sum i øvrigt skrives som

$\mathbf u'=\sum_{k\in F}{u_k\mathbf v_k}.$ Vi påstår at $\mathbf u=\mathbf u'$ . For at vise dette bruger vi at der er netop en løsning til ligningen $A\mathbf x=\mathbf 0$ sådan at $x_i=u_i$ for $i\in F$ , og den løsning kender vi, fordi det er jo $\mathbf u$ . For at vise at $\mathbf u'=\mathbf u$ er det altså fuldstændigt nok at vise at for alle $i\in F$ så er $(\mathbf u)_i=(\mathbf u')_i$ . Det er en lille udregning. Antag at $i\in F$ .

$\begin{aligned} (\mathbf u')_i&=(\cdots)_i +u_i(\mathbf v_i)_i+(\cdots)_i\\ &=0+u_i+0\\ &=u_i. \end{aligned}$ Dermed har vi vist at vektorerne $\mathbf v_i$ udspænder $N(A)$ . Der er lige så mange af dem som antallet søjler i $A$ der ikke er pivotsøjler. Så for at afslutte beviset skal v vise at vektorerne $\mathbf v_i$ er lineært uafhængige. Antag altså at $\cdots + \lambda_i\mathbf v_i+\cdots=\mathbf 0$ (hvor selvfølgelig $i\in F)$ . Da er

$\begin{aligned} 0&=(\mathbf 0)_i\\ &=(\cdots + \lambda_i\mathbf v_i+\cdots)_i\\ &=0+\lambda_i+0=\lambda_i \end{aligned}$ Altså er $\lambda_i=0$ for alle $i$ . Derfor er vektorerne $\mathbf v_i$ lineært uafhængige.

Nu kan vi bevise den vigtige sætning 6.25.

Bevis

Vi viser først sætningen for en matrix $B$ på RREF. Lad os sige at $B$ har $p$ pivotsøjler. Pivotsøjlerne er de første $p$ enhedsvektorer $\mathbf e_i$ for $i\leq p$ , så at $\mathrm{span}(\mathbf e_1,\ldots, \mathbf e_p)\subset C(B)$ . En søjle i $B$ ,

$\mathbf v=\begin{pmatrix} \lambda_1 \\ \lambda_2 \\ \vdots \\ \lambda_n \end{pmatrix},$ opfylder at $\lambda_i=0$ for $i>p$ , da $B$ er på RREF. Men det vil sige at

$\mathbf v=\lambda_1\mathbf e_1+\cdots \lambda_p \mathbf e_p \in \mathrm{span}(\mathbf e_1,\ldots,\mathbf e_p).$ Det betyder at $C(B)\subset\mathrm{span}(\mathbf e_1,\ldots, \mathbf e_p)$ , og dermed at faktisk $C(B)=\mathrm{span}(\mathbf e_1,\ldots, \mathbf e_p)$ . Men $\mathrm{span}(\mathbf e_1,\ldots, \mathbf e_p)$ har basis $\mathbf e_1,\ldots \mathbf e_p$ , så at $\dim C(B) =p$ .

$\phantom{phantom}$ Rækkerummet $R(B)$ er rummet udspændt af de rækker i $B$ der indeholder pivoter. Vi kan lade de nulrækker væk der ikke indeholder pivotelementer, og vedtage at de resterende rækker hedder $\mathbf v_1^T,\ldots,\mathbf v_p^T$ , så at $R(B)=\mathrm{span}(\mathbf v_1^T,\ldots,\mathbf v_p^T)$ . Sætning 6.23 siger at $R(B)$ har en basis der består af de rækker som ikke er nulrækker i den reducerede række echelon form for $B$ . Men RREF af $B$ er jo bare $B$ selv, så det betyder at $(\mathbf v_1,\ldots,\mathbf v_p)$ er lineært uafhængige, og $\dim R(B)=p$ . Vi har altså vist at $\dim C(B )=\dim R(B)$ .

$\phantom{phantom}$ Lemma 6.26 siger at $\dim(N(B))=n-p$ . Ved at sætte ind at $\dim C(B)=p$ får vi at $\dim N(B)+\dim C(B)=n$ . Dermed er sætningen bevist for de matricer $B$ som er på RREF. Vi skal selvfølgelig også kigge på det generelle tilfælde

$\phantom{phantom}$ Hvis $A$ er en eller anden $m\times n$ matrix, så kan den i hvert fald rækkereduceres til en $m\times n$ matrix $B$ på RREF. Og nu gælder det at $N(A)=N(B)$ og $C(A)=C(B)$ . Der er ingen grund til at tro at $R(A)=R(B)$ , men i det mindste følger det fra sætning 6.23 at $\dim R(A)$ er lig med antallet $p$ af pivotelementer i $B$ . På samme måde er $\dim R(B)$ er lig med antallet $p$ af pivotelementer i rækkereduktionen af $B$ , men da $B$ rækkereducerer til sig selv, er $\dim R(B)=p=\dim R(A)$ . Nu bruger vi at vi allerede ved at sætningen er rigtig for $B$ til at konkludere

$\begin{aligned} \dim C(A) &=\dim C(B) =\dim R(B) =\dim R(A)\\ \dim N(A) + \dim C(A) &= \dim N(B)+\dim C(B) = n. \end{aligned}$

Dimensionen af søjlerummet $C(A)$ for en matrix kaldes rangen af matricen $A$ og betegnes $\mathrm{rk}(A)$ . Med denne betegnelse kan dimensionssætningen for en $m\times n$ matrix udtrykkes som

$n = \dim N(A) + \mathrm{rk}(A).$

Opgave

I denne opgave gælder det om at regne mindst muligt. Hvad er dimensionen af nulrummet for matricen

$\begin{pmatrix} 1 & 2 & 3\\ 4 & 5 & 6\\ 7 & 8 & 9 \end{pmatrix}$ ud fra udregningerne i Eksempel 6.24?

En løs snak om abstrakte vektorrum

Det kan ske at et abstrakt vektorrum $V$ har en basis der består af endeligt mange vektorer. Antallet af elementer i denne basis kaldes for dimensionen af $V$ , og vi siger at $V$ har endelig dimension. I stort set alt der gælder om underrum af $F^n$ vil også gælde for vektorrum af endelig dimension. For eksempel vil alle baser for $V$ have det samme antal elementer, og de efterfølgende afsnit om koordinater og lineære transformationer vil også kunne kopieres næsten uden ændringer. Det betyder jo også at det ikke giver så meget mere indsigt at formulere disse afsnit for abstrakte vektorrum, så det vil vi ikke gøre. Der findes også abstrakte vektorrum som ikke har en endelig basis. De spiller en stor rolle indenfor matematik, men er ikke så vigtige i anvendelser. I kvantfysik bruges dog ofte ``Hilbertrum'' som er vektorrum over de kompleks tal, og ikke plejer at have en endelig dimension.

6.5 Koordinater

Lad $V$ være et underrum af $F^n$ og $B = (\mathbf v_1, \ldots, \mathbf v_r)$ en basis for $V$ . Hvis

$\mathbf v = x_1 \mathbf v_1 + \cdots + x_r \mathbf v_r\in V$ for $x_1, \ldots, x_r\in F$ , så kaldes $\begin{pmatrix}x_1\\ \vdots\\ x_r\end{pmatrix}$ for koordinatvektoren eller koordinaterne for $v$ med hensyn til basen $B$ .

Læg mærke til at en vektor $\mathbf v\in V$ ikke kan have to forskellige koordinatvektorer med hensyn til en basis $B$ som ovenfor. Hvis

$\mathbf v = x_1 \mathbf v_1 + \cdots + x_r \mathbf v_r = y_1 \mathbf v_1 + \cdots + y_r \mathbf v_r,$ så er

$(x_1 - y_1) \mathbf v_1 + \cdots + (x_r - y_r) \mathbf v_r = \mathbf 0,$ og dermed er $x_1 = y_1, \ldots, x_r = y_r$ , fordi basisvektorerne er lineært uafhængige. Der er myriader af baser for et underrum. Det er rigtigt nyttigt at kunne regne om fra koordinater i en basis til koordinater i en anden basis, men det gælder om at holde tungen lige i munden.

Lad $B_1 = (\mathbf u_1, \ldots, \mathbf u_n)$ og $B_2 = (\mathbf v_1, \ldots, \mathbf v_n)$ være to baser for et underrum $V$ af dimension $n$ . Basisskiftmatricen fra $B_1$ til $B_2$ er $n\times n$ matricen $T = (a_{ij})$ , hvis søjler er koordinaterne for basisvektorerne i $B_1$ med hensyn til basen $B_2$ , det vil sige

$\mathbf u_i = a_{1i} \mathbf v_1 + \ldots + a_{ni} \mathbf v_n$ for $i = 1, \ldots, n$ .

Eksempel

Hvis $B_1=(\mathbf u_1,\ldots,\mathbf u_n)$ er en basis for $F^n$ og $B_2=(\mathbf e_1,\ldots,\mathbf e_n)$ er standardbasen for $F^n$ , så er basisskiftmatricen fra $B_1$ til $B_2$ matricen hvis søjler er vektorerne $\mathbf u_i$ , fordi

$\mathbf u_i=(\mathbf u_i)_1\mathbf e_1+(\mathbf u_i)_2\mathbf e_2+\cdots+(\mathbf u_i)_n\mathbf e_n.$

Hvis

$\mathbf w = x_1 \mathbf u_1 + \cdots + x_n \mathbf u_n \tag{6.3}$ har koordinaterne

$\begin{pmatrix} x_1\\ \vdots\\ x_n \end{pmatrix}$ med hensyn til basen $B_1$ og det samme $\mathbf w = y_1 \mathbf v_1 + \cdots + y_n \mathbf v_n$ har koordinaterne

$\begin{pmatrix} y_1\\ \vdots\\ y_n \end{pmatrix}$ med hensyn til basen $B_2$ , så gælder

$\begin{pmatrix} y_1\\ \vdots\\ y_n \end{pmatrix} = T \begin{pmatrix} x_1\\ \vdots\\ x_n \end{pmatrix}.$ Matricen $T$ er invertibel. Hvis $V = F^n$ er $T = B_2^{-1} B_1$ , hvor baserne opfattes som søjler i en $n\times n$ matrix.

Bevis *

Man udtrykker som skrevet basisvektorerne i $B_1$ via basisvektorerne i $B_2$ :

$\begin{aligned} \mathbf u_1 = a_{11} \mathbf v_1 &+ \cdots + a_ {n1} \mathbf v_n\\ &\vdots \\ \mathbf u_n = a_{1n} \mathbf v_1 &+ \cdots + a_{nn} \mathbf v_n \end{aligned}\tag{6.4}$ og sætter derefter (6.4) ind i (6.3):

$\begin{aligned} \mathbf w = x_1 (a_{11} \mathbf v_1 &+ \cdots + a_ {n1} \mathbf v_n) + \\ &\vdots\\ \phantom{=} x_n (a_{1n} \mathbf v_1 &+ \cdots + a_{nn} \mathbf v_n). \end{aligned}\tag{6.5}$ Ved nu at summere (6.5) lodret får vi koordinaterne for $\mathbf w$ i basen $B_2$ som

$\begin{aligned} \mathbf w= (a_ {11} x_1 &+ \cdots + a_{1n} x_n) \mathbf v_1 + \\ &\vdots \\ + (a_{n1} x_1 &+ \cdots + a_{nn} x_n) \mathbf v_n. \end{aligned}$ Hvis vi skriver $\mathbf y=T\mathbf x$ , så at $y_j=a_{j1}x_1+a_{j2}x_2+\cdots+a_{jn}x_j$ , får vi altså

$\mathbf w=y_1\mathbf v_1+y_2\mathbf v_2+\cdots+y_n\mathbf v_n.$ Herved ses at matrixmultiplikationen giver koordinaterne for $\mathbf w$ i basen $B_2$ .

$\phantom{phantom}$ Hvad er nulvektorens koordinater i en basis $B$ ? Ja,

$\mathbf 0=0\mathbf v_1+0\mathbf v_2+\cdots+0\mathbf v_n,$ så de er allesammen 0. Omvendt, hvis en vektor $\mathbf v$ har alle koordinater lige med $0$ , så er

$\mathbf v=0\mathbf v_1+0\mathbf v_2+\cdots+0\mathbf v_n=\mathbf 0.$ Og det gælder for enhver basis. Vi vil bruge dette lille faktum til at vise at $T$ er invertibel. Hvis den ikke var, så ville der findes en vektor $\mathbf x\in F^n$ , $\mathbf x\neq \mathbf 0$ , så at $T\mathbf x=\mathbf 0$ . Det vil sige, $T\mathbf x$ repræsenterer vektoren $\mathbf 0$ i basen $B_2$ . Men ifølge det vi lige har sagt om repræsentationen af $\mathbf 0$ i en basis, betyder det at $\mathbf x$ også repræsenterer vektoren $\mathbf 0$ i basen $B_1$ , Det følger at $\mathbf x=\mathbf 0$ , så at $T$ er invertibel.

$\phantom{phantom}$ Hvad med den sidste påstand? Ved vi egentlig at $B_2$ er invertibel, så at det i det hele taget giver det mening at skrive $B_2^{-1}$ ? Jo, det ved vi, fordi ifølge eksempel 6.30 er $B_2$ også en basisskiftmatrix. Og vi har jo lige vist, at enhver basisskiftmatrix er invertibel! Hvis vi nu skriver $B_1=(u_{ij})$ , $B_2=(v_{ij})$ ser vi at $u_{ij}=(\mathbf u_j)_i$ og $v_{ij}=(\mathbf v_j)_i$ . Læg mærke til at de to indekser $i$ og $j$ ''bytter plads'', og sådan skal det også være. Nu kan vi skrive om på (6.4):

$\begin{aligned} u_{ij}&=(\mathbf u_j)_i\\ &=a_{1j}(\mathbf v_1)_i+\cdots+a_{nj}(\mathbf v_n)_i\\ &=a_{1j}v_{i1}+\cdots+a_{nj}v_{in}\\ &=v_{i1}a_{1j}+\cdots+v_{in}a_{nj} \end{aligned}$ Dette genkender vi som et matrixprodukt, så at vi har vist at

$B_1=B_2T$ Nu multiplicerer vi med $B_2^{-1}$ på venstresiden, og får at

$B_2^{-1}B_1=B_2^{-1}\left(B_2T\right)=\left(B_2^{-1}B_2\right)T=T.$

Eksempel

Det betaler sig at se et helt konkret eksempel på anvendelsen af Proposition 6.31. Lad

$B_1 = \left(\begin{pmatrix} 5 \\ 3 \end{pmatrix}, \begin{pmatrix} 2 \\ 1 \end{pmatrix}\right)\qquad \mathrm{og}\qquad B_2 = \left(\begin{pmatrix} 1 \\ 0 \end{pmatrix}, \begin{pmatrix} 0 \\ 1 \end{pmatrix}\right)$ være to baser for $\mathbb{R}^2$ . Her er $T$ heldigvis nem at regne ud: Da

$\begin{aligned} \begin{pmatrix} 5 \\ 3 \end{pmatrix} &= 5 \begin{pmatrix} 1 \\ 0 \end{pmatrix} + 3 \begin{pmatrix} 0 \\ 1 \end{pmatrix}\qquad\mathrm{og}\\ \\ \begin{pmatrix} 2 \\ 1 \end{pmatrix} &= 2 \begin{pmatrix} 1 \\ 0 \end{pmatrix} + \begin{pmatrix} 0 \\ 1 \end{pmatrix} \end{aligned}$ bliver

$T = \begin{pmatrix} 5 & 2\\ 3 & 1 \end{pmatrix}.$ Så hvis $x_1, x_2$ er koordinaterne til en vektor i basen $B_1$ , så er koordinaterne $y_1, y_2$ til vektoren i basen $B_2$ givet ved

$\begin{pmatrix} y_1 \\ y_2 \end{pmatrix} = \begin{pmatrix} 5 & 2\\ 3 & 1 \end{pmatrix} \begin{pmatrix} x_1 \\ x_2 \end{pmatrix}$ Men vent! Det gælder også den anden vej ved at invertere $T$ : Hvis $y_1, y_2$ er koordinaterne til en vektor i basen $B_2$ , så er koordinaterne $x_1, x_2$ til vektoren i basen $B_1$ givet ved

$\begin{pmatrix} x_1 \\ x_2 \end{pmatrix} = \begin{pmatrix} 5 & 2\\ 3 & 1 \end{pmatrix}^{-1} \begin{pmatrix} y_1 \\ y_2 \end{pmatrix} = \begin{pmatrix} -1 & \phantom{-}2\\ \phantom{-}3 & -5 \end{pmatrix}. \begin{pmatrix} y_1 \\ y_2 \end{pmatrix}.$ For eksempel har vektoren $\begin{pmatrix} 1 \\ 1\end{pmatrix}$ koordinaterne $\begin{pmatrix} \phantom{-}1 \\ -2 \end{pmatrix}$ med hensyn til basen $B_1$ . Lad os checke påstanden:

$\begin{pmatrix} 1 \\ 1\end{pmatrix} = \begin{pmatrix} 5 \\ 3\end{pmatrix} - 2 \begin{pmatrix} 2 \\ 1\end{pmatrix}.$

Quiz

Hvad gælder om $\lambda_1$ og $\lambda_2$ hvis

$\lambda_1 \begin{pmatrix} 1 \\ 2\end{pmatrix} + \lambda_2 \begin{pmatrix} 3 \\ 4\end{pmatrix} = \begin{pmatrix} 2 \\ 3 \end{pmatrix}?$

$\lambda_1 + \lambda_2 = 0$

$\lambda_1 = 2$

$2\lambda_1^2 = \lambda_2$

Quiz

Hvis koordinaterne i basen

$\begin{pmatrix} 1 \\ 2 \end{pmatrix}\quad{\mathrm{og}}\quad \begin{pmatrix} 3 \\ 4 \end{pmatrix}$ til en vektor er $(2, -1)$ , hvad gælder så om koordinaterne $(\lambda_1, \lambda_2)$ til vektoren i basen

$\begin{pmatrix} 5 \\ 6 \end{pmatrix}\quad{\mathrm{og}}\quad \begin{pmatrix} 7 \\ 8 \end{pmatrix}?$

$\lambda_1 < 0$ .

$\lambda_2 < 0$ .

$\lambda_1 + \lambda_2 = 1$

Kommentarer/spørgsmål?

6.6 Lineære transformationer

Ligesom definitionen af underrum var forbavsende enkel, har vi her også en ret enkel definition af lineære afbildninger (transformationer) mellem underrum

Lad $U\subseteq F^m$ og $V\subseteq F^n$ være underrum En lineær transformation fra $U$ til $V$ er en afbildning

$L: U\rightarrow V,$ som opfylder

$L(\mathbf u + \mathbf v) = L(\mathbf u) + L(\mathbf v)$
$L(\lambda \mathbf u) = \lambda L(\mathbf u),$ for $\mathbf u, \mathbf v\in U$ og $\lambda\in F$ .

Det er ekstremt vigtigt at bemærke at en lineær transformation $L: U\rightarrow V$ er givet entydigt ud fra dens værdier

$L(\mathbf u_1), \ldots, L(\mathbf u_r)$ på en basis $\mathbf u_1, \ldots, \mathbf u_r$ for $U$ : Enhver vektor $\mathbf u\in U$ kan skrives som

$\mathbf u = \lambda_1 \mathbf u_1 + \cdots + \lambda_r \mathbf u_r$ for entydigt bestemte $\lambda_1, \ldots, \lambda_r\in F$ . Dette følger ved at bruge egenskaberne (α) og (β) i Definition 6.35:

$\begin{aligned} L(\mathbf u) &= L(\lambda_1 \mathbf u_1 + \cdots + \lambda_r \mathbf u_r)\\ &= L(\lambda_1 \mathbf u_1) + \cdots + L(\lambda_r \mathbf u_r)\\ &= \lambda_1 L(\mathbf u_1) + \cdots + \lambda_r L(\mathbf u_r). \end{aligned}$

Quiz

Hvilke af nedenstående påstande er rigtige?

Afbildningen $f: \mathbb{R}\rightarrow \mathbb{R}$ givet ved $f(x) = x + 1$ er en lineær transformation.

Afbildningen $f: \mathbb{R}\rightarrow \mathbb{R}$ givet ved $f(x) = x^2$ er en lineær transformation.

Afbildningen $f: \mathbb{R}\rightarrow \mathbb{R}$ givet ved $f(x) = 2 x$ er en lineær transformation.

Afbildningen $f: \mathbb{R}^2\rightarrow \mathbb{R}^2$ givet ved $f(x, y) = (x + y, x -y)$ er en lineær transformation.

6.6.1 Repræsentation ved en matrix

Nu kommer vi til et meget centralt punkt i disse noter: sammenhænget mellem matricer og lineære afbildninger. Vi vil gerne kunne sige at ``en lineær afbildning er det samme som en matrix'', og det er ikke helt forkert, men det er heller ikke helt rigtigt, og for at komme videre er man nødt til at forstå hvorfor. Den lille men vigtige forskel er at før vi kan sige det på denne måde har vi har brug for at vælge baser!

$\phantom{phantom}$ Hvis vi for eksempel er kommet i besiddelse af en lineær transformation $L:U \rightarrow V$ , og gerne vil ``oversætte'' denne lineære transformation til en matrix gør vi følgende. Betragt baserne $B^U = (\mathbf u_1, \ldots, \mathbf u_n)$ for $U$ og $B^V=(\mathbf v_1, \ldots, \mathbf v_m)$ for $V$ . Per ovenstående noterer vi at

$\begin{aligned} L(\mathbf u_1) &= a_{11} \mathbf v_1 + \cdots + a_{m1} \mathbf v_m\\ &\vdots\\ L(\mathbf u_n) &= a_{1n} \mathbf v_1 + \cdots + a_{mn} \mathbf v_m\\ \end{aligned}$ Og nu har vi lavet en matrix.

Matricen

$\begin{pmatrix} a_{11} & \cdots & a_{1n} \\ \vdots & \ddots & \vdots \\ a_{m1} & \cdots & a_{mn} \end{pmatrix}$ i (6.6) siges at repræsentere $L$ med hensyn til basen $B^U$ for $U$ og basen $B^V$ for $V$ .

Hvis vi allerede har valgt de to baser $B^U$ og $B^V$ så er matricen $(a_{ij})$ entydigt bestemt af $L$ . Hvis vi vil holde styr på at den opstår ud fra $L$ så skriver vi $(a_{ij})=M(L)$ . Nogle mennesker ville endog være omhyggelige nok at skrive $(a_{ij})=\phantom{}_{B^V}M(L)_{B^U}$ for at være sikre på at vi ikke glemmer at vores matrix også afhænger af vores valg af baser.

$\phantom{phantom}$ En forvirrende detalje er at vi ofte har favoritbaser for $U$ og $V$ , og så vælger vi bare dem. For eksempel har vi standardbasen $(\mathbf e_1,\ldots,\mathbf e_n)$ for $F^n$ , så hvis $U=\mathbb{R}^n$ og $V=\mathbb{R}^m$ kan vi altid bare vælge $B^U=(\mathbf e_1,\ldots,\mathbf e_n)$ og $B^V=(\mathbf e_1,\ldots,\mathbf e_m)$ , og sige at en linear transformation $L:\mathbb{R}^n\to \mathbb{R}^m$ bestemmer en matrix. Simpelthen. Der er to problemer med denne lemfældige tilgang til situationen. Det ene er at vi sagtens kan komme ud for at betragte lineære afbildninger mellem underrum af $\mathbb{R}^n$ , og så findes der ikke mere en standardbasis. Det andet og mere afgørende problem er at vi ofte vil bruge en basis eller måske endog flere forskellige baser der er tilpasset til den situation vi betragter. Så vi må leve med at hvis vi vil kunne gå uhindret fra en lineær afbildning $L:U\to V$ til en matrix, så skal $U$ og $V$ være forsynede med baser $B^U$ og $B^V$ .

$\phantom{phantom}$ Vi ved altså at vi kan gå fra lineære transformationer til matricer, men kan vi gå den anden vej? Selvfølgelig kun under forudsætning af at vi har givet baser. Så lad $B^U = (\mathbf u_1, \ldots, \mathbf u_n)$ være en basis for $U$ og $B^V=(\mathbf v_1, \ldots, \mathbf v_m)$ en basis for for $V$ . Hvis $(a_{ij})$ er en $m\times n$ matrix, så laver vi en afbildning $L:U\to V$ sådan her: Vektoren $x_1 \mathbf u_1 + \cdots + x_n \mathbf u_n\in U$ afbildes over i vektoren med koordinater

$\begin{pmatrix} \lambda_{11} & \cdots & \lambda_{1n} \\ \vdots & \ddots & \vdots \\ \lambda_{m1} & \cdots & \lambda_{mn} \end{pmatrix} \begin{pmatrix} x_1 \\ \vdots \\ x_n \end{pmatrix} \tag{6.6}$ med hensyn til basen $B^V$ . Vi formulerer nu en sætning der siger at de to begreber "lineær transformation" og "matrix" kun er to forskellige avatarer af det samme begreb.

Lad $U\subset F^p$ og $V\subset F^q$ være underrum med baser $B^U$ henholdsvis $B^V$ . Hvis $M$ er en $m\times n$ matrix og $L$ er afbildningen beskrevet ved (6.6), så er $L$ en lineær transformation, entydigt bestemt af $M$ . Desuden er $M=M(L)$ .

Ikke flere beviser nu

Beviset for dettes minder i høj grad om beviset for Proposition 6.31 og vi vil ikke gå i detaljer her.

Quiz

Antag at den lineære transformation $L: U \rightarrow V$ , hvor $U = \mathbb{R}^2$ og $V = \mathbb{R}^2$ er givet ved

$L\begin{pmatrix} x \\ y\end{pmatrix} = \begin{pmatrix} x + y \\ x - y \end{pmatrix}.$ Hvad er matricen som repræsenterer $L$ med hensyn til

$B_1^U = B_1^V = \left(\begin{pmatrix} 1 \\ 0 \end{pmatrix}, \begin{pmatrix} 0 \\ 1 \end{pmatrix}\right)?$

$\begin{pmatrix} 1 & 1 \\ 1 & 1 \end{pmatrix}.$

$\begin{pmatrix} 1 & \phantom{-}1 \\ 1 & -1 \end{pmatrix}.$

$\begin{pmatrix} 1 & 0 \\ 1 & 1 \end{pmatrix}.$

Nedenfor en forelæsning fra 2012 forklarende matrixrepræsentationer af lineære transformationer med ekstern bistand.

Kommentarer/spørgsmål?

Matricen i Definition 6.37 kan oftest udregnes ved hjælp af nedenstående omformulering af definitionen.

Lad $L:U\rightarrow V$ være en lineær transformation, $B_1 = (\mathbf u_1, \ldots, \mathbf u_n)$ en basis for $U$ og $B_2 = (\mathbf v_1, \ldots, \mathbf v_m)$ en basis for $V$ . Søjlen $A^j$ i $m\times n$ matricen $A$ med som repræsenterer $L$ med hensyn til baserne $B_1$ og $B_2$ er den vektor

$A^j= \begin{pmatrix} a_{1j}\\ a_{2j}\\ \vdots\\ a_{mj} \end{pmatrix}$ som er entydigt fastlagt af at

$a_{1j}\mathbf v_1+a_{2j}\mathbf v_2+\cdots a_{mj}\mathbf v_m=L(\mathbf u_j).$

En helt konkret anvendelse af resultatet ovenfor er gennemgået i nedenstående video.

Kommentarer/spørgsmål?

6.7 Sammensætning af lineære transformationer

De sker at vi har tre underrum $U,V,W$ og lineære transformationer $G:U\to V$ og $F:V\to W$ . Da kan vi sammensætte og får en ny lineær transformation $FG$ defineret ved at

$FG(\mathbf v)=F(G(\mathbf v)).$ Lad os lægge mærke til at denne sammensætning lige som alle andre sammensætninger af afbildninger overholder den associative lov:

$((FG)H)(\mathbf v)=F(G(H(\mathbf v)))=F(GH)(\mathbf v)$ Hvis de tre rum har baser $B^U,B^V,B^W$ så kan vi ifølge sætning 6.38 om matrixrepræsentationer lige så godt betragte de to tre matricer $M(F),M(G)$ og $M(FG)$ .

$M(FG)=M(F)M(G)$

Bevis

Vi kan genkende matricen $M(FG)$ på at dens indgange er givet ved at

$FG(\mathbf u_j) = M(FG)_{1j} \mathbf w_1 + \cdots + M(FG)_{mj} \mathbf w_m \tag{6.7}$ På den anden side er

$\begin{aligned} FG(\mathbf u_j)&=F(G(\mathbf u_j))\\ &=F(M(G)_{1j}\mathbf v_1+M(G)_{2j}\mathbf v_2+\cdots M(G)_{kj}\mathbf v_k\\ &=M(G)_{1j}F(\mathbf v_1)+M(G)_{2j}F(\mathbf v_2)+\cdots M(G)_{kj}F(\mathbf v_k)\\ &=M(G)_{1j}(M(F)_{11}\mathbf w_1+M(F)_{21}\mathbf w_2+\cdots M(F)_{m1}\mathbf w_m)\\ &+M(G)_{2j}(M(F)_{12}\mathbf w_1+M(F)_{22}\mathbf w_2+\cdots M(F)_{m2}\mathbf w_m)\\ &\cdots \end{aligned}$ Nu samler vi koefficienterne, hvilket i dette tilfælde betyder at vi summerer vertikalt:

$\begin{aligned} FG(\mathbf u_j)&=(M(F)_{11}M(G)_{1j}+M(F)_{12}M(G)_{2j}+\cdots+M(F)_{1k}M(G)_{kj})\mathbf w_1\\ &+(M(F)_{21}M(G)_{1j}+M(F)_{22}M(G)_{2j}+\cdots+M(F)_{2k}M(G)_{kj})\mathbf w_2\\ &\ldots \end{aligned}$ Ved at sammenligne koefficienterne i denne ligning med koefficienterne i (6.7) ser vi at

$M(FG)_{ij}=M(F)_{i1}M(G)_{1j}+M(F)_{12}M(G)_{2j}+\ldots+M(F)_{ik}M(G)_{kj}$ Her genkender vi formlen for matrixmultiplikation, og slutter at $M(FG)=M(F)M(G)$ .

Hvad er spørgsmålet som har svaret "sætning 6.42''?

Hvor kommer formlen for matrixmultiplikation fra?

Nu kan vi endelig forklare hvorfor det er blændende indlysende at matrixmultiplikation er associativ - det er den fordi den bare er en anden måde at skrive sammensætning af lineære transformationer, og sammensætning af afbildninger er altid associativ! I formler: Lad $M_1,M_2,M_3$ være tre matricer som kan ganges sammen i denne rækkefølge. Da er

$\begin{aligned} L((M_1M_2)M_3)&=L(M_1M_2)L(M_3)\\ &=(L(M_1)L(M_2))L(M_3)\\ &=L(M_1)(L(M_2)L(M_3))\\ &=L(M_1(M_2M_3)) \end{aligned}$ Det vil sige, $L((M_1M_2)M_3))=L(M_1(M_2M_3))$ og derfor er $(M_1M_2)M_3=M_1(M_2M_3)$ .

Lad $A$ være matricen, som repræsenterer en lineær transformation $L: U\rightarrow V$ med hensyn til basen $B_1^U$ for $U$ og basen $B_1^V$ for $V$ . Matricen, som repræsenterer $L$ med hensyn til basen $B_2^U$ for $U$ og basen $B_2^V$ for $V$ er givet ved

$S A T,$ hvor $T$ er basiskiftmatricen fra $B_2^U$ til $B_1^U$ og $S$ er basisskiftmatricen fra $B_1^V$ til $B_2^V$ .

Bevis

Vi skal holde styr på fire baser i den her sætning. Det er simpelthen for meget for vores hjernekapacitet, så vi vil dele det lidt op. Lad os skrive matricen der repræsenterer $L$ med hensyn til baserne $B^U$ og $B^V$ som $A(B^U,B^V)$ . Vi skriver altså $A=A(B^U_1,B^V_1)$ og skal vise at $A(B^U_2,B^V_2)=SAT$ . Beviset går nu i to trin.

$A(B^U_2,B^V_1)=A(B^U_1,B^V_1)T$
$A(B^U_2,B^V_2)=SA(B^U_2,B^V_1)$

Hvis vi kan bevise begge disse to trin så følger sætningen, fordi

$A(B^U_2,B^V_2)=SA(B^U_2,B^V_1)=S\left(A(B^U_1,B^V_1)T\right)=SAT$ Beviset for de to trin minder meget om hinanden, og også stærkt om beviset for Sætning 6.41. Begge dele består af hjernedøde udregninger, som vi drevet af en absurd pligtfølelse nu reproducerer.

HD udregning 1

Vi har tre baser at holde styr på.

$\begin{aligned} B_1^U&=(\mathbf u_1,\mathbf u_2,\ldots,\mathbf u_n)\\ B_2^U&=(\mathbf w_1,\mathbf w_2,\ldots,\mathbf w_n)\\ B_1^V&=(\mathbf v_1,\mathbf v_2,\ldots,\mathbf v_m) \end{aligned}$ Lad os skrive $T=(t_{ij})$ og $A(B^U_1,B^V_1)=(a_{ij})$ Ifølge proposition 6.40 kan vi kende matricen $A'=A(B^U_2,B^V_1)=(a'_ {ij})$ på at dens søjle med søjlenummer $j$

$A'^j= \begin{pmatrix} a'_{1j}\\ a'_{2j}\\ \vdots\\ a'_{mj} \end{pmatrix}$ opfylder at

$a'_{1j}\mathbf v_1+a'_{2j}\mathbf v_2+\cdots a'_{mj}\mathbf v_m=L(\mathbf w_j). \tag{6.8}$ Men det kan vi faktisk regne på.

$\begin{aligned} L(\mathbf w_j)&=L(t_{1j}\mathbf u_1+t_{2j}\mathbf u_2+\cdots t_{nj}\mathbf u_n)\\ &=t_{1j}L(\mathbf u_1)+t_{2j}L(\mathbf u_2)+\cdots t_{nj}L(\mathbf u_n)\\ &=t_{1j}\left(a_{11}\mathbf v_1+\cdots+a_{n1}\mathbf v_n\right)+\\ &+t_{2j}\left(a_{12}\mathbf v_1+\cdots+a_{n2}\mathbf v_n\right)+\\ &\vdots\\ &+t_{nj}\left(a_{1n}\mathbf v_1+\cdots+a_{nn}\mathbf v_n\right)\\ &=(a_{11}t_{1j}+a_{12}t_{2j}+\cdots+a_{1n}t_{nj})\mathbf v_1+\cdots \end{aligned}$ Ved at sammenligne med (6.8) ser vi at

$\begin{aligned} a'_{1j}&=a_{11}t_{1j}+a_{12}t_{2j}+\cdots+a_{1n}t_{nj}\\ a'_{2j}&=a_{21}t_{1j}+a_{22}t_{2j}+\cdots+a_{2n}t_{nj}\\ &\ldots\\ a'_{mj}&=a_{m1}t_{1j}+a_{m2}t_{2j}+\cdots+a_{mn}t_{nj}\\ \end{aligned}$ Dette genkender vi som formlen for matrixmultiplikation, så at $A(B^U_2,B^V_1)=A'=AT$ .

HD udregning 2

Vi har tre baser at holde styr på.

$\begin{aligned} B_2^U&=(\mathbf w_1,\mathbf w_2,\ldots,\mathbf w_n)\\ B_1^V&=(\mathbf v_1,\mathbf v_2,\ldots,\mathbf v_m)\\ B_2^V&=(\mathbf x_1,\mathbf x_2,\ldots,\mathbf x_m)\\ \end{aligned}$ Lad os skrive $S=(s_{ij})$ og $A(B^U_2,B^V_1)=(a'_{ij})$ Ifølge proposition 6.40 kan vi kende matricen $A''=A(B^U_2,B^V_2)=(a''_ {ij})$ på at dens søjle med søjlenummer $j$

$A''^j= \begin{pmatrix} a''_{1j}\\ a''_{2j}\\ \vdots\\ a''_{mj} \end{pmatrix}$ opfylder at

$a''_{1j}\mathbf x_1+a''_{2j}\mathbf x_2+\cdots a''_{mj}\mathbf x_m=L(\mathbf w_j). \tag{6.9}$ Men det kan vi faktisk regne på.

$\begin{aligned} L(\mathbf w_j)&=a'_{1j}\mathbf v_1+a'_{2j}\mathbf v_2+\cdots a'_{mj}\mathbf v_m\\ &=a'_{1j}\left(s_{11}\mathbf x_1+\cdots+s_{m1}\mathbf x_m\right)+\\ &+a'_{2j}\left(s_{12}\mathbf x_1+\cdots+s_{m2}\mathbf x_m\right)+\\ &\vdots\\ &+a'_{mj}\left(s_{1n}\mathbf x_1+\cdots+s_{mn}\mathbf x_m\right)\\ &=(s_{11}a'_{1j}+s_{12}a'_{2j}+\cdots+s_{1m}a'_{mj})\mathbf x_1+\cdots \end{aligned}$ Ved at sammenligne med (6.9) ser vi at

$\begin{aligned} a''_{1j}&=s_{11}a'_{1j}+s_{12}a'_{2j}+\cdots+s_{1m}a'_{mj}\\ a''_{2j}&=s_{21}a'_{1j}+s_{22}a'_{2j}+\cdots+s_{2m}a'_{mj}\\ &\ldots\\ a''_{mj}&=s_{m1}a'_{1j}+s_{m2}a'_{2j}+\cdots+s_{mm}a'_{mj}\\ \end{aligned}$ Dette genkender vi som formlen for matrixmultiplikation, så at $A(B^U_2,B^V_2)=A''=SA'$ .

Som man hurtigt ser er proposition 6.43 er en anelse langhåret og notationstungt, og vi skal slet ikke snakke om beviset. Lad os prøve at kigge på den i et helt konkret tilfælde.

Eksempel

I vektorrummet $V = \mathbb{R}^2$ har vi den naturlige basis

$B = \left(\begin{pmatrix} 1 \\ 0 \end{pmatrix}, \begin{pmatrix} 0 \\ 1 \end{pmatrix}\right).$ Den lineære transformation $f:\mathbb{R}^2\rightarrow \mathbb{R}^2$ givet ved

$f\begin{pmatrix} x \\ y \end{pmatrix} = \begin{pmatrix} 7 x + 2 y\\ -15 x - 4 y \end{pmatrix}$ repræsenteres af matricen

$A = \begin{pmatrix} 7 & 2\\ -15 & -4 \end{pmatrix}$ med hensyn til basen $B$ for $\mathbb{R}^2$ (her er $U = V = \mathbb{R}^2$ og $B_1^U = B_1^V = B$ med hensyn til notationen i Proposition 6.43). Hvad er matricen, som repræsenterer $f$ med hensyn til basen

$B' = \left(\begin{pmatrix} -2 \\ 5 \end{pmatrix}, \begin{pmatrix} -1 \\ 3 \end{pmatrix}\right)?$ I henhold til Proposition 6.31 bliver basisskiftmatricen fra $B'$ til $B$ netop

$T = \begin{pmatrix} -2 & -1\\ 5 & 3 \end{pmatrix}.$ Tilsvarende bliver basisskiftmatricen fra $B$ til $B'$

$T^{-1} = \begin{pmatrix} -3 & -1\\ \phantom{-}5 & \phantom{-}2 \end{pmatrix}.$ Samlet bliver matricen, som repræsenterer $f$ i basen $B'$ så

$T^{-1} A T = \begin{pmatrix} -3 & -1\\ \phantom{-}5 & \phantom{-}2 \end{pmatrix} \begin{pmatrix} 7 & 2\\ -15 & -4 \end{pmatrix} \begin{pmatrix} -2 & -1\\ 5 & 3 \end{pmatrix} = \begin{pmatrix} 2 & 0\\ 0 & 1 \end{pmatrix}.$

Dette lille eksempel leder os naturligt frem til næste afsnit.

6.8 Egenvektorer og diagonalisering af kvadratiske matricer

Husk på definitionen af diagonaliserbare matricer og egenvektorer fra foregående kapitel. Der definerede vi en kvadratisk matrix $A$ til at være diagonaliserbar, hvis der fandtes en invertibel matrix $T$ så

$T^{-1} A T$ er en diagonalmatrix. Samtidig så vi at søjlerne i $T$ blev nødt til at være egenvektorer for $A$ . Tallet $\lambda\in F$ er en egenværdi for $A$ hvis og kun hvis

$A \mathbf v = \lambda \mathbf v$ for en vektor $\mathbf v\neq 0$ i $F^n$ . Hvis $\lambda$ er en egenværdi lader vi

$F_\lambda^n = N(A - \lambda I_n).$ Læg mærke til at $F_\lambda^n$ er nulrummet for matricen $A-\lambda I_n$ og at dette nulrum netop er mængden af egenvektorer hørende til $\lambda$ kaldet egenrummet hørende til $\lambda$ . Vi siger at en vektor $\mathbf v\in F_\lambda^n$ som ikke er nulvektoren er en egenvektor hørende til egenværdien $\lambda$ . Underrummet $F_\lambda^n\subset F^n$ består altså af alle egenvektorer til egenværdien $\lambda$ sammen med nulvektoren $\mathbf 0$ . Med nogle få tricks kan man vise følgende

Egenvektorer hørende til forskellige egenværdier er lineært uafhængige.

Bevis

Helt præcis vil vi vise, at hvis $\mathbf v_1,\ldots,\mathbf v_n$ er egenvektorer til $A$ med egenværdier $\lambda_1,\ldots,\lambda_n$ som alle er forskellige, så er $\mathbf v_1,\ldots,\mathbf v_n$ lineært uafhængige. Vi begynder med at vise det for to vektorer $\mathbf v_1,\mathbf v_2$ . Hvis vi har en linearkombination

$b_1 \mathbf v_1 + b_2 \mathbf v_2 = \mathbf 0 \tag{6.10}$ så kan vi gange med $\lambda_1$ og få

$\mathbf 0=\lambda_1 b_1 \mathbf v_1 + \lambda_1 b_2 \mathbf v_2 \tag{6.11}$ Man vi kan også anvende $A$ på (6.10) og få

$\mathbf 0=A\mathbf 0= b_1 A \mathbf v_1 + b_2 A \mathbf v_2 = \lambda_1 b_1 \mathbf v_1 + \lambda_2b_2 \mathbf v_2 \tag{6.12}$ Ved at trække (6.12) fra (6.11) fås

$(\lambda_1 - \lambda_2)b_2 \mathbf v_2 = 0,$ Nu var jo $\mathbf v_2$ en egenvektor, så at specielt er $\mathbf v_2\neq\mathbf 0$ . Dette giver $b_2 = 0$ , da $\lambda_1\neq \lambda_2$ . På den samme måde er $b_1=0$ .

$\phantom{phantom}$ Nu har vi starten på en induktion. Induktionsstarten er at sætningen er rigtig for $n=2$ . Induktionsskridtet er at vise at hvis sætningen er rigtig for $n-1$ egenvektorer, så er den også rigtig for $n$ egenvektorer. Hvis vi har en linearkombination

$b_1 \mathbf v_1 + b_2 \mathbf v_2 + \cdots + b_n \mathbf v_n = \mathbf 0,$ får vi på samme måde som før to ligninger:

$\mathbf 0=\lambda_1b_1 \mathbf v_1 + \lambda_1b_2 \mathbf v_2 + \cdots + \lambda_1b_n \mathbf v_n$ og

$\mathbf 0=\lambda_1 b_1 \mathbf v_1 + \lambda_2 b_2\mathbf v_2 + \cdots + \lambda_nb_n \mathbf v_n.$ Dette medfører at

$b_2 (\lambda_1 - \lambda_2) \mathbf v_2 + \cdots + b_n (\lambda_1 - \lambda_n) \mathbf v_n = 0.$ Ved at bruge sætningen på de $n-1$ egenvektorer $\mathbf v_2,\ldots,\mathbf v_n$ finder vi at $0=b_2=\cdots =b_n$ . Det følger dermed også at $b_1\mathbf v_1=\mathbf 0$ , så at $b_1=0$ , og induktionen er fuldstændig.

Med hensyn til et konkret eksempel på udregning af egenvektorer for en matrix det vil sige udregning af egenrummene $F^n_\lambda$ henvises til sidste del (cirka fra 7:25) af videoen (som skamløst er blevet genbrugt fra Kapitel 4) nedenfor.

Kommentarer/spørgsmål?

Med vores nye viden om underrum, baser og dimension kan vi nu sammenfatte dette i følgende

En $n\times n$ matrix $A$ er diagonaliserbar hvis og kun hvis $F^n$ har en basis bestående af egenvektorer for $A$ . At $F^n$ har en basis bestående af egenvektorer er ækvivalent med at

$\dim F^n_{\mu_1} + \cdots + \dim F^n_{\mu_r} = n,$ hvor $\mu_1, \ldots, \mu_r$ er de forskellige egenværdier for $A$ .

Bevis

Hvis $F^n$ har en basis $(\mathbf v_1, \ldots, \mathbf v_n)$ bestående af egenvektorer for $A$ hørende til respektive egenværdier $\lambda_1, \lambda_2, \ldots, \lambda_n$ , så vil matricen $T$ med søjler $\mathbf v_1, \ldots, \mathbf v_n$ være invertibel og

$T^{-1} A T = D,$ hvor

$D = \begin{pmatrix} \lambda_1 & 0 & \cdots & 0\\ 0 & \lambda_2 & \cdots &0\\ \vdots & \vdots & \ddots & \vdots\\ 0 & 0 & \cdots & \lambda_n \end{pmatrix}.$ Det har vi overejet. Modsat hvis $T$ er invertibel med ovenstående egenskab, så vil søjlerne i $T$ udgøre en basis af egenvektorer med tilhørende egenværdier i diagonalen. For at vise det skriver vi ud de to matrixmultiplikationer $A T$ og $T D$ , og overvejer at er identiske. Det er jo nok at tjekke dette på vektorerne i standardbasen, så det er det vi gør.

$AT\mathbf e_j=A\mathbf v_j=\lambda_j\mathbf v_j=A(\lambda_j\mathbf e_j)=AD\mathbf e_j.$

$\phantom{phantom}$ Vi mangler den sidste påstand i sætningen. Som vi plejer, deler vi beviset op i lidt mindre stykker. Til at begynde med kan vi for hvert $\mu_i$ vælge en basis for $F^n_{\mu_i}$ , lad os sige at den hedder $\mathbf u^i_1,\ldots,\mathbf u_{m_i}^i$ . Da antallet elementer i en basis er det samme som dimensionen er $m_i=\dim F^n_{\mu_i}$ . Vi påstår nu at hvis vi tager alle disse vektorer sammen, så er de stadig lineært uafhængige i $F^n$ . Hvorfor nu det? Jo, hvis vi har en linearkombination

$\mathbf 0=\left(b_1^1 \mathbf u_1^1 +\cdots\right)+\left(b_1^2 \mathbf u_1^2 +\cdots\right)+\cdots \tag{6.13}$ samler vi alle termer der hører til det samme egenrum, det vil sige

$\begin{aligned} \mathbf w_1&=b_1^1 \mathbf u_1^1 +\cdots\\ \mathbf w_2&=b_1^2 \mathbf u_1^2 +\cdots\\ &\ldots \end{aligned}$ Da er $\mathbf w_i$ enten en egenvektor med egenværdi $\mu_i$ , eller også er $\mathbf w_i=0$ . Disse $\mu_i$ er forskellige, og

$\mathbf w_1+\mathbf w_2+\cdots =\mathbf 0$ Ifølge (6.13) er altså alle $\mathbf w_i=0$ , så at

$\mathbf 0=\mathbf w_i=b_1^i \mathbf u_1^i +\cdots \in F^n_{\mu_i}.$ Da $\mathbf u_1^i,\mathbf u_2^i,\ldots$ er en basis for $F^n_{\mu_i}$ så følger det at alle $b_j^i=0$ . Vi har nu lavet en mængde af lineært uafhængige vektorer i $F^n$ . Da de er lineært uafhængige kan der ikke være flere end allerhøjst $n$ af dem, og hvis der er nøjagtig $n$ af dem, så danner de en basis for $F^n$ . Nu tæller vi op hvor mange $\mathbf u^i_j$ vi har. Alt i alt er der

$m_1+m_2+\cdots +m_r=\dim F^n_{\mu_1}+\ldots+F^n_{\mu_r}.$ Der er altså nu to alternativer. $\color{green} \mathrm{Enten} \color{black}$ er

$\dim F^n_{\mu_1}+\ldots+\dim F^n_{\mu_r}=n$ og $\{\mathbf u^i_j\}$ danner en basis af egenvektorer for $F^n$ $\color{red} \mathrm{eller} \color{black}$ også er

$\dim F^n_{\mu_1}+\ldots+\dim F^n_{\mu_r}<n$ Nu følger den første halvdel af vores påstand: Hvis

$\dim F^n_{\mu_1}+\ldots+\dim F^n_{\mu_r}=n,$ så er vi i tilfældet hvor der $\color{green} \mathrm{ findes }$ en basis for $F^n$ der udelukkende består af egenvektorer for $A$ . For at fuldstændiggøre beviset skal vi vise den omvendte implikation, nemlig at hvis der findes en basis af egenvektorer, så er

$\dim F^n_{\mu_1}+\ldots+\dim F^n_{\mu_r}=n.$ Så antag at der findes en sådan basis $\lambda_j$ . Vi kan omsortere egenværdierne $\lambda_j$ så at der er tal $n_0=0<n_1<n_2< \ldots <n_{r-1}<n_r=n$ og

$\begin{aligned} \lambda_j=\mu_1 &\quad\mathrm{ hvis } \quad 0<j\leq n_1,\\ \lambda_j=\mu_2 &\quad\mathrm{ hvis } \quad n_1<j\leq n_2,\\ &\cdots\\ \lambda_j=\mu_r &\quad\mathrm{ hvis } \quad n_{r-1}<j\leq n. \end{aligned}$ Der er altså $n_i-n_{i-1}$ af de lineært uafhængige vektorer $\mathbf v_j$ der er egenvektorer med egenværdi $\mu_i$ . Det betyder at $\dim F^n_{\mu_j}\geq n_i-n_{i-1}$ , så at

$\dim F^n_{\mu_1}+\ldots+\dim F^n_{\mu_r} \geq (n_1-n_0)+(n_2-n_1)+\cdots(n-n_{r-1})=n.$ Dette udelukker vores $\color{red} \mathrm{ andet }$ alternativ. så at vi faktisk har en basis for $F^n$ der består af egenvektorer for $A$ .

Det er hændt at jeg er stødt på kandidatstuderende i matematik, som ikke kan give et eksempel på en ikke-diagonaliserbar matrix efter at have været gennem større kurser i lineær algebra og avancerede kurser i topologi og abstrakt algebra. Det får mig til at tænke på at matematikundervisningen tit fokuserer alt for meget på at skrive tingene fint og fejlfrit ned og ofte er alt for langt fra de konkrete tiltag, hvor de fleste mennesker har en reel mulighed for at få en dyb forståelse. Her er en helt konkret opgave.

Opgave

Gør detaljeret rede for at matricen

$\begin{pmatrix} 1 & 1\\ 0 & 1 \end{pmatrix}$ ikke er diagonaliserbar.

6.8.1 Egenværdier via potensmetoden

Hånden på hjertet. Vi har reelt kun nu det karakteristiske polynomium til at bestemme egenværdierne for en matrix. For store matricer bliver det helt uoverkommeligt for ikke at sige umuligt at udregne det karakteristiske polynomium. Der er brug for andre metoder til udregning af egenværdier. Her giver jeg et eksempel på en sådan klassisk metode. Antag at $A$ er diagonaliserbar med en basis $\mathbf v_1, \ldots, \mathbf v_n$ af egenvektorer hørende til egenværdierne $\lambda_1, \ldots, \lambda_n$ . Antag yderligere at $\dim F_{\lambda_1}^n = 1$ og at

$|\lambda_1| > |\lambda_i|$ for $i>1$ . Begynd med en vektor

$\mathbf v^0 = x_1 \mathbf v_1 + \cdots + x_n \mathbf v_n$ og antag $x_1\neq 0$ . Herefter itereres

$\mathbf v^k := A^k \mathbf v_0 = x_1 \lambda_1^k \mathbf v_1 + \cdots + x_n \lambda_n^k \mathbf v_n.$ Antag at den $i$ -te koordinat i $x_1 \mathbf v_1$ er $\neq 0$ . Så vil

$(\mathbf v^k)_i = \lambda_1^k x_1 v_{1i} + \cdots + \lambda_n^k x_n v_{ni},$ fordi $A^k \mathbf v_i = \lambda_i^k \mathbf v_i$ og dermed

$\frac{(v^{k+1})_{i}}{(v^k)_i} = \frac{\lambda_1 x_1 v_{1i} + \epsilon_1}{x_1 v_{1i} + \epsilon_2},$ hvor

$\begin{aligned} \epsilon_1 &= \lambda_2 \left(\frac{\lambda_2}{\lambda_1}\right)^k x_2 v_{2i} + \cdots + \lambda_n \left(\frac{\lambda_n}{\lambda_1}\right)^k x_n v_{ni}\\ \epsilon_2 &= \left(\frac{\lambda_2}{\lambda_1}\right)^k x_2 v_{2i} + \cdots + \left(\frac{\lambda_n}{\lambda_1}\right)^k x_n v_{ni} \end{aligned}$ Derfor vil

$\lambda^{(k)}=\frac{(v^{k})_{i}}{(v^{k-1})_i}\to \lambda_1$ for $k\to \infty$ . Lad os illustrere metoden med matricen

$A = \begin{pmatrix} 7 & 2\\ -15 & -4 \end{pmatrix}$ og startvektoren $v^0 = \begin{pmatrix} 1 \\ 0 \end{pmatrix}$ . Nedenfor er angivet de første $7$ iterationer af metoden. Første søjle angiver $k$ , anden søjle er $x$ -koordinaten for $v^k$ , tredje søjle er $y$ -koordinaten for $v^k$ , mens sidste søjle angiver $\lambda^{(k)}$ for $i=1$ det vil sige med hensyn til $x$ -koordinaten.

0	1	0
1	7	-15	7
2	19	-45	2.714
3	43	-105	2.263
4	91	-225	2.116
5	187	-465	2.055
6	379	-945	2.023
7	763	-1905	2.013

Iterationerne ser ud til at indikere at $\lambda= 2$ er en egenværdi for $A$ , hvilket viser sig at være korrekt.

$\phantom{phantom}$ Der findes modeller i anvendelser hvor en vektor $\mathbf v$ angiver tilstanden til et tidspunkt, og den lineære afbildning $A$ fortæller hvordan $\mathbf v$ udvikles i løbet af en bestemt tidsenhed (et sekund, en dag eller et år etc..). Det betyder at tilstanden efter at $n$ tidsenheder er forløbet er angivet af vektoren $A^n\mathbf v$ . Ifølge ovenstående betragtning vil det betyde at hvis den største numerisk største egenvektor $\lambda_1$ opfylder at $|\lambda_1|>1$ så forudsiger modellen eksponentiel vækst. Det vil normalt betyde at på et tidspunkt vil modellen bryde sammen, og ikke mere være en god beskrivelse af virkeligheden

6.9 Gershgorins cirkelsætning

Gershgorins cirkelsætning (efter Semyon Aranovich Gershgorin) udtrykker hvor langt vi kan forvente egenværdierne for en matrix ligger fra diagonalelementer. Lad $A = (a_{ij})$ være en $n \times n$ matrix og lad

$D(a_{ii}, R_i) = \{z\in \mathbb{C} \mid |z - a_{ii}| \leq R_i\},$ hvor

$R_i = \sum_{j\neq i} |a_{ij}|$ være cirkelskiven med centrum i $a_{ii}$ og radius $R_i$ i de komplekse tal. Bemærk at $R_i$ er summen af de absolutte værdier af indgangene udenfor diagonalen i $i$ -te række for $A$ .

Enhver egenværdi for $A$ ligger i mindst en af cirkelskiverne $D(a_{ii}, R_i)$ for $i = 1, \ldots, n$ .

Bevis

Lad $\lambda$ være en egenværdi for $A$ og vælg en egenvektor $v$ hørende til $\lambda$ med en koordinat $x_i=1$ , hvor $|x_j|\leq 1$ for $j\neq i$ . Med definitionen af matrixmultiplikation og $A v = \lambda v$ følger

$\sum_{j\neq i} a_{ij} x_j + a_{ii} = \lambda$ og dermed

$|\lambda - a_{ii}| = \left|\sum_{j\neq i} a_{ij} x_j\right| \leq \sum_{j\neq i} |a_{ij}|\, | x_j| \leq \sum_{j\neq i} |a_{ij}| = R_i.$

En $n\times n$ matrix $A= (a_{ij})$ kaldes strengt diagonaldominant hvis

$|a_{ii}| > \sum_{j\neq i} |a_{ij}|$ for $i=1, \ldots, n$ .

En strengt diagonaldominant $n\times n$ matrix $A$ er invertibel.

Bevis

Lad $a_{ij}$ betegne indgangene i $A$ . Det er nok at vise at $0$ ikke er en egenværdi for $A$ . Hvis $0$ var en egenværdi måtte vi have $0\in D(a_{ii}, R_i)$ for et eller andet $i = 1, \ldots, n$ på grund af Sætning 6.48. Dette er umuligt, da

$|a_{ii}| > \sum_{j\neq i} |a_{ij}| = R_i.$

Matricen

$\begin{pmatrix} 8 & 1 & 2 & 3\\ 0 & 4 & 1 & 1\\ 4 & 2 & 7 & 0\\ 1 & 2 & 1 & 5 \end{pmatrix}$ er invertibel ifølge Sætning 6.50. For denne matrix er

$\begin{aligned} R_1 &= 1 + 2 + 3 = 6\\ R_2 &= 0 + 1 + 1 = 2\\ R_3 &= 4 + 2 + 0 = 6\\ R_4 &= 1 + 2 + 1 = 3. \end{aligned}$

6.10 Opgaver

6.10.1

Lad $v_1, \ldots, v_m\in F^n$ . Vis ud fra Definition 6.1 at

$\mathrm{span}(v_1, \ldots, v_m)$ er et underrum i $F^n$ .

Vink

Begynd med $m=1$ og $m=2$ for at få ideer.

6.10.2

Lad $e_1, \ldots, e_n$ være den naturlige basis for $\mathbb{R}^n$ det vil sige

$\begin{pmatrix} x_1 \\ \vdots \\ x_n \end{pmatrix} = x_1 e_1 + \ldots + x_n e_n$ for $x_1, \ldots, x_n \in \mathbb{R}$ . Hvis $V$ er et underrum af $\mathbb{R}^n$ og $e_1, \ldots, e_n$ alle ligger i $V$ , hvorfor gælder så at $V = \mathbb{R}^n$ ?

6.10.3

$\left(\begin{pmatrix} 2 \\ 3 \\ 5 \end{pmatrix},\quad \begin{pmatrix} 7 \\ 11 \\ 13 \end{pmatrix},\quad \begin{pmatrix} 17 \\ 19 \\ 23 \end{pmatrix} \right)$ en basis for $\mathbb{R}^3$ ? Begrund dit svar.

6.10.4

Lad

$A=\begin{pmatrix} -1 & \phantom{-}1 & 1\\ \phantom{-}4 & -2 & 0\\ -2 & \phantom{-}1 & 0 \end{pmatrix}.$ Find baser for $R(A), C(A)$ og $N(A)$ som underrum af $\mathbb{R}^3$ .

6.10.5

Lad $A$ være en $4\times 5$ matrix med rang $3$ . Hvad kan du sige om $\dim N(A)$ ? Opskriv et eksempel på en matrix $A$ med disse egenskaber.

6.10.6

Opgave om taxa fordeling.

6.10.7

Lad $L: U\rightarrow V$ , hvor $U = V = \mathbb{R}^2$ være givet ved

$L \begin{pmatrix} x \\ y \end{pmatrix} = \begin{pmatrix} x \\ -y \end{pmatrix}.$ Find matrixrepræsentationen af $L$ med hensyn til basen

$\left( \begin{pmatrix} 1 \\ 2 \end{pmatrix}, \begin{pmatrix} 2 \\ 1\end{pmatrix}\right)$ for $U$ og basen

$\left( \begin{pmatrix} 2 \\ 3 \end{pmatrix}, \begin{pmatrix} 3 \\ 2\end{pmatrix}\right)$ for $V$ .

6.10.8

Lad

$A = \begin{pmatrix} \phantom{-}11 & -2 & \phantom{-}2\\ -36 & \phantom{-}10 & -8\\ -81 & \phantom{-}18 & -16 \end{pmatrix}.$ Det opgives at $\lambda=1$ og $\lambda=2$ er egenværdierne for $A$ . Undersøg om $\mathbb{R}^3$ har en basis af egenvektorer for $A$ det vil sige om $A$ er diagonaliserbar. Find i givet fald en invertibel matrix $T$ så

$T^{-1} A T$ er en diagonalmatrix.

6.10.9

Gør rede for at matricen

$\begin{pmatrix} 2 & 2 & 1 \\ 1 & 2 & 1 \\ 2 & 1 & 3 \end{pmatrix}.$ ikke er diagonaliserbar ud fra oplysningen om at dens karakteristiske polynomium er

$-\lambda^3 + 7 \lambda^2- 11\lambda + 5 = (\lambda-1)^2 (\lambda - 5).$

6.10.10

Kan en invertibel matrix have $0$ som egenværdi?

6.10.11

Sandsynliggør at $2$ er en egenværdi for

$A=\begin{pmatrix} 1 & 1\\ 1 & 1 \end{pmatrix}$ ved at benytte potensmetoden beskrevet i afsnit 6.8.1. Er $A$ diagonaliserbar?

6.10.12

Hvorfor vil $n$ lineært uafhængige vektorer i et underrum af dimension $n$ altid udgøre en basis?

6 Konkrete vektorer

6.1 Konkrete vektorrum

6.1.1 De reelle tal \mathbb{R}

6.1.2 Geometri, linear algebra og vektorer i rummet.

6.1.3 De komplekse tal \mathbb{C}

6.2 Underrum

6.2.1 Linearkombinationer og span af vektorer

6.2.2 Nulrum, søjlerum og rækkerum for matricer

6.3 Lineær uafhængighed

6.4 Basis for og dimension af underrum

6.5 Koordinater

6.6 Lineære transformationer

6.6.1 Repræsentation ved en matrix

6.7 Sammensætning af lineære transformationer

6.8 Egenvektorer og diagonalisering af kvadratiske matricer

6.8.1 Egenværdier via potensmetoden

6.9 Gershgorins cirkelsætning

6.10 Opgaver

6.10.1

6.10.2

6.10.3

6.10.4

6.10.5

6.10.6

6.10.7

6.10.8

6.10.9

6.10.10

6.10.11

6.10.12

6.1.1 De reelle tal $\mathbb{R}$

6.1.3 De komplekse tal $\mathbb{C}$