6Vektorrum

I dette kapitel begynder vi for alvor at introducere terminologien og grundstrukturen i lineær algebra, nemlig vektorrum, baser og koordinater. Det er grundstenene for senere at kunne formulere problemstillinger inden for linear algebra og kunne analysere løsninger og virkelig forstå faget. På grund af de mange nye begreber, og fordi det kan være svært med det samme at se relationen til anvendelser, vil dette også for manges vedkommende være et af de sværeste kapitler i kurset. Derfor er det særdeles vigtigt at I grundigt gennemgår eksemplerne undervejs for at opnå den nødvendige intuition.

Det første vi introducerer er vektorrum. Her skelner man mellem vektorrum over reelle tal $\mathbb{R}$ og vektorrum over komplekse tal $\mathbb{C}$ . Men fordi de fleste resultater er identiske for de to typer af vektorrum, så vil vi bruge notationen $\mathbb{F}$ til enten at betegne $\mathbb{R}$ eller $\mathbb{C}$ .

6.1 Abstrakte og konkrete vektorrum

Inden vi kigger på de mere konkrete vektorrum, som vi hovedsagligt vil beskæftige os med i dette kursus, så nævner vi først de grundlæggende principper der ligger bag et generelt vektorrum.

Lad $V$ være en mængde. Lad $\mathbf u,\mathbf v,\mathbf w\in V$ og lad $\mu,\lambda\in\mathbb{F}$ være vilkårlige. $V$ kaldes et vektorrum over $\mathbb{F}$ såfremt der gælder:

$\mathbf u+\mathbf v$ og $\lambda \mathbf v$ kan defineres som elementer i $V$ .
$\mathbf u+\mathbf v=\mathbf v+\mathbf u$ .
$(\mathbf u+\mathbf v)+\mathbf w=\mathbf u+(\mathbf v+\mathbf w)$ .
Der er et origo/nulvektor $\mathbf 0\in V$ så $\mathbf u+\mathbf 0=\mathbf u$ og $\mathbf u+(-1)\cdot\mathbf u = \mathbf 0.$
$\lambda(\mathbf u+\mathbf v)=\lambda\mathbf u+\lambda\mathbf v$ .
$(\lambda+\mu)\mathbf u=\lambda\mathbf u+\mu\mathbf u$ .
$\lambda(\mu\mathbf u)=(\lambda\mu)\mathbf u$ .
$1\cdot \mathbf v=\mathbf v$ .

Endnu mere generelt kan $\mathbb{F}$ være et legeme.

Definition 6.1 kan se kompliceret ud når man første gang ser den, men der er i virkeligheden tale om en struktur de fleste er vant til at bruge, måske uden at tænke over at det hører til en mere generel teori. Lad os først kigge på nogle eksempler på velkendte vektorrum.

6.1.1 Nogle konkrete eksempler på vektorrum

Hvis vi kigger lidt nærmere på definitionen af et vektorrum, så er det altså en struktur hvor det giver mening at lægge elementer sammen og gange med skalarer. Vi kender allerede eksempler på vektorrum, nemlig de reelle tal $\mathbb{R}$ og komplekse tal $\mathbb{C}$ . Andre velkendte eksempler er geometriske vektorer, f.eks. vektorer i planen og rummet som vi har diskuteret i Kapitel 1.

Lidt mere generelt, så kan man tale om vektorrum af reelle eller komplekse $m\times n$ matricer, som også betegnes $\mathbb{R}^{m\times n}$ eller $\mathbb{C}^{m\times n}$ . Nulvektoren for vektorrum af matricer er nulmatricen, som har nuller i alle dens indgange.

Nogle andre eksempler kunne være vektorrum af funktioner. Eksempelvis er mængden af alle polynomier af grad højst $n$ et vektorrum, altså funktioner på formen

$p(z) = a_n z^n + a_{n-1}z^{n-1} + \dots + a_1z + a_0,$ hvor koefficienterne $a_n,\dots,a_0$ beskriver hvilket polynomium der er tale om. Addition for polynomierne sker på den mest naturlige måde, nemlig punktvis, det vil sige at for polynomier $p_1$ og $p_2$ , er $q = p_1 + p_2$ funktionen med funktionsværdierne

$q(z) = p_1(z) + p_2(z).$ Det er nu klart at summen af to polynomier af grad højst $n$ , igen giver et polynomium af grad højst $n$ , da det svarer til at man lægger koefficienterne sammen. På samme punktvise måde kan man definere at gange med en skalar. Nulvektoren for et rum af polynomier er nulfunktionen, som svarer til at alle koefficienterne er nul, $a_n=a_{n-1}=\dots=a_0=0$ .

Et mere kompliceret eksempel på et vektorrum af funktioner, men som er vigtigt inden for Fourieranalyse og signalbehandling, er rummet af kvadratisk integrable funktioner. Det vil sige funktioner $f$ på et interval $[a,b]$ så

$\int_a^b |f(x)|^2\,\mathrm{d}x < \infty.$ Det er måske lidt mere kompliceret at overbevise sig selv om, at summen af kvadratisk integrable funktioner igen giver en kvadratisk integrabel funktion; dette kaldes Minkowskis ulighed. Nulvektoren for dette vektorrum er også mere kompliceret, da det ikke bare er nulfunktionen, men i stedet er en ækvivalensklasse af alle funktioner som er lig med nul næsten over alt. Dette bunder i, at integraler ikke ''ser forskel'' på om en funktion er lig med nul over alt, eller om der er enkelte punkter med en anden funktionsværdi.

Grunden til at kigge på en generel struktur, er at vi kan genbruge denne struktur uanset om der er tale om geometriske vektorer eller om der tale om funktioner, eller noget helt tredje. På denne måde slipper vi for at skulle gennem den samme teori igen og igen, og vi kan endda bruge vores intuition om eksempelvis ortogonalitet for vektorer i planen i en mere generel sammenhæng, hvilket også gør det lettere at lære disse begreber.

6.1.2 Vektorrum af søjlevektorer

I dette kursus vil vi hovedsagligt fokusere på vektorrum bestående af søjlevektorer, svarende til $m\times 1$ matricer. En helt naturlig generalisering af vektorer i planen $\mathbb{R}^2$ er søjlevektorer med $m$ indgange i $\mathbb{R}$ :

$\mathbb{R}^m = \left\{ \begin{pmatrix} x_1 \\ \vdots \\ x_m\end{pmatrix} : x_1, \dots, x_m\in \mathbb{R}\right\},$ og tilsvarende har vi for komplekse søjlevektorer

$\mathbb{C}^m = \left\{ \begin{pmatrix} z_1 \\ \vdots \\ z_m\end{pmatrix} : z_1, \dots, z_m\in \mathbb{C}\right\}.$ Samlet set vil $\mathbb{F}^m$ betegne enten $\mathbb{R}^m$ eller $\mathbb{C}^m$ .

6.2 Underrum, linearkombinationer og span

Overvej en linje gennem origo i rummet. Dette svarer til alle vektorerne der er parallelle med en enkelt vektor $\mathbf v\in \mathbb{R}^3$ . Hvis vi lægger parallelle vektorer sammen skifter de ikke retning, men vil stadig ligge på denne samme linje. Dette er fordi at en linje der går gennem origo er et vektorrum!

På præcis samme måde vil en plan i $\mathbb{R}^3$ der skærer origo også være et vektorrum: Lægger man vektorer i sådan et plan sammen, forbliver det stadig i planen.

Plan der udspændes af to vektorer $\mathbf u$ og $\mathbf v$ fra Wikipedia.

Det er altså muligt at have vektorrum som ligger i eksempelvis $\mathbb{R}^3$ , men som kun udgør en lille andel af vektorerne i $\mathbb{R}^3$ . Disse typer af vektorrum kaldes underrum.

Lad $V$ være et vektorrum (f.eks. $\mathbb{F}^m$ ). En ikke-tom delmængde $U\subseteq V$ kaldes et underrum af $V$ , hvis det for alle $\mathbf u,\mathbf v\in U$ og $\lambda\in \mathbb{F}$ opfylder:

$\mathbf u + \mathbf v\in U$ ,
$\lambda \mathbf u\in U$ .

Vi vil mest se på underrum af $\mathbb{F}^m$ i dette kursus.

Et underrum af $\mathbb{R}^3$ kan være af fire forskellige slags.

Det kan bestå af kun origo, $\{\mathbf 0\}$ .
Det kan være en linje der indeholder origo.
Det kan være en plan der indeholder origo.
Det kan være hele $\mathbb{R}^3$ (som selvfølgelig automatisk indeholder origo).

Et underrum arver egenskaberne fra Definition 6.1, da $U$ er en delmængde af $V$ . Betingelserne i Definition 6.2 viser at man nu kan erstatte $V$ med $U$ i den første betingelse af Definition 6.1, så længe at vektorerne kommer fra $U$ . Vi får også at origo, $\mathbf 0$ , ligger i $U$ fordi der må gælde at $\mathbf 0 = 0\cdot \mathbf u \in U$ for en vektor $\mathbf u\in U$ . Det betyder faktisk at:

Et underrum er også et vektorrum.

Hvilke af nedenstående udsagn er rigtige?

Punkterne på linjen i $\mathbb{R}^2$ givet ved $y = 2x + 1$ er et underrum af $\mathbb{R}^2$ .

Et underrum af $\mathbb{F}^m$ indeholder altid $\mathbf 0$ .

Hvis $\lambda, \mu\in \mathbb{F}$ og $\mathbf u, \mathbf v\in U$ , hvor $U$ er et underrum af $\mathbb{F}^m$ så vil

$\lambda \mathbf u + \mu \mathbf v \in U.$

Punkterne på parablen $y = x^2$ i $\mathbb{R}^2$ er et underrum af $\mathbb{R}^2$ .

Betragt delmængden $U = \{(x, y, z) : x + y - z = a\}$ af $\mathbb{R}^3$ . For hvilke tal $a$ er $U$ et underrum af $\mathbb{R}^3$ ?

$a=1$ .

$a=-1$ .

$a=0$ .

6.2.1 Linearkombinationer og span af vektorer

Vi skal nu se på den mest almindelige måde at beskrive underrum på, nemlig ved linearkombinationer.

Lad $V$ være et vektorrum over $\mathbb{F}$ (f.eks. $\mathbb{F}^m$ ), og lad $\mathbf v_1,\dots,\mathbf v_n\in V$ . Vi kalder

$x_1\mathbf v_1 + x_2\mathbf v_2 + \dots + x_n\mathbf v_n$ for en linearkombination af vektorerne $\mathbf v_1,\dots,\mathbf v_n$ , hvor $x_1,\dots,x_n$ er skalarer i $\mathbb{F}$ .

Mængden af alle linearkombinationer af $\mathbf v_1,\dots,\mathbf v_n$ kaldes spannet af vektorerne, og skrives

$\mathrm{span}\{\mathbf v_1,\dots,\mathbf v_n\} = \{ x_1\mathbf v_1 + x_2\mathbf v_2 + \dots + x_n\mathbf v_n : x_1,\dots,x_n\in\mathbb{F} \}.$

Lad os starte med et simpelt geometrisk eksempel. Overvej følgende vektorer i $\mathbb{R}^3$ :

$\mathbf e_1 = \begin{pmatrix} 1 \\ 0 \\ 0 \end{pmatrix} \quad \text{og} \quad \mathbf e_2 = \begin{pmatrix} 0 \\ 1 \\ 0 \end{pmatrix}.$ Så vil spannet af $\mathbf e_1$ og $\mathbf e_2$ bestå af alle vektorer i $\mathbb{R}^3$ på formen

$x\mathbf e_1 + y\mathbf e_2 = \begin{pmatrix} x \\ y \\ 0 \end{pmatrix}.$ Vi har altså at

$\mathrm{span}\{\mathbf e_1,\mathbf e_2\} = \{(x,y,0)^T : x,y\in\mathbb{R}\}.$ Dette er lige præcis punkterne i $xy$ -planen.

Lad os nu se på en anden vektor

$\mathbf v = \begin{pmatrix} 1 \\ 2 \\ 0 \end{pmatrix}.$ Nu kan vi overveje spannet af $\mathbf e_1$ og $\mathbf v$ :

$\mathrm{span}\{\mathbf e_1,\mathbf v\} = \{(x_1+x_2,2x_2,0)^T : x_1,x_2\in\mathbb{R}\}.$ Det er måske lidt mindre tydeligt denne gang, men faktisk er dette også $xy$ -planen. Hvis vi sætter $x_2 = \frac{1}{2}y$ og $x_1 = x - \frac{1}{2}y$ , så får vi lige præcis koordinaterne til punktet $(x,y,0)$ .

Grunden til dette kommer af, at $\mathbf v = \mathbf e_1 + 2\mathbf e_2$ , det vil sige at $\mathbf v$ ligger i $\mathrm{span}\{\mathbf e_1,\mathbf e_2\}$ , så vi kan ikke få ''nye'' vektorer som ikke allerede er udspændt af $\mathbf e_1$ og $\mathbf e_2$ , ved at tage linearkombinationer af $\mathbf e_1$ og $\mathbf v$ . Omvendt har vi også at $\mathbf e_2 = \frac{1}{2}(\mathbf v-\mathbf e_1)$ . Faktisk har vi netop at

$\mathrm{span}\{\mathbf e_1,\mathbf e_2\} = \mathrm{span}\{\mathbf e_1,\mathbf v\} = \mathrm{span}\{\mathbf e_2,\mathbf v\} = \mathrm{span}\{\mathbf e_1,\mathbf e_2,\mathbf v\}.$ I næste afsnit skal vi se hvordan man finder det minimale antal vektorer der udspænder en mængde, ved at tjekke for lineær uafhængighed.

Betragt ligningen

$x_1 \begin{pmatrix} 1 \\ 0 \\ 1 \end{pmatrix} + x_2 \begin{pmatrix} 0 \\ 1 \\ 1 \end{pmatrix} + x_3 \begin{pmatrix} 1 \\ 2 \\ 1 \end{pmatrix} + x_4 \begin{pmatrix} 4 \\ 0 \\ 1 \end{pmatrix} = \begin{pmatrix} 0 \\ 0 \\ 0 \end{pmatrix},$ hvor $x_1, x_2, x_3, x_4 \in \mathbb{R}$ . Denne ligning er opfyldt for?

$\begin{aligned} &x_1 = -6,\quad x_2 = -2,\quad x_3 = 3\\ &x_4 = 5. \end{aligned}$

$\begin{aligned} &2x_1 = -5 x_4,\quad x_2 = 3 x_4\\ &2 x_3 = - 3x_4. \end{aligned}$

$\begin{aligned} &x_1 = -2,\quad x_2 = -1,\quad x_3 = 3\\ &x_4 = 7. \end{aligned}$

$\begin{aligned} &x_1 = 5,\quad x_2 = -6,\quad x_3 = 3\\ &x_4 = -2. \end{aligned}$

Man kan nu overveje, hvad relationen fra linearkombinationer og til lineære ligningssystemer er. Bemærk at hvis vi har $\mathbf v_1,\dots,\mathbf v_n \in \mathbb{F}^m$ , så kan vi opstille en $m\times n$ matrix med disse søjler $A = (\mathbf v_1,\dots,\mathbf v_n)$ . Tilsvarende kan vi tage en vektor $\mathbf x = (x_1,\dots,x_n)^T$ fra $\mathbb{F}^n$ , og så vil matrix-vektor produktet give følgende linearkombination:

$A\mathbf x = x_1\mathbf v_1 + \dots + x_n\mathbf v_n.$ Så vi er faktisk allerede ret bekvemme med linearkombinationer gennem vores erfaring med at gange matricer på vektorer. Dette viser at en vektor $\mathbf b\in \mathbb{F}^m$ ligger i $\mathrm{span}\{\mathbf v_1,\dots,\mathbf v_n\}$ hvis og kun hvis ligningssystemet

$A\mathbf x=\mathbf b$ har en løsning $\mathbf x\in\mathbb{F}^n$ .

Betragt nu vektorerne

$\mathbf v_1 = \begin{pmatrix} 1 \\ 1 \\ 0 \end{pmatrix}\qquad\text{og}\qquad \mathbf v_2 = \begin{pmatrix} 0 \\ 1 \\ 1 \end{pmatrix}.$ Lad os undersøge om

$\mathbf b = \begin{pmatrix} 1 \\ 2 \\ 3 \end{pmatrix}\in \mathrm{span}\{\mathbf v_1, \mathbf v_2\}.$ Som ovenfor kan vi opstille ligningssystemet $A \mathbf x = \mathbf b$ , hvor $A$ er matricen med søjler $\mathbf v_1$ og $\mathbf v_2$ . Fra totalmatricen får vi

$\left(\begin{array}{cc|c} 1 & 0 & 1\\ 1 & 1 & 2\\ 0 & 1 & 3 \end{array}\right) \sim \left(\begin{array}{cc|c} 1 & 0 & 1\\ 0 & 1 & 1\\ 0 & 0 & 2 \end{array}\right),$ hvor sidste række indikerer $0 = 2$ (hvorfor gør den det?). Ligningssystemet har ikke en løsning og dermed gælder $\mathbf b\notin\mathrm{span}\{\mathbf v_1, \mathbf v_2\}$ .

Der er tale om en relativt abstrakt definition i Definition 6.6 og det er en rigtig god ide at forbinde den til de konkrete forhold i den følgende opgave.

Lad

$\mathbf v_1 = \begin{pmatrix} 1\\ 0\\ 0\end{pmatrix},\quad \mathbf v_2 = \begin{pmatrix} 0\\ 1\\ 0\end{pmatrix}\quad\text{og}\quad \mathbf v_3 = \begin{pmatrix} 0\\ 0\\ 1\end{pmatrix}$ være vektorer i $\mathbb{R}^3$ . Forklar hvorfor

$\mathrm{span}\{\mathbf v_1, \mathbf v_2, \mathbf v_3\} = \mathbb{R}^3$ det vil sige hvorfor alle vektorer i $\mathbb{R}^3$ er linearkombinationer af $\mathbf v_1, \mathbf v_2$ og $\mathbf v_3$ .

Lad nu

$\mathbf v_1 = \begin{pmatrix} 3\\ 2\end{pmatrix}\quad\text{og}\quad \mathbf v_2 = \begin{pmatrix} 2\\ 3\end{pmatrix}$ være vektorer i $\mathbb{R}^2$ . Hvordan afgør man om $\mathrm{span}\{\mathbf v_1, \mathbf v_2\} = \mathbb{R}^2$ i dette tilfælde?

En helt fundamental observation er, at spannet ikke ændrer sig ved operationer svarende til rækkeoperationerne for en matrix, ligesom vi også så i Eksempel 6.7.

Lad $\mathbf v_1, \dots, \mathbf v_n$ være vektorer i et vektorrum $V$ (f.eks. $\mathbb{F}^m$ ) og lad

$U = \mathrm{span}\{\mathbf v_1, \dots, \mathbf v_i, \dots, \mathbf v_j, \dots, \mathbf v_n\},$ hvor $1 \leq i < j \leq n$ . Så gælder at $U$ ikke ændres ved følgende modifikationer til spannet:

Ombytning af vektorer:
$\mathrm{span}\{\mathbf v_1, \dots, \mathbf v_j, \dots, \mathbf v_i, \dots, \mathbf v_n\},$
Multiplikation af en vektor med et tal $\lambda\neq 0$ :
$\mathrm{span}\{\mathbf v_1, \dots, \lambda \mathbf v_i, \dots, \mathbf v_n\},$
Addition af et multiplum af en vektor til en anden vektor:
$\mathrm{span}\{\mathbf v_1, \dots, \mathbf v_i, \dots, \mathbf v_j + \lambda \mathbf v_i, \dots, \mathbf v_n\}.$

Bevis

Vi beviser kun (iii), da beviserne for (i) og (ii) er tilsvarende (men lettere).

Lad os kalde

$\widetilde{U} = \mathrm{span}\{\mathbf v_1,\dots,\mathbf v_i,\dots,\mathbf v_j+\lambda\mathbf v_i,\dots,\mathbf v_n\}.$ Vi starter nu med at se på en linearkombination $\mathbf v\in \widetilde{U}$ fra vektorerne der definerede $\widetilde{U}$ :

$\begin{aligned} \mathbf v &= x_1\mathbf v_1 + \dots + x_i\mathbf v_i + \dots + x_j(\mathbf v_j+\lambda\mathbf v_i) + \dots + x_n\mathbf v_n \\ &= x_1\mathbf v_1 + \dots + (x_i+x_j\lambda)\mathbf v_i + \dots + x_j\mathbf v_j + \dots + x_n\mathbf v_n. \end{aligned}$ Vi har altså at $\mathbf v\in U$ . Omvendt, lad os overveje en linearkombination $\mathbf u\in U$ fra vektorerne der definerede $U$ :

$\begin{aligned} \mathbf u &= x_1\mathbf v_1 + \dots + x_i\mathbf v_i + \dots + x_j\mathbf v_j + \dots + x_n\mathbf v_n \\ &= x_1\mathbf v_1 + \dots + (x_i-x_j\lambda)\mathbf v_i + \dots + x_j(\mathbf v_j+\lambda\mathbf v_i) + \dots + x_n\mathbf v_n. \end{aligned}$ Vi har altså at $\mathbf u\in\widetilde{U}$ . Samlet set har vi vist at $\widetilde{U}\subseteq U \subseteq \widetilde{U}$ , eller rettere $U = \widetilde{U}$ .

Den mest almindelige måde at konstruere underrum på, er netop ved spannet af nogle givne vektorer.

Hvis $\mathbf v_1,\dots,\mathbf v_n$ er vektorer i et vektorrum $V$ (f.eks. $\mathbb{F}^m$ ), så er

$U = \mathrm{span}\{\mathbf v_1,\dots,\mathbf v_n\}$ et underrum af $V$ .

Beviset for dette resultat er givet i følgende teoretiske opgave.

Lad $\mathbf v_1, \dots, \mathbf v_n\in V$ være vektorer i et vektorrum $V$ .

Forklar hvorfor
$\mathrm{span}\{\mathbf v_1, \dots, \mathbf v_n\} \subseteq V.$ Eventuelt start med $n = 2$ eller $n = 3$ .
Argumenter for hvorfor $\mathrm{span}\{\mathbf v_1, \dots, \mathbf v_n\}$ er et underrum af $V$ ud fra Definition 6.2.

6.3 Lineær uafhængighed

De to vektorer

$\begin{pmatrix} 1 \\ 0 \end{pmatrix}\qquad\text{og}\qquad \begin{pmatrix} 0 \\ 1 \end{pmatrix}$ er specielle i og med at ingen af dem kan udelades fra

$V = \mathrm{span}\left\{\begin{pmatrix} 1 \\ 0 \end{pmatrix}, \begin{pmatrix} 0 \\ 1 \end{pmatrix} \right\}$ uden at $V$ bliver mindre eller ændres (fra $\mathbb{R}^2$ til $x$ -aksen eller $y$ -aksen). Det er helt anderledes med for eksempel vektorerne

$\begin{pmatrix} 1 \\ 1 \end{pmatrix}\qquad\text{og}\qquad \begin{pmatrix} 2 \\ 2 \end{pmatrix}.$ Her ændres

$V = \mathrm{span}\left\{\begin{pmatrix} 1 \\ 1 \end{pmatrix}, \begin{pmatrix} 2 \\ 2 \end{pmatrix} \right\}$ ikke hvis en af dem udelades. Her er vektorerne parallelle, og vi får derfor ikke nye vektorer i spannet ved at anvende begge disse vektorer.

Mere kompliceret bliver det hvis vi har flere vektorer $\mathbf v_1,\dots,\mathbf v_n$ , da det ikke længere er nok at tjekke om nogle af vektorerne er parallelle, men rettere om nogle af vektorerne er linearkombinationer af de andre.

Lad $\mathbf v_1,\dots,\mathbf v_n$ være vektorer i et vektorrum $V$ (f.eks. $\mathbb{F}^m$ ).

Overvej følgende linearkombination der giver nulvektoren:
$\mathbf 0 = x_1\mathbf v_1 + x_2\mathbf v_2 + \dots + x_n\mathbf v_n. \tag{6.1}$ Vektorerne $\mathbf v_1, \dots, \mathbf v_n$ kaldes lineært uafhængige hvis den eneste mulighed for linearkombinationen (6.1) er for
$x_1 = x_2 = \dots = x_n = 0.$
Hvis $V$ er et underrum af $\mathbb{F}^m$ og vi danner $m\times n$ matricen $A = (\mathbf v_1,\dots,\mathbf v_n)$ , så er vektorerne lineært uafhængige hvis og kun hvis
$A\mathbf x = \mathbf 0$ kun har nulløsningen (ingen frie variable).
Hvis vektorerne ikke er lineært uafhængige, så kaldes de i stedet lineært afhængige.

Vi ser at dette er den korrekte definition for at finde det minimale antal vektorer der udspænder en mængde. Årsagen er, at hvis $\mathbf v_1,\dots,\mathbf v_n$ er lineært afhængige, så findes en linearkombination som giver nulvektoren

$\mathbf 0 = x_1\mathbf v_1 + \dots + x_{j-1}\mathbf v_{j-1} + x_j\mathbf v_j + x_{j+1}\mathbf v_{j+1} + \dots + x_n\mathbf v_n,$ hvor mindst en koefficient er forskellig fra nul, f.eks. $x_j \neq 0$ . Så vil man kunne isolere $\mathbf v_j$ i ligningen og få

$\mathbf v_j = -\frac{x_1}{x_j}\mathbf v_1 - \dots - \frac{x_{j-1}}{x_j}\mathbf v_{j-1} - \frac{x_{j+1}}{x_j}\mathbf v_{j+1} - \dots - \frac{x_n}{x_j}\mathbf v_n.$ Dette betyder at $\mathbf v_j$ er en linearkombination af de andre vektorer, og derfor bidrager $\mathbf v_j$ ikke med yderligere nye vektorer i spannet. Hvis vi udelader $\mathbf v_j$ i $\mathrm{span}\{\mathbf v_1,\dots,\mathbf v_n\}$ får vi derfor stadig den samme mængde af vektorer.

Når man har lineært uafhængige vektorer, kan ingen af vektorerne undværes fra spannet.

Det er på høje tid med en quiz.

Hvilke af nedenstående påstande er rigtige?

Vektorerne $\begin{pmatrix} 0 \\ 0 \end{pmatrix}$ og $\begin{pmatrix} 1 \\ 0 \end{pmatrix}$ i $\mathbb{R}^2$ er lineært uafhængige.

Vektorerne $\begin{pmatrix} 1 \\ 0 \end{pmatrix}$ og $\begin{pmatrix} 0 \\ 1 \end{pmatrix}$ i $\mathbb{R}^2$ er lineært uafhængige.

Vektorerne $\begin{pmatrix} 2 \\ 3 \end{pmatrix}$ og $\begin{pmatrix} 1 \\ 2 \end{pmatrix}$ i $\mathbb{R}^2$ er lineært uafhængige.

Vektorerne $\begin{pmatrix} 2 \\ 3 \end{pmatrix}, \begin{pmatrix} 1 \\ 2 \end{pmatrix}$ og $\begin{pmatrix} 1 \\ 1 \end{pmatrix}$ i $\mathbb{R}^2$ er lineært uafhængige.

Vektoren $\begin{pmatrix} 2 \\ 3 \end{pmatrix}$ i $\mathbb{R}^2$ ligger i $\mathrm{span}\left\{\begin{pmatrix} 1 \\ 1\end{pmatrix}\right\}.$

Vektoren $\begin{pmatrix} 1 \\ -1 \end{pmatrix}$ i $\mathbb{C}^2$ ligger i $\mathrm{span}\left\{\begin{pmatrix} -i \\ i\end{pmatrix}\right\}.$

Betragt vektorerne

$\begin{pmatrix} 2 \\ 3 \end{pmatrix},\qquad \begin{pmatrix} 1 \\ 2 \end{pmatrix}\qquad\text{og}\qquad \begin{pmatrix} 1 \\ 1 \end{pmatrix}$ i $\mathbb{R}^2$ . For at afgøre om de er lineært uafhængige skal vi ifølge Definition 6.14 undersøge ligningssystemet

$\begin{pmatrix} 2 & 1 & 1\\ 3 & 2 & 1 \end{pmatrix} \begin{pmatrix} x_1\\ x_2\\ x_3 \end{pmatrix} = \begin{pmatrix} 0\\ 0 \end{pmatrix}.$ Vi kan ret hurtigt se at RREF for systemmatricen er

$\begin{pmatrix} 1 & 0 & 1\\ 0 & 1 & -1 \end{pmatrix}.$ Derfor er $x_3$ en fri variabel. Med $x_3 = 1$ bliver $x_1 = -1$ og $x_2=1$ i fin overensstemmelse med at

$(-1)\cdot \begin{pmatrix} 2 \\ 3 \end{pmatrix} + 1\cdot \begin{pmatrix} 1 \\ 2 \end{pmatrix} + 1\cdot \begin{pmatrix} 1 \\ 1 \end{pmatrix} = \begin{pmatrix} 0\\ 0 \end{pmatrix}.$ Derfor er vektorerne ikke lineært uafhængige.

Vi har dog, ved at udelade den sidste af søjlerne i ligningssystemet, at vektorerne $(2,3)^T$ og $(1,2)^T$ er lineært uafhængige.

6.4 Basis og koordinatvektor

Vi tager nu et skridt videre fra lineær uafhængighed, til at tale om baser for vektorrum.

Som tidligere nævnt i dette kapitel, så kan vektorrum bestå af andet end søjlevektorer, men vi ønsker stadig at kunne anvende teorien fra matrixregning til eksempelvis at løse ligningssystemer indenfor disse vektorrum. Dette kræver en konsekvent måde at gå mellem abstrakte vektorer og koordinater i linearkombinationer, hvor disse koordinater er almindelige tal i $\mathbb{F}$ .

Derudover, selv hvis vi arbejder med vektorrum af søjlevektorer, så kan det ofte være brugbart at beskrive dem i et andet koordinatsystem. Dette er faktisk helt essentielt for anvendelser, og bliver mere tydeligt i de kommende kapitler.

Begge disse problemstillinger løses med baser.

Lad $V$ være et vektorrum (f.eks. $\mathbb{F}^m$ ).

En mængde af vektorer $B = \{\mathbf v_1, \dots, \mathbf v_m\}$ kaldes en basis for $V$ , hvis vektorerne er lineært uafhængige og
$V = \mathrm{span}\{\mathbf v_1, \dots, \mathbf v_m\}.$
For en linearkombination af basisvektorer
$\mathbf v = x_1\mathbf v_1 + \dots + x_m\mathbf v_m,$ kaldes vektoren $[\mathbf v]_B = (x_1,\dots,x_m)^T$ for koordinatvektoren for $\mathbf v$ med hensyn til basen $B$ .
Hvis $V$ er et vektorrum af søjlevektorer, kan vi skrive $B = (\mathbf v_1,\dots,\mathbf v_m)$ som en matrix. Så findes koordinatvektoren $[\mathbf v]_B=\mathbf x$ som løsning til ligningssystemet
$B\mathbf x = \mathbf v.$

Det første man bør fundere over, er entalsformen der bliver brugt: Koordinatvektoren. Det hentyder at der til hvert $\mathbf v$ er en entydig måde at skrive $\mathbf v$ som en linearkombination af basisvektorerne. Dette kommer fra den lineære uafhængighed for basisvektorer. Lad os sige at vi har to linearkombinationer som giver $\mathbf v$ :

$\begin{aligned} \mathbf v &= x_1\mathbf v_1 + x_2\mathbf v_2 + \dots + x_m\mathbf v_m \\ &= y_1\mathbf v_1 + y_2\mathbf v_2 + \dots + y_m\mathbf v_m. \end{aligned}$ Ved at trække de to udtryk fra hinanden, får vi

$\mathbf 0 = (x_1-y_1)\mathbf v_1 + (x_2-y_2)\mathbf v_2 + \dots + (x_m-y_m)\mathbf v_m.$ Men basisvektorerne er per definition lineært uafhængige, så fra Definition 6.14 må vi have at $x_1 = y_1$ , $x_2 = y_2$ , $\dots$ , $x_m = y_m$ . Dermed er der kun en koordinatvektor for $\mathbf v$ for hver basis.

Notationen $[\mathbf v]_B$ kan se lidt forvirrende ud, men den indeholder faktisk alt hvad vi har brug for at vide. Vi ved at der er en underliggende vektor $\mathbf v$ , og at vi ønsker at beskrive denne vektor ved hjælp af en basis $B$ . Koordinatvektoren $[\mathbf v]_B$ indeholder lige præcis de koefficienter der beskriver $\mathbf v$ ud fra basen $B$ .

Vi kender allerede en basis for $\mathbb{F}^m$ , da vi er vant til at beskrive vektorer ud fra akserne i et sædvanligt koordinatsystem.

For $\mathbb{F}^m$ kaldes mængden af vektorerne

$\mathbf e_1 = \begin{pmatrix} 1 \\ 0 \\ 0 \\ \vdots \\ 0 \\ 0 \end{pmatrix}, \quad \mathbf e_2 = \begin{pmatrix} 0 \\ 1 \\ 0 \\ \vdots \\ 0 \\ 0 \end{pmatrix}, \quad \dots, \quad \mathbf e_m = \begin{pmatrix} 0 \\ 0 \\ 0 \\ \vdots \\ 0 \\ 1 \end{pmatrix}$ for standard basen. Det svarer til søjlerne i identitetsmatricen $I_m$ .

Standard basen er vidunderlig let at bruge. Hvis $B = \{\mathbf e_1,\dots,\mathbf e_m\}$ og $\mathbf v\in \mathbb{F}^m$ , så gælder at $[\mathbf v]_B = \mathbf v$ . Vi kan altså aflæse koordinaterne direkte fra vektoren. Eksempelvis har vi

$\begin{pmatrix} 1 \\ 2 \\ 3 \end{pmatrix} = 1\mathbf e_1 + 2\mathbf e_2 + 3\mathbf e_3.$

Man kan måske undre sig over, hvorfor man nogensinde skulle have brug for andre baser end standard basen når man undersøger vektorer i $\mathbb{F}^m$ . For det første er der underrum af $\mathbb{F}^m$ som slet ikke indeholder nogen af standard basisvektorerne, og så må man jo klare sig uden; eksempelvis linjen givet ved $\mathrm{span}\{(1,1)^T\}$ indeholder ikke nogen af $x$ - eller $y$ -akserne. En anden årsag kommer vi til i Kapitel 7, hvor vi skal bruge baser til at repræsentere lineære transformationer ved hjælp af matricer. Standard basen giver sjældent pæne matricer i sådan nogle matrixrepræsentationer, og her kommer vi i Kapitlerne 8, 11 og 12 til at se hvordan vi kan finde optimale baser, så vi kan opnå matrixrepræsentationer som er diagonalmatricer.

Det kan ikke understreges nok, at for at forstå hvad en basis er, bliver man nødt til at se på adskillige konkrete eksempler. Som et absolut minimum bør du løse følgende opgave.

Forklar helt præcist hvorfor

$B = \left\{\begin{pmatrix} 1 \\ 0\end{pmatrix}, \begin{pmatrix} 0 \\ 1 \end{pmatrix}\right\}$ er en basis for $\mathbb{R}^2$ .

Lad os betragte vektorerne

$\mathbf v_1 = \begin{pmatrix} 1 \\ 2 \\ 0 \end{pmatrix}, \quad \mathbf v_2 = \begin{pmatrix} 1 \\ 1 \\ 1 \end{pmatrix}, \quad \text{og} \quad \begin{pmatrix} 0 \\ 0 \\ 1 \end{pmatrix}.$ Det oplyses at $B = \{\mathbf v_1,\mathbf v_2,\mathbf v_3\}$ udgør en basis for $\mathbb{R}^3$ . Vi kan derfor også tænke på $B$ som $3\times 3$ matricen med søjler $\mathbf v_1$ , $\mathbf v_2$ og $\mathbf v_3$ .

Vi ønsker nu at finde koordinatvektoren $[\mathbf v]_B$ for vektoren

$\mathbf v = \begin{pmatrix} 2 \\ 3 \\ 4 \end{pmatrix}.$ Fra Definition 6.17 skal vi derfor løse ligningssystemet $B\mathbf x = \mathbf v$ . Vi sætter totalmatricen $(B|\mathbf v)$ på RREF:

$\left(\begin{array}{ccc|c} 1 & 1 & 0 & 2 \\ 2 & 1 & 0 & 3 \\ 0 & 1 & 1 & 4 \end{array}\right) \sim \left(\begin{array}{ccc|c} 1 & 0 & 0 & 1 \\ 0 & 1 & 0 & 1 \\ 0 & 0 & 1 & 3 \end{array}\right).$ Dermed er $[\mathbf v]_B = (1,1,3)^T$ , hvilket er i fin overensstemmelse med at

$\mathbf v = \mathbf v_1 + \mathbf v_2 + 3\mathbf v_3.$ Matricen $B$ er invertibel, så man kunne også en gang for alle finde $B^{-1}$ , i tilfælde af at man skal udregne flere koordinatvektorer.

Det blev påstået i starten af eksemplet at $\{\mathbf v_1,\mathbf v_2,\mathbf v_3\}$ er en basis. Det næste resultat nedenfor siger at det er nok at finde tre lineært uafhængige vektorer i $\mathbb{R}^3$ for at de udgør en basis. Fra RREF ovenfor så vi blandt andet også at disse tre vektorer er lineært uafhængige.

Følgende resultat er specifikt for endelig dimensionelle vektorrum, hvilket er de vektorrum vi undersøger i dette kursus. Det er et helt centralt begreb, som først siger at forskellige baser for det samme vektorrum altid består af det samme antal vektorer. Anden del siger, at hvis vi kender dette antal (dimensionen), så er det nok at tjekke om vektorerne er lineært uafhængige for at få en basis. Dem der senere skal have Fourieranalyse vil også støde på uendelig dimensionelle vektorrum, hvor begrebet $\infty$ gør dette mere kompliceret.

Hvis $\{\mathbf v_1, \dots, \mathbf v_n\}$ og $\{\mathbf u_1, \dots, \mathbf u_{m}\}$ er to baser for et vektorrum $V$ , så er $m = n$ .

Antallet af vektorer i en basis for $V$ kaldes dimensionen af $V$ og skrives $\dim(V)$ .

Hvis $\dim(V) < \infty$ så vil enhver mængde med $\dim(V)$ lineært uafhængige vektorer i $V$ udgøre en basis.

Bevis*

Det er nok at vise at $n\leq m$ , fordi med samme bevis kan vi også vise at $m\leq n$ . Vi argumenterer ved modstrid. Det vil sige, vi antager at $n>m$ , og viser at dette fører til en modstrid mod forudsætningen at $\{\mathbf v_1, \dots, \mathbf v_n\}$ og $\{\mathbf u_1, \dots, \mathbf u_{m}\}$ begge er baser for $V$ .

Til at begynde med bruger vi at vektorerne $\{\mathbf u_1,\dots, \mathbf u_m\}$ danner en basis, så at vi kan skrive

$\begin{aligned} \mathbf v_1&=a_{11}\mathbf u_1+a_{21}\mathbf u_2+\dots +a_{m1}\mathbf u_m\\ \mathbf v_2&=a_{12}\mathbf u_1+a_{22}\mathbf u_2+\dots +a_{m2}\mathbf u_m\\ \vdots\\ \mathbf v_n&=a_{1n}\mathbf u_1+a_{2n}\mathbf u_2+\dots +a_{mn}\mathbf u_m. \end{aligned}$

Nu opstiller vi et ligningssystem med $n$ ubekendte og $m$ ligninger, med $m\times n$ systemmatricen $A = (a_{ij})$ (bemærk at elementerne for $i$ 'te række af $A$ er ganget på $\mathbf u_i$ ovenfor):

$A\mathbf x = \mathbf 0.$

Da $n>m$ findes der af Sætning 3.10 en løsning til dette ligningssystem som ikke er nulløsningen. Lad $\mathbf x = (x_1,\dots,x_n)^T$ være en sådan løsning. Vi definerer nu en vektor $\mathbf y=x_1\mathbf v_1+\dots+x_n\mathbf v_n$ . Nu er tiden kommet til at bruge at $\{\mathbf v_1,\dots,\mathbf v_n\}$ også er en basis, fordi det betyder jo at $\mathbf y\neq \mathbf 0$ da dens koordinatvektor $\mathbf x\neq\mathbf 0$ . På den anden side, ved at indsætte udtrykkene for $\mathbf v_1,\dots,\mathbf v_n$ og samle bidragene fra $\mathbf u_1,\dots,\mathbf u_m$ , så får vi

$\begin{aligned} \mathbf y =&\left(a_{11}x_1+a_{12}x_2+\dots+a_{1n}x_n\right) \mathbf u_1\\ &+\cdots+\\ &\left(a_{m1}x_1+a_{m2}x_2+\dots+a_{mn}x_n\right) \mathbf u_m=\mathbf 0. \end{aligned}$ Dette giver en modstrid mod antagelsen at såvel $\{\mathbf u_1,\dots,\mathbf u_m\}$ som $\{\mathbf v_1,\dots,\mathbf v_n\}$ er en basis, og første del af sætningen er bevist.

Til anden del af sætningen, antag at $\dim(V) = m$ og at $\{\mathbf u_1,\dots,\mathbf u_m\}$ er en basis for $V$ . Hvis $\mathbf w_1,\dots,\mathbf w_m \in V$ så ved vi at deres span også er i $V$ . Vi vil nu vise resultatet ved modstrid, så antag at $\{\mathbf w_1,\dots,\mathbf w_m\}$ er lineært uafhængige men ikke udspænder $V$ . Så findes derfor en en vektor $\mathbf w_{m+1}\in V$ således at $\mathbf w_1,\dots,\mathbf w_{m+1}$ er lineært uafhængige. Men fra beviset ovenfor hvor $\mathbf v_1,\dots,\mathbf v_n$ erstattes af $\mathbf w_1,\dots,\mathbf w_{m+1}$ , får vi en modstrid. Derfor må $\{\mathbf w_1,\dots,\mathbf w_m\}$ udspænde $V$ .

Vi har at $\mathbb{F}^m$ er $m$ -dimensionelt, da standard basen er en basis for $\mathbb{F}^m$ . Dermed ved vi også, at enhver mængde af $m$ lineært uafhængige vektorer i $\mathbb{F}^m$ udgør en basis. Et eksempel på en basis for $\mathbb{R}^3$ som ikke er standard basen kan findes i Eksempel 6.21.

Der gælder noget særligt om vektorrummet $\{\mathbf 0\}$ som kun består af origo. Dette vektorrum har dimension $0$ . Hvis vi igen ser på underrum af $\mathbb{R}^3$ så er $\{\mathbf 0\}$ bare punktet $(0,0,0)$ , mens et underrum af dimension 1 er en linje gennem origo, et underrum af dimension $2$ er en plan der skærer origo, og hele $\mathbb{R}^3$ har dimension $3.$

6.5 Nulrum, søjlerum og rækkerum for matricer

Vi vender nu tilbage til at undersøge matricer, fordi der er nogle helt fundamentale underrum som knytter sig til enhver matrix.

Lad $A$ være en $m\times n$ matrix med tal i $\mathbb{F}$ . Nulrummet for $A$ er givet ved

$N(A) = \{ \mathbf v\in \mathbb{F}^n : A\mathbf v = \mathbf 0 \}.$ Søjlerummet for $A$ er givet ved

$C(A) = \{ A\mathbf v : \mathbf v\in\mathbb{F}^n \}.$ Søjlerummet $C(A^T)$ for $A^T$ har også et navn, dette kaldes rækkerummet for $A$ .

Nogle stedet bruges notationen $R(A)$ for rækkerummet. Det gør vi ikke her, da det kan skabe forvirring hvis man læser amerikanske bøger hvor $R(A)$ nogle gange bruges for søjlerummet, og de to må ikke forveksles. Her står $R$ for range hvilket oversat til et dansk matematisk term betyder billedmængden. Vores notation i Definition 6.24 er blevet mere almindeligt brugt de senere år.

Som en teoretisk øvelse kan man vise at $N(A)$ og $C(A^T)$ er underrum af $\mathbb{F}^n$ mens at $C(A)$ er et underrum af $\mathbb{F}^m$ .

For en $m\times n$ matrix $A$ med tal i $\mathbb{F}$ , vis at $N(A)$ er et underrum af $\mathbb{F}^n$ og at $C(A)$ er et underrum af $\mathbb{F}^m$ . At $C(A^T)$ er et underrum af $\mathbb{F}^n$ svarer til beviset for $C(A)$ men med den transponerede matrix, så det dropper vi.

Hint

Det er nødvendigt at bruge at $A(\mathbf x+\mathbf y) = A\mathbf x + A\mathbf y$ og $A(\lambda\mathbf x) = \lambda A\mathbf x$ .

Søjlerummet $C(A)$ indeholder præcis de vektorer som kan rammes af $A\mathbf v$ , det vil sige de vektorer som er linearkombinationer af søjlerne i $A$ . Det betyder også, at et ligningssystem

$A\mathbf x = \mathbf b \tag{6.2}$ har en løsning hvis og kun hvis $\mathbf b\in C(A)$ , fordi så findes netop en vektor $\mathbf x$ der opfylder (6.2). Søjlerummet beskriver derved alle tænkelige højresider som giver anledning til et løsbart ligningssystem.

Nulrummet $N(A)$ er også vigtigt når man løser ligningssystemer. En vektor $\mathbf v$ tilhører $N(A)$ præcis hvis $A\mathbf v = \mathbf 0$ . Hvis $\mathbf x$ er en løsning til (6.2) og $\mathbf v\in N(A)$ så må gælde

$A(\mathbf x+\mathbf v) = A\mathbf x+A\mathbf v = \mathbf b.$ Det vil sige at $\mathbf x + \mathbf v$ også er en løsning til (6.2), og hvis $\mathbf v\neq\mathbf 0$ så er der tale om en ny løsning. Samtidig ved vi også, at hvis $\mathbf x$ og $\mathbf y$ er løsninger til (6.2), så vil gælde

$A(\mathbf x-\mathbf y) = A\mathbf x-A\mathbf y = \mathbf 0,$ så vektoren $\mathbf x-\mathbf y$ må tilhøre $N(A)$ . Samlet set har vi, at vektorer i $N(A)$ kan lægges til en løsning $\mathbf x$ for at skabe nye løsninger, samt at differencen på løsninger altid vil ligge i $N(A)$ . Det betyder at $N(A)$ kan bruges til at opskrive samtlige løsninger til (6.2), såfremt vi har fundet en enkelt løsning. Mere præcist svarer $N(A)$ til at beskrive de frie variable til (6.2).

Ligningssystemet (6.2) har en løsning hvis og kun hvis $\mathbf b\in C(A)$ .
Ligningssystemet (6.2) har en entydig løsning hvis og kun hvis $\mathbf b \in C(A)$ og $\dim N(A) = 0$ (trivielt nulrum).
Hvis $\mathbf v_0$ er løsning til (6.2) og $\{\mathbf v_1,\dots,\mathbf v_k\}$ er en basis for $N(A)$ , så kan samtlige løsninger til (6.2) skrives
$\mathbf v_0 + \alpha_1\mathbf v_1 + \dots + \alpha_k\mathbf v_k, \tag{6.3}$ for vilkårlige tal $\alpha_1,\dots,\alpha_k\in \mathbb{F}$ .

Rækkerummet $C(A^T)$ er ikke så vigtigt lige nu, men det bliver det senere i Kapitel 9 når vi kigger på ortogonale komplementer. Navnet på rækkerummet kommer af, at det er vektorrummet af alle linearkombinationer af rækkerne i $A$ (transponeret, det vil sige rejst op som søjlevektorer), tilsvarende som vi har at søjlerummet er vektorrummet af linearkombinationer af søjlerne i $A$ .

En særdeles vigtig observation er at nulrummet og rækkerummet ikke ændres ved rækkeoperationer på matricen. Desuden er søjlerummet relateret til pivotsøjlerne i matricens RREF. Dette er det helt centrale resultat når det kommer til at finde baser for $N(A)$ , $C(A)$ og $C(A^T)$ .

Lad $A$ være en $m\times n$ matrix og $B$ dens RREF. Så har $A$ og $B$ identiske nulrum og rækkerum.

Vi kan finde baser på følgende måde:

Søjlerne i $A$ svarende til pivotsøjlerne i $B$ (samme søjlenummer), udgør en basis for $C(A)$ .
Rækkerne i $B$ som er $\neq \mathbf 0$ udgør en basis for $C(A^T)$ .
En basis for $N(A)$ kan findes fra den fuldstændige løsning af $B\mathbf x = \mathbf 0$ , ved at udtrække vektorer med bidraget fra hvert af de frie variable.

Bevis

Der findes en invertibel matrix $E$ (produkt af elementærmatricer) så $B = EA$ . Da $E$ er invertibel ses at $A \mathbf x = \mathbf 0$ holder hvis og kun hvis

$B \mathbf x = (E A) \mathbf x = E (A \mathbf x) = \mathbf 0.$ Dette oversættes umiddelbart til at $N(A) = N(B)$ . Ud fra RREF indses at vi kan skrive løsninger op til $B\mathbf x=\mathbf 0$ ved brug af de frie variable. En vektor kan opskrives fra hver fri variabel, f.eks. $x_j$ , svarende til at isolere den i ligningssystemet og sætte $x_j = 1$ ; i den fuldstændige løsning har man linearkombinationer af disse vektorer, lad os kalde dem $\mathbf w_1,\dots,\mathbf w_k$ . Hver af disse vektorer vil have en indgang med et $1$ (svarende til søjlenummeret for den frie variabel) og de resterende vil have $0$ i samme indgang. Derfor er disse vektorer lineært uafhængige og udspænder $N(A)$ .

På samme måde får vi at $A^T \mathbf x = (E A)^T\mathbf y=B^T\mathbf y$ , hvor $\mathbf y = (E^T)^{-1} \mathbf x$ og dermed er $C(A^T)=C(B^T)$ . Da rækkerne i $B$ som er $\neq\mathbf 0$ er lineært uafhængige (hver pivotsøjle har kun en indgang forskellig fra 0), så gælder af Sætning 6.22 at disse rækker udgør en basis for $C(A^T)$ .

Det var nemt nok. Det er lidt mere indviklet at vise påstanden om søjlerummet $C(A)$ . Hvis $A = (\mathbf a_1,\dots,\mathbf a_n)$ og $B = (\mathbf b_1,\dots,\mathbf b_n)$ , så har vi at

$C(A) = \mathrm{span}\{\mathbf a_1,\dots,\mathbf a_n\} = \mathrm{span}\{E^{-1}\mathbf b_1,\dots,E^{-1}\mathbf b_n\} = E^{-1}\mathrm{span}\{\mathbf b_1,\dots,\mathbf b_n\}.$ Den sidste notation betyder, at vi ganger $E^{-1}$ på alle elementerne i spannet. Men vi ved jo også, at $\mathrm{span}\{\mathbf b_1,\dots,\mathbf b_n\}$ er det samme som spannet af pivotsøjlerne. Ved at gange $E^{-1}$ på pivotsøjlerne giver nu de tilsvarende søjler i $A$ . Dette svarer til de bundne variable som fra RREF er lineært uafhængige af Definition 6.14, og udgør derfor en basis for $C(A)$ på grund af Sætning 6.22.

Vi giver et eksempel på hvordan nulrummet $N(A)$ , rækkerummet $C(A^T)$ og søjlerummet $C(A)$ udregnes for en matrix $A$ .

Lad

$A = \begin{pmatrix} {1} & -1 & 1 & -2\\ -1 & {2} & 1 & {1}\\ 1 & -1 & 1 & -2\\ -1 & {2} & 1 & {1} \end{pmatrix}.$ Først rækkereducerer vi $A$ til RREF:

$A \,\stackrel{\sim}{\substack{R_2 \to R_2 + R_1 \\ R_3\to R_3-R_1 \\ R_4\to R_4+R_1}}\, \begin{pmatrix} 1 & -1 & 1 & -2\\ 0 & {1} & 2 & -1\\ 0 & {0} & 0 & {0}\\ 0 & {1} & 2 & -1 \end{pmatrix} \,\stackrel{\sim}{\substack{R_4\to R_4-R_2}}\, \begin{pmatrix} 1 & -1 & 1 & -2\\ 0 & {1} & 2 & -1\\ 0 & {0} & 0 & {0}\\ 0 & {0} & 0 & {0} \end{pmatrix} \,\stackrel{\sim}{\substack{R_1\to R_1+R_2}}\, \begin{pmatrix} 1 & 0 & 3 & -3\\ 0 & 1 & 2 & -1\\ 0 & 0 & 0 & {0}\\ 0 & 0 & 0 & {0} \end{pmatrix}.$ Sidste matrix er på RREF, lad os kalde den $B$ . Nu ved vi fra Sætning 6.27 at $N(A) = N(B)$ og $C(A^T) = C(B^T)$ .

De bundne variable er $x_1$ og $x_2$ , og de frie er $x_3$ og $x_4$ . Det vil sige at et typisk element i $N(A)$ har formen

$\begin{pmatrix} x_1 \\ x_2 \\ x_3 \\ x_4 \end{pmatrix} = \begin{pmatrix} -3t_3 + 3t_4 \\ -2t_3 + t_4 \\ t_3 \\ t_4 \end{pmatrix} = t_3 \begin{pmatrix} -3\\ -2\\ \color{red}{1} \\ {0} \end{pmatrix} + t_4 \begin{pmatrix} 3 \\ 1\\ 0 \\ \color{red}{1} \end{pmatrix}.$ for vilkårlige tal $t_3$ og $t_4$ . Bemærk $\color{red}{\text{et}}$ -tallerne på pladserne for de frie variable, som viser at man får lineært uafhængige vektorer. Heraf fremgår det at

$\left\{ \begin{pmatrix} -3 \\ -2 \\ 1 \\ 0 \end{pmatrix}, \begin{pmatrix} 3 \\ 1 \\ 0 \\ 1 \end{pmatrix} \right\}$ er en basis for $N(A)$ .

Fra rækkerne i $B$ aflæser vi en basis for $C(A^T)$ til at være

$\left\{ \begin{pmatrix} {1} \\ {0} \\ {3} \\ -3 \end{pmatrix}, \begin{pmatrix} {0} \\ {1} \\ {2} \\ -1 \end{pmatrix} \right\}.$ Læg mærke til at vi gik fra at have rækkerummet som span af $4$ vektorer (de $4$ rækker (transponeret) i $A$ ) til et span af kun $2$ vektorer.

Pivotsøjlerne er de første to søjler i $B$ , så de første to søjler af $A$

$\left\{ \begin{pmatrix} {1} \\ -1 \\ {1} \\ -1 \end{pmatrix}, \begin{pmatrix} -1 \\ {2} \\ -1 \\ {2} \end{pmatrix} \right\}$ udgør en basis for $C(A)$ . Igen ser vi, at vi går fra et span på 4 søjlevektorer i $A$ , til kun at have brug for $2$ for at beskrive en basis.

Det er faktisk ikke tilfældigt at søjlerum og rækkerum begge havde dimension 2 i Eksempel 6.28, ligesom det heller ikke var tilfældigt at summen af dimensionerne for søjlerum og nulrum gav det samme som antal søjler i matricen. Dette er nemlig den såkaldte dimensionssætning nedenfor.

Hvis man tænker lidt nærmere over Sætning 6.27, vil man indse at $\dim C(A)$ relaterer til antal bundne variable og $\dim N(A)$ til antal frie variable, hvilket til sammen giver antallet af søjler i $A$ .

Lad $A$ være en $m\times n$ matrix. Så gælder

$\dim C(A) = \dim C(A^T)$ ,
$n = \dim N(A) + \dim C(A)$ .

Bevis

Den første del kommer direkte fra Sætning 6.27, da antallet af pivotsøjler og pivotrækker er identisk.

Hvis $p$ er antal pivotsøjler i RREF af $A$ , så er $\dim C(A) = p$ og fra beviset i Sætning 6.27 er $\dim N(A) = n-p$ .

Hvem skulle på forhånd tro at dimensionerne af række- og søjlerummene for en matrix havde noget med hinanden at gøre? Hvorfor skulle for eksempel dimensionerne af

$\mathrm{span}\left\{ \begin{pmatrix} 1 \\ 5 \\ 9 \end{pmatrix}, \begin{pmatrix} 2 \\ 6 \\ 10 \end{pmatrix}, \begin{pmatrix} 3 \\ 7 \\ 11 \end{pmatrix}, \begin{pmatrix} 4 \\ 8 \\ 12 \end{pmatrix} \right\}$ og

$\mathrm{span}\left\{ \begin{pmatrix} 1 \\ 2 \\ 3 \\ 4 \end{pmatrix}, \begin{pmatrix} 5 \\ 6 \\ 7 \\ 8 \end{pmatrix}, \begin{pmatrix} 9 \\ 10 \\ 11\\ 12 \end{pmatrix} \right\}$ være identiske? Dette viser hvor stærke matematiske resultater nogle gange kan være.

Dimensionen af søjlerummet $C(A)$ (og dermed også dimensionen af rækkerummet $C(A^T)$ ) for en matrix kaldes rangen af matricen $A$ og betegnes $\mathrm{rang}(A)$ . Med denne betegnelse kan dimensionssætningen for en $m\times n$ matrix udtrykkes som

$n = \dim N(A) + \mathrm{rang}(A),$

som passer fint med det engelske navn for dimensionssætningen: Rank-nullity theorem. Vi kan med garanti sige, at rangen for en $m\times n$ matrix $A$ opfylder $\mathrm{rang}(A) \leq \min\{m,n\}$ på grund af dimensionssætningen.

Find RREF af matricen

$\begin{pmatrix} 1 & 2 & 3\\ 4 & 5 & 6\\ 7 & 8 & 9 \end{pmatrix}$ og angiv dimensionerne for søjlerum og nulrum.

6.6 Mere om rangen af en matrix

I næste store revision af noterne vil her komme et afsnit om resultater for rangen af matrixprodukter $AB$ ud fra rangen af $A$ og $B$ .

6.7 Opgaver

Lad $\{\mathbf e_1, \dots, \mathbf e_n\}$ være standard basen for $\mathbb{R}^n$ . Hvis $U$ er et underrum af $\mathbb{R}^n$ og $\mathbf e_1, \dots, \mathbf e_n$ alle ligger i $U$ , hvorfor gælder så at $U = \mathbb{R}^n$ ?

$\left\{\begin{pmatrix} 2 \\ 3 \\ 5 \end{pmatrix}, \begin{pmatrix} 7 \\ 11 \\ 13 \end{pmatrix}, \begin{pmatrix} 17 \\ 19 \\ 23 \end{pmatrix} \right\}$ en basis for $\mathbb{R}^3$ ? Som sædvanlig: Begrund dit svar.

Lad

$A=\begin{pmatrix} -1 & {1} & 1\\ {4} & -2 & 0\\ -2 & {1} & 0 \end{pmatrix}.$ Find baser for $C(A^T), C(A)$ og $N(A)$ som underrum af $\mathbb{R}^3$ .

Lad $A$ være en $4\times 5$ matrix med rang $3$ . Hvad kan du sige om $\dim N(A)$ ? Opskriv et eksempel på en matrix $A$ med disse egenskaber.

(Eksamen april 2015)

Betragt matricen

$A = \begin{pmatrix} 2 & -1 & 0 & 1 \\ 0 & 1 & 4 & 5 \\ 1 & 1 & -2 & -2 \end{pmatrix}.$

Find RREF af $A$ .
Angiver baser for rækkerummet og søjlerummet for $A$ .
Angiv en basis for nulrummet af $A$ .
Afgør om vektoren
$\begin{pmatrix} 0 \\ 0 \\ 1 \end{pmatrix}$ ligger i søjlerummet for $A$ .

(Eksamen januar 2018)

Lad

$A = \begin{pmatrix} 22 & -8 & -7 \\ -3 & 2 & 1 \\ 12 & -7 & -4 \end{pmatrix}$ være en reel matrix.

Gør rede for at $A$ er invertibel og bestem $A^{-1}$ med angivelse af metode og udregninger.
Forklar hvorfor
$B = \left\{ \begin{pmatrix} 22 \\ -3 \\ 12 \end{pmatrix}, \begin{pmatrix} -8 \\ 2 \\ -7 \end{pmatrix}, \begin{pmatrix} -7 \\ 1 \\ -4 \end{pmatrix} \right\}$ er en basis for $\mathbb{R}^3$ .
Bestem koordinaterne til vektoren
$\begin{pmatrix} 1 \\ 1 \\ 1 \end{pmatrix}$ i basen $B$ ovenfor.