9Indre produkt og ortogonalitet

I planen $\mathbb{R}^2$ har vi i Kapitel 1 set på det Euklidiske indre produkt (kaldes også nogle gange prikprodukt eller skalarprodukt)

$\begin{pmatrix} x_1 \\ x_2 \end{pmatrix} \cdot \begin{pmatrix} y_1 \\ y_2 \end{pmatrix} = x_1 y_1 + x_2 y_2$ for to vektorer. Ved hjælp af det indre produkt indførte vi begreber som normen (længden) af en vektor og ortogonalitet. Normen af en vektor $\mathbf u\in \mathbb{R}^2$ blev defineret som $\sqrt{\mathbf u\cdot \mathbf u}$ og to vektorer $\mathbf u, \mathbf v\in \mathbb{R}^2$ blev kaldt vinkelrette eller ortogonale hvis $\mathbf u\cdot \mathbf v = 0$ .

I dette kapitel indfører vi den oplagte generalisering af det indre produkt fra planen $\mathbb{R}^2$ til vilkårlige søjlevektorer i $\mathbb{C}^n$ . Her skal man være særlig opmærksom på at der for komplekse tal også indgår en kompleks konjugering, som er helt essentiel for at vi kan tale om længden af en kompleks vektor. Vi husker at konjugeringen af et komplekst tal $z = x+iy$ er givet ved at skifte fortegn på imaginærdelen

$\overline{z} = x - iy,$ og vi husker at der helt særligt fås et reelt tal (modulus af $z$ i anden potens) når et komplekst tal ganges med sin konjugerede

$z\overline{z} = |z|^2.$

Lad $\mathbf u,\mathbf v\in \mathbb{C}^n$ . Det (Euklidiske) indre produkt mellem $\mathbf u$ og $\mathbf v$ er defineret som

$\mathbf u\cdot \mathbf v = \overline{\mathbf v}^T\mathbf u = u_1\overline{v_1}+\dots+u_n\overline{v_n}.$ Vektorerne $\mathbf u$ og $\mathbf v$ kaldes ortogonale, skrevet $\mathbf u\perp\mathbf v$ , hvis

$\mathbf u\cdot\mathbf v = 0.$ Normen (længden) af $\mathbf u$ er defineret som

$|\mathbf u| = \sqrt{\mathbf u\cdot\mathbf u} = \sqrt{|u_1|^2 + \dots + |u_n|^2}.$ En vektor $\mathbf u$ kaldes en enhedsvektor hvis $|\mathbf u|=1$ .

Hvilke af nedenstående udsagn er rigtige, for det indre produkt i Definition 9.1?

Hvis $\mathbf u, \mathbf v\in \mathbb{R}^n$ er

$\mathbf u\cdot \mathbf v = \mathbf v^T \mathbf u.$

$\begin{pmatrix} 1 \\ i \end{pmatrix}\cdot \begin{pmatrix} 1 \\ i \end{pmatrix} = 0.$

$\begin{pmatrix} 1 \\ i \end{pmatrix}\cdot \begin{pmatrix} 1 \\ i \end{pmatrix} = 2.$

$\begin{pmatrix} 1 \\ 2 \end{pmatrix}\cdot \begin{pmatrix} 3 \\ 4 \end{pmatrix} = 11.$

Moralen i dette kapitel er at lineær algebra bliver væsentligt mere kraftfuldt (og spændende!), når vi har et indre produkt at arbejde med. Specielt kan meget af vores geometriske intuition fra vektorer i planen fra Kapitel 1 anvendes på vektorer i $\mathbb{C}^n$ . Det vigtigste begreb vi kommer ind på i denne sammenhæng er ortonormalbaser som giver en let måde at finde koordinater til vektorer (på samme måde som det er kendt fra standard basen) og hvordan en ''almindelig'' basis kan omdannes til en ortonormalbasis.

9.1 Egenskaber for indre produkter og normer

Der gælder følgende helt essentielle egenskaber for det Euklidiske indre produkt.

Lad $\mathbf u, \mathbf v, \mathbf w\in \mathbb{C}^n$ og $\lambda\in \mathbb{C}$ . Så gælder

$(\lambda \mathbf u)\cdot \mathbf v = \lambda (\mathbf u\cdot \mathbf v)$
$\mathbf u\cdot (\lambda \mathbf v) = \bar \lambda (\mathbf u\cdot \mathbf v)$
$\mathbf u\cdot (\mathbf v+\mathbf w) = \mathbf u\cdot \mathbf v + \mathbf u\cdot \mathbf w$
$\mathbf u\cdot \mathbf v = \overline{\mathbf v\cdot \mathbf u}$
$\mathbf u\cdot \mathbf u \geq 0$ og $\mathbf u\cdot \mathbf u=0$ hvis og kun hvis $\mathbf u=\mathbf 0$ .

Bevis

Med det indre produkt defineret som $\mathbf u\cdot \mathbf v = \overline{\mathbf v}^T \mathbf u$ følger resultaterne af regneregler for matrixmultiplikation og konjugering af komplekse tal og overlades til læseren som en øvelse.

Når egenskaberne ovenfor blev kaldt helt essentielle, er det fordi disse egenskaber faktisk er definitionen af hvad et generelt indre produkt skal opfylde. Det er muligt at definere indre produkter på andre typer af vektorrum end for søjlevektorer, eksempelvis på vektorrum af polynomier eller kvadratisk integrable funktioner. Hovedessensen er, at de ovenstående egenskaber er nok til at kunne vise mange af resultaterne i dette kapitel med brug af indre produkter på abstrakte vektorrum; eksempelvis kan Gram-Schmidt algoritmen også anvendes til at bestemme ortogonale funktioner, som er en vigtig del af teorien bag signalbehandling.

Ud fra egenskaberne i Proposition 9.3, kan vi nu se at vi kan bruge samme formel for projektionen af en vektor $\mathbf u\in\mathbb{C}^n$ på en vektor $\mathbf v\in\mathbb{C}^n$ hvor $\mathbf v\neq \mathbf 0$ , som vi havde i Kapitel 1:

$\mathbf w = \Bigl(\frac{\mathbf u\cdot \mathbf v}{|\mathbf v|^2}\Bigr)\mathbf v. \tag{9.1}$

Specifikt har vi at $\mathbf w$ er parallel med $\mathbf v$ (det er $\mathbf v$ ganget med skalaren i parantesen) og vi har at $\mathbf w\perp(\mathbf u-\mathbf w)$ :

$\mathbf w\cdot(\mathbf u-\mathbf w) = \mathbf w\cdot\mathbf u - |\mathbf w|^2 = \frac{(\mathbf u\cdot\mathbf v)(\mathbf v\cdot\mathbf u)}{|\mathbf v|^2} - \frac{|\mathbf u\cdot\mathbf v|^2|\mathbf v|^2}{|\mathbf v|^4} = 0.$ Bemærk at vi derfor kan skrive $\mathbf u = \mathbf w + (\mathbf u-\mathbf w)$ , hvor højresiden er to ortogonale vektorer; $\mathbf w$ er komponenten af $\mathbf u$ der peger i retning af $\mathbf v$ , mens $\mathbf u-\mathbf w$ er komponenten af $\mathbf u$ der er ortogonal på $\mathbf v$ .

Ud fra kun definitionen af det indre produkt og ortogonale projektioner kan vi lave overraskende meget nyttig matematik. Blandt andet nedenstående resultat, som kaldes Cauchy-Schwarz ulighed.

Lad $\mathbf u, \mathbf v\in \mathbb{C}^n$ . Så gælder

$|\mathbf u\cdot \mathbf v| \leq |\mathbf u|\,|\mathbf v|.$

Bevis

Hvis $\mathbf v = \mathbf 0$ er uligheden sand, da der står $0$ på begge sider. Antag nu at $\mathbf v\neq \mathbf 0$ , så kan vi bestemme den ortogonale projektion $\mathbf w$ af $\mathbf u$ på $\mathbf v$ ved brug af formlen i (9.1), således at $\mathbf u = \mathbf w + (\mathbf u-\mathbf w)$ og $\mathbf w\perp(\mathbf u-\mathbf w)$ .

Nu kan vi lave en udregning hvor udtrykket for $\mathbf u$ indsættes:

$\begin{aligned} |\mathbf u|^2 &= \mathbf u\cdot\mathbf u \\ &= (\mathbf w+(\mathbf u-\mathbf w))\cdot(\mathbf w+(\mathbf u-\mathbf w)) \\ &= \mathbf w\cdot\mathbf w + \underbrace{(\mathbf u-\mathbf w)\cdot(\mathbf u-\mathbf w)}_{=|\mathbf u-\mathbf w|^2\geq 0} + \underbrace{(\mathbf u-\mathbf w)\cdot\mathbf w + \mathbf w\cdot(\mathbf u-\mathbf w)}_{= 0} \\ &\geq |\mathbf w|^2 \\ &= \frac{|\mathbf u\cdot\mathbf v|^2}{|\mathbf v|^2}. \end{aligned}$ Nu kan vi gange igennem med $|\mathbf v|^2$ på begge sider, for derefter at tage kvadratroden, for at få

$|\mathbf u\cdot\mathbf v| \leq |\mathbf u|\,|\mathbf v|.$

Lad $x_1, \dots, x_n\in \mathbb{R}$ . Prøv at bevise

$(x_1 + x_2 + \cdots +x_n)^2 \leq n (x_1^2 + x_2^2 + \cdots + x_n^2)$ uden at bruge Sætning 9.5. Lykkedes det? Hvis ikke, prøv med.

Ud fra Cauchy-Schwarz ulighed kan vi udlede trekantsuligheden.

For to vektorer $\mathbf u, \mathbf v\in \mathbb{C}^n$ gælder

$|\mathbf u + \mathbf v| \leq |\mathbf u| + |\mathbf v|.$

Bevis

Vi starter med at minde om nogle egenskaber for komplekse tal. Først har vi at $2\mathrm{Re}(z) = z + \overline{z}$ og dernæst har vi også at

$\mathrm{Re}(z) \leq |\mathrm{Re}(z)| \leq |z|.$ Ved en udregning får vi derfor

$|\mathbf u+\mathbf v|^2 = (\mathbf u+\mathbf v)\cdot (\mathbf u+\mathbf v) = |\mathbf u|^2 + |\mathbf v|^2 + 2 \mathrm{Re}(\mathbf u\cdot \mathbf v) \leq |\mathbf u|^2 + |\mathbf v|^2 + 2 |\mathbf u\cdot \mathbf v|.$ Beviset følger nu ved brug af Sætning 9.5:

$|\mathbf u+\mathbf v|^2 \leq |\mathbf u|^2 + |\mathbf v|^2 + 2 |\mathbf u|\,|\mathbf v| = (|\mathbf u| + |\mathbf v|)^2.$

For ortogonale vektorer, $\mathbf u\perp\mathbf v$ i $\mathbb{C}^n$ , gælder

$|\mathbf u+\mathbf v|^2 = |\mathbf u|^2+|\mathbf v|^2.$

Bevis

Beviset er en direkte udregning, hvor sammenhængen mellem indre produkt og norm udnyttes:

$|\mathbf u+\mathbf v|^2 = (\mathbf u+\mathbf v)\cdot(\mathbf u + \mathbf v) = \mathbf u\cdot\mathbf u + \mathbf v\cdot\mathbf v + \underbrace{\mathbf u\cdot\mathbf v + \mathbf v\cdot\mathbf u}_{=0} = |\mathbf u|^2 + |\mathbf v|^2.$

9.2 Ortonormalbaser

De fleste kan godt lide at bruge standard basen $\{\mathbf e_1,\dots,\mathbf e_m\}$ for $\mathbb{C}^m$ , på grund af de flotte geometriske egenskaber den har. Hver vektor peger ud af akserne i det typiske retvinklede koordinatsystem, og koordinaterne til vektor $\mathbf u = (x_1,\dots,x_m)^T\in \mathbb{C}^m$ kan direkte aflæses fra vektorens indgange. Vi har nemlig

$\begin{aligned} \mathbf u &= x_1\mathbf e_1 + x_2\mathbf e_2 + \dots + x_n\mathbf e_m \\ &= (\mathbf u\cdot\mathbf e_1)\mathbf e_1 + (\mathbf u\cdot\mathbf e_2)\mathbf e_2 + \dots + (\mathbf u\cdot\mathbf e_n)\mathbf e_m. \end{aligned}\tag{9.2}$ Det at vi kan ''aflæse'' koordinaterne nemt, svarer præcis til udregningen af koordinatvektoren ved de indre produkter $(\mathbf u\cdot\mathbf e_1,\dots,\mathbf u\cdot\mathbf e_m)^T$ . Dette er betydelig lettere end at skulle løse et ligningssystem for at finde en koordinatvektor. Vi skal se at denne lettere måde at finde koordinater på hænger sammen med ortogonalitet af basisvektorerne.

Først skal vi overbevise os selv om, at ortogonale vektorer er lineært uafhængige, hvilket fra et geometrisk synspunkt nok ikke er så overraskende.

Hvis $\mathbf v_1,\dots,\mathbf v_m$ er indbyrdes ortogonale vektorer, $\mathbf v_i\perp\mathbf v_j$ for alle $i\neq j$ , og ingen af vektorerne er nulvektorer, så er $\mathbf v_1,\dots,\mathbf v_m$ lineært uafhængige.

Bevis

For at undersøge lineær uafhængighed af vektorerne, ser vi på en linearkombination

$\mathbf v = \alpha_1\mathbf v_1 + \alpha_2\mathbf v_2 + \dots + \alpha_m\mathbf v_m$ for nogle tal $\alpha_1,\dots,\alpha_m\in \mathbb{C}$ . Af ortogonaliteten får vi derfor

$\mathbf v\cdot\mathbf v_i = \alpha_1(\mathbf v_1\cdot\mathbf v_i) + \alpha_2(\mathbf v_2\cdot\mathbf v_i)+\dots+\alpha_m(\mathbf v_m\cdot\mathbf v_i) = \alpha_i|\mathbf v_i|^2$ for hvert indeks $i = 1,\dots,m$ .

Det betyder, at hvis $\mathbf v = \mathbf 0$ , så kan vi konkludere at hvert $\alpha_i = 0$ for $i=1,\dots,m$ da $\mathbf v_i\neq \mathbf 0$ var en af antagelserne i sætningen. Det betyder at den eneste linearkombination af $\mathbf v_1,\dots,\mathbf v_m$ som kan give $\mathbf 0$ er hvis alle koordinaterne er 0, altså er vektorerne lineært uafhængige.

Da ortogonale vektorer er lineært uafhængige, så opfylder de allerede det vigtigste kriterium for at danne baser for vektorrum.

En basis $\{\mathbf u_1,\dots,\mathbf u_m\}$ for et vektorrum $V$ kaldes en ortogonalbasis hvis $\mathbf u_i\perp\mathbf u_j$ for alle $i\neq j$ .
Hvis en ortogonalbasis består af enhedsvektorer, $|\mathbf u_i| = 1$ for alle $i$ , så kaldes det en ortonormalbasis (ONB).

Vi vil meget ofte anvende ONB-forkortelsen fra Definition 9.10 fremadrettet. Der er flere af resultaterne i de næste afsnit og kapitler der specifikt gør brug af ortonormalbaser, hvor det er vigtigt at vektorerne er normaliseret så de har norm 1 (ved at dividere med normen af vektoren) og ikke kun er ortogonale; dette er nok en af de mest almindelige fejl man begår når man første gang skal diagonalisere en matrix ved brug af spektralsætningen i Kapitel 11.

Nu skal vi se nogle pæne formler for at udregne koordinater for en ONB, helt analogt med hvad vi så for standard basen i (9.2), samt en brugbar formel der relaterer normen af en vektor til de indre produkter med basisvektorerne.

Lad $\{\mathbf w_1,\dots,\mathbf w_m\}$ være en ONB for et vektorrum $V$ . For ethvert $\mathbf v\in V$ gælder

$\begin{aligned} \mathbf v &= (\mathbf v\cdot \mathbf w_1) \mathbf w_1 + \cdots + (\mathbf v\cdot \mathbf w_m) \mathbf w_m,\\ |\mathbf v|^2 &= |\mathbf v\cdot \mathbf w_1|^2 + \cdots + |\mathbf v\cdot \mathbf w_m|^2. \end{aligned}$

Bevis

Lad $(x_1,\dots,x_m)^T$ være koordinatvektor for $\mathbf v$ med hensyn til $\{\mathbf w_1,\dots,\mathbf w_m\}$

$\mathbf v = x_1 \mathbf w_1 + \cdots + x_m \mathbf w_m.$ Nu følger af ortonormaliteten at

$\mathbf v\cdot \mathbf w_i = (x_1 \mathbf w_1 + \cdots + x_m \mathbf w_m)\cdot \mathbf w_i = x_i|\mathbf w_i|^2 = x_i,$ hvilket viser første påstand om at koordinaterne er givet ved de indre produkter.

Den anden påstand følger af regneregler for det indre produkt:

$|\mathbf v|^2 = \mathbf v\cdot \mathbf v = (x_1 \mathbf w_1 + \cdots + x_m \mathbf w_m)\cdot (x_1 \mathbf w_1 + \cdots + x_m \mathbf w_m) = |x_1|^2 + \cdots + |x_m|^2,$ hvor vi på samme måde har benyttet at $\mathbf w_i\cdot \mathbf w_j = 0$ for $i\neq j$ og $\mathbf w_i\cdot \mathbf w_i = 1$ .

De tre vektorer

$\mathbf w_1 = \frac{1}{\sqrt{2}}\begin{pmatrix} -1 \\ 1 \\ 0\\ 0 \end{pmatrix},\quad \mathbf w_2 = \frac{1}{2}\begin{pmatrix} 1 \\ 1 \\ 1 \\ 1 \end{pmatrix},\quad\text{og}\quad \mathbf w_3 = \frac{1}{2}\begin{pmatrix} -1 \\ -1 \\ 1 \\ 1 \end{pmatrix}$ udgør en ONB for deres span, $V = \mathrm{span}\{\mathbf w_1, \mathbf w_2, \mathbf w_3\}$ i $\mathbb{C}^4$ . Dette ses ved at vektorerne er normaliserede og ortogonale (tjek det gerne!) samt af Sætning 9.9.

Det er nu ikke så kompliceret at bruge Proposition 9.11 til at afgøre om en vektor $\mathbf v\in \mathbb{C}^4$ ligger i $V$ . Dette sker hvis og kun hvis

$\mathbf v = (\mathbf v\cdot \mathbf w_1) \mathbf w_1 + (\mathbf v\cdot \mathbf w_2) \mathbf w_2 + (\mathbf v\cdot \mathbf w_3) \mathbf w_3.$ Hvis for eksempel

$\mathbf v = \begin{pmatrix} 1 \\ 1 \\ 2 \\ 1 \end{pmatrix}$ er

$(\mathbf v\cdot \mathbf w_1) \mathbf w_1 + (\mathbf v\cdot \mathbf w_2) \mathbf w_2 + (\mathbf v\cdot \mathbf w_3) \mathbf w_3 = \tfrac{5}{2}\, \mathbf w_2 + \tfrac{1}{2}\, \mathbf w_3 = \begin{pmatrix} 1\\ 1\\[1mm] \frac{3}{2}\\[1.5mm] \frac{3}{2} \end{pmatrix}$ hvilket tydeligvis ikke er lig $\mathbf v$ , og derfor har vi $\mathbf v\notin V$ . Derimod har vi med

$\mathbf u = \begin{pmatrix} 0 \\ 0 \\ 1 \\ 1 \end{pmatrix}$ at

$(\mathbf u\cdot \mathbf w_1) \mathbf w_1 + (\mathbf u\cdot \mathbf w_2) \mathbf w_2 + (\mathbf u\cdot \mathbf w_3) \mathbf w_3 = \mathbf w_2 + \mathbf w_3 = \mathbf u,$ det vil sige $\mathbf u\in V$ .

Lad $V$ være underrummet i $\mathbb{C}^3$ med en basis $B$ bestående af vektorerne

$\mathbf v_1 = \begin{pmatrix} 1\\ 2\\ 1 \end{pmatrix}\quad\text{og}\quad \mathbf v_2 = \begin{pmatrix} -1\\ 1\\ -1 \end{pmatrix}.$ Hvilke af nedenstående udsagn er rigtigt?

$B$ er en ortogonalbasis for $V$ .

$B$ er en ONB for $V$ .

$V = \mathbb{C}^3$ .

$\{\tfrac{1}{\sqrt{6}}\, \mathbf v_1, \tfrac{1}{\sqrt{3}}\, \mathbf v_2\}$ er en ONB for $V$ .

$\begin{pmatrix} 1\\ 1\\ 1 \end{pmatrix}\in V.$

9.3 Gram-Schmidt algoritmen

Vi har set ovenfor at ONB'er er specielt nemme at regne med. Spørgsmålet er om alle underrum af $\mathbb{C}^m$ har en ONB? Her er svaret ja og grunden ligger i en klassisk og smuk algoritme tilmed opfundet af en dansker. Ideen kommer fra formlen for projektion af en vektor på en anden vektor, som vi genopfriskede i (9.1).

Hvis $\{\mathbf u_1,\dots,\mathbf u_m\}$ er en ortogonalbasis for et vektorrum $V$ , så kan vi finde en ONB ved at normalisere

$\mathbf w_1 = \frac{\mathbf u_1}{|\mathbf u_1|}, \quad \mathbf w_2 = \frac{\mathbf u_2}{|\mathbf u_2|}, \quad \dots, \quad \mathbf w_m = \frac{\mathbf u_m}{|\mathbf u_m|}.$ Ved at sætte dette ind i Proposition 9.11, får vi den tilsvarende formel for koordinaterne i en ortogonalbasis

$\begin{aligned} \mathbf v &= (\mathbf v\cdot \mathbf w_1) \mathbf w_1 + (\mathbf v\cdot \mathbf w_2) \mathbf w_2 + \cdots + (\mathbf v\cdot \mathbf w_m) \mathbf w_m \\ &= \Bigl(\frac{\mathbf v\cdot\mathbf u_1}{|\mathbf u_1|^2}\Bigr)\mathbf u_1 + \Bigl(\frac{\mathbf v\cdot\mathbf u_2}{|\mathbf u_2|^2}\Bigr)\mathbf u_2 + \dots + \Bigl(\frac{\mathbf v\cdot\mathbf u_m}{|\mathbf u_m|^2}\Bigr)\mathbf u_m. \end{aligned}\tag{9.3}$ Hvis vi kigger på de enkelte led, og sammenligner med (9.1), så ser vi at $\mathbf v$ er summen af de ortogonale projektioner af $\mathbf v$ på henholdsvis $\mathbf u_1$ , $\mathbf u_2$ , $\dots$ , $\mathbf u_m$ .

En måske vigtigere observation fra (9.3), er at vi kan finde komponenten af $\mathbf v$ i én ortogonal retning ved at trække alle de andre ortogonale projekterne fra $\mathbf v$ . For eksempel er det sidste komponent

$\Bigl(\frac{\mathbf v\cdot\mathbf u_m}{|\mathbf u_m|^2}\Bigr)\mathbf u_m = \mathbf v - \Bigl(\frac{\mathbf v\cdot\mathbf u_1}{|\mathbf u_1|^2}\Bigr)\mathbf u_1 - \Bigl(\frac{\mathbf v\cdot\mathbf u_2}{|\mathbf u_2|^2}\Bigr)\mathbf u_2 - \dots - \Bigl(\frac{\mathbf v\cdot\mathbf u_{m-1}}{|\mathbf u_{m-1}|^2}\Bigr)\mathbf u_{m-1}.$ Dette er princippet der ligger bag Gram-Schmidt algoritmen: Tag en basis for et vektorrum, og lav nye vektorer hvor vi induktivt trækker ortogonalprojektioner fra til at danne en ny ortogonalbasis for det samme vektorrum.

Animation af den modificerede Gram-Schmidt algoritme for tre vektorer fra Wikipedia. Læg mærke til at de indre produkter $\mathbf u\cdot \mathbf v$ noteres som $\langle \mathbf u, \mathbf v\rangle$ i animationen.

Proceduren i animationen ovenfor kan generaliseres fra to og tre vektorer til et vilkårligt antal vektorer. Denne generalisering blev først fundet af danskeren Gram i 1883 og kendes i dag under navnet Gram-Schmidt algoritmen. Algoritmen er angivet i sætningen nedenfor. Det er en af de helt fundamentale metoder i lineær algebra.

Lad $\mathbf v_1, \dots, \mathbf v_m$ være lineært uafhængige vektorer i $\mathbb{C}^n$ og lad

$V = \mathrm{span}\{\mathbf v_1,\dots, \mathbf v_m\}.$ Ved algoritmen

$\begin{aligned} \mathbf u_1 &= \mathbf v_1\\ \mathbf u_2 &= \mathbf v_2 - \Bigl(\frac{\mathbf v_2\cdot \mathbf u_1}{|\mathbf u_1|^2}\Bigr) \mathbf u_1\\ \mathbf u_3 &= \mathbf v_3 - \Bigl(\frac{\mathbf v_3\cdot \mathbf u_1}{|\mathbf u_1|^2}\Bigr) \mathbf u_1 - \Bigl(\frac{\mathbf v_3\cdot \mathbf u_2}{|\mathbf u_2|^2}\Bigr) \mathbf u_2\\ &\vdots\\ \mathbf u_m &= \mathbf v_m - \Bigl(\frac{\mathbf v_m\cdot \mathbf u_1}{|\mathbf u_1|^2}\Bigr) \mathbf u_1 - \cdots - \Bigl(\frac{\mathbf v_m\cdot \mathbf u_{m-1}}{|\mathbf u_{m-1}|^2}\Bigr) \mathbf u_{m-1} \end{aligned}\tag{9.4}$ opnås ortogonale vektorer $\mathbf u_1, \dots, \mathbf u_m\in V$ så at $\mathbf u_i\neq \mathbf 0$ og

$V = \mathrm{span}\{\mathbf u_1, \dots, \mathbf u_m\}.$ En ONB basis $\{\mathbf w_1,\dots,\mathbf w_m\}$ for $V$ opnås ved at normalisere basisvektorerne:

$\mathbf w_1 = \frac{\mathbf u_1}{|\mathbf u_1|}, \quad \dots, \quad \mathbf w_m = \frac{\mathbf u_m}{|\mathbf u_m|}.$

Bevis

Fra ortogonal projektionerne har vi for hvert $j=1,\dots,m$ at $\mathbf u_j\perp\mathbf u_i$ for $i=1,\dots,j-1$ .

Givet to indeks $i,j=1,\dots,m$ med $i\neq j$ , har vi altså enten at $i<j$ eller $i>j$ . I begge tilfælde får vi derfor at $\mathbf u_j\perp\mathbf u_i$ . Altså er $\{\mathbf u_1,\dots,\mathbf u_m\}$ ortogonale vektorer.

Fra processen i (9.4) ser vi at $\mathbf u$ -vektorerne er linearkombinationer af $\mathbf v$ -vektorerne (indsæt udtrykkende for $\mathbf u$ i højresiden). Tilsvarende, ved at flytte de ortogonale projektioner til venstresiden i (9.4), ser vi også at $\mathbf v$ -vektorerne er linearkombinationer af $\mathbf u$ -vektorerne. Det betyder altså at

$\mathrm{span}\{\mathbf u_1,\dots,\mathbf u_m\} = \mathrm{span}\{\mathbf v_1,\dots,\mathbf v_m\} = V.$ Da $\{\mathbf v_1,\dots,\mathbf v_m\}$ er en basis for $V$ er $\dim(V) = m$ , og derfor må også $\{\mathbf u_1,\dots,\mathbf u_m\}$ være en basis for $V$ .

Hvis Sætning 9.15 benyttes på et sæt af vektorer som ikke er lineært uafhængige, vil algoritmen undervejs afsløre dette og give $\mathbf u_i = \mathbf 0$ , hvor

$\mathbf v_i\in \mathrm{span}\{\mathbf v_1, \dots, \mathbf v_{i-1}\}.$ Algoritmen kan modificeres ret enkelt ved at springe trin med $\mathbf u_i = \mathbf 0$ over og arbejde videre med $\mathbf v_{i+1}$ ud fra de allerede fundne ortogonale vektorer $\mathbf u_1, \dots, \mathbf u_{i-1}$ .

Vi betragter underrummet $V$ i $\mathbb{C}^5$ udspændt af vektorerne.

$\mathbf v_1 = \begin{pmatrix} 1 \\ -1 \\ 0 \\ 1 \\ 1 \end{pmatrix}, \quad \mathbf v_2 = \begin{pmatrix} 6 \\ 2 \\ 3 \\ 0 \\ 4 \end{pmatrix} \quad\text{og}\quad \mathbf v_3 = \begin{pmatrix} 5 \\ 3 \\ 3 \\ 1 \\ 5 \end{pmatrix}.$ Vi benytter Gram-Schmidt algoritmen til at finde en ONB for $V$ . Første trin er $\mathbf u_1 = \mathbf v_1$ . Dernæst udregner vi

$\mathbf u_2 = \mathbf v_2 - \Bigl(\frac{\mathbf v_2\cdot \mathbf u_1}{|\mathbf u_1|^2}\Bigr) \mathbf u_1 = \begin{pmatrix} 6 \\ 2 \\ 3 \\ 0 \\ 4 \end{pmatrix} - 2\begin{pmatrix} 1 \\ -1 \\ 0 \\ 1 \\ 1 \end{pmatrix} = \begin{pmatrix} 4 \\ 4 \\ 3 \\ -2 \\ 2 \end{pmatrix}.$ Så vidt så godt; man kan tjekke efter for regnefejl ved at undersøge om $\mathbf u_1 \cdot \mathbf u_2 = 0$ . Sidste skridt er nu udregningen af $\mathbf u_3$ via

$\begin{aligned} \mathbf u_3 &= \mathbf v_3 - \Bigl(\frac{\mathbf v_3\cdot \mathbf u_1}{|\mathbf u_1|^2}\Bigr) \mathbf u_1 - \Bigl(\frac{\mathbf v_3\cdot \mathbf u_2}{|\mathbf u_2|^2}\Bigr) \mathbf u_2 \\ \\ &= \begin{pmatrix} 5 \\ 3 \\ 3 \\ 1 \\ 5 \end{pmatrix} - 2 \begin{pmatrix} 1 \\ -1 \\ 0 \\ 1 \\ 1 \end{pmatrix} - \begin{pmatrix} 4 \\ 4 \\ 3 \\ -2 \\ 2 \end{pmatrix} = \begin{pmatrix} -1 \\ 1 \\ 0 \\ 1\\ 1 \end{pmatrix}. \end{aligned}$ Hermed er $\{\mathbf u_1, \mathbf u_2, \mathbf u_3\}$ en ortogonalbasis for $V$ . Da $|\mathbf u_1| = 2, |\mathbf u_2| = 7$ og $|\mathbf u_3| = 2$ vil

$\{\tfrac{1}{2}\, \mathbf u_1, \tfrac{1}{7}\, \mathbf u_2, \tfrac{1}{2}\, \mathbf u_3\}$ være en ONB for $V$ .

9.3.1 Den modificerede Gram-Schmidt algoritme

Gram-Schmidt algoritmen som angivet ovenfor er numerisk ustabil i praksis. Ved en lille modifikation med hensyn til udregningen af $\mathbf u_i$ fås en numerisk stabil algoritme, som er mindre følsom overfor afrundingsfejl. Dette modificerede trin består i at udregne $\mathbf u_i$ gennem følgende kæde af operationer:

$\begin{aligned} \mathbf u_i^{(1)} &= \mathbf v_i - (\mathbf v_i\cdot \mathbf u_1) \mathbf u_1\\ \mathbf u_i^{(2)} &= \mathbf u_i^{(1)} - (\mathbf u_i^{(1)}\cdot \mathbf u_2) \mathbf u_2\\ &\vdots\\ \mathbf u_i^{(i-1)} &= \mathbf u_i^{(i-2)} - (\mathbf u_i^{(i-2)}\cdot \mathbf u_{i-1}) \mathbf u_{i-1} \end{aligned}$ med $\mathbf u_i = \frac{\mathbf u_i^{(i-1)}}{|\mathbf u_i^{(i-1)}|}$ som resultat.

Eksempel

Lad os benytte vektorerne

$\mathbf v_1 = \begin{pmatrix} 1 \\ -1 \\ 0 \\ 1 \\ 1 \end{pmatrix}, \quad \mathbf v_2 = \begin{pmatrix} 6 \\ 2 \\ 3 \\ 0 \\ 4 \end{pmatrix} \quad\text{og}\quad \mathbf v_3 = \begin{pmatrix} 5 \\ 3 \\ 3 \\ 1 \\ 5 \end{pmatrix}$ fra sidste eksempel som input til den modificerede Gram-Schmidt algoritme. Første skridt giver

$\mathbf u_1 = \frac{\mathbf v_1}{|\mathbf v_1|} = \frac{1}{2}\begin{pmatrix} 1 \\ -1 \\ 0 \\ 1 \\ 1 \end{pmatrix}.$ Udregningen af $\mathbf u_2$ foregår som

$\mathbf u_2^{(1)} = \mathbf v_2 - (\mathbf v_2\cdot \mathbf u_1) \mathbf u_1 = \begin{pmatrix} 6 \\ 2 \\ 3 \\ 0 \\ 4 \end{pmatrix} - 4\cdot \frac{1}{2}\begin{pmatrix} 1 \\ -1 \\ 0 \\ 1 \\ 1 \end{pmatrix} = \begin{pmatrix} 4 \\ 4 \\ 3 \\ -2 \\ 2 \end{pmatrix}$ med

$\mathbf u_2 = \frac{1}{7}\begin{pmatrix} 4 \\ 4 \\ 3 \\ -2 \\ 2 \end{pmatrix}.$ Udregningen af $\mathbf u_3$ foregår som

$\mathbf u_3^{(1)} = \mathbf v_3 - (\mathbf v_3\cdot \mathbf u_1) \mathbf u_1 = \begin{pmatrix} 5 \\ 3 \\ 3 \\ 1 \\ 5 \end{pmatrix} - 4\cdot \frac{1}{2} \begin{pmatrix} 1 \\ -1 \\ 0 \\ 1 \\ 1 \end{pmatrix} = \begin{pmatrix} 3 \\ 5 \\ 3 \\ -1 \\ 3 \end{pmatrix}$ og

$\mathbf u_3^{(2)} = \mathbf u_3^{(1)} - (\mathbf u_3^{(1)}\cdot \mathbf u_2) \mathbf u_2 = \begin{pmatrix} 3 \\ 5 \\ 3 \\ -1 \\ 3 \end{pmatrix} - 7 \cdot \frac{1}{7} \begin{pmatrix} 4 \\ 4 \\ 3 \\ -2 \\ 2 \end{pmatrix} = \begin{pmatrix} -1 \\ 1 \\ 0 \\ 1 \\ 1 \end{pmatrix}$ med endeligt resultat

$\mathbf u_3 = \frac{1}{2}\begin{pmatrix} -1 \\ 1 \\ 0 \\ 1 \\ 1 \end{pmatrix}$ i fin overensstemmelse med foregående eksempel.

Denne algoritme kaldes den modificerede Gram-Schmidt algoritme. Den numeriske stabilitet illustreres i eksemplet (hentet fra MIT OpenCourseWare) nedenfor.

For at uddybe hvad der egentlig menes med numerisk stabil, eller mindre følsom overfor afrundingsfejl, kan man som eksempel afprøve Gram-Schmidt algoritmen og den modificerede Gram-Schmidt algoritme på vektorerne

$\begin{pmatrix} 1 \\ \epsilon \\ 0 \\ 0 \end{pmatrix},\quad \begin{pmatrix} 1 \\ 0 \\ \epsilon \\ 0 \end{pmatrix}\quad \text{og}\quad \begin{pmatrix} 1 \\ 0 \\ 0 \\ \epsilon \end{pmatrix}$ med afrundingsfejlen $1 + \epsilon^2 \approx 1$ . Hvis en lommeregner for eksempel kan vise $10$ cifre i displayet og $\epsilon = 0.000001$ så er $1 + \epsilon^2 = 1$ på lommeregneren.

Med afrunding og normering i hvert trin giver den klassiske Grams-Schmidt algoritme resultatet

$\mathbf u_1 = \begin{pmatrix} 1 \\ \epsilon \\ 0 \\ 0 \end{pmatrix},\quad \mathbf u_2 = \frac{1}{\sqrt{2}} \begin{pmatrix} 0 \\ -1 \\ 1 \\ 0 \end{pmatrix}\quad\text{og}\quad \mathbf u_3 = \frac{1}{\sqrt{2}} \begin{pmatrix} 0 \\ -1 \\ 0 \\ 1 \end{pmatrix}.$ Læg mærke til at $\mathbf u_2\cdot \mathbf u_3 = \frac{1}{2}$ , hvilket er en grim fejl som følge af afrundingen, som ikke afhænger af hvor lille $\epsilon$ bliver.

Derimod giver den modificerede Grams-Schmidt algoritme resultatet

$\mathbf u_1 = \begin{pmatrix} 1 \\ \epsilon \\ 0 \\ 0 \end{pmatrix},\quad \mathbf u_2 = \frac{1}{\sqrt{2}} \begin{pmatrix} 0 \\ -1 \\ 1 \\ 0 \end{pmatrix}\quad\text{og}\quad \mathbf u_3 = \frac{1}{\sqrt{6}} \begin{pmatrix} 0 \\ -1 \\ -1 \\ 2 \end{pmatrix}.$ Her er $\mathbf u_2\cdot \mathbf u_3 = 0$ .

9.4 Unitære og ortogonale matricer

For en $m\times n$ kompleks matrix $A$ er $\overline{A}$ den kompleks konjugerede af $A$ . Det svarer til at konjugere hver af indgangene i matricen, som set nedenfor:

$A = \begin{pmatrix} a_{11} & \dots & a_{1n} \\ \vdots & \ddots & \vdots \\ a_{m1} & \dots & a_{mn} \end{pmatrix}, \qquad \overline{A} = \begin{pmatrix} \overline{a_{11}} & \dots & \overline{a_{1n}} \\ \vdots & \ddots & \vdots \\ \overline{a_{m1}} & \dots & \overline{a_{mn}} \end{pmatrix}.$

Hvad gælder for kompleks konjugering af en matrix?

$\overline{ \begin{pmatrix} 1 - i & -i\\ \\ 1 - i & -i \end{pmatrix}} = \begin{pmatrix} 1 + i & i \\ \\ -1 + i & -i \end{pmatrix}.$

$\overline{ \begin{pmatrix} 1 - i & -i\\ \\ 1 - i & i \end{pmatrix}} = \begin{pmatrix} 1 + i & i \\ \\ 1 + i & -i \end{pmatrix}.$

For to matricer $A$ og $B$ , hvor matrixproduktet $A B$ giver mening gælder

$\overline{A B} = A \overline{B}.$

For to matricer $A$ og $B$ , hvor matrixproduktet $A B$ giver mening gælder

$\overline{A B} = \overline{A} \overline{B}.$

Nu skal vi introducere en matrix som har helt særlige egenskaber når det kommer til det indre produkt, og som bliver brugt i resten af kapitlerne.

For matrix $A$ definerer vi den konjugerede og transponerede matrix

$A^* = \overline{A}^T.$

For eksempel er

$A^* = \begin{pmatrix} -i & 1\\ 1 - i & i \end{pmatrix}\qquad\text{for}\qquad A = \begin{pmatrix} i & 1 + i\\ 1 & -i \end{pmatrix}.$

Som vi kender det fra transponering af matricer, kan vi bestemme den konjugerede og transponerede af et produkt ved formlen

$(AB)^* = B^*A^*.$ Herudover kan vi også se, at en anden måde at skrive det Euklidiske indre produkt af to vektorer $\mathbf u,\mathbf v\in\mathbb{C}^n$ , er

$\mathbf u\cdot\mathbf v = \mathbf v^*\mathbf u.$ Ved at kombinere de to ovenstående principper, får vi en meget vigtig egenskab.

Lad $A$ være en $m\times n$ matrix, $\mathbf u\in \mathbb{C}^n$ og $\mathbf v\in \mathbb{C}^m$ . Så gælder

$(A\mathbf u)\cdot \mathbf v = \mathbf u\cdot (A^*\mathbf v) \qquad\text{og}\qquad (A^*\mathbf v)\cdot\mathbf u = \mathbf v\cdot(A\mathbf u).$

Vi kan altså flytte en matrix fra én indgang i det indre produkt til den anden, ved at finde dens konjugerede og transponerede.

Læg mærke til at $\overline{A} = A$ hvis $A$ er en reel matrix, så i det tilfælde vil $A^* = A^T$ .

Vi skal nu se på de matricer $U$ , hvorom det gælder at $U^* = U^{-1}$ , altså hvor vi meget nemt kan udregne den inverse af matricen ved blot at konjugere og transponere. Selvom disse matricer ofte ser grimme og ubehagelige ud (rent numerisk) så er det nogle af de letteste at arbejde med, måske lige ud over diagonalmatricerne, og de har en særrolle i diagonalisering af nogle vigtige klasser af matricer i Kapitel 11.

En $n\times n$ matrix $U$ kaldes en unitær matrix hvis $U^* = U^{-1}$ .

Hvis $U$ herudover er en reel matrix, så vi har $U^T = U ^{-1}$ , kaldes den i stedet for en ortogonal matrix.

En vigtig geometrisk egenskab for unitære matricer $U$ , er at de bevarer det indre produkt, altså

$(U\mathbf u)\cdot (U\mathbf v) = (U\mathbf v)^*(U\mathbf u) = \mathbf v^*U^*U\mathbf u = \mathbf v^*\mathbf u = \mathbf u\cdot \mathbf v.$

Tilsvarende, ved at indsætte $\mathbf u$ på $\mathbf v$ 's plads ovenfor, ses at unitære matricer også bevarer normen af en vektor:

$|U\mathbf u| = |\mathbf u|.$

En afbildning med denne egenskab kaldes en isometri.

Det næste resultat viser, at det ikke er kompliceret at konstruere unitære matricer; det svarer præcis til de kvadratiske matricer med ortonormale søjler. Her kender vi allerede Gram-Schmidt algoritmen til at bestemme ONB'er.

En $n\times n$ matrix er unitær netop hvis dens søjler er ortonormale.

Bevis

Dette følger af definitionen på matrixmultiplikation opfattet på følgende måde. Lad $A$ og $B$ være komplekse $n\times n$ matricer og lad $\mathbf b_1, \dots, \mathbf b_n$ være søjlerne i $B$ . Så er søjlerne i $A B$ netop

$A \mathbf b_1, \dots, A \mathbf b_n.$ Altså er søjlerne i $B^* B$ netop $B^* \mathbf b_j$ og dermed er

$(B^* B)_{ij} = (B^*)^i B_j = \mathbf b_j\cdot \mathbf b_i.$ Kravet om $B^*B = I_n$ , er nu ensbetydende med at

$\mathbf b_j\cdot\mathbf b_i = \begin{cases} 1 & \text{for } i=j, \\ 0 & \text{for } i\neq j, \end{cases}$ altså at søjlerne i $B$ er ortonormale.

Lad os analysere hvordan en ortogonal $2\times 2$ matrix $Q$ tager sig ud. Antag at

$Q = \begin{pmatrix} a & b\\ c & d \end{pmatrix}.$ Så er

$\begin{pmatrix} 1 & 0\\ 0 & 1 \end{pmatrix} = Q^T Q = \begin{pmatrix} a & c\\ b & d \end{pmatrix} \begin{pmatrix} a & b\\ c & d \end{pmatrix} = \begin{pmatrix} a^2 + c^2 & a b + c d\\ a b + d c & b^2 + d^2 \end{pmatrix}.$ Derfor er søjlevektorerne i $Q$ ortogonale enhedsvektorer. Sætter vi $a = \cos(\theta)$ og $c = \sin(\theta)$ har vi altså to muligheder for $Q$ :

$Q_1 = \begin{pmatrix} \cos(\theta) & -\sin(\theta)\\ \sin(\theta) & \cos(\theta) \end{pmatrix}\qquad\text{og}\qquad Q_2 = \begin{pmatrix} \cos(\theta) & \sin(\theta)\\ \sin(\theta) & -\cos(\theta) \end{pmatrix}.$ Geometrisk svarer $Q_1$ til en rotation af planen, mens $Q_2$ svarer til en spejling. Ved eksplicit udregning ser man at $1$ er en egenværdi for $Q_2$ . En tilhørende egenvektor er retningsvektor for linjen, som der spejles i (som viser sig at være linjen gennem $(0,0)$ med vinklen $\theta/2$ med $x$ -aksen).

En unitær $1\times 1$ matrix er netop et komplekst tal $z$ med $z \bar{z} = 1$ . Det vil sige $z = e^{i \theta}$ for en passende vinkel $\theta$ . For to komplekse tal $a, b\in \mathbb{C}$ med $|a|^2+|b|^2 = 1$ er

$U = \begin{pmatrix} a & b\\ -\bar{b} & \bar{a} \end{pmatrix}$ et eksempel på en unitær $2\times 2$ matrix. Her kan man for eksempel benytte

$\begin{aligned} a &= e^{i\varphi_1} \cos \theta\\ b &= e^{i\varphi_2} \sin \theta \end{aligned}$ for vilkårlige vinkler $\theta, \varphi_1, \varphi_2$ . For eksempel er

$\begin{pmatrix} \frac{1}{2} + \frac{1}{2} i & \frac{1}{2} + \frac{1}{2} i\,\, \\ \\ -\frac{1}{2} + \frac{1}{2} i & \frac{1}{2} - \frac{1}{2} i\,\, \end{pmatrix}$ en unitær $2\times 2$ matrix svarende til $\theta = \varphi_1 = \varphi_2 = \pi/4$ .

Tre berømte unitære matricer er

$\begin{pmatrix} 0 & 1\\ 1 & 0 \end{pmatrix},\qquad \begin{pmatrix} 0 & -i\\ i & 0 \end{pmatrix}\qquad\text{og}\qquad \begin{pmatrix} 1 & 0\\ 0 & -1 \end{pmatrix},$ som indgår i beskrivelsen af sammenhængen mellem en partikels spin og et elektromagnetisk felt inden for kvantemekanik.

Hvilke af nedenstående udsagn er rigtige?

Determinanten af en ortogonal matrix kan være alle tal $\neq 0.$

Determinanten af en ortogonal matrix er enten $1$ eller $-1.$

Matricen som repræsenterer en rotation omkring en akse gennem origo $\mathbf 0$ i $\mathbb{R}^3$ , med hensyn til standard basen, er en ortogonal matrix.

Matricen

$\begin{pmatrix} 1 & 0 & 0\\ 0 & \cos(\theta) & -\sin(\theta)\\ 0 & \sin(\theta) & \cos(\theta) \end{pmatrix}$ er ortogonal for enhver vinkel $\theta$ .

9.4.1 QR dekomposition

Hvis vi benytter Gram-Schmidt algoritmen på søjlerne $\mathbf a_1, \dots, \mathbf a_n$ i en invertibel $n\times n$ matrix $A$ fås

$\begin{aligned} \mathbf u_1 &= \mathbf a_1\\ \mathbf u_2 &= \mathbf a_2 - \Bigl(\frac{\mathbf a_2\cdot \mathbf u_1}{|\mathbf u_1|^2}\Bigr) \mathbf u_1\\ \mathbf u_3 &= \mathbf a_3 - \Bigl(\frac{\mathbf a_3\cdot \mathbf u_1}{|\mathbf u_1|^2}\Bigr) \mathbf u_1 - \Bigl(\frac{\mathbf a_3\cdot \mathbf u_2}{|\mathbf u_2|^2}\Bigr) \mathbf u_2\\ &\vdots\\ \mathbf u_n &= \mathbf a_n - \Bigl(\frac{\mathbf a_n\cdot \mathbf u_1}{|\mathbf u_1|^2}\Bigr) \mathbf u_1 - \cdots -\Bigl(\frac{\mathbf a_n\cdot \mathbf u_{n-1}}{|\mathbf u_{n-1}|^2}\Bigr) \mathbf u_{n-1}. \end{aligned}$ Efter normalisering $\mathbf w_i = \mathbf u_i/|\mathbf u_i|$ fås nu af Proposition 9.11

$\begin{aligned} \mathbf a_1 &= (\mathbf a_1\cdot \mathbf w_1) \mathbf w_1\\ \mathbf a_2 &= (\mathbf a_2\cdot \mathbf w_1) \mathbf w_1 + (\mathbf a_2\cdot \mathbf w_2) \mathbf w_2\\ \mathbf a_3 &= (\mathbf a_3\cdot \mathbf w_1) \mathbf w_1 + (\mathbf a_3\cdot \mathbf w_2) \mathbf w_2 + (\mathbf a_3\cdot \mathbf w_3) \mathbf w_3\\ &\vdots\\ \mathbf a_n &= (\mathbf a_n\cdot \mathbf w_1) \mathbf w_1 + (\mathbf a_n\cdot \mathbf w_2) \mathbf w_2 + \cdots + (\mathbf a_n\cdot \mathbf w_{n}) \mathbf w_{n}. \end{aligned}\tag{9.5}$ Oversat giver det matrix identiteten

$A = Q R,$ hvor $Q$ er matricen med søjler $\mathbf w_1, \dots, \mathbf w_n$ og

$R = \begin{pmatrix} \mathbf a_1\cdot \mathbf w_1 & \mathbf a_2 \cdot \mathbf w_1 & \cdots & \mathbf a_n\cdot \mathbf w_1\\ 0 & \mathbf a_2\cdot \mathbf w_2 & \cdots & \mathbf a_n\cdot \mathbf w_2\\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & \mathbf a_n \cdot \mathbf w_n \end{pmatrix}.$

Læg mærke til at matricen $Q$ er unitær fordi dens søjler udgør en ONB, samt at $R$ er en øvre trekantsmatrix (den har nuller under diagonalen). Vi har vist følgende.

En invertibel matrix $A$ kan skrives som produkt af en unitær matrix $Q$ og en øvre trekantsmatrix $R.$

Hvis $A$ er en reel matrix, så kan $Q$ vælges som en ortogonal matrix.

Faktoriseringen $A = QR$ kaldes, af åbenlyse årsager, en QR dekomposition eller QR faktorisering af $A$ .

Matricen

$A = \begin{pmatrix} 2 & 1 \\ 1 & 2 \end{pmatrix}$ er en invertibel $2\times 2$ matrix. Ved hjælp af Gram-Schmidt algoritmen finder man med input fra søjlerne i $A$ , matricen $Q$ indeholdende ONB

$Q = \begin{pmatrix} \frac{2}{\sqrt{5}} & -\frac{1}{\sqrt{5}} \\[1.5mm] \frac{1}{\sqrt{5}} & \frac{2}{\sqrt{5}} \end{pmatrix}$ med QR dekompositionen

$A = \begin{pmatrix} \frac{2}{\sqrt{5}} & -\frac{1}{\sqrt{5}} \\[1.5mm] \frac{1}{\sqrt{5}} & \frac{2}{\sqrt{5}} \end{pmatrix} \begin{pmatrix} \sqrt{5} & \frac{4}{\sqrt{5}} \\[1.5mm] 0 & \frac{3}{\sqrt{5}} \end{pmatrix}.$

9.4.2 Den mirakuløse QR-algoritme

Det meste lineære algebra er langtidsholdbart matematik og flere hundrede år gammelt. Det hænder dog at ekstremt vigtige nye opdagelser bliver gjort for eksempel ved at eksperimentere med computere. Følgende næsten halvnaive algoritme til at udregne egenværdier for en kvadratisk matrix $A$ blev opdaget sidst i 1950'erne. Den hedder QR algoritmen og bygger netop på QR dekompositionen.

Indledningsvis sættes $A_0 = A$ og algoritmen udregner nye QR dekompositioner i hvert trin med hensyn til det modsatte produkt af $Q$ og $R$ fra foregående trin:

$\begin{aligned} A_0 &= Q_0 R_0 \\ A_1 &= R_0 Q_0 = Q_1 R_1\\ A_2 &= R_1 Q_1 = Q_2 R_2\\ &\vdots \end{aligned}$

Læg her mærke til at $A_i$ og $A_{i+1}$ har de samme egenværdier, fordi de er similære:

$A_{i+1} = R_iQ_i=(Q_i^{-1}Q_i)(R_iQ_i)=Q_i^{-1}(Q_iR_i)Q_i=Q_i^{-1}A_iQ_i.$ Her har vi brugt at vi ved at den unitære matrix $Q_i$ er invertibel. Under alle omstændigheder, hvis $\mathbf u$ er en egenvektor til $A_i$ med egenværdi $\lambda$ , så er $Q_i^{-1}\mathbf u$ en egenvektor til $A_{i+1}$ med den samme egenværdi $\lambda$ .

Oftest vil diagonalelementerne i $R_n$ konvergere mod egenværdierne i den oprindelige matrix $A$ .

Betragt matricen

$A = \begin{pmatrix} 2 & 1\\ 1 & 2 \end{pmatrix}.$ Man kan ret hurtigt regne ud at $A$ har egenværdierne $\lambda = 1$ og $\lambda = 3$ .

Lad os afprøve QR algoritmen rent numerisk på $A$ . De første trin giver

$\begin{aligned} A_0 = Q_0 R_0 = \begin{pmatrix} 0.894427 & -0.447214\\ 0.447214 & 0.894427 \end{pmatrix} &\begin{pmatrix} \color{red}{2.23607} & 1.78885\\ 0 & \color{red}{1.34164} \end{pmatrix} \\ A_1 = R_0 Q_0 = Q_1 R_1 = \begin{pmatrix} 0.977802 & 0.209529\\ 0.209529 & 0.977802 \end{pmatrix} &\begin{pmatrix} \color{red}{2.86356} & 0.83812\\ 0 & \color{red}{1.04765} \end{pmatrix} \\ A_2 = R_1 Q_1 = Q_2 R_2 = \begin{pmatrix} 0.99729 & -0.0735706\\ 0.0735706 & 0.99729 \end{pmatrix} &\begin{pmatrix} \color{red}{2.9837} & 0.29428\\ 0 & \color{red}{1.00546} \end{pmatrix} \\ A_3 = R_2 Q_2 = Q_3 R_3 = \begin{pmatrix} 0.999696 & -0.0246726\\ 0.0246726 & 0.999696 \end{pmatrix} &\begin{pmatrix} \color{red}{2.99817} & 0.098690\\ 0 & \color{red}{1.00061} \end{pmatrix}. \end{aligned}$

Eksperimentet synes at bekræfte at diagonalelementerne (markeret med rødt) i følgen af de øvrige trekantsmatricer i QR dekompositionerne konvergerer mod egenværdierne af den oprindelige matrix.

9.5 Ortogonal komplement og ortogonal projektion

Man har ofte brug for en anelse mere terminologi omkring underrum og ortogonalitet, herunder ortogonalt komplement og ortogonal projektion på et underrum. Dette er særlig vigtigt for at få en god geometrisk forståelse af hvad der foregår når man løser et ligningssystem, og det er helt essentielt for at forstå tilnærmelsesvise løsninger med mindste kvadraters metode i Kapitel 10.

For et underrum $V$ i $\mathbb{C}^n$ knytter der sig et komplementært underrum med hensyn til det indre produkt. Dette underrum er defineret ved

$V^\perp = \{\mathbf v\in \mathbb{C}^n : \mathbf v\cdot \mathbf u = 0 \textrm{ for alle }\mathbf u\in V\}.$ og kaldes det ortogonale komplement til $V$ .

$V^\perp$ er altså samtlige vektorer som står ortogonalt på alle vektorer i $V$ . At $V^\perp$ er et underrum af $\mathbb{C}^n$ følger af egenskaberne ved det indre produkt givet i Proposition 9.3.

Ortogonale komplementer giver en fornuftig måde at opdele vektorrum på med forskellige egenskaber, som eksempelvis er nyttigt til at beskrive løsninger til lineære ligningssystemer.

Lad $V$ være et underrum af $\mathbb{C}^n$ . For enhver vektor $\mathbf u\in \mathbb{C}^n$ findes entydige vektorer $\mathbf w\in V$ og $\mathbf v\in V^\perp$ så

$\mathbf u = \mathbf w + \mathbf v. \tag{9.6}$ Formlen (9.6) kaldes den ortogonale dekomposition af $\mathbf u$ med hensyn til $V$ og $V^\perp$ .

Bevis

Lad $\{\mathbf w_1, \dots, \mathbf w_m\}$ være en ONB for $V$ , og definer

$\mathbf w = (\mathbf u\cdot\mathbf w_1)\mathbf w_1 + \dots + (\mathbf u\cdot\mathbf w_m)\mathbf w_m.$ Vi har altså konstrueret en vektor $\mathbf w\in V$ ud fra $\mathbf u$ . Nu bestemmer vi

$\mathbf v = \mathbf u-\mathbf w = \mathbf u - ((\mathbf u\cdot\mathbf w_1)\mathbf w_1 + \dots + (\mathbf u\cdot\mathbf w_m)\mathbf w_m).$ Ved samme argument som ved Gram-Schmidt algoritmen, har vi at $\mathbf v\perp\mathbf w_i$ for $i = 1,\dots,m$ . Da $\mathbf v$ er ortogonal på en basis for $V$ , så må $\mathbf v\in V^\perp$ , da den derved står ortogonalt på enhver linearkombination af $\{\mathbf w_1,\dots,\mathbf w_m\}$ .

Til sidst skal entydigheden af (9.6) bevises. Antag at

$\mathbf u = \mathbf w + \mathbf v = \widetilde{\mathbf w} + \widetilde{\mathbf v}, \tag{9.7}$ hvor $\mathbf w,\widetilde{\mathbf w}\in V$ og $\mathbf v,\widetilde{\mathbf v}\in V^\perp$ . Vi skal nu vise at $\mathbf w=\widetilde{\mathbf w}$ og $\mathbf v=\widetilde{\mathbf v}$ .

Ved at se på det sidste lighedstegn i (9.7) får vi

$\underbrace{\mathbf w-\widetilde{\mathbf w}}_{\in V} = \underbrace{\widetilde{\mathbf v}-\mathbf v}_{\in V^\perp}.$ Men dette betyder at $(\mathbf w-\widetilde{\mathbf w}),(\widetilde{\mathbf v}-\mathbf v) \in V\cap V^\perp$ , altså det er vektorer der står ortogonalt på sig selv. Som set nedenfor, er der kun en vektor der opfylder dette, nemlig nulvektoren

$0 = \mathbf x\cdot\mathbf x = |\mathbf x|^2 \Leftrightarrow \mathbf x = \mathbf 0.$ Dette betyder at $V\cap V^\perp = \{\mathbf 0\}$ , og vi har dermed vist $\mathbf w=\widetilde{\mathbf w}$ og $\mathbf v=\widetilde{\mathbf v}$ .

Vektorerne i Sætning 9.30 har særlige navne, de kaldes nemlig ortogonale projektioner på henholdsvis $V$ og $V^\perp$ .

I den ortogonale dekomposition (9.6) kaldes $\mathbf w$ for den ortogonale projektion af $\mathbf u$ på $V$ . Tilsvarende er $\mathbf v$ den ortogonale projektion af $\mathbf u$ på $V^\perp$ .

På samme måde som (9.1) angiver en formel for den ortogonale projektion ind på et et-dimensionelt vektorrum (på linjen udspændt af en vektor), så giver Sætning 9.30 at man kan projicere ind på ethvert underrum af $\mathbb{C}^n$ , eksempelvis et to-dimensionelt vektorrum (en plan udspændt af to vektorer) eller af en vilkårlig høj dimension $\leq n$ .

Med underrummet $V = \mathrm{span}\{\mathbf v\}$ i $\mathbb{C}^2$ er $\lambda \mathbf v$ ortogonalprojektion af $\mathbf u$ på $V$ og ortogonalkomplementet $V^\perp$ til $V$ er underrummet $\mathrm{span}\{\mathbf u-\lambda \mathbf v\}$ .

I modsætning til (9.1) giver Sætning 9.30 dog ikke nogen direkte formel til at udregne projektionerne $\mathbf w$ eller $\mathbf v$ .

Men her skal man bare kigge ind i beviset til Sætning 9.30, som afslører hvordan man kan bruge en ONB til at udregne en ortogonal projektion. Ydermere viser Pythagoras sætning hvad en ortogonal projektion $\mathbf w\in V$ af $\mathbf u$ geometisk betyder: $\mathbf w$ er vektoren i $V$ med korteste afstand til $\mathbf u$ .

Lad $V$ være et underrum af $\mathbb{C}^n$ , og lad $\mathbf w$ være den ortogonale projektion af $\mathbf u\in\mathbb{C}^n$ på $V$ . Så gælder

$|\mathbf u-\mathbf w| = \min\{ |\mathbf u-\widetilde{\mathbf w}| : \widetilde{\mathbf w}\in V \}.$ Tallet $|\mathbf u-\mathbf w|$ kaldes afstanden fra $\mathbf u$ til $V$ .

Hvis $\{\mathbf w_1,\dots,\mathbf w_m\}$ er en ONB for $V$ , så kan projektionen $\mathbf w$ udregnes ved

$\mathbf w = (\mathbf u\cdot\mathbf w_1)\mathbf w_1 + \dots + (\mathbf u\cdot\mathbf w_m)\mathbf w_m.$

Bevis

Anden del af sætningen kommer direkte fra konstruktionen i beviset i Sætning 9.30, så det er tilstrækkeligt at vise første del af sætningen.

Vi har at $\mathbf u = \mathbf w + (\mathbf u-\mathbf w)$ hvor $\mathbf w\in V$ og $(\mathbf u-\mathbf w)\in V^\perp$ . Lad $\widetilde{\mathbf w}$ være en vilkårlig vektor i $V$ . Fra Pythagoras sætning (Sætning 9.8) har vi

$|\mathbf u-\mathbf w|^2 \leq |\underbrace{\mathbf u-\mathbf w}_{\in V^\perp}|^2 + |\underbrace{\mathbf w-\widetilde{\mathbf w}}_{\in V}|^2 = |(\mathbf u-\mathbf w)+(\mathbf w-\widetilde{\mathbf w})|^2 = |\mathbf u-\widetilde{\mathbf w}|^2.$ Vi har vist at $|\mathbf u-\mathbf w| \leq |\mathbf u-\widetilde{\mathbf w}|$ for alle $\widetilde{\mathbf w}\in V$ .

I Eksempel 9.12 betragtede vi underrummet $V = \mathrm{span}\{\mathbf w_1, \mathbf w_2, \mathbf w_3\}$ af $\mathbb{C}^4$ med

$\mathbf w_1 = \frac{1}{\sqrt{2}}\begin{pmatrix} -1 \\ 1 \\ 0\\ 0 \end{pmatrix},\quad \mathbf w_2 = \frac{1}{2}\begin{pmatrix} 1 \\ 1 \\ 1 \\ 1 \end{pmatrix},\quad\text{og}\quad \mathbf w_3 = \frac{1}{2}\begin{pmatrix} -1 \\ -1 \\ 1 \\ 1 \end{pmatrix}.$ Bemærk igen at $\{\mathbf w_1, \mathbf w_2, \mathbf w_3\}$ er en ONB for $V$ (tjek det efter, hvis du ikke allerede har gjort det!). I Eksempel 9.12 fandt vi ud af at $\mathbf u\notin V$ , hvor

$\mathbf u = \begin{pmatrix} 1 \\ 1 \\ 2 \\ 1 \end{pmatrix}.$ Vi udregnede i eksemplet også

$(\mathbf u\cdot \mathbf w_1) \mathbf w_1 + (\mathbf u\cdot \mathbf w_2) \mathbf w_2 + (\mathbf u\cdot \mathbf w_3) \mathbf w_3 = \tfrac{5}{2} \mathbf w_2 + \tfrac{1}{2} \mathbf w_3 = \begin{pmatrix} 1\\ 1\\[1mm] \frac{3}{2}\\[1.5mm] \frac{3}{2} \end{pmatrix}.$ Denne vektor er den ortogonale projektion $\mathbf w$ af $\mathbf u$ på $V$ ved brug af Sætning 9.32.

Vi har derfor at afstanden fra $\mathbf u$ til $V$ er

$|\mathbf u-\mathbf w| = |(1,1,2,1)^T - (1,1,\tfrac{3}{2},\tfrac{3}{2})^T| = |(0,0,\tfrac{1}{2},-\tfrac{1}{2})^T| = \frac{1}{\sqrt{2}}.$ Hvis $\mathbf u$ havde været en vektor i $V$ , ville denne afstand naturligvis være $0$ , da i et sådan tilfælde ville $\mathbf w=\mathbf u$ .

Lad os nu bestemme det ortogonale komplement $V^\perp$ . Da $\dim(V) = 3$ og $\dim(\mathbb{C}^4) = 4$ , så må vi have $\dim(V^\perp) = 1$ , så vi skal finde en enkelt vektor $\mathbf x$ der står ortogonalt på vektorerne i $V$ ; eller rettere, ortogonalt på basisvektorerne $\mathbf w_1,\dots,\mathbf w_3$ . I lige præcis dette tilfælde er vi heldige at $\dim(V^\perp) = 1$ , fordi vi ved hvordan man kan finde en vektor i $V^\perp$ , nemlig den ortogonale projektion af $\mathbf u$ på $V^\perp$ ,

$\mathbf v = \mathbf u-\mathbf w = \begin{pmatrix} 0\\ 0\\[1mm] \tfrac{1}{2}\\[1.5mm] -\tfrac{1}{2} \end{pmatrix}.$ Så vi har $V^\perp = \mathrm{span}\{\mathbf v\}$ .

Men lad os prøve at gå systematisk til værks, og se hvordan man kunne bestemme $V^\perp$ hvis f.eks. $\dim(V^\perp)>1$ . Vi har tre ligninger i spil $\mathbf x\cdot\mathbf w_1=0$ , $\mathbf x\cdot\mathbf w_2 = 0$ og $\mathbf x\cdot \mathbf w_3 = 0$ . Hvis vi samler en matrix ud fra basisvektorerne for $V$ , $A = (\mathbf w_1,\mathbf w_2,\mathbf w_3)$ , så kan disse ligninger lige præcis skrives

$A^*\mathbf x = \mathbf 0.$ Vi ser nu at $V^\perp = N(A^*)$ , så en basis for $V^\perp$ kan findes ud fra nulrummet af en matrix, ligesom vi kender det fra Kapitel 6.

9.6 De fire fundamentale underrum

Som vi allerede så en indikation af i foregående eksempel, så er der en sammenhæng mellem søjlerummet af en matrix $A$ og nulrummet af $A^*$ .

For en matrix $A$ gælder

$N(A)^\perp = C(A^*).$

Bevis

Lad $\mathbf v\in C(A^*)$ (der findes en vektor $\mathbf x$ så $A^*\mathbf x = \mathbf v$ ) og lad $\mathbf u\in N(A)$ (så $A\mathbf u=\mathbf 0$ ). Ved direkte udregning, og brug af Sætning 9.21, har vi

$\mathbf u\cdot\mathbf v = \mathbf u\cdot(A^*\mathbf x) = (A\mathbf u)\cdot\mathbf x = \mathbf 0\cdot\mathbf x = 0.$ Så vi har at $C(A^*)$ er en delmængde af $N(A)^\perp$ . Nu skal vi tælle dimensioner, for at sætte lighedstegn mellem vektorrummene.

Lad $A$ være en $m\times n$ matrix med rang $r$ . Fra dimensionsætningen (Sætning 6.29) har vi at $\dim C(A^*) = r$ og $\dim N(A) = n-r$ . Hvis vi nu lader $\{\mathbf v_1,\dots,\mathbf v_r\}$ være en ONB for $C(A^*)$ og $\{\mathbf v_{r+1},\dots,\mathbf v_n\}$ være en ONB for $N(A)$ , så har vi samlet set at $\{\mathbf v_1,\dots,\mathbf v_n\}$ udgør $n$ ortonormale vektorer i $\mathbb{C}^n$ og derfor en ONB for $\mathbb{C}^n$ . Dette betyder altså at $N(A)^\perp = C(A^*)$ .

Ved at indse at $(A^*)^* = A$ , så får vi også fra Sætning 9.34 at $N(A^*)^\perp = C(A)$ . For enhver $m\times n$ matrix har vi derfor følgende fire fundamentale underrum

$N(A), C(A^*), N(A^*) \text{ og } C(A).$

Det er næsten for godt til at være sandt, at ud fra en vilkårlig $m\times n$ matrix $A$ , så kan søjlerum og nulrum for $A$ og $A^*$ bruges til at finde baser for $\mathbb{C}^m$ og $\mathbb{C}^n$ . Bemærk at for en reel matrix $A$ , så er $C(A^*) = C(A^T)$ hvilket er rækkerummet af $A$ .

Specifikt, hvis man nærstuderer følgende figur, som er populariseret af Gilbert Strang, så kan man med stor sikkerhed påstå at man har styr på sine fundamentale begreber, og beskrivelse af løsninger, inden for lineær algebra.

Figuren ovenfor, samt en række andre figurer, er blevet brugt som redskaber til undervisning under navnet lineær algebraens fundamentalsætning (ikke at forveksle med algebraens fundamentalsætning).

Figur 9.35 fortæller stort set alt hvad der er værd at vide om lineære ligningssystemer med komplekse $m\times n$ matricer $A$ med rang $r$ . Enhver vektor $\mathbf x\in \mathbb{C}^n$ kan ortogonalt dekomponeres som $\mathbf x = \mathbf x_1 + \mathbf x_2$ hvor $\mathbf x_1 \in C(A^*)$ og $\mathbf x_2\in N(A)$ , det vil sige at $\mathbf x_1\perp\mathbf x_2$ . Hvis vi udregner matrix-vektor produktet $A\mathbf x$ , ser vi

$\mathbf b = A\mathbf x = A\mathbf x_1 + A\mathbf x_2 = A\mathbf x_1$ da vi har at komponenten $\mathbf x_2$ sendes til $A\mathbf x_2 = \mathbf 0$ . Bemærk at $\mathbf b = A\mathbf x \in C(A)$ .

Specifikt, når vi løser et ligningssystem $A\mathbf x = \mathbf b$ har det kun en løsning hvis $\mathbf b\in C(A)$ . Blandt alle løsninger vil en entydig komponent komme fra $C(A^*)$ , mens $N(A)$ beskriver alle tænkelige bidrag fra de frie variable. Kun hvis $N(A) = \{\mathbf 0\}$ kan der være en entydig løsning til ligningssystemet.

Vi skal se hvordan de fire fundamentale underrum på den mest fantastiske vis binder hele teorien sammen ved brug af singulær værdi dekomposition i Kapitel 12.

9.7 Opgaver

Find den inverse til matricen

$P = \begin{pmatrix} 0 & \frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}}\\ 0 & \frac{1}{\sqrt{2}} & -\frac{1}{\sqrt{2}}\\ -1 & 0 & 0 \end{pmatrix}$ uden at regne.

Gør detaljeret rede for at

$\left\{\begin{pmatrix} -1 \\ 2 \\ -1 \end{pmatrix}, \begin{pmatrix} 1 \\ 1 \\ 1 \end{pmatrix}\right\}$ er en ortogonalbasis for underrummet

$V = \mathrm{span}\left\{ \begin{pmatrix} 1 \\ 2 \\ 1 \end{pmatrix}, \begin{pmatrix} 1 \\ 1 \\ 1 \end{pmatrix}\right\}$ af $\mathbb{R}^3$ . Normaliser basen og benyt derefter Proposition 9.11 (se også Eksempel 9.12) til at afgøre om

$\begin{pmatrix} 1 \\ 0 \\ 1 \end{pmatrix}\in V.$

Find en ONB for underrummet

$\mathrm{span}\left\{\begin{pmatrix} 1 \\ 1 \\ 0\\ 0 \end{pmatrix}, \begin{pmatrix} 1 \\ 0 \\ 1 \\ 0\end{pmatrix}, \begin{pmatrix} 1 \\ 0 \\ 0 \\ 1\end{pmatrix} \right\}$ af $\mathbb{R}^4$ .

Find $QR$ dekomposition af

$A = \begin{pmatrix} 1 & 1 & 0\\ 1 & 0 & 1\\ 0 & 1 & 1 \end{pmatrix}.$ Gør rede for dine udregninger og metoder.

(Eksamen januar 2021)

Lad $V = \mathrm{span}\{\mathbf v_1, \mathbf v_2, \mathbf v_3\}$ være et underrum af $\mathbb{R}^4$ , udspændt af vektorerne

$\mathbf v_1 = \begin{pmatrix} 1 \\ 2 \\ 0 \\ -1 \end{pmatrix}, \quad \mathbf v_2 = \begin{pmatrix} 1 \\ 3 \\ -2 \\ 1 \end{pmatrix}, \quad \mathbf v_3 = \begin{pmatrix} 6 \\ 0 \\ 0 \\ 0 \end{pmatrix}.$

Gør rede for at $\mathbf v_1$ , $\mathbf v_2$ og $\mathbf v_3$ er lineært uafhængige.
Bestem en ortonormalbasis (ONB) for $V$ .
Lad to vektorer $\mathbf x$ og $\mathbf y$ være givet ved
$\mathbf x = \begin{pmatrix} 0 \\ 9 \\ 0 \\ 18 \end{pmatrix} \quad \textup{og} \quad \mathbf y = \begin{pmatrix} 7 \\ 0 \\ 4 \\ -5 \end{pmatrix}.$ Beregn ortogonal projektionerne af $\mathbf x$ og $\mathbf y$ på $V$ .
På baggrund af dette, gør rede for hvilken af vektorerne $\mathbf x$ eller $\mathbf y$ der tilhører $V$ .

(Eksamen juni 2016)

Betragt matricen

$A = \begin{pmatrix} 1 & 3 \\ 1 & 4 \\ 3 & 3 \\ 2 & 3 \end{pmatrix}.$

Find baser for søjlerum $C(A)$ og rækkerum $C(A^T)$ . Hvad er deres dimensioner? Bestem nulrummet $N(A)$ .
Gør rede for, uden at udregne nulrummet $N(A^T)$ , hvad $\dim N(A^T)$ er ud fra $\dim C(A)$ .
Udregn en basis for $N(A^T)$ .
Find en ortonormalbasis (ONB) for det ortogonale komplement af $C(A)$ i $\mathbb{R}^4$ .