4 Matricer

Kommentarer/spørgsmål?

Når man har regnet med lineære ligninger et stykke tid opstår behovet for at forenkle notationen. For eksempel kan ligningerne

\begin{matrix} && &2y &+ &4z &= &-2\\ &3x &+ &2y &+ &7z &= &4 \end{matrix} \tag{4.1}

repræsenteres ved talskemaet

\begin{pmatrix} 0 & 2 & 4 & -2\\ 3 & 2 & 7 & 4 \end{pmatrix} \tag{4.2}

og mange af de operationer vi foretager for at løse ligningerne kan lige så vel udføres på det tilsvarende talskema.

4.1 Matricer

4.1.1 Definitioner

Et rektangulært talskema kaldes en matrix. En matrix med

m

rækker og

n

søjler kaldes en

m\times n

(læs:

m

gange

n

) matrix. Notation for en

m\times n

matrix

A

A = \begin{pmatrix} a_{11} & \cdots &a_{1j}& \cdots& a_{1 n} \\ \vdots & \ddots &\vdots & \ddots & \vdots\\ a_{i1} & \cdots &a_{ij}& \cdots& a_{i n} \\ \vdots & \ddots &\vdots & \ddots & \vdots\\ a_{m1} & \cdots &a_{mj}& \cdots& a_{m n} \end{pmatrix}, \tag{4.3}

hvor

A_{ij} = a_{i j}

betegner tallet i

i

-te række og

j

-te søjle. Hvis vi kalder matricen i (4.2) for

A

, består den af

2

rækker og

4

søjler med

A_{14} = -2

En matrix kaldes kvadratisk hvis den har lige så mange rækker som søjler. For eksempel er de første to matricer nedenfor kvadratiske, mens den tredje ikke er det. $\begin{pmatrix} 1 \end{pmatrix}, \qquad \begin{pmatrix} 1 & 2 & 3\\ 4 & 5 & 6\\ 7 & 8 & 9\end{pmatrix}, \qquad \begin{pmatrix} 0 & 1 & 0\\ 1 & 0 & 1\end{pmatrix}.$
Diagonalen i en matrix er defineret som indgangene i matricen med samme række- og søjlenummer. Nedenfor er angivet en $3\times 4$ matrix, hvor diagonalelementerne er markerede $\begin{pmatrix} \color{red}{1} & 3 & 0 & 1\\ 3 & \color{red}{2} & 1 & 5\\ 1 & 0 & \color{red}{3} & 6 \end{pmatrix}.$ En matrix kaldes en diagonalmatrix, hvis alle dens indgange udenfor diagonalen er $=0$ . Nedenfor er et eksempel på en kvadratisk diagonalmatrix $\begin{pmatrix} 1 & 0 & 0\\ 0 & 2 & 0\\ 0 & 0 & 3 \end{pmatrix}.$
En matrix kaldes en rækkevektor hvis den kun har en række. For eksempel er $\begin{pmatrix} 1 & 2 & 3 \end{pmatrix}$ en rækkevektor med tre søjler.
En matrix kaldes en søjlevektor hvis den kun har en søjle. For eksempel er $\begin{pmatrix} 1\\ 2 \\ 3 \end{pmatrix}$ en søjlevektor med tre rækker.
Rækkerne i en matrix kaldes matricens rækkevektorer. Den $i$ -række i en matrix $A$ betegnes $A_i$ . For eksempel har matricen $A$ i (4.2) rækkevektorerne $A_1 = \begin{pmatrix} 0 & 2 & 4 & -2 \end{pmatrix} \qquad\mathrm{og}\qquad A_2 = \begin{pmatrix} 3 & 2 & 7 & 4 \end{pmatrix}.$
Søjlerne i en matrix kaldes matricens søjlevektorer. Den $j$ -te søjle i en matrix $A$ betegnes $A^j$ . For eksempel har matricen $A$ i (4.2) søjlevektorerne $A^1 = \begin{pmatrix} 0 \\ 3 \end{pmatrix},\quad A^2 =\begin{pmatrix} 2 \\ 2 \end{pmatrix},\quad A^3 =\begin{pmatrix} 4 \\ 7 \end{pmatrix}\quad\mathrm{og}\quad A^4 = \begin{pmatrix} -2 \\ 4 \end{pmatrix}.$
En række- eller søjlevektor refereres til som en vektor.

Vi vil senere give en mere abstrakt definition af vektorer som elementer i et såkaldt vektorrum.

4.2 Matrixmultiplikation

Antag vi har givet to ligningssystemer

\begin{matrix} & \color{blue}{u} &+ &2 \color{red}{v} &= p\\ & \color{blue}{u} &- &2 \color{red}{v} &= q \end{matrix} \qquad\mathrm{og}\qquad \begin{matrix} &2 x &+ &3 y &= \color{blue}{u}\\ &-x &- &2 y &= \color{red}{v}. \end{matrix}

i de variable

u, v

x, y

. Vi får et nyt ligningssystem i

x

y

ved at sætte

u = 2x + 3 y

v=-x-2y

ind i det første ligningssystem:

\begin{matrix} &u &+ &2 v &= &(2 x + 3 y) &+ &2(-x -2 y) &= & &- &y &= p\\ &u &- &2 v &= &(2 x + 3 y) &- &2(-x -2 y) &= &4 x &+ &7 y &= q. \end{matrix}

Med matricer skriver vi

\begin{pmatrix} 1 & 2\\ 1 & -2 \end{pmatrix} \begin{pmatrix} 2 & 3\\ -1 & -2 \end{pmatrix} = \begin{pmatrix} 0 & -1\\ 4 & 7 \end{pmatrix} \tag{4.4}

Lad os prøve at skrive operationen i (4.4) ud generelt det vil sige antag vi har to ligningssystemer a la ovenfor:

\begin{matrix} & a_{11} \color{blue}{u} &+ &a_{12}\color{red}{v} &= p\\ & a_{21} \color{blue}{u} &+ &a_{22}\color{red}{v} &= q \end{matrix} \qquad\mathrm{og}\qquad \begin{matrix} &b_{11} x &+ &b_{12} y &= \color{blue}{u}\\ &b_{21} x &+ &b_{22} y &= \color{red}{v} \end{matrix}

men nu med generelle koefficienter. Ved substitution fås som før

\begin{matrix} & a_{11} u &+ &a_{12} v &= & a_{11} (b_{11} x + b_{12} y) &+ &a_{12} (b_{21} x + b_{22} y)\\ & a_{21} u &+ &a_{22} v &= &a_{21} (b_{11} x + b_{12} y) &+ &a_{22} (b_{21} x + b_{22} y) \end{matrix}

som så er lig med

\begin{matrix} &(a_{11} b_{11} + a_{12} b_{21}) x &+ &(a_{11}b_{12} + a_{12} b_{22}) y &= p\\ &(a_{21} b_{11} + a_{22} b_{21}) x &+ &(a_{21} b_{12} + a_{22} b_{22}) y &= q \end{matrix}

Formuleret med matricer som i (4.4) skrives

\begin{pmatrix} a_{11} & a_{12}\\ \color{blue}{a_{21}} & \color{red}{a_{22}} \end{pmatrix} \begin{pmatrix} \color{blue}{b_{11}} & b_{12}\\ \color{red}{b_{21}} & b_{22} \end{pmatrix} = \begin{pmatrix} a_{11} b_{11} + a_{12} b_{21} & a_{11} b_{12} + a_{12} b_{22}\\ \color{blue}{a_{21} b_{11}} + \color{red}{a_{22} b_{21}} & a_{21} b_{12} + a_{22} b_{22} \end{pmatrix} \tag{4.5}

Ligningen ovenfor er intet mindre end formlen for multiplikation af to

2\times 2

matricer, præcis som den blev indført historisk af Cayley omkring 1857. Ved nærmere eftersyn (og markeret med farver i (4.5) for

i=2

j= 1

) ses reglen at tallet i den

i

-te række og

j

-te søjle i produktmatricen er række-søjle multiplikationen mellem

i

-te række og

j

-te søjle i de to matricer.

Rækkesøjle multiplikationen mellem en rækkevektor

\mathbf x = (x_1 x_2 \ldots x_n)

og en søjlevektor

\mathbf y = \begin{pmatrix} y_1 \\ y_2 \\ \vdots \\ y_n \end{pmatrix}

med det samme antal indgange er defineret som

\mathbf x \mathbf y = x_1 y_1 + x_2 y_2 + \cdots + x_n y_n.

Hvis man er lidt pedantisk vil man måske i notationen skelne mellem tallet

5

1\times 1

matricen

(5)

, men det er vi ikke.

Lad

A

være en

\color{blue}{m}\times \color{black}{p}

matrix og

B

\color{black}{p}\times \color{red}{r}

matrix. Så er produktet

A B

defineret som

\color{blue}{m}\times\color{red}{r}

matricen

C

givet ved

C_{ij} = A_i B^j

for

1\leq i \leq m

1\leq j \leq r

Hvis

A

er en

m\times n

matrix og

B

r\times s

matrix giver matrixproduktet

A B

kun mening, hvis

n = r

: Antallet af søjler i

A

skal være lig med antallet af rækker i

B

Quiz

Lad matricerne

A = \begin{pmatrix} 1 & 0 & 0\\ 0 & 1 & 0 \end{pmatrix}, \quad B = \begin{pmatrix} 1 & 0\\ 0 & 1\end{pmatrix}, \quad C = \begin{pmatrix} 1 & 1 & 1\end{pmatrix}, \quad\mathrm{og}\quad D = \begin{pmatrix} 1 \\ 1 \\ 1\end{pmatrix}

være givet. Hvilke af nedenstående matrixprodukter giver mening?

B A

A B

C D

D C

C A

A D

Kommentarer/spørgsmål?

Med formlen for matrix multiplikation kan ligningssystemet (4.1) nu skrives som

\begin{pmatrix} 0 & 2 & 4\\ 3 & 2 & 7 \end{pmatrix} \begin{pmatrix} x \\ y \\ z \end{pmatrix} = \begin{pmatrix} -2 \\ 4 \end{pmatrix}

Her ganger vi en

2\times 3

matrix sammen med en

3\times 1

matrix. Rækkesøjlemultiplikationen giver

2\times 1

matricen

\begin{pmatrix} 2 y + 4 z\\ 3 x + 2 y + 7 z \end{pmatrix}.

Denne matrix skal netop være lig med

2\times 1

matricen på højresiden ovenfor for at ligningssystemet (4.1) er opfyldt.

Quiz

Lad

A = \begin{pmatrix} 1 & 2 & 3\\ 0 & 1 & 2\\ 3 & x & 1 \end{pmatrix}, \quad B = \begin{pmatrix} 1& 1 & 1\\ 2 & 2 & 2\\ 0 & 1 & 1 \end{pmatrix}\quad\mathrm{og}\quad C = A B

Hvilke af nedenstående udsagn er rigtige?

C_{12} = 9

C_{23} = 4

Hvis

C_{32} = 4

, så er

x = 0

Hvis

C_{31} = -1

, så er

x=-1

Matrixmultiplikation optræder mange steder. Nedenfor et meget anvendeligt eksempel indenfor sandsynlighedsregning, som i generaliseret form leder til Googles berømte page rank algoritme.

Eksempel

Matrixmultiplikation forekommer naturligt i sandsynlighedsregning. Lad os illustrere med et enkelt eksempel. Lad os antage at rundt regnet

20\%

af de mennesker, der bor på landet, flytter til byen og at

30\%

af de mennesker, som bor i byen flytter til landet. Lad os også fastslå at disse procentsatser er opgjort per år og lige omformulere en smule:

Hvis man bor på landet er sandsynligheden for at man flytter til byen $0.2$ ,
Hvis man bor på landet er sandsynligheden for at man bliver boende $0.8$ ,
Hvis man bor i byen er sandsynligheden for at man flytter til landet $0.3$ ,
Hvis man bor i byen er sandsynligheden for at man bliver boende $0.7$ ,

når man ser på et år som tidsramme. Dette kan illustreres med nedenstående diagram

Dette giver anledning til lidt købmandsregning. Lad os sige at der i starten til tiden

t = 0

år bor

x_0

mennesker i byen og

y_0

mennesker på landet. Hvor mange mennesker

x_1

bor der så i byen og hvor mange mennesker

y_1

bor der på landet til tiden

t = 1

år? Med ord bliver byen affolket med

30\%

, men der kommer tilflyttere, som udgør

20\%

af befolkningen på landet. Det vil sige

x_1 = 0.7 x_0 + 0.2 y_0.

Tilsvarende har vi for befolkningen på landet at

y_1 = 0.3 x_0 + 0.8 y_0.

Dette kan skrives via matrixmultiplikation som

\begin{pmatrix} x_1 \\ y_1 \end{pmatrix} = \begin{pmatrix} 0.7 & 0.2\\ 0.3 & 0.8 \end{pmatrix} \begin{pmatrix} x_0 \\ y_0 \end{pmatrix}.

Proceduren giver også mening for

t=2

år. Her bliver resultatet

\begin{aligned} \begin{pmatrix} x_2 \\ y_2 \end{pmatrix} &= \begin{pmatrix} 0.7 & 0.2\\ 0.3 & 0.8 \end{pmatrix} \begin{pmatrix} x_1 \\ y_1 \end{pmatrix} = \begin{pmatrix} 0.7 & 0.2\\ 0.3 & 0.8 \end{pmatrix} \left(\begin{pmatrix} 0.7 & 0.2\\ 0.3 & 0.8 \end{pmatrix} \begin{pmatrix} x_0 \\ y_0 \end{pmatrix}\right)\\ &= \left( \begin{pmatrix} 0.7 & 0.2\\ 0.3 & 0.8 \end{pmatrix} \begin{pmatrix} 0.7 & 0.2\\ 0.3 & 0.8 \end{pmatrix}\right) \begin{pmatrix} x_0 \\ y_0 \end{pmatrix} = P^2 \begin{pmatrix} x_0 \\ y_0 \end{pmatrix}, \end{aligned}\tag{4.6}

hvor

P=\begin{pmatrix} 0.7 & 0.2\\ 0.3 & 0.8 \end{pmatrix}. \tag{4.7}

Ovenstående kan generaliseres så vi har formlen

\begin{pmatrix} x_n \\ y_n \end{pmatrix} = P^n \begin{pmatrix} x_0 \\ y_0 \end{pmatrix}, \tag{4.8}

som giver fordelingen af by- og landbefolkning til tiden

t = n

år. For at kunne benytte formlen (4.8) skal vi altså udføre

n-1

matrixmultiplikationer, hvilket kan være lidt overvældende, for eksempel hvis vi ønsker at kende befolkningstallet på landet efter

50

år. Hver matrixmultiplikation indeholder

8

almindelige talmultiplikationer og

4

almindelige taladditioner. Vi vil senere i kapitlet se hvordan egenvektorer og egenværdier for matricer kan hjælpe med denne udregning. Inden da, lad os blot eksperimentere med at udregne de første potenser af

P

\begin{aligned} P^2 &= \begin{pmatrix} 0.55 & 0.3\\ 0.45 & 0.7 \end{pmatrix}\\ P^3 = P P^2 &= \begin{pmatrix} 0.475 & 0.35\\ 0.525 & 0.65 \end{pmatrix}\\ P^4 = P P^3 &= \begin{pmatrix} 0.4375 & 0.375\\ 0.5625 & 0.625 \end{pmatrix}\\ &\vdots\\ P^{15} &= \begin{pmatrix} 0.400018 & 0.399951\\ 0.599982 & 0.600012 \end{pmatrix}\\ P^{16} &= \begin{pmatrix} 0.400009 & 0.399994\\ 0.599991 & 0.600006 \end{pmatrix} \end{aligned}

Umiddelbart ser det ud som om udregningerne stabiliseres på et stationært niveau, hvor

40\%

bor i byen og

60\%

på landet taget ud fra det samlede indbyggertal til at begynde med det vil sige til

t = 0

år. Matricen

P

er et eksempel på en stokastisk

2\times 2

matrix. Generelt kaldes en kvadratisk matrix en stokastisk matrix hvis alle dens indgange er

\geq 0

og dens søjlesummer er

1

Nedenfor et eksempel på anvendelser i netværksteori.

Eksempel

Matrixmultiplikation forekommer også i praktiske problemer, hvor netværk er involveret. Lad os antage vi har fem byer, som er forbundet med forskellige veje som nedenfor

Dette netværk har en

5\times 5

incidensmatrix, hvor by nummer

i

hører til

i

-te række og

i

-te søjle. Et

1

-tal i matricen på plads

(i, j)

betyder at der er en vej fra by

i

til by

j

, mens et

0

betyder at by

i

og by

j

ikke er forbundet med en vej:

A = \begin{pmatrix} 0 & 1 & 1 & 0 & 0\\ 1 & 0 & 1 & 1 & 0\\ 1 & 1 & 0 & 1 & 1\\ 0 & 1 & 1 & 0 & 1\\ 0 & 0 & 1 & 1 & 0 \end{pmatrix}.

Her er

A^2 = \begin{pmatrix} 2 & 1 & 1 & 2 & 1 \\ 1 & 3 & 2 & 1 & 2 \\ 1 & 2 & 4 & 2 & 1 \\ 2 & 1 & 2 & 3 & 1 \\ 1 & 2 & 1 & 1 & 2 \end{pmatrix}\quad\mathrm{og}\quad A^3 = \begin{pmatrix} 2 & 5 & 6 & 3 & 3 \\ 5 & 4 & 7 & 7 & 3 \\ 6 & 7 & 6 & 7 & 6 \\ 3 & 7 & 7 & 4 & 5 \\ 3 & 3 & 6 & 5 & 2 \end{pmatrix}.

Hvad er netværksfortolkningen af

A^2, A^3

og generelt

A^n

? Det viser sig at fortolkningen af indgang

(i, j)

i matricen

A^n

netop er antallet af stier af længde

n

fra by

i

til by

j

. For eksempel ser vi ovenfor at der er

3

stier fra by

1

til by

5

af længde

3

svarende til

1245, 1345, 1235

. De

2

stier fra by

1

til by

1

af længde

3

1231, 1321

og de

5

stier af længde

3

fra by

1

til

2

1342, 1242, 1323, 1212, 1232

. Lad os antage at vi har et netværk med

m

byer og en tilhørende incidensmatrix

A

. Det generelle bevis bygger på at en sti af længde

n

fra by

i

til by

j

må ende med en vej fra en naboby

k

til

j

. For hver af disse nabobyer kan vi så nøjes med at tælle antallet af stier af længde

n-1

fra by

i

. Hvis vi nu antager at

A^{n-1}_{gh}

er antallet af stier af længde

n-1

fra by

g

til by

h

, så siger matrixmultiplikation at

A^n_{i j} = A^{n-1}_{i 1} A_{1 j} + \cdots + A^{n-1}_{i m} A_{m j}

Dette tal er antallet af stier af længde

n

fra by

i

til by

j

fordi

A_{k j} = 1

netop når

k

er en naboby til

j

(og ellers

0

4.3 Matrixregning

Matrixmultiplikation er forskellig fra almindelig talmultiplikation på et helt centralt punkt: Faktorernes orden er ikke ligegyldig. Betragt matricerne

A= \begin{pmatrix} 1 & 1\\ 0 & 1 \end{pmatrix}\qquad\mathrm{og}\qquad B = \begin{pmatrix} 1 & 0\\ 1 & 1 \end{pmatrix}.

Så er

A B = \begin{pmatrix} 2 & 1 \\ 1 & 1\end{pmatrix}\qquad \mathrm{og} \qquad B A = \begin{pmatrix} 1 & 1 \\ 1 & 2\end{pmatrix}

dvs

A B \neq B A

. Man siger også at matrixmultiplikation er ikke-kommutativ.

4.3.1 Addition af matricer

Man kan (næsten) regne med matricer som almindelige tal. Specielt giver det mening at lægge matricer med samme antal rækker og søjler sammen indgang for indgang:

\begin{pmatrix} a_{11} & \cdots & a_{1 n} \\ \vdots & \ddots & \vdots\\ a_{m1} & \cdots & a_{m n} \end{pmatrix} + \begin{pmatrix} b_{11} & \cdots& b_{1 n} \\ \vdots & \ddots & \vdots\\ b_{m1} & \cdots & b_{m n} \end{pmatrix} = \begin{pmatrix} a_{11} + b_{11} & \cdots & a_{1 n} + b_{1n}\\ \vdots & \ddots & \vdots\\ a_{m1}+b_{m1} & \cdots & a_{m n}+b_{mn} \end{pmatrix}.

Med hensyn til addition opfører matricer sig ligesom almindelige tal, det vil sige at

A+B=B+A

4.3.2 Skalarmultiplikation af matricer

En matrix kan på naturlig måde multipliceres med et tal

\lambda

ved at gange ind plads for plads:

\lambda \begin{pmatrix} a_{11} & \cdots & a_{1 n} \\ \vdots & \ddots & \vdots\\ a_{m1} & \cdots & a_{m n} \end{pmatrix} = \begin{pmatrix} \lambda a_{11} & \cdots & \lambda a_{1 n} \\ \vdots & \ddots & \vdots\\ \lambda a_{m1} & \cdots & \lambda a_{m n} \end{pmatrix}.

Opgave

Findes et tal

\lambda

så

\lambda \begin{pmatrix} 1 & 2 & 3\\ 4 & 5 & 6 \end{pmatrix} + \begin{pmatrix} 0 & 0 & 0\\ 0 & 0 & 2 \end{pmatrix} = \begin{pmatrix} 2 & 4 & 6\\ 8 & 10 & 15 \end{pmatrix}?

4.3.3 Den distributive lov

For almindelige tal gælder at man kan gange ind i en parentes det vil sige

a (b + c) = a b + a c

. Denne regel gælder også for matricer og kaldes generelt for den distributive lov (gange bliver distribueret (fordelt) over plus).

Lad

B

C

være

m\times n

matricer,

A

r\times m

matrix og

D

n\times s

matrix. Så gælder

A ( B + C) = A B + A C\qquad\mathrm{og}\qquad (B + C) D = B D + C D.

Bevis

Man kan nøjes med at bevise den første påstand i tilfældet, hvor

A

er en rækkevektor og

B, C

søjlevektorer, fordi

(A (B+C))_{ij} = A_i (B+C)^j = A_i (B^j + C^j).

Tilsvarende kan den anden påstand bevises i tilfældet hvor

B, C

er rækkevektorer og

D

en søjlevektor, fordi

((B+C) D)_{ij} = (B+C)_i D^j = (B_i + C_i) D^j.

Begge disse tilfælde følger af den distributive lov for almindelige tal. For eksempel, hvis

A = (a_1,\ldots,a_m)

er en rækkevektor og

B= \begin{pmatrix} b_1\\ b_2\\ \vdots\\ b_m \end{pmatrix} \qquad C= \begin{pmatrix} c_1\\ c_2\\ \vdots\\ c_m \end{pmatrix}

søjlevektorer, så er

A(B+C)

AB+AC

begge

1\times 1

matricer, det vil sige at de kun har et eneste element. Helt præcis er

\begin{aligned} A(B+C)&=(\sum_i{a_i(b_i+c_i)})\\ &=(\sum_i{(a_ib_i+a_ic_i)})\\ &=(\sum_i{a_ib_i})+(\sum_i{a_ic_i})\\ &=AB+AC \end{aligned}

4.3.4 Den mirakuløse associative lov

Giver det mening at gange tre matricer

A, B

C

sammen? Vi har faktisk kun defineret produktet af to matricer. Der er to naturlige måder at udregne produktet

A B C

på:

( A B ) C\qquad \mathrm{og}\qquad A (B C).

Vi kan begynde med at gange

A

sammen med

B

og så gange

C

på fra højre. Vi kan også først gange

B

sammen med

C

og så gange

A

på fra venstre. Det er slet ikke klart at de to måder leder frem til samme resultat! At det gælder er helt centralt når man regner med matricer. Resultatet kaldes den associative lov for matrixmultiplikation.

Lad

A

være en

m\times n

matrix,

B

n\times r

matrix og

C

r\times s

matrix. Så er

(A B) C = A (B C).

Det nedenstående bevis er ikke særlig informativt, men det er korrekt. Senere, når vi har set sammenhængen mellem matricer og lineære afbildninger, vil vi være i stand til at give en meget bedre forklaring på hvorfor den associative lov er en selvfølge.

Bevis

Vi skal bevise at

((A B) C)_{ij} = (A (B C))_{ij}

for

1\leq i \leq m

1\leq j \leq s

. Venstresiden kan skrives

\begin{aligned} (A B)_i C^j &= (A_i B^1, \ldots, A_i B^r) C^j\\ &= (A_i B^1) C_{1j} + (A_i B^2) C_{2j} + \cdots + (A_i B^r) C_{rj}. \end{aligned}\tag{4.9}

Højresiden kan skrives som

A_i (B C)^j = A_i \begin{pmatrix} B_1 C^j \\ \vdots \\ B_n C^j\end{pmatrix} = A_{i1} (B_1 C^j) + \cdots + A_{in} (B_n C^j). \tag{4.10}

Ved at skrive rækkesøjle multiplikationerne i (4.9) ud fås

\begin{aligned} &A_{i1} B_{11} C_{1j} + \cdots + A_{in} B_{n1} C_{1j} +\\ &A_{i1} B_{12} C_{2j} + \cdots + A_{in} B_{n2} C_{2j} +\\ &\vdots\\ &A_{i1} B_{1r} C_{rj} + \cdots + A_{in} B_{nr} C_{rj}. \end{aligned}\tag{4.11}

Ved at skrive rækkesøjle multiplikationerne i (4.10) ud fås

\begin{aligned} &A_{i1} B_{11} C_{1j} + \cdots + A_{i1} B_{1r} C_{rj} +\\ &A_{i2} B_{21} C_{1j} + \cdots + A_{i2} B_{2r} C_{rj} +\\ &\vdots\\ &A_{in} B_{n1} C_{1j} + \cdots + A_{in} B_{nr} C_{rj}. \end{aligned}\tag{4.12}

Rækkerne i summen i (4.11) svarer til søjlerne i summen (4.12) og det ses at disse summer er ens. Derfor er

((A B) C)_{ij} = (A (B C))_{ij}

4.3.5 Opbygning af matricer fra søjler

Hvis vi har

n

søjlevektorer

\mathbf v_i

som alle har højde

n

kan vi danne en

m\times n

matrix

A=(\mathbf v_1,\mathbf v_2,\ldots \mathbf v_n)

ved at sætte dem ved siden af hinanden. Så hvis vi har søjlevektorerne

\mathbf v_1 = \begin{pmatrix} 0 \\ 3 \end{pmatrix},\quad \mathbf v_2 =\begin{pmatrix} 2 \\ 2 \end{pmatrix},\quad \mathbf v_3 =\begin{pmatrix} 4 \\ 7 \end{pmatrix}\quad\mathrm{og}\quad \mathbf v_4 = \begin{pmatrix} -2 \\ 4 \end{pmatrix}.

så er

A=(\mathbf v_1,\mathbf v_2,\ldots, \mathbf v_n)= \begin{pmatrix} 0&2&4&-2\\ 3&2&7&4 \end{pmatrix}

Vi kan genfinde søjlevektorerne af

A

som

A^1=\mathbf v_1

A^2=\mathbf v_2

A^3=\mathbf v_3

A^4=\mathbf v_4

. Vi vil senere få brug for følgende simple udregning.

Hvis

B

er en

p\times m

matrix, så er

BA=B(\mathbf v_1,\mathbf v_2,\ldots,\mathbf v_n)=(B\mathbf v_1,B\mathbf v_2,\ldots,B\mathbf v_n)

Bevis

Vi regner efter. På den ene side er

(BA)_{ij}=B_iA^j=B_i\mathbf v_j

På den anden side er

(B\mathbf v_1,B\mathbf v_2,\ldots,B\mathbf v_n)_{ij}=(B\mathbf v_j)_{ij}=B_i\mathbf v_j

Illustration af beviset ved et eksempel

A= \begin{pmatrix} 1&2\\ 1&0 \end{pmatrix} ;\quad B= \begin{pmatrix} 1&2&3\\ 1&0&-1 \end{pmatrix} = \left( \begin{pmatrix} 1\\1 \end{pmatrix}, \begin{pmatrix} 2\\0 \end{pmatrix}, \begin{pmatrix} 3\\-1 \end{pmatrix} \right)

Nu er

\begin{aligned} AB &= \begin{pmatrix} 1&2\\ 1&0 \end{pmatrix} \begin{pmatrix} 1&2&3\\ 1&0&-1 \end{pmatrix} \\ &= \begin{pmatrix} 1 * 1 +2*1&1*2+2*0&1*3+2*(-1)\\ 1*1+0*1&1*2+0*0&1*3+0*(-1) \end{pmatrix} \\ &= \left( \begin{pmatrix} 1&2\\ 1&0 \end{pmatrix}\begin{pmatrix} 1\\1 \end{pmatrix}, \begin{pmatrix} 1&2\\ 1&0 \end{pmatrix}\begin{pmatrix} 2\\0 \end{pmatrix}, \begin{pmatrix} 1&2\\ 1&0 \end{pmatrix}\begin{pmatrix} 3\\-1 \end{pmatrix} \right) \end{aligned}

4.3.6 Identitetsmatricen

Identitetsmatricen

I_n

af orden

n

n\times n

diagonalmatricen med

1

i diagonalen. Nedenfor er identitetsmatricen af orden

5

\begin{pmatrix} 1 & 0 & 0 & 0 & 0\\ 0 & 1 & 0 & 0 & 0\\ 0 & 0 & 1 & 0 & 0\\ 0 & 0 & 0 & 1 & 0\\ 0 & 0 & 0 & 0 & 1 \end{pmatrix}

Identitetsmatricen

I_n

har egenskaben at

I_n A = A I_n = A

for alle

n\times n

matricer

A

Opgave

Gør rede for ovenstående egenskab det vil sige at identitetsmatricen ikke ændrer ved en kvadratisk matrix når den bliver ganget på enten fra venstre eller fra højre.

4.3.7 Den inverse matrix

Man kan dividere med almindelige tal

\neq 0

. Giver det mening at dividere med matricer? Et almindeligt tal

a\neq 0

har et "inverst" tal

c

så

a c = c a = 1

. Her kan vi bare sætte

c = 1/a = a^{-1}

. Vi kan umiddelbart overføre denne definition til kvadratiske matricer.

Opgave

Lad

A, B

C

være

n\times n

matricer. Gør rede for at hvis

B A = I_n

A C = I_n

så må

B = C

n\times n

matrix

A

siges at være invertibel, hvis der eksisterer en

n\times n

matrix

B

så

A B = B A = I_n.

I givet fald kaldes

B

den inverse matrix og betegnes

A^{-1}

Man kunne jo spørge om det kan ske for en

m\times n

matrix

A

hvor

m<n

at der findes en

n\times m

matrix

B

så at

BA=I_n

. Det kan desværre aldrig lade sig gøre, selv om det sagtens kan ske at der findes en

n\times m

matrix

B

så at

AB=I_m

Kommentarer/spørgsmål?

Den inverse matrix kommer for eksempel ind i billedet ved løsning af lineære ligninger. Et lineært ligningssystem med

n

ligninger og

n

ubekendte:

\begin{aligned} a_{11}x_1 + a_{12} x_2 + \cdots + a_{1n} x_n &= b_1\\ &\vdots\\ a_{n1} x_1 + a_{n2} x_2 + \cdots + a_{nn} x_n &= b_n \end{aligned}

kan med matrixnotation skrives

\begin{pmatrix} a_{11} & \cdots & a_{1 n} \\ \vdots & \ddots & \vdots\\ a_{n1} & \cdots & a_{n n} \end{pmatrix} \begin{pmatrix} x_1 \\ \vdots \\ x_n \end{pmatrix} = \begin{pmatrix} b_1 \\ \vdots \\ b_n \end{pmatrix}

eller mere kompakt som

A \mathbf x = \mathbf b

. Hvis

A

er invertibel giver den associative lov følgende udregning:

\begin{aligned} A \mathbf x &= \mathbf b \Rightarrow\\ A^{-1} \left(A \mathbf x\right) &= A^{-1} \mathbf b \Rightarrow \\ (A^{-1} A) \mathbf x &= A^{-1} \mathbf b \Rightarrow\\ I \mathbf x &= A^{-1} \mathbf b\Rightarrow\\ \mathbf x &= A^{-1} \mathbf b.\\ \end{aligned}

Den inverse matrix giver altså løsningen til ligningssystemet ud fra kun en matrixmultiplikation med højresiden. Bemærk at denne udregning gælder for alle højresider

\mathbf b

i ligningssystemet.

Eksempel

Ligningssystemet

\begin{matrix} &5 x &+ &3 y &= &13\\ &3 x &+&2 y &= &8 \end{matrix} \tag{4.13}

kan ved hjælp af matrixmultiplikation skrives som

A \mathbf v = \mathbf b,

hvor

A = \begin{pmatrix} 5& 3 \\ 3 & 2 \end{pmatrix}, \qquad \mathbf v = \begin{pmatrix} x \\ y \end{pmatrix}\qquad \mathrm{og}\qquad \mathbf b = \begin{pmatrix} 13 \\ 8 \end{pmatrix}.

Jeg kan her afsløre at

A

rent faktisk er invertibel samt at

A^{-1} = \begin{pmatrix} 2 & -3\\ -3 & 5 \end{pmatrix}.

En enkel matrixmultiplikation:

\begin{pmatrix} x \\ y \end{pmatrix} = \begin{pmatrix} 2 & -3\\ -3 & 5 \end{pmatrix} \begin{pmatrix} 13 \\ 8 \end{pmatrix} = \begin{pmatrix} 2 \\ 1 \end{pmatrix}

afslører som forventet løsningen til ligningssystemet i (4.13).

Produktet af to invertible matricer (når produktet giver mening) er også en invertibel matrix. Dette er indholdet af følgende resultat, som bevises helt formelt ud fra definitionen og den associative lov.

Produktet

A B

af to invertible matricer

A

B

er invertibelt med

(A B)^{-1} = B^{-1} A^{-1}

Bevis

Vi skal checke betingelserne i definitionen det vil sige at

(B^{-1} A^{-1}) (A B) = I\qquad\mathrm{og}\qquad A B (B^{-1} A^{-1}) = I.

Lad os checke den første betingelse ved brug af den associative lov:

\begin{aligned} (B^{-1} A^{-1}) (A B) &= ((B^{-1} A^{-1}) A) B\\ &= (B^{-1} (A^{-1} A)) B \\ &= (B^{-1} I) B = B^{-1} (I B) = B^{-1} B = I, \end{aligned}

hvor

I

betegner identitetsmatricen. Betingelsen

A B (B^{-1} A^{-1}) = I

checkes analogt.

For de nysgerrige er her en udfordring. Vi har defineret en matrix

A

til at være invertibel, hvis der findes en matrix

B

så både

A B = I

B A = I

. Kan vi umiddelbart konkludere at

B A = I

hvis kun

A B = I

? Vi vil vende tilbage til denne udfordring senere.

4.3.8 Den transponerede matrix

Den transponerede til en

m\times n

matrix

A

n\times m

matricen

A^T

givet ved

A^T_{i j} = A_{j i},

det vil sige matricen, som indeholder søjlerne i

A

som rækker (og rækkerne som søjler). For eksempel er

\begin{pmatrix} 0 & 2 & 4 & -2\\ 3 & 2 & 7 & 4 \end{pmatrix}^T = \begin{pmatrix} 0 & 3\\ 2 & 2\\ 4 & 7\\ -2 & 4 \end{pmatrix}.

Læg også mærke til at

(A^T)^T = A

for en vilkårlig matrix

A

Lad

A

være en

m\times r

matrix og

B

r\times n

matrix. Så er

(A B)^T = B^T A^T.

Bevis

Per definition er

(A B)^T_{i j} = (A B)_{j i}

. Denne indgang er givet som række-søjle multiplikation mellem

j

-te række i

A

i

-te søjle i

B

, hvilket er identisk med række-søjle multiplikation mellem

i

-række i

B^T

j

-te søjle i

A^T

Opgave

Lad

A

være en kvadratisk matrix. Gør rede for at

A

er invertibel hvis og kun hvis

A^T

er invertibel.

Opgave

En kvadratisk matrix

A

kaldes symmetrisk hvis

A = A^T

. Gør rede for at

B B^T

er en symmetrisk matrix, hvor

B

er en vilkårlig matrix.

Vink

Brug proposition 4.16!

4.4 Rækkeoperationer

Der er en række meget naturlige operationer man kan udføre på matricer, som præcis svarer til hvad man ville gøre på det tilsvarende system af ligninger:

Ombytning af to rækker.
Multiplikation af en række med et tal forskellig fra nul.
Addition af en række multipliceret med et tal til en anden række.

Disse operationer kaldes rækkeoperationer. Rækkeoperationer er invertible:

\bullet

Ved først at ombytte to rækker og dernæst ombytte de samme to rækker genfinder vi den oprindelige matrix.

\bullet

Ved først at gange en række med et tal

\lambda\neq 0

og dernæst gange samme række med

1/\lambda

genfinder vi den oprindelige matrix.

\bullet

Ved at addere

\lambda

gange rækken

i

til rækken

j

og dernæst addere

-\lambda

gange rækken

i

til rækken

j

genfinder vi den oprindelige matrix.

To matricer

A

B

kaldes rækkeækvivalente, hvis man kan udføre en følge af rækkeoperationer på

A

og få

B

frem. Dette skrives

A\sim B

Quiz

Betragt følgende fire

2\times 2

matricer

A = \begin{pmatrix} 2 & 1\\ 1 & 2 \end{pmatrix},\quad B = \begin{pmatrix} 1 & 0\\ 0 & 1 \end{pmatrix},\quad C = \begin{pmatrix} 3 & 1\\ 1 & 3 \end{pmatrix}\quad\mathrm{og}\quad D= \begin{pmatrix} 1 & 1\\ 1 & 1 \end{pmatrix}.

Hvilke af følgende udsagn er sande?

A\sim A

A\sim B

A\sim C

B\sim D

Opgave

Lad

A

B

C

være tre matricer med samme antal rækker og søjler. Gør rede for at

$A\sim A$ .
$A\sim B\quad$ medfører at $\quad B\sim A$ .
$A\sim B\quad\mathrm{og}\quad B\sim C\quad$ medfører at $A\sim C$ .

Opgave

Vis at hvis

A\sim B

så er

B\sim A

, det vil sige, hvis at man kan udføre en følge af rækkeoperationer på

B

så at man ender med at få

A

frem.

Operationen (

\gamma

) svarer til Gauss elimination. At trække første ligning fra anden ligning i (4.1) svarer til at gange første række i (4.2) med

-1

og addere til anden række. Efter denne operation på matricen (4.2) har vi matricen

\begin{pmatrix} 0 & 2 & 4 & -2\\ 3 & 0 & 3 & 6 \end{pmatrix} \tag{4.14}

Vi benytter nu operationen (

\beta

) og ganger anden række med

\frac {1}{3}

og får matricen

\begin{pmatrix} 0 & 2 & 4 & -2\\ 1 & 0 & 1 & 2 \end{pmatrix}.

Tilsvarende ganger vi første række med

\frac{1}{2}

og får matricen

\begin{pmatrix} 0 & 1 & 2 & -1\\ 1 & 0 & 1 & 2 \end{pmatrix}.

Hvis vi omformulerer matricen ovenfor til ligninger, svarer den til

\begin{matrix} && &y &+ &2z &= &-1\\ &x & & &+ &z &= &2 \end{matrix}

Intuitivt er rækkefølgen af ligningerne her forkert. Vi vil gerne have at ligningen indeholdende den første variabel

x

kommer først. Vi benytter operationen (

\alpha

) og bytter rundt på første og anden række. Dermed har vi

\begin{pmatrix} 0 & 2 & 4 & -2\\ 3 & 0 & 3 & 6 \end{pmatrix} \quad\sim\quad \begin{pmatrix} 1 & 0 & 1 & 2\\ 0 & 1 & 2 & -1 \end{pmatrix}. \tag{4.15}

Vi accepterer matricen til sidst i (4.15) som en specielt enkel form vi kan reducere den oprindelige matrix (4.2) til. Den enkle form af matricen afspejler sig i det tilsvarende ligningssystem ved at man umiddelbart kan aflæse løsningerne til at være

\begin{matrix} &x& & &= &-z &+ &2\\ & & &y&= &-2z &-&1 \end{matrix}.

Det Vil Sige

z

er en fri variabel og bestemmer

x

y

som ovenfor. Den simple form vi har reduceret den oprindelige matrix til kaldes reduceret række echelon form.

4.5 Reduceret række echelon form (RREF)

En række i en matrix kaldes en nulrække hvis alle dens indgange er tallet

0

En matrix

A

siges at være på reduceret række echelon form (RREF) hvis

Nulrækker er i bunden af matricen.
Hvis en række i $A$ ikke er en nulrække, så er den første indgang $\neq 0$ i rækken tallet $1$ . Denne indgang kaldes et pivotelement.
Et pivotelement er længere til højre end pivotelementerne i de foregående rækker.
Et pivotelement er den eneste indgang $\neq 0$ i sin søjle.

Quiz

Hvilke af nedenstående matricer er på RREF?

\begin{pmatrix} 1 & 1 & 0\\ 0 & 1 & 0\\ 0 & 0 & 1 \end{pmatrix}

\begin{pmatrix} 1 & 0 & 1\\ 0 & 1 & 1\\ 0 & 0 & 0 \end{pmatrix}

\begin{pmatrix} 0 & 1 & 1\\ 1 & 0 & 1\\ 0 & 0 & 0 \end{pmatrix}

\begin{pmatrix} 0 & 0 & 0\\ 1 & 0 & 1\\ 0 & 1 & 1 \end{pmatrix}

\begin{pmatrix} 1 & 0 & 0 & -1\\ 0 & 1 & 0 & 1\\ 0 & 0 & 2 & 1 \end{pmatrix}

\begin{pmatrix} 1 & 0 & 0 & 0\\ 0 & 1 & 2 & 0\\ 0 & 0 & 0 & 1 \end{pmatrix}

Enhver

m\times n

matrix

A

er rækkeækvivalent med en entydig

m\times n

matrix på RREF.

Bevis *

En konkret matrix

A= \begin{pmatrix} 0 & 0 & 0 & 0\\ 0 & 2 & 4 & 10\\ 0 & 2 & 1 & 1 \end{pmatrix}

Lad

j

markere første søjle i

A

, som indeholder en indgang

\neq 0

. Efter ombytning af rækker kan vi antage at

a = A_{1j}\neq 0

Vi følger A

\begin{pmatrix} 0 & 2 & 4 & 10\\ 0 & 0 & 0 & 0\\ 0 & 2 & 1 & 1 \end{pmatrix}

Ved at gange første række igennem med

1/a

kan vi yderligere antage at

A_{1j} = 1

Fortsætning

\begin{pmatrix} 0 & 1 & 2 & 5\\ 0 & 0 & 0 & 0\\ 0 & 2 & 1 & 1 \end{pmatrix}

Vi kan så rækkereducere via Gauss elimination ud fra antagelsen

A_{1j}=1

og opnå at

A_{1j}

er eneste indgang

\neq 0

i sin søjle. Lad os kalde første række

R

efter disse modifikationer af

A

Nu ser vi på R

\begin{pmatrix} 0 & 1 & 2 & 5\\ 0 & 0 & 0 & 0\\ 0 & 0 & -3 & -9 \end{pmatrix}\quad R= \begin{pmatrix} 0 & 1 & 2 & 5 \end{pmatrix}

Denne procedure kan gentages på

(m-1)\times n

matricen

B

bestående af de sidste

m-1

rækker i

A

og vi kan antage at denne mindre matrix kan rækkereduceres til

(m-1)\times n

matricen

H

på RREF.

Og på B og H

B= \begin{pmatrix} 0 & 0 & 0\\ 0 & -3 & -9 \end{pmatrix}\quad H= \begin{pmatrix} 0 & 1 & 3\\ 0 & 0 & 0 \end{pmatrix}

Lad

m\times n

matricen

C

bestå af

R

som første række og

H

som de sidste

m-1

rækker.

Reduktion til C

C= \begin{pmatrix} 0&1&2&5\\ 0&0 & 1 & 3\\ 0&0 & 0 & 0 \end{pmatrix}\quad

RREF for den oprindelige matrix

A

fremkommer nu ved at benytte pivotelementerne i

H

til at skabe

0

i første række i

C

i deres respektive søjler.

Endelig har vi en RREF

\begin{pmatrix} 0&1&0&-1\\ 0&0 & 1 & 3\\ 0&0 & 0 & 0 \end{pmatrix}\quad

Dermed har vi vist eksistensen af en RREF. Nu skitserer vi et bevis for entydigheden af RREF (fra en artikel af Thomas Yuster i Mathematics Magazine, March, 1984). Vi bruger et induktionsargument. Induktionen bruger antallet søjler.

\phantom{phantom}

Hvis

n=1

har

A

kun en søjle. Der er kun to muligheder.

A

kunne være nullvektoren

\mathbf 0

. Men

\mathbf 0

er selv på RREF, og den ændrer sig ikke under rækkoperationer, så entydigheden er klar. Hvis

A\neq \mathbf 0

er RREF også entydig, fordi rækkereduktionen af

A

er nødvendigvis søjlevektoren med

1

på første indgang og

0

på de øvrige indgange. Nu har vi klaret induktionsstarten. For at give et fuldstændigt induktionsbevis for entydigheden er det nok at vise at hvis vi allerede har bevist entydighed af RREF for matricer på formen

m\times (n-1)

, så er entydigheden også gældende for matricer på formen

m\times n

\phantom{phantom}

Vi laver nu induktionskridtet, og antager at

n>1

, og at sætningen gælder for alle

m\times (n-1)

matricer. Lad

A'

betegne

m\times (n-1)

matricen som fremkommer fra

A

ved at slette sidste søjle i

A

. Hvis nu

B

C

er to RREF, som begge hører til

A

, kan vi antage at de stemmer overens på de første

n-1

søjler.

Stop! Hvorfor kan vi antage det?

Jo, fordi hvis vi tilsvarende sletter de sidste søjler i

B

C

får vi to

m\times (n-1)

matricer

B'

C'

. Og

B'

C'

er begge RREF for

A'

. Ifølge vores induktionsantagelse er dermed

B'=C'

B

C

kan kun adskille i den sidste søjle, så vores opgave er at vise at også de to sidste søjler er ens, det vil sige at

B^n=C^n

. Vi skelner nu mellem to tilfælder. Det første tilfælde er at både

B^n

C^n

er pivotsøjler. Det andet tilfælde er at enten

B^n

ikke er en pivotsøjle i

B

, eller at

C^n

ikke er en pivotsøjle i

C

. Vi giver et argument der viser at

B=C

i det første tilfælde, og et helt andet argument der viser at

B=C

i det andet tilfælde. Tilsammen beviser de to argumenter sætningen.

Bevis for at B og C er ens i det første tilfælde

Antag at

B^n

C^n

begge er pivotsøjler. Vi kigger først på

B

. Vi bemærker at pivotsøjlen

B^n

er bestemt af

B'

. Hvis vi kender

B'

og ved at den sidste søjle er en pivotsøjle, så kender vi også

B

. Pivotelementet står nemlig i den første række i

B

der er en nullrække i

B'

Sådan her:

\begin{pmatrix} 1&0&6&0& 0\\ 0&1&0&3&0\\ 0&0&0&0&\color{red}1\\ 0&0&0&0&0 \end{pmatrix}

På den samme måde er

C

bestemt af

C'

, fordi vi ved at

C^n

er en pivotsøjle. Men da

B'=C'

følger det at

B=C

Bevis for at B og C er ens i det andet tilfælde

Enten er den sidste række i

B

eller den sidste række i

C

ikke en pivotsøjle. Der er ikke forskel på

B

C

i antagelserne, så vi kan også lige så godt antage at det er

B^n

der ikke er en pivotsøjle. Det efterfølgende argument virker lige så fint for

C

, vi skifter bare

B

ud mod

C

i notationen. Vi antager altså at

B^n

ikke er en pivotsøjle. Da den sidste række i

B

ikke er en pivotsøjle, kan vi finde ifølge bemærkning 4.27 finde en løsning

u

til vektorligningen

Bu=0

som opfylder at

u_n\neq 0

. Nu er

B

C

RREF til den samme matrix

A

, så hvis

Bu=0

er også

Au =0

Cu=0

, og dermed

(B-C)u=0

. Siden

B'=C'

befinder sig de eneste elementer i

B-C

der er forskellige fra 0 i den sidste søjle. Hvis vi tager højde for dette og udfører matrixmultiplikationen får vi

0=(B-C)u=(B^n-C^n)\color{red}(u_n)\color{black}=u_n(B^n-C^n)

Her er

\color{red}(u_n)\color{black}

1\times 1

matrix. Da

u_n\neq 0

har vi lov til at dividere med

u_n

. Vi får at

B^n-C^n=0

, og dermed er vi færdige.

Eksempel

Et eksempel til illustration af proceduren i beviset kunne være

A = \begin{pmatrix} 0 & 1 & 1 & 1 & 1\\ 0 & 0 & 1 & 1 & 1\\ 0 & 0 & 1 & 1 & 0 \end{pmatrix},

hvor

j = 2

. Her er

B = \begin{pmatrix} 0 & 0 & 1 & 1 & 1\\ 0 & 0 & 1 & 1 & 0 \end{pmatrix}

og dermed

H = \begin{pmatrix} 0 & 0 & 1 & 1 & 0\\ 0 & 0 & 0 & 0 & 1 \end{pmatrix}.

Derfor bliver

C = \begin{pmatrix} 0 & 1 & 1 & 1 & 1\\ 0 & 0 & \color{red}{1} & 1 & 0\\ 0 & 0 & 0 & 0 & \color{red}{1} \end{pmatrix}

og de markerede pivotelementer ovenfor bruges ved Gauss elimination til at give den endelige RREF

\begin{pmatrix} 0 & 1 & 0 & 0 & 0\\ 0 & 0 & 1 & 1 & 0\\ 0 & 0 & 0 & 0 & 1 \end{pmatrix}.

4.5.1 Løsning af ligninger ved hjælp af RREF

Hvis en

m\times n

matrix

R

er på RREF er ligningssystemet

R \mathbf x = \mathbf b

med

m

ligninger og

n

variable specielt nemt at gå til. Pivotelementerne i

R

er de eneste indgange i deres søjle

\neq 0

. Deres søjlenumre

B

svarer til de såkaldte bundne variable. De øvrige søjlenumre

F

svarer til de såkaldte frie variable. Vi samler de frie variable i en vektor

\mathbf x_F

, og de bundne variable i en anden vektor

\mathbf x_B

. Lad os se på et konkret eksempel. Lad

R= \begin{pmatrix} 0 & 1 & 2 & 0 & 0 & 1\\ 0 & 0 & 0 &1 & 0 & 1\\ 0 & 0 & 0 & 0 & 1 & 3 \end{pmatrix}

Da er

R

på RREF, og de tre pivoter står i søjlerne med nummer

2,4,5

. Hvis vi vil løse en ligning

R\mathbf x=\mathbf b

, så er

\mathbf x=(x_1,x_2,x_3,x_4,x_5.x_6)^T

, de bundne variable er

x_2,x_4,x_5

og de frie variable er

x_1,x_3,x_6

. Vi skriver altså

\mathbf x_F=(x_1,x_3,x_6)^T

\mathbf x_B=(x_2,x_4,x_5)^T

. Vi laver nu en lille omsortering af søjlerne i

R

. Vi flytter de tre pivot søjle foran. De resterende søjler der svarer til bundne variable samler vi til en matrix vi kalder

R'= \begin{pmatrix} 0&2&1\\ 0&0&1\\ 0&0&3 \end{pmatrix} .

Nu ser vi at følgende to ligninger er fuldstændigt ensbetydende:

\begin{pmatrix} 0 & 1 & 2 & 0 & 0 & 1\\ 0 & 0 & 0 &1 & 0 & 1\\ 0 & 0 & 0 & 0 & 1 & 3 \end{pmatrix} \begin{pmatrix} x_1\\ x_2\\ x_3\\ x_4\\ x_5\\ x_6 \end{pmatrix}= \begin{pmatrix} b_1\\ b_2\\ b_3 \end{pmatrix}

\begin{pmatrix} 1 & 0 & 0 & 0 & 2 & 1\\ 0 & 1 & 0 & 0 & 0 & 1\\ 0 & 0 & 1 & 0 & 0 & 3 \end{pmatrix} \begin{pmatrix} x_2\\ x_4\\ x_5\\ x_1\\ x_3\\ x_6 \end{pmatrix}= \begin{pmatrix} b_1\\ b_2\\ b_3 \end{pmatrix}

Formuleret i matrixsprog siger det at ligningen

A=\mathbf b

er ensbetydende med at

I_3\mathbf x_B+R'\mathbf x_F=\mathbf b

som er ensbetydende med at

\mathbf x_B=\mathbf b-R'\mathbf x_F.

For eksempel er

\mathbf x = (x_1, x_2, x_3, x_4, x_5, x_6)^T

en løsning til

\begin{pmatrix} 0 & 1 & 2 & 0 & 0 & 1\\ 0 & 0 & 0 &1 & 0 & 1\\ 0 & 0 & 0 & 0 & 1 & 3 \end{pmatrix} v = \begin{pmatrix} 1 \\ 2 \\ 3 \end{pmatrix}

hvis og kun hvis

\begin{pmatrix} x_2 \\ x_4 \\ x_5 \end{pmatrix} = \begin{pmatrix} 1 \\ 2 \\ 3 \end{pmatrix} - \begin{pmatrix} 0 & 2 & 1\\ 0 & 0 & 1\\ 0 & 0 & 3 \end{pmatrix} \begin{pmatrix} x_1 \\ x_3 \\ x_6 \end{pmatrix}.

Her er

x_2, x_4, x_5

de bundne variable og

x_1, x_3, x_6

de frie variable. Skrevet som ligninger svarer dette til ligningssystemet

\begin{matrix} &x_2 &+ &2x_3 & && &&+ &x_6 &= &1\\ && && &x_4 & &&+ &x_6 &= &2\\ && && && &x_5&+ &3x_6 &= &3 \end{matrix}

med løsningsformlerne

\begin{aligned} x_2 &= 1 - 2x_3 - x_6\\ x_4 &= 2 - x_6\\ x_5 &= 3 - 3 x_6. \end{aligned}

Læg mærke til at

x_1

er en fri variabel, som her ikke indgår i formlerne for

x_2, x_4, x_5

Det betyder, for eksempel, at hvis

R

er en matrix på RREF, og hvis en søjle i matricen

R

med søjlenummer

i

ikke indeholder en pivot, så findes der en søjlevektor

\mathbf u

så at hver indgang i

\mathbf u

opfylder at

u_i=1

, og desuden sådan at

R\mathbf u=0

Opgave

Vi har allerede brugt denne bemærkning i beviset for den vigtige sætning (4.25). Men måske var det snyd at vi brugte et resultat der står senere i teksten? Lidt som at rejse tilbage i tiden og give sig selv de rigtige lottotal? Argumentér for at vi ikke har snydt (eller argumentér alternativt for at vi har snydt).

Kommentarer/spørgsmål?

4.6 Elementære matricer

Vi vil nu omfortolke rækkeoperationer ved hjælp af matrixmultiplikation. Hver af de tre typer af rækkeoperationer som vi beskrev i begyndelsen af 4.4 svarer til multiplikation fra venstre med en matrix af en bestemt type. For eksempel er ombytning af rækkke 1 med række 2 i en

3\times n

matrix det samme som multiplikation fra venstre med

\begin{pmatrix} 0 & 1 & 0\\ 1 & 0 & 0\\ 0 & 0 & 1 \end{pmatrix}.

Multiplikation af den anden række med 5 er detsamme som produkt med

\begin{pmatrix} 1 & 0 & 0\\ 0 & 5 & 0\\ 0 & 0 & 1 \end{pmatrix},

og operationen at gange den tredie række med

-3

og lægge den til den første række er detsamme som multiplikation med matricen

\begin{pmatrix} 1 & 0 & -3\\ 0 & 1 & 0\\ 0 & 0 & 1 \end{pmatrix}.

Eksempel

For eksempel giver udtrykket for matrixmultiplikation

\begin{aligned} &\begin{pmatrix} 1 & 0 & -3\\ 0 & 1 & 0\\ 0 & 0 & 1 \end{pmatrix} \begin{pmatrix} a & b & c\\ d & e & f\\ g & h & i \end{pmatrix} \\ =&\begin{pmatrix} 1*a+0*d-3*g & 1*b+0*e-3*h & 1*c+0*f-3*i\\ 0*a+1*d+0*g & 0*b+1*e+0*h & 0*c+1*f+0*i\\ 0*a+0*d+1*g & 0*b+0*e+1*h & 0*c+0*f+1*i \end{pmatrix}\\ =& \begin{pmatrix} a -3g& b-3h & c-3i\\ d & e & f\\ g & h & i \end{pmatrix} \end{aligned}

Opgave

Vis de resterende to af de ovenstående påstande for

3\times 3

matricer ved direkte udregning!

Vi siger at en elementær matrix fremkommer ved at udføre præcis en rækkeoperation på den kvadratiske

m\times m

identitetsmatrix

I_m

. Hvis denne rækkeoperation er givet ved at multiplicere fra venstre med en matrix

E

, er den tilhørende elementære matrix altså

EI_m=E

. Vi indfører betegnelser for de tre typer af elementære matricer. Lad

P_{rs}

være den matrix der fremkommer fra identitetsmatricen ved at bytte om på rækkerne med nummer

r

respektive

s

. Vi lader

D_i(\lambda)

betegne matricen, som fremkommer ved at gange

i

-te række i identitetsmatricen af orden

m

med

\lambda

. Dette er stadig en diagonal matrix, lige som enhedsmatricen, det vil sige at hvis

j\neq k

D_i(\lambda)_{jk}=0

. Til sidst lader vi

E_{ij}(\lambda)

betegne den elementære matrix, som fremkommer fra identitetsmatricen af orden

m

ved at gange

j

-te række med

\lambda

og addere til

i

-te række. Denne matrix er lig identitetsmatricen med undtagelse af at der i indgangen i

i

-te række og

j

-te søjle står

\lambda

i stedet for

0

Quiz

Lad

A= \begin{pmatrix} 1 &1\\ 0&3.14 \end{pmatrix}

Hvad gælder om

A

A=P_{12}

A=D_{1}(2)

A=E_{12}(1)

A

er ikke en elementær matrix.

Lad

A= \begin{pmatrix} 1 &1\\ 0&1 \end{pmatrix}

Hvad gælder om

A

A=P_{12}

A=D_{1}(2)

A=E_{12}(1)

A

er ikke en elementær matrix.

Tre

Lad

A= \begin{pmatrix} 1 &0\\ 0&2 \end{pmatrix}

Hvad gælder om

A

A=P_{12}

A=D_{1}(2)

A=E_{12}(1)

A

er ikke en elementær matrix.

Fire

Lad

A= \begin{pmatrix} 1 &0&0\\ 0&1&0 \end{pmatrix}

Hvad gælder om

A

A=P_{23}

A=D_{1}(1)

A=E_{12}(1)

A

er ikke en elementær matrix.

Fem

Lad

A= \begin{pmatrix} 0&1\\ 1&0 \end{pmatrix}

Hvad gælder om

A

A=P_{12}

A=D_{2}(2)

A=E_{12}(1)

A

er ikke en elementær matrix.

Seks

Lad

A= \begin{pmatrix} 1 &0\\ 0&2 \end{pmatrix}

Hvad gælder om

A

A=P_{12}

A=D_{2}(2)

A=E_{12}(1)

A

er ikke en elementær matrix.

Syv

Lad

A= \begin{pmatrix} 0 &0&1\\ 0&1&0\\ 1&0&0 \end{pmatrix}

Hvad gælder om

A

A=P_{13}

A=D_{2}(1)

A=E_{12}(0)

A

er ikke en elementær matrix.

Otte

Lad

A= \begin{pmatrix} 1 &0&0\\ 0&3.14&0\\ 0&0&1 \end{pmatrix}

Hvad gælder om

A

A=P_{12}

A=D_{2}(3.14)

A=E_{12}(3.14)

A

er ikke en elementær matrix.

At udføre en rækkeoperation på en $m\times n$ matrix $A$ svarer til at gange den tilsvarende elementære $m\times m$ matrix på fra venstre.
En elementær matrix svarende til en rækkeoperation er invertibel. Dens inverse matrix er den elementære matrix svarende til den inverse rækkeoperation.

Bevis

Vi begynder med at bevis for (α). Vi betragter først tilfældet at

A

er en

m\times 1

matrix, det vil sige at

A

er en søjlevektor. For at spare på det dyrbare papir plejer man at skrive en søjlevektor som

(v_1,v_2,\ldots,v_m)^T

hvor

T

står for transponering, og gamle vaner er svære at give slip på selv når man skriver for skærmen. Nu regner vi ved at bruge formlen for matrixmultiplikation. Følgende to produkter er nemme at beregne:

\begin{aligned} P_{ij}(v_1,v_2,\ldots,v_m)^T&=(\ldots,v_{i-1},v_j,v_{i+1},\ldots,v_{j-1},v_i,v_{j+1},\ldots)^T\\ D_i(\lambda)(v_1,v_2,\ldots,v_m)^T&=(\ldots,v_{i-1},\lambda v_i,v_{i+1},\ldots)^T \end{aligned}

Vi er lidt mere forsigtige i det tredie tilfælde.

E_{ij}(\lambda)(v_1,v_2,\ldots,v_m)^T=(w_1,\ldots,w_m)

hvor

w_r=\sum_s E_{ij}(\lambda)_{rs}v_s

Hvis

r\neq i

E_{ij}(\lambda)_{rs}=0

for

r\neq s

, så at

w_r=E_{ij}(\lambda)_{rr}v_r=1\cdot v_r=v_r.

Hvis

r=i

så er

E_{ij}(\lambda)_{is}=0

for

s\neq i

eller

s\neq j

, så at

w_r=E_{ij}(\lambda)_{ri}v_i+E_{ij}(\lambda)_{rj}v_j=1\cdot v_i+\lambda\cdot v_j=v_i+\lambda v_j

Det vil sige,

E_{ij}(\lambda)(v_1,v_2,\ldots,v_m)^T=(\ldots,v_{i-1},v_i+\lambda v_j,v_{i+1},\ldots)^T

Vi ser at i alle tre tilfælder er multiplikation med en elementær matrix

EA

detsamme som den tilsvarende rækkeoperation, hvis

A

er en søjlevektor. I det generelle tilfælde kan vi skrive matricen

A

som opbygget af søjlevektorer af højde

m

, og bruge 4.9

\begin{aligned} A&=(A_1,\ldots, A_n)\\ EA&=(EA_1,\ldots,EA_n) \end{aligned}

Ifølge specialtilfældet brugt på hver søjle

A_i

, så fremkommer

EA

fra

A

ved at bruge den samme rækkeoperation på hver søjle i

A

. Men det er det samme som at bruge søjleoperationen på

A

. Nu ser vi på del (β). Hvis

E_1,E_2

er en elementære matricer der svarer til inverse søjleoperationer, så er

E_1E_2=E_1E_2 I_m

den matrix der fremkommer ved at udføre først søjleoperationen der svarer

E_2

på identitetsmatricen, og derefter udføre søjleoperationen der svarer til

E_1

på resultatet. Da disse søjleoperationer er inverse, ender vi med at få identitetsmatricen tilbage, det vil sige at

E_1E_2=I_m

. Tilsvarende er

E_2E_1=I_m

, så at

E_1

E_2

er inverse matricer.

Nu er vi endelig i stand til at gengive en algoritme til at udregne den inverse matrix.

n\times n

matrix

A

er invertibel hvis og kun hvis dens RREF er

I_n

. Hvis

A

er invertibel er RREF for

n\times (2n)

matricen

\left(A | I_n\right)

lig med

n\times (2n)

matricen

\left(I_n | A^{-1}\right).

Bevis

n\times n

matrix på RREF som ikke er identitetsmatricen bliver nødt til at indeholde en nulrække. Med andre ord, hvis en matrix på RREF er invertibel, så er den nødt til at være identitetsmatricen. Lad os antage at

A

er invertibel. Som for enhver anden matrix kan vi finde et produkt

E

af elementære matricer så

E A

er RREF for

A

, men da

E

E A

er invertible bliver denne RREF altså nødt til at være lig identitetsmatricen. Modsat hvis matricen har RREF lig identitetsmatricen så findes et produkt

F

af elementære matricer så

F A = I_n

A

er invertibel med

A^{-1} = F

, da

F

som produkt af elementære matricer er invertibel. Den sidste påstand følger ved at gange matricen

F

ovenfor på matricen

(A | I_n)

. Dette matrixprodukt giver

(FA | FI_n)=(I_n | F)

. Da multiplikation med

F

fra venstre giver rækkereduktion, og da

(I_n | F)=(I_n| A^{-1})

er på RREF, er

(I_n,A^{-1})

den entydigt bestemte RREF af

(A| I_n)

Ovenstående sætning giver en metode til at udregne den inverse matrix.

Kommentarer/spørgsmål?

Lad

A

være en

n\times n

matrix. Så er

A

invertibel hvis og kun hvis ligningssystemet

A \mathbf v = \mathbf 0

kun har løsningen

\mathbf v=\mathbf 0

Bevis

Hvis

A

er invertibel fås

A \mathbf v = \mathbf 0\Rightarrow A^{-1} (A \mathbf v) = A^{-1}\mathbf 0 =\mathbf 0 \Rightarrow (A^{-1} A) \mathbf v = \mathbf 0 \Rightarrow \mathbf v = \mathbf 0.

Hvis

A

ikke er invertibel kan vi rækkereducere

A

til en matrix

B

med en nulrække til sidst (se Sætning 4.33 og Opgave 4.8.12). Men her gælder

A \mathbf v = \mathbf 0 \Leftrightarrow B \mathbf v = \mathbf 0

og ligningsystemet

B \mathbf v = \mathbf 0

har en løsning

\neq \mathbf 0

, fordi det har mindst en fri variabel svarende til at den sidste søjle ikke indeholder et pivotelement (se afsnit 4.5.1).

4.7 Egenvektorer og egenværdier for en matrix

I eksemplet med stokastiske matricer havde vi brug for at udregne potenser

P^2, P^3, \ldots

af en matrix

P

. Hvis

P

er en kvadratisk diagonalmatrix er disse operationer meget mere overkommelige.

Hvis

D = \begin{pmatrix} \lambda_1 & 0 & \ldots & 0\\ 0 & \lambda_2 & \ldots & 0\\ \vdots & \vdots &\ddots &\vdots\\ 0 & 0 & \ldots & \lambda_n \end{pmatrix}

er en kvadratisk diagonalmatrix, så er

D^m = \begin{pmatrix} \lambda_1^m & 0 & \ldots & 0\\ 0 & \lambda_2^m & \ldots & 0\\ \vdots & \vdots &\ddots &\vdots\\ 0 & 0 & \ldots & \lambda_n^m \end{pmatrix}.

Det vil sige en kvadratisk diagonalmatrix opløftes til en potens ved at opløfte diagonalelementerne til potensen.

Bevis

Definition 4.1 (af matrixmultiplikation) for to diagonalmatricer giver

\begin{pmatrix} \lambda_1 & 0 & \ldots & 0\\ 0 & \lambda_2 & \ldots & 0\\ \vdots & \vdots &\ddots &\vdots\\ 0 & 0 & \ldots & \lambda_n \end{pmatrix} \begin{pmatrix} \mu_1 & 0 & \ldots & 0\\ 0 & \mu_2 & \ldots & 0\\ \vdots & \vdots &\ddots &\vdots\\ 0 & 0 & \ldots & \mu_n \end{pmatrix} = \begin{pmatrix} \lambda_1 \mu_1 & 0 & \ldots & 0\\ 0 & \lambda_2 \mu_2 & \ldots & 0\\ \vdots & \vdots &\ddots &\vdots\\ 0 & 0 & \ldots & \lambda_n \mu_n \end{pmatrix}.

Formlen for

D^m

er en konsekvens af dette.

Det betaler sig at lave

P

om til en diagonalmatrix for at udregne

P^m

og jeg vil her kort forklare hvordan dette ofte kan lade sig gøre.

4.7.1 Konjugering

For en invertibel matrix

T

findes den inverse matrix

T^{-1}

og udregningen

T^{-1} A T

giver mening for en kvadratisk matrix

A

med samme antal rækker som

T

. Denne operation kaldes konjugering med

T

og matricen

T^{-1} A T

kaldes en konjugeret matrix til

A

Quiz

Lad

T = \begin{pmatrix} \lambda_1 & 0 \\ 0 & \lambda_2 \end{pmatrix}\qquad\mathrm{og}\qquad A = \begin{pmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{pmatrix},

hvor

\lambda_1\neq 0

\lambda_2\neq 0

. Lad

B = T^{-1} A T

. Hvad er rigtigt af nedenstående?

B = \begin{pmatrix} a_{11} & \frac{\lambda_2}{\lambda_1} a_{12} \\ \frac{\lambda_1}{\lambda_2} a_{21} & a_{22} \end{pmatrix}.

B = \begin{pmatrix} \frac{\lambda_2}{\lambda_1} a_{11} & a_{12} \\ \frac{\lambda_1}{\lambda_2} a_{21} & a_{22} \end{pmatrix}.

A T = T A.

B = A

hvis

\lambda_1 = \lambda_2

Konjugering viser sig at være central i lineær algebra. Lad os se på et eksempel. Lad os antage et øjeblik at matricen

P

kan konjugeres til en diagonalmatrix det vil sige vi kan finde en invertibel matrix

T

så

T^{-1} P T = D,

hvor

D

er en diagonalmatrix. Så vil

P = T D T^{-1}

og dermed

P^2 = (T D T^{-1}) (T D T^{-1}) = T D (T^{-1} T) D T^{-1} = T D^2 T^{-1}.

Nøjagtig den samme udregning kan laves ikke bare for potensen

2

, men for en generel potens

m

P^m = T D^m T^{-1}.

Det Vil Sige hvis vi er så heldige at finde en invertibel matrix

T

, således at

T^ {-1} P T

er en diagonalmatrix, så kan vi udregne potenser af

P

meget nemmere end ved almindelig matrixmultiplikation. Der er slet ikke sikkert at

T

findes, men vi kan prøve på at analysere hvad matricen

P

skal opfylde for at det lader sig gøre.

Lad

P

være en

n\times n

matrix,

T

en invertibel

n\times n

matrix med søjlevektorer

\mathbf v_1, \ldots, \mathbf v_n

D

diagonalmatricen

D = \begin{pmatrix} \lambda_1 & 0 & \ldots & 0\\ 0 & \lambda_2 & \ldots & 0\\ \vdots & \vdots &\ddots &\vdots\\ 0 & 0 & \ldots & \lambda_n \end{pmatrix}.

Så gælder

T^{-1} P T = D

hvis og kun hvis

P \mathbf v_i = \lambda_i \mathbf v_i

for

i = 1, \ldots, n

Bevis

T^{-1} P T = D

gælder hvis og kun hvis

P T = T D

. Per definition af matrixmultiplikation følger det at søjlevektorerne i

P T

P \mathbf v_i

for

i=1, \ldots, n

samt at de tilsvarende søjlevektorer i

T D

\lambda_i \mathbf v_i

Disse overvejelser leder frem til følgende definitioner.

Lad

P

være en kvadratisk matrix.

$P$ kaldes diagonaliserbar hvis der findes en invertibel matrix $T$ så $T^{-1} P T$ er en diagonalmatrix.
En vektor $\mathbf v$ kaldes en egenvektor for $P$ , hvis $\mathbf v\neq \mathbf 0$ og $P \mathbf v = \lambda \mathbf v,$ for et tal $\lambda$ (som gerne må være 0). Dette tal kaldes for en egenværdi for $P$ og $\mathbf v$ siges at være en egenvektor hørende til $\lambda$ .

Det er ikke oplagt med vores viden nu om en matrix overhovedet har endeligt mange egenværdier eller hvordan man bærer sig ad med at regne egenværdier ud. Lad os prøve at kigge på

2\times 2

matricer.

4.7.2 Hvad sker der for små matricer?

At finde egenværdier for en kvadratisk

n\times n

matrix

A

kan omformuleres til at at finde et tal

\lambda

(en egenværdi), så der findes en vektor

\mathbf v\neq \mathbf 0

med

A \mathbf v = \lambda \mathbf v

. Dette er det samme som at der findes en vektor

\mathbf v\neq \mathbf 0

med

(A - \lambda I_n) \mathbf v = 0. \tag{4.16}

Lad os i dette lille afsnit foregribe begivenhedernes gang ved at kigge på en

2\times 2

matrix

B = \begin{pmatrix} b_{11} & b_{12}\\ b_{21} & b_{22} \end{pmatrix}

og spørgsmålet: Hvornår findes en vektor

\mathbf v\neq 0

så

B \mathbf v = 0

? Vi ved fra Sætning 4.34 at dette forekommer præcis når

B

ikke er invertibel. Samtidig ved vi fra Sætning 4.33 at

B

er invertibel hvis og kun

B

er rækkeækvivalent med identitetsmatricen. Lad os eksperimentere: Hvis både

b_{11}

b_{21}

0

kan

B

ikke være invertibel. Hvis

b_{11}\neq 0

så er

B = \begin{pmatrix} b_{11} & b_{12}\\ b_{21} & b_{22} \end{pmatrix} \sim \begin{pmatrix} b_{11} & b_{12}\\ 0 & b_{22} - \frac{b_{21}} {b_{11}} b_{12} \end{pmatrix}

og dermed er

B

invertibel hvis og kun hvis

b_{11} \left(b_{22} - \frac{b_{21}}{b_{11}} b_{12}\right) = b_{11} b_{22} - b_{21} b_{12} \neq 0.

Samme betingelse gør sig gældende ved rækkereduktioner ud fra antagelsen

b_{21}\neq 0

. Vi kalder

b_{11} b_{22} - b_{21} b_{12}

for determinanten for

B

og betegner den

\det(B)

. Nu kan vi svare på hvornår

\begin{pmatrix} a_{11} -\lambda & a_{12}\\ a_{21} & a_{22}-\lambda \end{pmatrix} v = 0

har en løsning

v\neq 0

for en

2\times 2

matrix

A = \begin{pmatrix} a_{11} & a_{12}\\ a_{21} & a_{22} \end{pmatrix}

i (4.16). Dette gælder hvis og kun hvis

\det \begin{pmatrix} a_{11} -\lambda & a_{12}\\ a_{21} & a_{22}-\lambda \end{pmatrix} = \lambda^2 - (a_{11} + a_{22}) \lambda + \det(A) = 0. \tag{4.17}

Polynomiet i (4.17) kaldes for det karakteristiske polynomium hørende til

A

. Det vi har vist er altså at en

2\times 2

matrix

A

har mindst en egenvektor hørende til egenværdien

\lambda

hvis og kun hvis

\lambda

er en rod i det karakteristiske polynomium. I næste kapitel kommer vi ind på hvad der sker for større matricer ved at definere determinanten af en generel

n\times n

matrix.

4.7.3 Differentialligninger som eksempel

Egenværdier og egenvektorer er ekstremt nyttige ved løsning af koblede differentialligninger som

\begin{aligned} x'_1(t) &= a x_1(t) + b x_2(t)\\ x'_2(t) &= c x_1(t) + d x_2(t), \end{aligned}\tag{4.18}

hvor

a, b, c, d\in \mathbb{R}

. Tilfældet med kun en ubekendt funktion kendes fra radioaktivt henfald. Her støder vi på differentialligningen

x'(t) = \lambda x(t),

som har løsningen

x(t) = C e^{\lambda t}

, hvor

C

er en konstant. Hvis man arbejder ud fra hypotesen om at (4.18) har løsninger af formen

x_1(t)= A e^{\lambda t}\qquad\mathrm{og}\qquad x_2(t) = B e^{\lambda t}

så kan man indsætte i (4.18) og komme frem til at

\begin{pmatrix} A \\ B\end{pmatrix}\quad \mathrm{er en egenvektor for}\quad \begin{pmatrix} a & b\\ c & d \end{pmatrix}

hørende til egenværdien

\lambda

. Dette er gennemgået i videoen nedenfor.

Kommentarer/spørgsmål?

4.8 Opgaver

4.8.1

Lad

P = \begin{pmatrix} p_{11} & p_{12}\\ p_{21} & p_{22} \end{pmatrix}

være en stokastisk matrix det vil sige alle indgangene i matricen er

\geq 0

p_{11} + p_{21} = 1

samt

p_{12} + p_{22} = 1

. Antag at

p_{21} + p_{12} > 0

og lad

v

være vektoren

\begin{pmatrix} \dfrac{p_{12}}{p_{21} + p_{12}}\\ \\ \dfrac{p_{21}}{p_{21} + p_{12}} \end{pmatrix}

Hvorfor er

P v = v

? Hvordan relaterer det til Eksempel 4.4 om stokastiske matricer?

4.8.2

Lad

A

B

være invertible

n\times n

matricer. Gør detaljeret rede for at

A B (B^{-1} A^{-1}) = I

ved brug af den associative lov.

4.8.3

Forklar hvorfor matricen

\begin{pmatrix} 1 & 4 & 5\\ 2 & 5 & 7\\ 3 & 6 & 9 \end{pmatrix}

ikke er invertibel.

4.8.4

For hvilke tal

x

er matricen

\begin{pmatrix} 1 & 0 & 1\\ x & 1 & 1\\ 3 & 2 & 1 \end{pmatrix}

invertibel.

4.8.5

Lad

A = \begin{pmatrix} 1 & -2 & -7 & -8 & -9\\ 3 & -4 & -13 & -14 & -15 \end{pmatrix}.

Find den reducerede række echelon form for $A$ .
Find samtlige løsninger til ligningssystemet $\begin{aligned} x -2 y -7z - 8 w &= -9 \\ 3x -4 y -13 z - 14 w &= -15. \end{aligned}$

4.8.6

Udregn den inverse matrix til matricen

\begin{pmatrix} i & 1 & 1\\ 1 & i & 1\\ 1 & 1 & -i \end{pmatrix}

og gør rede for alle trin i din beregning.

4.8.7

Skriv matricen

\begin{pmatrix} 5 & 3\\ 3 & 2 \end{pmatrix}

som et produkt af elementære matricer.

4.8.8

Giv alle detaljer i udregningen (4.17).

4.8.9

Lad

A = \begin{pmatrix} 7 & -2 \\ 15 & -4 \end{pmatrix}.

Bestem egenværdierne for

A

og egenværdierne for

A^{10}

. Hvad er egenvektorerne for

A^{10}

? Begrund dine svar.

4.8.10

Find, ved at bruge teorien i dette kapitel, to funktioner

x_1(t), x_2(t): \mathbb{R}\rightarrow \mathbb{R}

som udgør en løsning til systemet

\begin{aligned} x'_1(t) &= x_1(t) + x_2(t)\\ x'_2(t) &= -x_1(t) + x_2(t), \end{aligned}

af differentialligninger og som opfylder

x_1(0) = 1

x_2(0) = 0

. Skitser din metode grundigt og henvis kun til materialet i disse noter.

4.8.11

I udregningen (4.6) i eksemplet om stokastiske matricer er der urent trav i forklaringerne. Hvad er der galt?

4.8.12

Gør rede for at en kvadratisk matrix forskellig fra identitetsmatricen bliver nødt til at indeholde en nulrække hvis den er på RREF.

4.8.13

Lad

A

B

være to

2\times 2

matricer. Er det rigtigt at

(A+B)^2 = (A+B)(A+B) = A^2 + B^2 + 2 A B?

Hvad med

(A + B)(A - B) = A^2 - B^2?