11Spektralsætning og Hermitiske matricer

Vi husker fra Kapitel 9, at for en matrix kan vi definere dens adjungerede ved
I dette kapitel skal vi se på en helt særlig klasse af matricer, opkaldt efter Charles Hermite.
  1. Matrix kaldes Hermitisk (eller selvadjungeret) hvis
  2. Reel matrix kaldes symmetrisk hvis
Bemærk, en symmetrisk matrix er Hermitisk, men det modsatte er kun sandt hvis matricen er reel.
Matricen
er et eksempel på en Hermitisk matrix, prøv selv at tjekke efter ved at finde dens adjungerede. Prøv at overvise jer selv om, hvorfor diagonalelementerne i en Hermitisk matrix bliver nødt til at være reelle.
Matricen
er et eksempel på en symmetrisk matrix (som naturligvis derfor også er Hermitisk).
Blandt de komplekse matricer fortjener de Hermitiske en særstatus. Det viser sig, at disse altid er diagonaliserbare, og endda ved brug af en ONB bestående af egenvektorer. Dette resultat kaldes spektralsætningen, og er et af højdepunkterne i noterne. Husk på, normalt kan man ikke forvente, at en matrix er diagonaliserbar. For eksempel er matricen
ikke diagonaliserbar.
Før vi når til diagonalisering af Hermitiske matricer, skal vi se nogle pæne egenskaber for deres egenværdier og egenvektorer.

11.1 Egenværdier og egenvektorer for Hermitiske matricer

En meget vigtig observation er, at selvom Hermitiske matricer generelt har komplekse tal som indgange, er deres egenværdier reelle tal og egenvektorer hørende til forskellige egenværdier er ortogonale. Dette er en meget stærk anvendelse af det indre produkt, og faktisk er beviset slet ikke kompliceret.
Lad være en Hermitisk matrix. Så er egenværdierne for reelle tal.
Lad være egenværdier for Hvis er en egenvektor hørende til og en egenvektor hørende til så gælder
Det vil sige, at egenvektorer hørende til forskellige egenrum for er ortogonale.
Bevis
For en egenvektor hørende til egenværdi har vi
Dermed er og vi må have fordi og dermed
Samme type argument giver ortogonaliteten af egenvektorerne og (dette er også et særtilfælde af Opgave 9.14):
Denne identitet medfører ligningen
hvoraf da
At egenværdierne for en Hermitisk matrix er reelle, skyldes symmetrien i matricen, for eksempel har
ikke reelle egenværdier. Faktisk er det ret utroligt, at hvis man stanger en vilkårlig symmetrisk matrix ud, som for eksempel
kan dens karakteristiske polynomium kun kan have reelle rødder. Det er en af konsekvenserne af Sætning 11.3.
Det er dog vigtigt at huske på, at Sætning 11.3 kun giver ortogonalitet for egenvektorer hørende til forskellige egenrum. Hvis den geometriske multiplicitet af en egenværdi er større end én, så bliver vi stadig nødt til at anvende Gram-Schmidt algoritmen (Sætning 9.10) for at finde ortogonale egenvektorer for dette egenrum.

11.2 Schur dekomposition

Den matematiske indgang til diagonalisering af Hermitiske matricer, er et klassisk resultat af Issai Schur. Hvis du kigger fremad til beviset for spektralsætningen (Sætning 11.9), vil du helt klart opdage meningen med resultatet nedenfor som kaldes Schur dekomposition.
Lad være en kvadratisk matrix. Der eksisterer en unitær matrix
er en øvre trekantsmatrix.
Bevis
Vi beviser resultatet med induktion. Det er sandt for matricer med Antag nu, at resultatet er sandt for matricer, så skal vi vise at dette medfører resultatet for matricer.
Lad for en egenværdi og hvor Korollar 6.20 og Gram-Schmidt algoritmen (Sætning 9.10) kan udvide med vektorer således at udgør en ONB for Vi definerer en unitær matrix ved Bemærk at
viser, at første søjle af er Så matricen har følgende blok-struktur:
hvor er , er og er en nulvektor.
Fra induktionsantagelsen findes en unitær matrix således at er en øvre trekantsmatrix. Nu udvider vi til en matrix på følgende måde:
Nullerne i søjlerne hvor indgår påvirker ikke normerne af søjlevektorerne, og tydeligvis er første søjle af ortogonal med de resterende søjler. Da er unitær har den ortonormale søjler (Proposition 9.19), og dermed er også unitær.
Vi ser på hvor vi udnytter blok-strukturerne for matricerne:
Da er en øvre trekantsmatrix, er også
en øvre trekantsmatrix. Beviset afsluttes, da produktet af unitære matricer igen giver en unitær matrix (Opgave 11.4), så vi kan bruge

11.2.1 Determinant og spor fra egenværdier

Udover at Schur dekomposition kan anvendes til at bevise spektralsætningen i næste afsnit, kan den også bruges til andre mindre resultater, der udnytter den pæne struktur i en trekantsmatrix.
Vi starter med at definere sporet (på engelsk: trace) af en matrix.
Lad være en matrix. Sporet af er defineret som summen af diagonalelementerne:
Ud fra definitionen af sporet ses let, at er en lineær afbildning. Men herudover gælder også, at sporet er cyklisk.
For matrix og matrix gælder
Bevis
Fra definitionen af matrixmultiplikation:
hvilket giver resultatet.
Der er en smuk sammenhæng mellem egenværdierne for en matrix, og matricens determinant og spor.
Lad være en kvadratisk matrix med egenværdier (gentaget efter algebraisk multiplicitet). Så gælder
Bevis
For en trekantsmatrix er lig med produktet af diagonalelementerne (Proposition 5.11):
Men egenværdierne for gentaget efter deres algebraiske multipliciteter, står i diagonalen (Opgave 8.8). Dermed er lig produktet af dens egenværdier.
Lad os nu se på en generel matrix Schur dekomposition (Sætning 11.4) fortæller, at der findes en unitær matrix således at er en øvre trekantsmatrix. Specifikt har vi, at og er similære. Fra Opgave 8.15 har og det samme karakteristiske polynomium (og derfor samme egenværdier), samt de har samme determinant. Samlet set er
For sporet har vi fra Proposition 11.6, at

11.2.2 Alle kvadratiske matricer er næsten diagonaliserbare

Den næste konsekvens af Schur dekomposition vi skal se på er, at for enhver kvadratisk matrix eksisterer en diagonaliserbar matrix vilkårligt tæt på Det vil sige, for en given tolerance kan vælges så absolut værdien for indgangene i er mindre end Matematisk kaldes dette, at de diagonaliserbare matricer udgør en tæt delmængde.
De diagonaliserbare matricer udgør en tæt delmængde af de kvadratiske matricer.
Bevis
Lad være vilkårlig. Lad være en kvadratisk matrix, med Schur dekomposition hvor er en øvre trekantsmatrix. Vi lader nu
hvor er en diagonalmatrix, således at samtlige diagonalelementer i er forskellige. Dette kan gøres hvor diagonalelementerne i er vilkårligt små, altså vi kan vælge
Da er similær med en trekantsmatrix, med forskellige diagonalelementer, så gælder af Opgave 8.15, Opgave 8.8 og Proposition 8.14 at er diagonaliserbar.
Vi ser nu fremad mod Kapitel 12, hvor der nævnes i Bemærkning 12.6, at alle matrixnormer er ækvivalente. Så vi vælger den spektrale norm fra (12.9), og regner:
Her brugte vi, at den spektrale norm er unitært invariant (Opgave 12.4). En anvendelse af Proposition 12.7 viser, at for enhver matrix

11.3 Spektralsætningen for Hermitiske matricer

Selvom Schur dekompositionen havde et lidt teknisk bevis, bliver beviset for spektralsætningen tilgengæld ekstremt kort.
Lad være en Hermitisk matrix. Der eksisterer en unitær matrix
er en diagonalmatrix med reelle indgange.
Søjlerne i er en ONB for bestående af egenvektorer for og diagonalen i består af de tilsvarende egenværdier for gentaget efter deres algebraiske multipliciteter.
Hvis er en symmetrisk matrix, kan vælges som en ortogonal matrix.
Bevis
Dette er et smukt og kort bevis, som benytter Schur dekomposition (Sætning 11.4): Der findes en unitær matrix
er en øvre trekantsmatrix. Men er en Hermitisk matrix da
En øvre trekantsmatrix som er Hermitisk, bliver nødt til at være en diagonalmatrix med reelle indgange (Opgave 11.5), hvilket giver resultatet i sætningen. Relationen til egenværdier og egenvektorer for en diagonalisering er kendt fra Kapitel 8.
Antag nu at er symmetrisk, og lad være en egenværdi (som er reel af Sætning 11.3). Så er en reel matrix, og reelle rækkeoperationer overfører denne til sin RREF. Fra Sætning 6.23 og Gram-Schmidt algoritmen (Sætning 9.10), eksisterer en reel ONB for egenrummet Nu kan reelle ONB'er fra hvert egenrum bruges til en diagonalisering, således at bliver en ortogonal matrix i denne konstruktion af Sætning 11.3.
Betragt den symmetriske matrix
Det oplyses, at har egenværdierne og Ud fra dette vil vi finde en ortogonal matrix er en diagonalmatrix, hvilket vi på forhånd ved er muligt af spektralsætningen (Sætning 11.9).
Her er det nok at finde en ONB af egenvektorer for Dette gøres ved at finde en ONB for hvert egenrum, bemærke at egenvektorer hørende til forskellige egenrum for en symmetrisk matrix er ortogonale (Sætning 11.3), og kombinere dem til en ONB for hele (Sætning 9.5 og Sætning 6.18). Vi kigger først på egenværdien Her regner man sig frem til at
er en basis for egenrummet ved at løse ligningssystemet
Se tilbage i Kapitel 6 hvordan dette relaterer sig til RREF af matricen og hvordan man kan finde en basis for
Vi benytter nu Gram-Schmidt algoritmen (Sætning 9.10) på vektorerne i (11.1), og kommer frem til ONB
Nu ved vi at for egenværdien (hvorfor? Hvis du ikke ved dette, kan det være en god ide at genopfriske Kapitel 8). Som ovenfor finder vi at
er en basis for og dermed at
er en ONB for Samlet bliver en ONB for bestående af egenvektorer for Matricen er dermed en ortogonal matrix
som opfylder

11.4 Min-max princip og sammenfletning af egenværdier

For en Hermitisk matrix bemærker vi at
så for ethvert er et reelt tal.
Følgende resultat er en meget berømt sætning, kendt som min-max princippet. Det er en af konsekvenserne af spektralsætningen, og bruges blandt andet til numerisk bestemmelse af egenværdier for Hermitiske matricer.
Lad være en Hermitisk matrix, med egenværdier (gentaget efter algebraisk multiplicitet) i aftagende rækkefølge.
For underrum optimerer vi over enhedsvektorerne i eller :
Så findes ved at minimere (eller maksimere ) blandt alle underrum af en given dimension:
Minimum/maksimum opnås ved hvor udspændes af ortonormale egenvektorer til mens udspændes af ortonormale egenvektorer til
Bevis
Beviset er opdelt, relateret til (min-max) og (max-min), og kan læses uafhængigt af hinanden.
Min-max
Fra spektralsætningen (Sætning 11.9) har en ONB af egenvektorer hvor hører til egenværdi Definer underrummene
Så har vi
Lad med det vil sige
hvor vektoren opfylder af Proposition 9.8. Af ortonormalitet har vi
Vi har også hvor det bemærkes at og Dermed er
Hvis vi kalder
så er af (11.2). Vi mangler at vise
Lad nu være et underrum med Da så må
Lad nu med det vil sige
hvor opfylder Igen, af ortonormalitet får vi
Dermed har vi for alle underrum med og derfor er
Max-min
Fra spektralsætningen (Sætning 11.9) har en ONB af egenvektorer hvor hører til egenværdi Definer underrummene
Så har vi og
Lad med det vil sige
hvor vektoren opfylder af Proposition 9.8. Af ortonormalitet har vi
Vi har også hvor det bemærkes at og Dermed er
Hvis vi kalder
så er af (11.3). Vi mangler at vise
Lad nu være et underrum med Da så må
Lad nu med det vil sige
hvor opfylder Igen, af ortonormalitet får vi
Dermed har vi for alle underrum med og derfor er
Ganske kort kan man fra Sætning 11.11 skrive
hvor navnet min-max princippet bliver åbenlyst.
Dette gør det muligt at vise følgende besynderlige resultat af Augustin-Louis Cauchy, som siger at hvis en matrix fremkommer ved at slette et antal rækker og søjler fra en Hermitisk matrix så vil deres egenværdier være sammenflettede.
Lad være en Hermitisk matrix, og lad fremkomme ved at slette rækker og søjler (samme række- og søjlenumre) fra
Lad være egenværdierne for og lad være egenværdierne for (gentaget efter algebraisk multiplicitet) i aftagende rækkefølge.
Så gælder
Bevis
Vi kan anvende et lige antal række-/søjleombytninger på således at bliver placeret i øverste venstre hjørne af matricen, og således at de tilsvarende operationer på en identitetsmatrix igen giver en identitetsmatrix. Dette ændrer ikke på egenværdierne af Sætning 5.4. Så vi kan antage, at dette allerede er udgangspunktet.
Lad bestå af de første søjler af så er og derved er også en Hermitisk matrix. For udvider vi med nuller i bunden til svarende til
Lad være som i Sætning 11.11, men relateret til matricen Så gælder
hvor Sætning 11.11 blev anvendt først på og dernæst på
Lad nu være som i Sætning 11.11, men relateret til matricen Bemærk, at her. Så har vi
hvor Sætning 11.11 igen først blev anvendt på og dernæst på

11.5 Positiv semidefinit matricer

En vigtig struktur for matricer, som ofte indgår i anvendelser, er positiv semidefinit matricer.
En Hermitisk matrix kaldes positiv definit hvis
kaldes positiv semidefinit hvis "" erstattes med "".
Hvis er positiv (semi)definit, kaldes negativ (semi)definit.
Positiv (semi)definit kan relateres til egenværdierne af via diagonalisering. Fra spektralsætningen (Sætning 11.9) eksisterer unitær matrix og diagonalmatrix med i diagonalen, så
Da er invertibel er hvis og kun hvis, hvor Så har vi
Dermed er en Hermitisk matrix positiv definit præcis hvis alle dens egenværdier er positive, og positiv semidefinit hvis egenværdierne er ikke-negative. Tilsvarende negativ definit hvis egenværdierne er negative, og negativ semidefinit hvis egenværdierne er ikke-positive.

11.5.1 Hessematrix og optimering

For en funktion hvor er en åben mængde og hvor er to gange kontinuert differentiabel, kan vi konstruere en Hessematrix (på engelsk: Hessian), navngivet efter Ludwig Otto Hesse:
Fra vores antagelser kan man ombytte rækkefølgen af de afledede, og derfor er en symmetrisk matrix i hvert punkt.
Lad og lad være en kugle i med centrum i og lille nok radius, så for Så kan vi undersøge funktionsværdierne for når vi går fra i en retning til punktet Her indgår gradienten og Hessematricen i anden ordens approksimationen fra Taylor's sætning i flere variable:
hvor restleddet bruger lille-o notation. Hvis er et indre kritisk punkt, det vil sige så har vi
og nu beskriver hvordan funktionsværdien ændres fra når man bevæger sig en lille smule fra i retning :
  1. Hvis er positiv definit, er for alle retninger og derfor vil vokse i alle disse retninger i en lille omegn omkring (så restleddet er lille nok). Derfor er et isoleret lokalt minimum.
  2. Hvis er negativ definit, er for alle retninger og derfor vil aftage i alle disse retninger i en lille omegn omkring (så restleddet er lille nok). Derfor er et isoleret lokalt maksimum.
  3. Hvis er indefinit, det vil sige matricen både har positive og negative egenværdier, så vil vokse i nogle retninger og aftage i andre retninger. Derfor er et såkaldt saddelpunkt.
Saddelpunkt fra Wikipedia, baseret på en funktion af to variable:
Hvis kun er positiv/negativ semidefinit, kan vi ikke umiddelbart afgøre noget på grund af restleddet. Specifikt, hvis er en egenvektor for en egenværdi 0 for er kun restleddet tilbage med afhængighed af i (11.5). Derfor ved vi ikke (uden at undersøge situationen nærmere) om funktionen vokser, aftager eller er konstant i denne retning.
Hessematricen indgår også i Newton's metode, en særdeles hurtig iterativ numerisk metode, til at bestemme kritiske punkter for en funktion, med kvadratisk lokal konvergens. Mange af de mest popuplære metoder til optimering, som Gauss-Newton, Levenberg-Marquardt og Broyden-Fletcher-Goldfarb-Shanno (BFGS), bruger approksimationer af Hessematricen for at undgå anden ordens afledede, men dog med et tab i konvergenshastighed.

11.5.2 Konjugerede gradienters metode

Hvis er en meget stor matrix (måske med mange tusinde/millioner rækker og søjler), kan det være en uoverskuelig opgave at udregne direkte, og i praksis kan iterative metoder til løsning af meget store lineære ligningssystemer være mere relevante end Gauss elimination.
Mange af sådanne iterative metoder baserer sig på de såkaldte Krylov underrum:
For en positiv definit matrix er en særlig kraftig metode kendt under navnet konjugerede gradienters metode (på engelsk: conjugate gradient method). er invertibel, så til en højreside vil have den entydige løsning Det er en konsekvens af Cayley-Hamilton sætning (Sætning B.13) at
Da er positiv definit, kan defineres et indre produkt på (andet end det Euklidiske indre produkt) ved
Det vil sige, at (11.6) opfylder alle de samme egenskaber som i Proposition 9.2 (det Euklidiske indre produkt svarer til ). Hvis to vektorer og er ortogonale i kaldes de konjugerede med hensyn til Fra det indre produkt kommer også en norm
Konjugerede gradienters metode er følgende. Man starter ud fra residualen og Følgende udføres nu iterativt, hvor et indeks forøges efter hver iteration, startende med :
Nu bemærker vi, at
Derfor er
residualen for den 'te iteration. Hvis undervejs er løsningen, og vi siger at metoden har konvergeret.
Konjugerede gradienters metode konvergerer inden for højst iterationer.
Hvis vi for et indeks har gælder:
  1. Vi har
  2. er indbyrdes ortogonale i det Euklidiske indre produkt, mens er indbyrdes konjugerede med hensyn til
Bevis
Antag at og for hvilket er brugbart for at vise (i) og (ii). Et efterfølgende induktionsbevis viser, at dette følger fra antagelsen
(i): Da og ses ved induktion (udført i flere omgange på formlerne i (11.7)):
Tilsvarende ved induktion på og ovenstående, ses at
(ii): Overvej hvis vi i metoden brugte
som vi nu viser er lig med den i metoden oprindeligt angivne Ud fra (11.8) og definitionen af haves
og er konjugerede. Derfor, ved brug af ovenstående for iteration (samt ved ved vi at ), har vi at
og derfor
Dermed er og ortogonale. Nu bruges
samt ortogonalitet og at er Hermitisk, til at vise
Ved at indsætte definitionen af er som angivet i metoden.
Vi vil nu vise at
Induktionsstarten er allerede vist ovenfor, at er ortogonal med og er konjugeret med Antag derfor, at (11.9) holder for og og med indeks
Vi har allerede ovenfor vist, at er ortogonal med og er konjugeret med så lad Så har vi
og derfor
Vi har også
og derfor
Dette afslutter induktionsbeviset for (11.9).
Til slut vises, at metoden konvergerer inden for iterationer. for og hvis der er lighed holder denne lighed også for alle indeks større end Samtidig er dimensionen af et Krylov underrum maksimalt da det er underrum af Derfor er det største Krylov underrum.
Hvis så må for samt at Men vi har også at for og dermed er Det betyder at
Typisk er man slet ikke interesseret i at anvende helt op til iterationer for store systemer, og man ser sig tilfreds med at være inden for en tilpas lille tolerance på Det kan vises, at der er følgende maksimale relative fejl på iterationerne af metoden (og ofte er fejlen meget lavere):
hvor er det såkaldte konditionstal for som beskriver hvor numerisk stabilt det lineære ligningssystem er; vi definerer og ser nærmere på konditionstallet i Afsnit 12.3.
En kvadratisk funktion (her med reelle matricer/vektorer/skalarer)
hvor er symmetrisk, har gradient
Så at finde et kritisk punkt for en kvadratisk funktion, er ækvivalent med at løse det lineære ligningssystem Dermed kan konjugerede gradienters metode også anvendes til at minimere/maksimere kvadratiske funktioner i flere variable, baseret på en positiv definit matrix. Dette anvendes i sequential quadratic programming (SQP), som kan løse meget generelle ikke-lineære optimeringsproblemer, ved i stedet at løse en følge af optimeringsproblemer med kvadratiske funktioner.
Eksempel fra Wikipedia: Konjugerede gradienters metode (rød) overfor metoden steepest descent (grøn), ved minimering af en kvadratisk funktion i to variable (niveaukurver i blå). Konjugerede gradienters metode konvergerer her i to iterationer.

11.5.3 Positiv kvadratrod og absolut værdi af matricer

Når det kommer til kvadratrødder, opfører positiv semidefinit matricer sig på samme måde som ikke-negative tal. Til ethvert ikke-negativt tal findes en entydig ikke-negativ kvadratrod som løser Tilsvarende kan man snakke om en positiv kvadratrod af en positiv semidefinit matrix
Lad være en positiv semidefinit matrix, med egenværdier (gentaget efter algebraisk multiplicitet). Fra diagonaliseringen af med unitær matrix
defineres den positive kvadratrod af :
Notationen med kommer naturligvis af følgende udregning:
også er positiv semidefinit (og positiv definit, hvis er positiv definit).
Lad og være positiv semidefinit matricer. Hvis er
Bevis
Af spektralsætningen (Sætning 11.9) eksisterer en ONB for bestående af egenvektorer for hørende til egenværdier Dermed har vi
Da er positiv semidefinit, er for Derfor har vi, per konstruktion af :
Af ovenstående er og da er en basis for er
Senere i Afsnit 12.1.1 gøres der rede for, at for enhver matrix er en positiv semidefinit matrix, som derfor har en positiv kvadratrod. Denne kaldes absolut værdien af
Lad være en matrix. Så er absolut værdien af den positiv semidefinit matrix

11.5.4 Dekompositioner med positiv semidefinit matricer

I numerisk løsning af lineære ligningssystemer bruges typisk dekompositioner med trekantsmatricer, da løsning med trekantsmatricer er hurtigt og numerisk stabilt. I alle standard computerimplementationer for løsning af lineære ligningssystemer, anvendes altid Cholesky dekomposition hvis systemmatricen er positiv semidefinit (ofte uden man eksplicit får det at vide).
Lad være en positiv semidefinit matrix. Der eksisterer en øvre trekantsmatrix
Hvis er positiv definit, er og invertible.
Hvis er en reel matrix, kan vælges som en reel matrix.
Bevis
Vi gør brug af QR dekompositionen af (Sætning 9.24),
hvor er unitær og er en øvre trekantsmatrix. Hvis er reel, er reel, og så kan og vælges som reelle matricer af Sætning 9.24.
Så er
Hvis er positiv definit har positive egenværdier, så nulrummet er trivielt og er invertibel. Dermed er
invertibel af Sætning 4.16. Af Sætning 9.17 er også invertibel.
Følgende resultat springer mest naturligt ud af den singulære værdi dekomposition, som er emnet i Kapitel 12. Vi inkluderer det dog her, da det omhandler som er positiv semidefinit.
Den polære dekomposition nedenfor kan relateres til den polære form for et komplekst tal (dette er tilfældet for en matrix). Den unitære matrix svarer (i en vis forstand) til en rotation, mens og svarer til skalering. Beviset viser også hvordan matricen konstrueres ud fra den singulære værdi dekomposition.
Lad være en kvadratisk matrix. Der eksisterer en unitær matrix
Bevis
Beviset gør brug af den singulære værdi dekomposition af fra Sætning 12.1. Det vil sige
hvor og er unitære, og er en kvadratisk diagonalmatrix (da er kvadratisk) med ikke-negative tal. Herfra regner man sig hurtigt frem til
Vi vælger som
som er unitær af Opgave 11.4. Dermed bliver
og
som forventet.

11.6 Struktur af kvadratiske former

Lad være en matrix. Så kaldes funktionen
for den tilhørende kvadratiske form.
Vi har allerede set flere anvendelser af kvadratiske former, for eksempel i min-max princippet (Sætning 11.11) og for positiv semidefinit matricer (Afsnit 11.5). I disse anvendelser har vi dog kun set på kvadratiske former hørende til Hermitiske matricer. I dette afsnit skal vi se, at altid kan relateres til kvadratiske former for Hermitiske matricer.
Vi starter ud med følgende egenskab, der som konsekvens viser, at en kvadratisk form har reelle funktionsværdier, hvis den hører til en Hermitisk matrix.
For enhver kvadratisk matrix gælder
Bevis
Beviset er en kort udregning med anvendelse af egenskaber for det indre produkt og Sætning 9.16:
En kvadratisk matrix kan generelt omskrives, ved brug af Hermitiske matricer:
hvor
En hurtig hovedregning viser, at og er Hermitiske matricer. Dette leder frem til følgende karakterisering af kvadratiske former.
Lad være en kvadratisk matrix.
  1. Den tilhørende kvadratiske form opfylder
    det vil sige at og .
  2. Der er entydighed i den forstand, at hvis
    hvor og er Hermitiske, så er og .
Bevis
(i): Dette kommer direkte ved at indsætte (11.11) i , samt at og har reelle værdier af Lemma 11.21.
(ii): Dette reduceres til at vise, at hvis er Hermitisk og så er . I den konkrete situation har vi de to tilfælde, og , som kommer af at se på realdel og imaginærdel hver for sig.
Men da er positiv semidefinit, og har derfor en positiv kvadratrod som blandt andet er en Hermitisk matrix. Vi får:
for alle . Det viser at og derfor er .
En direkte konsekvens af Sætning 11.22 er, at hvis og er reelle, så må . I det tilfælde gælder
hvor er den entydige symmetriske matrix, der tilhører den samme reelle kvadratiske form.
For en Hermitisk matrix så vi i Afsnit 11.5, hvordan et invertibelt variabelskifte kan overføre den kvadratiske form til at tilhøre diagonalmatricen fra en diagonalisering. Faktisk kan man gå endnu længere med kvadratiske former, hvor positive egenværdier også skaleres til og negative egenværdier skaleres til således at man får den simplest mulige kvadratiske form.
Lad være en Hermitisk matrix med antal positive egenværdier og antal negative egenværdier. Der eksisterer en invertibel matrix så variabelskiftet giver
hvor
Bevis
For diagonalisering med unitær matrix og diagonalmatrix lad egenværdierne være i rækkefølge hvor først er de positive, så de negative, og til sidst egenværdi . Overvej funktionen givet ved
og definer diagonalmatricen
Så er invertibel og
da multiplikation af diagonalmatricer sker elementvist (Proposition 8.1). Nu definerer vi
som er invertibel af Sætning 4.16, hvilket giver
Ved brug af det invertible variabelskifte , får vi derfor
Hvis er Hermitisk og er invertibel, så er også Hermitisk. Men og er ikke nødvendigvis similære ( behøver ikke være unitær her). Det vil sige, generelt er egenværdierne for og forskellige. Dette leder frem til følgende berømte sætning af James Sylvester, som fortæller at fortegnene af egenværdierne er bevaret.
Lad være en Hermitisk matrix, en invertibel matrix og Uafhængigt af og talt med algebraisk multiplicitet, har og samme antal positive egenværdier og samme antal negative egenværdier.
Bevis
Tag en vilkårlig Hermitisk matrix Af spektralsætningen (Sætning 11.9) findes en ONB af egenvektorer for hørende til egenværdier (gentaget efter algebraisk multiplicitet), og i rækkefølge så er positive mens er ikke-positive. Vi definerer nu
Lad
så gælder af ortonormalitet at
Dermed er positiv definit på underrummet mens er negativ semidefinit på Vi vil nu vise, at blandt underrum hvorpå er positiv definit, har maksimal dimension.
For et sådan gælder og begge er underrum af det vil sige
altså at
Hvis er underrummet udspændt af egenvektorerne for de negative egenværdier af findes et helt tilsvarende bevis for, at er et underrum af maksimal dimension hvorpå er negativ definit.
Lad os nu vende tilbage til situationen i sætningen. Da er Hermitisk er også Hermitisk. Lad og være som i Proposition 11.23 og lad så er Da og er invertible, så er den maksimale dimension af underrum hvorpå er positiv definit (eller negativ definit), lig den maksimale dimension af underrum hvorpå er positiv definit (eller negativ definit).
Fra ovenstående bevis, først med og dernæst med så har disse to matricer samme antal positive/negative egenværdier, hvilket fra konstruktionen af er det tilsvarende antal positive/negative egenværdier for

11.7 Spektralsætningen for normale matricer

Vi ser nu på det lidt mere generelle resultat end Sætning 11.9, som viser at alle normale matricer kan diagonaliseres, det vil sige matricer som opfylder
Her skal man ikke lade sig snyde af navnet normal matrix, da der er masser af "unormale" matricer. Et eksempel på en normal matrix, som ikke nødvendigvis er Hermitisk, er en unitær matrix.
En matrix opfylder
hvis og kun hvis, der eksisterer en unitær matrix
er en diagonalmatrix.
Søjlerne i er en ONB for bestående af egenvektorer for og diagonalen i består af de tilsvarende egenværdier for gentaget efter deres algebraiske multipliciteter.
Bevis
Antag at en unitær matrix eksisterer, således at er en diagonalmatrix. Så har vi
Her brugte vi, at kvadratiske diagonalmatricer kommuterer (Proposition 8.1), samt at
Lad os nu vise den anden retning i "hvis og kun hvis" resultatet, altså antag at er en normal matrix, det vil sige Vi kan via (11.11) skrive
hvor og er de Hermitiske matricer fra (11.12). Det ses også fra (11.12) at og kommuterer da er normal. Der findes derfor en unitær matrix som simultant diagonaliserer begge disse matricer (Opgave 11.11):
Her er og reelle diagonalmatricer, med henholdsvis egenværdierne for og . Hermed ses også, at realdel af egenværdierne for er egenværdier for og imaginærdel af egenværdierne for er egenværdier for
Hermitiske matricer er normale, og det viser sig at være lige præcis de normale matricer hvor alle egenværdierne er reelle, hvilket også ses at være den specifikke forskel i resultaterne for Sætning 11.9 og Sætning 11.25.
Der gælder tilsvarende for normale matricer, at egenvektorer hørende til forskellige egenværdier er ortogonale.
Lad være en normal matrix, det vil sige
  1. hvis og kun hvis,
  2. Lad være egenværdier for Hvis er en egenvektor hørende til og en egenvektor hørende til så gælder
    Det vil sige, at egenvektorer hørende til forskellige egenrum for er ortogonale.
Bevis
(i): Fra spektralsætningen (Sætning 11.25) findes en unitær matrix hvor er en diagonalmatrix indeholdende egenværdierne for efter deres algebraiske multipliciteter. Men så er hvilket betyder at er egenværdi for hvis og kun hvis, er egenværdi for og med samme algebraisk multiplicitet. Tilsvarende indeholder de tilhørende ONB'er for egenrummene, som derfor opfylder
(ii): Vi gør brug af (i) til dette resultat, og får
Dermed har vi
hvoraf da
Lad os overveje den to-dimensionale rotationsmatrix
Produktet for en vektor roterer med en vinkel mod urets retning (se også Eksempel 4.3).
Det er ikke kompliceret at tjekke, at er en ortogonal matrix (prøv at tjekke dette selv), og derfor også en normal matrix. Det er klart at ikke er symmetrisk, undtagen hvis er et heltalsmultiplum af Derfor får vi brug for Sætning 11.25 i stedet for Sætning 11.9.
har egenværdi med tilhørende enhedsegenvektor
samt egenværdi med tilhørende enhedsegenvektor
og er ortogonale enhedsvektorer, så er en unitær matrix. Vi har derfor følgende diagonalisering af rotationsmatricen:
afhænger ikke af og kan derfor bruges til diagonalisering for enhver vinkel.

11.8 Opgaver

Gør helt eksplicit rede for, ved direkte udregning (uden brug af Sætning 11.3), at en symmetrisk matrix
med faktisk har reelle egenværdier.
Hvilke af nedenstående udsagn er rigtige?
En Hermitisk matrix er kvadratisk.
En Hermitisk matrix kan have det komplekse tal som indgang i diagonalen.
er en Hermitisk matrix.
er en Hermitisk matrix.
er en symmetrisk matrix.
er en symmetrisk matrix.
Hvilke af nedenstående matricer er øvre trekantsmatricer?
Vis at produktet af to unitære matricer er en unitær matrix.
Lad være en Hermitisk trekantsmatrix. Hvorfor bliver nødt til at være en diagonalmatrix med reelle indgange?
Lad
Find en unitær matrix som diagonaliserer
Udregn en ONB for af egenvektorer for matricen
Find dernæst en ortogonal matrix er en diagonalmatrix.
Gør rede for, at det karakteristiske polynomium til matricen
er Benyt dette til at vise, at
for naturlige tal Find dernæst en ortogonal matrix er en diagonalmatrix.
Gør rede for, at der lige så godt kunne stå "nedre trekantsmatrix", som "øvre trekantsmatrix", i Schur dekompositionen (Sætning 11.4).
Hint
Lad være kvadratisk, og start med at bruge Schur dekomposition som angivet i Sætning 11.4, men for matricen Det vil sige, der er en unitær matrix
er en øvre trekantsmatrix. Hvad kan nu siges om og hvad er dens forbindelse til ?
(Eksamen januar 2021)
Lad en kompleks matrix være givet ved
  1. Gør rede for, at ikke er invertibel.
  2. Gør rede for, uden at regne egenværdier og egenvektorer, at er diagonaliserbar.
  3. Vis at vektorerne
    er egenvektorer for
  4. Bestem en unitær matrix og en diagonalmatrix således at
I denne opgave viser vi følgende resultat om simultan diagonalisering (sammenlign med Sætning 8.16):
Lad og være Hermitiske matricer. Så gælder hvis og kun hvis, der eksisterer en unitær matrix så både
er reelle diagonalmatricer. Hvis både og er symmetriske matricer, kan vælges som en ortogonal matrix.
Hint
Opgaven går ud på at gennemgå beviset for Sætning 8.16. Udnyt spektralsætningen (Sætning 11.9) til diagonaliseringer i beviset, og gør blandt andet rede for, at matricen i beviset dermed også bliver Hermitisk. Du får sikkert også brug for resultatet i Opgave 11.4.
Dette resultat kan eksempelvis bruges til at give et meget kort og intuitivt bevis for spektralsætningen for normale matricer (Sætning 11.25).
Vi generaliserer nu Opgave 11.11 til normale matricer:
Lad og være normale matricer (dvs. og ). Så gælder hvis og kun hvis, der eksisterer en unitær matrix så både
er diagonalmatricer.
Hint
Opgaven går ud på at gennemgå beviset for Sætning 8.16. Udnyt spektralsætningen (Sætning 11.25) til diagonaliseringer i beviset, og gør blandt andet rede for, at matricen i beviset dermed også bliver normal, Du får sikkert også brug for resultatet i Opgave 11.4.
Gør rede for, at resultatet af spektralsætningen (Sætning 11.9 og Sætning 11.25) alternativt kan skrives
hvor er de forskellige egenværdier af og er den ortogonale projektionsmatrix på egenrummet hørende til