7Basisskifte og lineære transformationer

I dette kapitel skal vi undersøge, hvordan lineære funktioner mellem vektorrum (lineære transformationer) kan beskrives af matricer, samt hvordan valg af baser kan bruges til at give forskellige matrixrepræsentationer; nogle pænere end andre. Eksempelvis repræsenterer matricerne
den samme underliggende lineære transformation. Heraf er det klart at foretrække diagonalmatricen. Den første matrixrepræsentation har brugt standardbasen for mens den anden har gjort brug af basen
I Kapitlerne 8, 11 og 12 skal vi vælge "optimale" baser, så vi får diagonalmatricer.
En af hovedpointerne i kapitlet (og i hele kurset) er, at de ting man vil undersøge for lineære transformationer mellem endelig dimensionale vektorrum, kan man lige så vel undersøge for en matrixrepræsentation (se eksempelvis Opgave 7.11). Man kan altså tænke på lineære transformationer som matricer, hvilket er naturligt, både fra et praktisk og et teoretisk synspunkt.
Inden vi kommer så langt, og inden vi definerer lineære transformationer og deres matrixrepræsentationer, skal vi se hvordan vi kan foretage basisskifte.

7.1 Basisskifte

Forskellige baser for det samme vektorrum kan bruges til at beskrive vektorer Vi kan have to baser i spil, og og vi husker at for hver basis vil have en koordinatvektor, som beskriver gennem linearkombination af basisvektorerne:
Her er koordinatvektorerne og Selv for abstrakte vektorrum vil koordinatvektorerne være søjlevektorer med tal i Så selvom vi i dette kursus mest ser på underrum af er princippet det samme for eksempelvis vektorrum af polynomier: Det vigtigste at tage med herfra er, at når vi regner med baser, er der altid tale om regning på koordinatvektorer.
Vektor beskrevet med baserne og
Vi ønsker en måde at komme fra koordinatvektoren til koordinatvektoren og her kommer basisskiftematricen i spil. Skift af basis er essentielt for anvendelser (se f.eks. Kapitel 12).
Lad og være to baser for et vektorrum Basisskiftematricen fra til er matricen givet ved
Det er altså matricen, hvis søjler er koordinatvektorerne for basen med hensyn til basen
Navnet på basisskiftematricen giver først mening når vi tager den i brug.
  1. Basisskiftematricen fra Definition 7.1, er den entydige matrix der opfylder
    for enhver vektor
  2. Matricen er invertibel, og er basisskiftematricen fra til
  3. Hvis kan vi skrive og som matricer. Så kan bestemmes ved matricen i øverste højre hjørne af RREF fra følgende totalmatrix:
    hvor antal nulrækker i RREF er
  4. Hvis kan findes ved
Bevis
Vi starter med entydigheden. Antag at der er to matricer og som opfylder (7.2). Så har vi at for alle hvilket kun opfyldes af nulmatricen, så
Lad det vil sige
Af lineariteten af koordinatvektorer (se Opgave 7.9):
Lad være basisskiftematricen fra til så er det klart at Derved er invertibel med
Hvis er et vektorrum af søjlevektorer, og vi identificerer og som matricer, med basisvektorerne som søjler, kan vi bestemme koordinatvektorerne ved at løse
for hvert Disse ligningssystemer løses samlet ved hjælp af (7.3). Da er entydigt bestemt, får man en RREF på den angivne form.
Hvis er invertibel. Nu er (7.3) det samme som
Som et særtilfælde, Hvis og vi går fra en basis til standardbasen (svarer til identitetsmatricen så er basisskiftematricen. Omvendt, hvis vi går fra standardbasen til basis er basisskiftematricen.
Det betaler sig at se et konkret eksempel på anvendelsen af Proposition 7.2. Lad
være to baser for Eller skrevet på matrixform:
Vi kan udregne basisskiftematricen fra til ved brug af (7.4):
Lad os tage en konkret vektor
Så er koordinatvektoren med hensyn til givet ved Vi kunne også have fundet koordinatvektoren som løsning til Nu kan vi let finde koordinater med hensyn til blot ved at gange med :
Vi kan tjekke efter, ved at opskrive linearkombinationen i basis og se om vi får vektoren fra (7.5):

7.2 Lineære transformationer og matrixrepræsentation

Nu skal vi se på nogle afbildninger (funktioner) mellem vektorrum, med nogle af de samme egenskaber som matricer. Hvis og er vektorrum, bruger vi notationen til at fortælle, at er en funktion med definitionsmængde og med funktionsværdier i Eksempelvis kunne vi have og som indikerer at funktionen afbilder punkter i planen til punkter i rummet. kunne have forskriften
Så vil og så videre. Selv hvis definitionsmængden er søjlevektorer, her vil vi af notationsmæssige årsager stadig skrive enten eller for i stedet for
Vi er særligt interesserede i afbildninger der er lineære.
Lad hvor og er vektorrum over Så kaldes en lineær transformation, hvis der for alle og gælder:
Egenskaberne for i Definition 7.4 kender vi fra matrixregning. Hvis er en matrix med tal i er funktionen en lineær transformation Det er faktisk ganske almindelig notation at skrive i stedet for på samme måde som med en matrix.
Men der er også andre vektorrum man kan have i spil. For eksempel, lad være vektorrummet af reelle polynomier af grad højst det vil sige funktioner på formen
for koefficienter Vi ved hvordan et polynomium differentieres:
og giver et polynomium af en grad lavere. Differentialkvotienten er en lineær transformation, hvor og kendes fra calculus.
For at kunne bruge al vores viden fra matrixregning i praksis, er det ofte nødvendigt at repræsentere lineære transformationer som matricer Her kan være afbildninger mellem funktionsrum, der beskriver systemer inden for fysik, kemi og biologi. Beregninger på disse systemer approksimeres ofte med stykvise polynomier i såkaldte finite element metoder, og ved at bruge polynomielle baser, kan man beskrive avancerede modeller ved hjælp af matricer.
Det er ekstremt vigtigt at bemærke, at en lineær transformation er entydigt bestemt ud fra dens funktionsværdier
på en basis for Hvis vi kalder koordinaterne af for følger dette ved at bruge linearitetsegenskaberne i Definition 7.4:
Hvis man også har en basis for så gælder af linearitet for koordinater (se Opgave 7.9):
Så har man en fuld beskrivelse af givet ved hjælp af koordinatvektorer, der viser hvordan man kommer fra et til funktionsværdien
Løs Quiz 7.2 nu, hvor der undersøges om en afbildning er en lineær transformation.

7.2.1 Repræsentation ved en matrix

Vi vil gerne kunne sige, at "en lineær transformation er det samme som en matrix", og det er ikke helt forkert, men det er heller ikke helt rigtigt, og for at komme videre er man nødt til at forstå hvorfor. Den lille men vigtige forskel er, at vi har brug for at vælge baser!
Lad være en lineær transformation. Hvis er en basis for og er en basis for så kaldes matricen
for matrixrepræsentationen af med hensyn til og Det er altså matricen hvis søjler er koordinatvektorerne for med hensyn til basen
At det kaldes en matrixrepræsentation, kommer fra matricens egenskaber.
  1. Matricen fra Definition 7.5, er den entydige matrix der opfylder
    for enhver vektor
  2. Hvis kan vi:
    • Skrive som en matrix.
    • Definere matricen
    Så kan bestemmes ved matricen i øverste højre hjørne af RREF fra følgende totalmatrix:
    hvor antal nulrækker i RREF er
  3. Hvis kan findes ved
Bevis
Entydigheden vises på samme måde som i beviset for Proposition 7.2.
Første del af beviset er næsten det samme som vi så i beviset af Proposition 7.2, og er faktisk gennemgået i (7.6).
Hvis er et vektorrum af søjlevektorer, kan vi bestemme koordinatvektorerne ved at løse
for hvert Ved at samle matricen kan disse ligningssystemer løses samlet ved hjælp af (7.8). Da er entydigt bestemt, får man en RREF på den angivne form.
Hvis er invertibel, og så er (7.8) det samme som
Basisskiftematricen og dens egenskaber fra Proposition 7.2, er intet mindre end et særtilfælde af Sætning 7.6. Overvej identitetsafbildningen defineret som
Hvis basis bruges på det første og basis på det andet i så er matrixrepræsentationen af med hensyn til og lige præcis basisskiftematricen fra til
Igen er det strengt nødvendigt at se dette anvendt på konkrete eksempler.
Lad med basis givet ved
Og lad med basis givet ved
Bemærk, at er et to-dimensionalt underrum af Nu ønsker vi at finde en matrixrepræsentation for givet ved
med hensyn til baserne og Tjek gerne på nuværende tidspunkt, at giver en vektor i for hvert samt at er en lineær transformation.
Først finder vi og :
Vi kan nu samle matricerne og og anvende (7.8):
Matrixrepræsentationen er givet ved matricen øverst til højre i RREF (det vil nemlig være en matrix):
Vi kan altid foretage et tjek for om vi har regnet rigtigt. Vi tager en konkret vektor i brug:
Der er derfor koordinatvektorer og hvilket heldigvis er helt i overensstemmelse med matrixrepræsentationen og Sætning 7.6:
I diskussionen efter Definition 7.4, var et eksempel på en lineær transformation mellem vektorrum af polynomier, for eksempel Vi kan udstyre med basen bestående af polynomierne og med basen ; prøv at overveje hvorfor disse rent faktisk er baser.
Koordinatvektoren for er mens for er
Differentiationen af giver
Vi ser at Tilsvarende er og Vi kan derfor repræsentere med matricen
svarende til at
Lad os differentiere ved hjælp af matrix-vektor multiplikation:
hvilket fra basen giver polynomiet
Dette er naturligvis en meget simpel anvendelse af en matrixrepræsentation, og det bliver mere interessant når disse indgår i ligningssystemer.

7.3 Sammensætning af lineære transformationer

Når man har matrixrepræsentationer, vil man typisk blive ved med at anvende disse til udregninger, da det ofte er lettere at regne på matricer. Vi skal nu se, at matrixmultiplikation svarer til at sammensætte to lineære transformationer.
Det sker at vi har tre endelig dimensionale vektorrum og to lineære transformationer og Så kan vi definere en sammensat lineær transformation ved
Lad og være givet ved
og
Her er og matrixrepræsentationerne for og i standardbaserne.
Vi kan nu finde tilsvarende matrixrepræsentationer for og :
Vi har matrixrepræsentationerne og for og i standardbaserne. Det finurlige er nu, at og
Denne sammenhæng er ikke tilfældig, og vi behøvede heller ikke at anvende standardbaser for at det går op. Så længe at samme basis bruges på i matrixrepræsentationerne og får man og hvis samme basis bruges på fås Dette resultat er givet nedenfor.
Lad være endelig dimensionale vektorrum med baser og lad og være lineære transformationer. Hvis
  • er matrixrepræsentationen af i baserne og og
  • er matrixrepræsentationen af i baserne og
så er
matrixrepræsentationen af i baserne og
Bevis
Vi regner i koordinater. Lad så er og vi har
og
Dermed er matrixrepræsentationen af i baserne og
Dette forklarer faktisk meget fint, hvorfor matrixmultiplikationen er defineret som den er. Det hele handler om repræsentationer af lineære transformationer, og at kunne sammensætte disse. Nu er det også klart hvorfor den associative lov gælder for matrixmultiplikation, da dette er sandt for sammensætning af afbildninger.
Vi skal naturligvis også se, hvordan man skifter mellem baser i matrixrepræsentationer. Nøglen til dette er, måske ikke så overraskende (navnet taget i betragtning), at gange med basisskiftematricer. Hvis vi har nogle faste baser vi skal arbejde med, kan vi altså en gang for alle udregne basisskiftematricer mellem disse, og så kan man altid gå frem og tilbage mellem forskellige baser for sine matrixrepræsentationer. Dette er nogle gange brugbart i anvendelser, hvor algoritmer kan være designet til at bruge udvalgte baser.
Lad være en lineær transformation mellem endelig dimensionale vektorrum. Antag at:
  1. er basisskiftematrix fra til på vektorrummet
  2. er basisskiftematrix fra til på vektorrummet
  3. er matrixrepræsentationen for med hensyn til og
Så er matrixrepræsentationen for med hensyn til og
Bevis
Vi regner i koordinater. Lad da har vi fra Proposition 7.2 og Sætning 7.6:
Dermed er matrixrepræsentationen af i baserne og
Vi vender nu tilbage til eksemplet fra starten af kapitlet. Lad
Dette er eksempelvis matrixrepræsentationen af givet ved i standardbasen (på begge vektorrum).
Men der blev også nævnt en anden basis
Vi kan identificere denne basis med en matrix
Basisskiftematricen fra basis til standardbasen, er bare matricen mens basisskiftematricen fra standardbasen til basis er matricen Derfor giver Proposition 7.12, at
er matrixrepræsentationen af med hensyn til basen (på begge vektorrum).
Som vi ser i Eksempel 7.13, er det ikke altid en god ide at anvende standardbasen, hvis man ønsker sig en flot matrixrepræsentation. Især i anvendelser er det vigtigt at få så mange nuller i sin matrix som muligt. Vi skal se videre på at finde optimale baser i Kapitlerne 8, 11 og 12, hvor begreber som egenværdier og egenvektorer bliver essentielle ingredienser.

7.4 En omfattende notation

I dette kursus beskæftiger vi os typisk med en matrixrepræsentation ad gangen, og generelt har vi forenklet notationen i dette kapitel, ved typisk at kalde en lineær transformation for og en tilhørende matrixrepræsentation for .
I tilfælde hvor man har mange sådanne transformationer og matrixrepræsentationer i spil, kan det dog betale sig at introducere en lidt mere rigid notation. Vi kan skrive matrixrepræsentationen for en lineær transformation i baser og som
Nu kan Sætning 7.6(i) skrives som
og Sætning 7.11 kan skrives
I forlængelse af Bemærkning 7.7, kan basisskiftematricen fra basis til basis skrives
hvor er identitetsafbildningen på Dermed bliver Proposition 7.2(i) til
og Proposition 7.12 bliver til
Det er en omfattende notation at vænne sig til, men formlerne bliver lettere at huske.

7.5 Kompleksifisering

I dette afsnit er et reelt vektorrum. Paradoksalt nok bliver tingene lettere at arbejde med, når alting er komplekst. Vi skal se hvordan vi naturligt kan udvide til et komplekst vektorrum kaldet en kompleksifisering af Tilsvarende skal vi se, hvordan lineære transformationer mellem reelle vektorrum naturligt kan udvides til de kompleksifiserede vektorrum.
Princippet er ganske simpelt, og helt analogt med hvordan de komplekse tal introduceres fra de reelle tal, hvor et komplekst tal svarer til par af to reelle tal, realdel og imaginærdel.
Fra vilkårlige dannes par som vi formelt skriver
  • kaldes realdelen af
  • kaldes imaginærdelen af
  • kaldes standard formen af
Kompleksifiseringen af er mængden
  • udstyres med addition mellem og på standard form:
    hvor additionen mellem realdelene og imaginærdelene, er additionen fra
  • udstyres med multiplikation af kompleks skalar for :
    hvor skalar multiplikationen med og er skalar multiplikationen fra
Det er ikke svært (men drønkedeligt) at vise, at er et komplekst vektorrum. Eksempelvis er kompleksifiseringen af Vi identificerer med og identificerer med er et reelt underrum af (et underrum hvor man kun anvender reelle skalarer).
Hvis er en basis for endelig dimensionalt så er også en basis for Som konsekvens er
For på standard form, gælder
svarende til kompleksifiseringen af koordinaterne.
Bevis
Lad Det følger direkte, at den lineære uafhængighed i overføres til lineær uafhængighed i Tag på standard form, og lad og Så har vi
og dermed er en basis for med
Lad være en lineær transformation mellem reelle vektorrum. Så er kompleksifiseringen defineret som
hvor er på standard form, og hvor og evalueres fra den reelle
Det er en udvidelse af den reelle og derfor anvendes samme symbol for afbildningen. Det er ganske lige til at vise, at den kompleksifiserede arver linearitetsegenskaberne.
Hvis man anvender baser fra og til matrixrepræsentation, så gælder af Proposition 7.15 og Sætning 7.6, at og repræsenteres med den samme matrix. Så de essentielle egenskaber er bevaret (se Opgave 7.11).
Pointen er, at vi uden frygt kan udvide reelle vektorrum og reelle lineære transformationer til komplekse versioner af disse. Det viser sig at være en kæmpe stor fordel for at vi nu kan anvende komplekse skalarer og baser for og i stedet. Dette er faktisk enormt vigtigt i Kapitel 8 til diagonalisering.
Hvis man interesserer sig for andre legemer end og kan man på en tilsvarende måde lave udvidelse af vektorrum og lineære transformationer til en algebraisk lukket udvidelse af legemet, som udfylder den rolle har i forhold til

7.6 Opgaver

Hvis koordinaterne til en vektor i basen
er hvad gælder så om koordinaterne til samme vektor i basen
Hvilke af nedenstående påstande er rigtige?
Afbildningen givet ved er en lineær transformation.
Afbildningen givet ved er en lineær transformation.
Afbildningen givet ved er en lineær transformation.
Afbildningen givet ved er en lineær transformation.
En lineær transformation hvor og er givet ved
Hvad er matricen som repræsenterer med hensyn til
Prøv at gennemgå Eksempel 7.9, men hvor vi ser på den lineære transformation med svarende til
Vis at matrixrepræsentationen af i baserne og er
Vis at hvis man i stedet bruger baserne og får man
Lad med være givet ved
Find matrixrepræsentationen af med hensyn til baserne for og for givet ved
(Eksamen marts 2017)
Betragt følgende produkt af reelle matricer (du behøver ikke tjekke det)
Definer nu følgende tre vektorer i :
  1. Vis at udgør en basis for
  2. Beregn koordinatvektoren med hensyn til for en vilkårlig vektor
  3. Herefter betragtes vektorerne
    Det oplyses at er en basis for (skal ikke tjekkes). Find basisskiftematricen fra basis til basis
(Eksamen juni 2016)
Betragt mængden bestående af vektorerne
i
  1. Gør rede for, at udgør en basis for
  2. Betragt som en matrix. Den inverse matrix er lig med
    for et tal Find tallet og skitser din metode for at nå frem til det.
  3. Lad være givet ved den lineære transformation
    Find matrixrepræsentationen for i basen (brugt på begge vektorrum).
(Eksamen maj 2021)
Lad tre vektorer og være givet ved
  1. Gør rede for, at er en basis for
  2. Find koordinater for nedenstående tre vektorer og med hensyn til basen :
  3. Lad være en basis for (skal ikke bevises), hvor
    Lad være en lineær transformation (skal ikke bevises), givet ved
    Bestem matrixrepræsentationen af med hensyn til baserne og
  4. Find koordinaterne til og med hensyn til basen
For endelig dimensionalt vektorrum med basis gør rede for at afbildningen fra til er lineær.
For vektorrum og over , gør rede for at mængden af alle lineære transformationer er et vektorrum over .
Lad være en lineær transformation mellem endelig dimensionale vektorrum og og lad være matrixrepræsentationen for med hensyn til baser og
  1. kaldes injektiv, hvis medfører
    Vis at da er lineær, så er injektiv, hvis og kun hvis, medfører
  2. Vis at hvis og kun hvis,
    Konkluder at er injektiv, hvis og kun hvis,
  3. Vis at der findes hvis og kun hvis,
  4. kaldes surjektiv, hvis for ethvert findes
    Vis at er surjektiv, hvis og kun hvis,
  5. kaldes bijektiv, hvis både er injektiv og surjektiv.
    Brug dimensionssætningen (Sætning 6.25) til at konkludere, at er bijektiv, hvis og kun hvis, er invertibel.
  6. Hvis er bijektiv, eksisterer en invers afbildning
    for alle og
    Vis at er en lineær transformation, og dens matrixrepræsentation er med hensyn til og
  7. Hvis : Vis at er injektiv, hvis og kun hvis, er surjektiv.