10Mindste kvadraters metode

Mindste kvadraters metode kendes nok bedst fra problemet, om at bestemme den bedste rette linje gennem nogle punkter i planen. Faktisk er den langt mere generel, og drejer sig om at finde approksimative løsninger til overbestemte (og nogle gange underbestemte) ligningssystemer. Metoden blev opfundet af Carl Friedrich Gauss, og brugt første gang i forbindelse med bestemmelse af baner for himmellegemer ud fra tre observationer.
Det er ikke altid at et ligningssystem
med en matrix har en løsning. Hvis for eksempel er meget større end det vil sige, at der er mange flere ligninger end ubekendte, og hvis og er "tilfældige", så vil med overvældende sandsynlighed gælde følgende to ting:
  1. Ligningen har ikke nogen løsning.
  2. Den homogene ligning har kun den ene løsning
Det lyder jo ikke særlig lovende. I denne situation kan vores forventning til at finde en løsning ligge på et meget lille sted, og det bedste vi kan gøre er at søge en vektor kommer tættest muligt på
Ligningssystemet
har ingen løsninger, da højresiden ikke ligger i søjlerummet for systemmatricen.

10.1 Normalligninger og mindste kvadraters løsning

Nøglen til at approksimativt løse et lineært ligningssystem, ligger i de såkaldte normalligninger.
For matrix kaldes
for normalligningerne til ligningssystemet
En løsning til (10.1) kaldes en mindste kvadraters løsning til (10.2).
Som vi efterhånden er blevet bekvemme med, ved vi at nulrummet er vigtigt for at kunne opskrive løsninger til et lineært ligningssystem. Det første vi indser er, at nulrummet for systemmatricen i normalligningerne er præcis det samme som i det oprindelige ligningssystem.
For enhver matrix er
Bevis
Det er klart at Lad os nu overveje så mangler vi at vise, at dette medfører Til dette formål kigger vi på normen af :
Dette viser at og derfor at som vi skulle vise.
Ved første øjekast ligner det ikke, at der er sket det store fra (10.2) til (10.1), for vi har jo kun ganget med fra venstre. Hvis der rent faktisk er en sædvanlig løsning til (10.2), vil også være en mindste kvadraters løsning.
Det smukke ved normalligningerne er, at de altid har en løsning, også hvis der ikke findes sædvanlige løsninger til (10.2). Forklaringen på dette kommer af, at (10.2) kun har løsninger hvis er i søjlerummet for mens (10.1) har løsninger hvis er i søjlerummet for Nu er pludselig involveret i både venstre- og højresiden af ligningssystemet. En geometrisk forklaring på eksistensen af en mindste kvadraters løsning kommer i næste afsnit.
Overvej et generelt lineært ligningssystemet
  1. Der findes mindst én mindste kvadraters løsning
  2. Alle mindste kvadraters løsninger er givet ved
    hvor
  3. er invertibel, hvis og kun hvis, nulrummet af er trivielt, dvs. I så fald er den entydige mindste kvadraters løsning givet ved
Bevis
Vi får brug for en ortogonal dekomposition af
hvor og (Sætning 9.33). Dette betyder blandt andet at
Det at betyder lige præcis, at der eksisterer en vektor der opfylder
Vi kan nu gange med for at indse at faktisk er en mindste kvadraters løsning:
Nu hvor vi har fundet en løsning til (10.1), kan samtlige mindste kvadraters løsninger opskrives på formen hvor hvilket fra Lemma 10.3 er ensbetydende med Dette medfører både resultaterne i (ii) og (iii).
  1. Fra dimensionssætningen (Sætning 6.25) ved vi, at nulrummet for er trivielt, hvis og kun hvis, rangen af matricen er lig Det vil sige, når alle søjlerne i er lineært uafhængige.
  2. Beviset for Sætning 10.4 gemmer på en meget vigtig viden om mindste kvadraters løsninger: De er lige præcis løsningerne til
    hvor er den ortogonale projektion af Det vil sige, at man udskifter højresiden i ligningssystemet med en vektor der ligger tættest muligt på den oprindelige højreside men garanterer at det nye ligningssystem har en løsning.

10.2 Hvorfor kaldes det mindste kvadraters metode?

Som det blev nævnt i Bemærkning 10.5, svarer mindste kvadraters løsningerne til at løse et nyt ligningssystem med en projiceret højreside. Det viser sig, at dette netop svarer til at løse et minimeringsproblem.
er en mindste kvadraters løsning til hvis og kun hvis, opfylder
Bevis
Lad være en matrix. Vi har at er en mindste kvadraters løsning, hvis og kun hvis, hvor er ortogonal projektionen af Fra Sætning 9.30 (og entydigheden for løsning af minimeringsproblemet i sætningen) ved vi, at dette er ensbetydende med
afbilder hele over på så vi kan erstatte med hvor :
I nogle sammenhænge bruges minimeringsproblemet i Sætning 10.6 som en definition på en mindste kvadraters løsning, og så vises at dette svarer til at løse normalligningerne; de to fremgangsmåder er helt ækvivalente for lineære ligningssystemer. Her har vi valgt at fokusere på selve løsningsmetoden i Sætning 10.4, da generelle metoder til løsning af optimeringsproblemer er en anden snak.
Når vi har en mindste kvadraters løsning kan vi se på hvor langt vi er fra at løse det tilhørende ligningssystem. Vi skal altså kigge på residualvektoren
Her angiver indgangene i fejlene der bliver begået i de forskellige ligninger i ligningssystemet. Det vil sige, at optimeringsproblemet i Sætning 10.6 minimerer
altså summen af de kvadrerede fejl; heraf navnet mindste kvadraters metode.

10.3 Eksempler

Lad os begynde med et konkret eksempel.
Lad
I Eksempel 10.1 blev det nævnt, at ikke har nogen løsning. Lad os i stedet finde mindste kvadraters løsninger.
Først har vi
hvilket giver
og
Vi ser hurtigt at determinanten af er så der er en entydig mindste kvadraters løsning. Vi kan med fordel anvende formlen (4.12) for den inverse af en matrix:
En almindelig anvendelse af mindste kvadraters løsninger er data-fitting.
Den helt klassiske anvendelse af mindste kvadraters løsninger er, at finde den bedste linje gennem nogle givne punkter
i planen
At det oftest ikke er muligt at finde en perfekt linje, som går gennem alle punkterne, kan oversættes til at ligningssystemet
ikke har løsninger. Her kan vi så arbejde med en mindste kvadraters løsning, som giver den bedste linje gennem punkterne, i den forstand at summen af den vertikale kvadratafstand fra linjen til -erne,
bliver minimal.
Bedste fit af linje til tilfældige punkter fra Wikipedia.
Faktisk kunne vi ligeså godt have spurgt om den bedste parabel
gennem punkterne
Dette ville med samme metode give os ligningssystemet
og mindste kvadraters løsningen til dette ligningssystem giver den bedste parabel gennem punkterne, med summen af den vertikale kvadratafstand fra parablen til punkterne minimeret.
Bedste fit af parabel til tilfældige punkter fra Wikipedia.
Samme metode kan bruges til at finde det bedste fit af et generelt 'te gradspolynomium
til punkter i planen.
Helt generelt, kan man ved samme princip fitte givne funktioner til datapunkter i planen, ved at bruge
Den hovedsaglige antagelse er, at de ubekendte indgår lineært i udtrykket.

10.4 Opgaver

Find den bedste mindste kvadraters linje gennem punkterne og ved at benytte Sætning 10.4.
En cirkel med centrum i og radius i planen har ligningen
  1. Gør rede for, hvordan (10.3) kan omskrives til ligningen
    hvor
  2. Forklar hvordan (10.4) i mindste kvadraters kontekst leder frem til ligningssystemet
    i forsøget på at tilpasse en cirkel til punkterne
  3. Find den bedste cirkel, i mindste kvadraters forstand, gennem punkterne
    ved at angive centrumkoordinaterne og radius med to decimaler.
  4. Diskuter hvornår der går en entydig cirkel gennem tre givne punkter og i henhold til egenskaber ved matricen
  5. Kan man finde en cirkel gennem tre ikke-sammenfaldende punkter, som ligger på en ret linje?
For med ubekendte reelle tal og vil vi gerne fitte til punkterne
  1. Hvorfor kan vi ikke direkte anvende mindste kvadraters metode, som beskrevet i dette kapitel?
  2. Definer nu hvor er den naturlige logaritme. Vis at
  3. Bestem og svarende til at fitte til punkterne ovenfor. Her skal vi udnytte funktionen og først bestemme og ved at fitte til punkterne ovenfor, hvor -værdierne i punkterne ændres hvordan?
(Eksamen januar 2023)
Lad være en funktion med forskrift
Her er og ubekendte reelle tal.
  1. Opskriv et lineært ligningssystem
    med hensyn til de ubekendte således at grafen for gennemløber følgende fire punkter i planen:
    Det er et ligningssystem på formen (I skal udfylde de manglende værdier "?"):
    så række tilpasser det 'te punkt nævnt ovenfor.
  2. Lad en vektor være givet ved
    Vis at er ortogonal med de to søjler i og at ikke er ortogonal med På baggrund af dette, gør rede for at ikke har løsninger.
  3. Bestem tallene og som mindste kvadraters løsning til
  4. Bestem en ortonormalbasis (ONB) for bestående af egenvektorer for