Afsnit 7.6: Regression med kendt skæring

Hubbles lov siger, at den hastighed, hvormed galakser bevæger sig væk fra hinanden, er proportional med afstanden mellem galakserne. Formuleringen af loven af Edwin Hubble i 1929 er baseret på data indsamlet over en 10-års periode og vist i kodevinduet nedenfor. Loven danner baggrund for teorien om det ekspanderende univers.
Data består af værdierne for 24 galakser (afstand måles i megaparsecs og hastighed i kilometer per sekund). Som statistisk model bruger vi (Statistisk Model 7.1.2)
I kodevinduet analyseres denne model.

Analyse og figur

Se opstartskoden (til/fra)

MATLAB-kode

Når du kører ovenstående kode, vil du se, at -værdien for et test af hypotesen er 0.630. Data strider altså ikke mod denne hypotese, som netop siger, at der er proportionalitet mellem afstand og (middelværdi af) hastighed.
Fra output ses også, at et 95%-konfidensinterval for hældningen er Intervallet er meget bredt, hvilket afspejler, at der er stor variation i data omkring den lineære sammenhæng.
Modellen, der udtrykker proportionalitet, kan udtrykkes generelt som
Analysen af denne model i python eller MATLAB foretages som før med funktionen ols eller fitlm. For at fortælle at skæringen er nul, skal man tilføje "-1" i modelformlen, således at denne bliver 'xt-1'. For Hubbles data er dette vist i det kommende kodevindue, hvor den røde linje i figuren er den estimerede linje i tilfældet med .

7.6.1 Analyse af regressionsmodel med kendt skæring

Se opstartskoden (til/fra)

MATLAB-kode

I regressionsmodellen, hvor vi har antaget proportionalitet, altså at skæringen er nul, viser output, at konfidensintervallet for hældningen er Vi kan se, at konfidensintervallet bliver noget smallere sammenlignet med konfidensintervallet fra modellen, hvor er en ukendt parameter. Dette er et generelt fænomen: hvis man kan reducere en model ved at sætte nogle parametre til nul, vil de resterende parametre blive bedre bestemt. En del af den statistiske analyse går netop ud på at reducere en model for både at få en mere simpel model og for at få de resterende parametre bedre bestemt.
Intervallet for hældningen (= proportionalitetskonstanten = Hubbles konstant) er stadig stort og, som det har vist sig, fejlvisende. Den anerkendte værdi i dag ligger omkring 70. Et af problemerne med Hubbles data er, at strukturen af nogle af de stjerner, der blev brugt, blev fejltolket på daværende tidspunkt.
Ovenfor har vi betragtet delmodellen af modellen hvor er kendt og lig med nul. Mere generelt kan vi se på situationen, hvor er kendt og lig med Denne model kan analyseres ved at betragte og benytte resultaterne for situationen med

7.6.1 Fordelingsresultater

I modellen er
og skønnet over variansen er
Ud fra disse resultater kan vi lave en -teststørrelse for test af værdien af hældningen og lave et 95%-konfidensinterval. Det sidstnævnte er på formen
ForegåendeNæste