Hva er lineær regresjon?
Q: Hva er lineær regresjon?
A: Lineær regresjon er en måte å se på hvordan noe endrer seg når andre ting endrer seg ved hjelp av matematikk. Den bruker en avhengig variabel og en eller flere forklaringsvariabler for å lage en rett linje, kjent som "regresjonslinjen".
Q: Hva er fordelene med lineær regresjon?
Svar: Modeller som avhenger lineært av de ukjente parametrene, er lettere å tilpasse enn modeller som ikke er lineært relatert til parametrene. I tillegg er de statistiske egenskapene til de resulterende estimatorene lettere å bestemme.
Spørsmål: Hva er noen praktiske bruksområder for lineær regresjon?
A: Lineær regresjon kan brukes til å tilpasse en prediktiv modell til observerte verdier (data) for å lage prediksjoner, prognoser eller reduksjoner. Den kan også brukes til å kvantifisere styrken på sammenhenger mellom variabler og identifisere undergrupper av data som inneholder overflødig informasjon om en annen variabel.
Spørsmål: Hvordan prøver lineære regresjonsmodeller å minimere feil?
A: Lineære regresjonsmodeller prøver å gjøre den vertikale avstanden mellom linjen og datapunktene (residualene) så liten som mulig. Dette gjøres ved å minimere enten summen av kvadrater av residualer (minste kvadraters metode), mangel på tilpasning i en annen norm (minste absolutte avvik), eller minimere en straffet versjon av minste kvadraters tapsfunksjon (ridge regresjon).
Q: Er det mulig for lineære regresjonsmodeller som ikke er basert på minste kvadraters metode?
A: Ja, det er mulig for lineære regresjonsmodeller som ikke er basert på minste kvadraters metode, men i stedet bruker metoder som å minimere manglende tilpasning i en annen norm (minste absolutte avvik) eller minimere en straffet versjon av minste kvadraters tapsfunksjon (ridge regresjon).
Q: Er "lineær modell" og "minste kvadraters metode" synonymer?
A: Nei, de er ikke synonymer. Selv om de er nært knyttet til hverandre, refererer "lineær modell" spesifikt til bruk av en rett linje, mens "minste kvadraters metode" spesifikt refererer til å prøve å minimere feil ved å sørge for at det er minimal vertikal avstand mellom linjen og datapunktene.