Multipel linjär regression | Ett sätt att undersöka hur något förändras när andra saker förändras med hjälp av matematik

Linjär regression är ett sätt att undersöka hur något förändras när andra saker förändras med hjälp av matematik. I en linjär regression används en beroende variabel och en eller flera förklarande variabler för att skapa en rak linje. Denna raka linje är känd som en "regressionslinje".

Linjär regression var det första av många sätt att utföra regressionsanalyser. Detta beror på att modeller som beror linjärt på sina okända parametrar är lättare att anpassa än modeller som är icke-linjärt relaterade till sina parametrar. En annan fördel med linjär regression är att de statistiska egenskaperna hos de resulterande estimatorerna är lättare att fastställa.

Linjär regression har många praktiska användningsområden. De flesta tillämpningar faller in i någon av följande två breda kategorier:

Linjär regression kan användas för att anpassa en prediktiv modell till en uppsättning observerade värden (data). Detta är användbart om målet är förutsägelser, prognoser eller reducering. Om man efter att ha utvecklat en sådan modell ger ett ytterligare värde på X utan det tillhörande värdet på y, kan den anpassade modellen användas för att göra en förutsägelse av värdet på y (skrivet som y ^ {\displaystyle {\hat {y}}} ${\hat {y}}$ ).
Med en variabel y och ett antal variabler X₁ , ..., X_p som kan vara relaterade till y, kan linjär regressionsanalys tillämpas för att kvantifiera styrkan i sambandet mellan y och X_j , för att bedöma vilken X_j som inte har något samband med y alls och för att identifiera vilka delmängder av X_j som innehåller överflödig information om y.

Med linjära regressionsmodeller försöker man göra det vertikala avståndet mellan linjen och datapunkterna (dvs. residualerna) så litet som möjligt. Detta kallas att "anpassa linjen till data". Ofta försöker linjära regressionsmodeller minimera summan av residualernas kvadrater (minsta kvadrat), men det finns andra sätt att anpassa linjen. De inkluderar att minimera "bristen på anpassning" i någon annan norm (som vid regression med minsta absoluta avvikelser), eller att minimera en straffad version av förlustfunktionen för minsta kvadrater som vid ridge-regression. Metoden med minsta kvadratmetoden kan också användas för att anpassa modeller som inte är linjära. Som framgår ovan är termerna "minsta kvadrat" och "linjär modell" nära förknippade med varandra, men de är inte synonymer.

Tanken är att hitta den röda kurvan, de blå punkterna är faktiska prov. Med linjär regression kan alla punkter kopplas samman med hjälp av en enda rak linje. I det här exemplet används enkel linjär regression, där kvadraten på avståndet mellan den röda linjen och varje provpunkt minimeras.

Användning

Ekonomi

Linjär regression är det viktigaste analysverktyget inom ekonomin. Det används till exempel för att gissa konsumtionsutgifter, fasta investeringar, lagerinvesteringar, inköp av ett lands exportvaror, importutgifter, efterfrågan på likvida tillgångar, efterfrågan på arbetskraft och arbetskraftsutbud.

Relaterade sidor

Frågor och svar

F: Vad är linjär regression?

S: Linjär regression är ett sätt att med hjälp av matematik undersöka hur något förändras när andra saker förändras. Den använder en beroende variabel och en eller flera förklarande variabler för att skapa en rak linje, som kallas "regressionslinje".

F: Vilka är fördelarna med linjär regression?

S: Modeller som beror linjärt på sina okända parametrar är lättare att anpassa än modeller som är icke-linjärt relaterade till sina parametrar. Dessutom är de statistiska egenskaperna hos de resulterande estimatorerna lättare att fastställa.

F: Vilka är några praktiska användningsområden för linjär regression?

S: Linjär regression kan användas för att anpassa en prediktiv modell till observerade värden (data) för att göra förutsägelser, prognoser eller reduktioner. Den kan också användas för att kvantifiera styrkan i sambanden mellan variabler och identifiera delmängder av data som innehåller överflödig information om en annan variabel.

F: Hur försöker linjära regressionsmodeller minimera fel?

S: Linjära regressionsmodeller försöker göra det vertikala avståndet mellan linjen och datapunkterna (residualerna) så litet som möjligt. Detta görs genom att minimera antingen summan av residualernas kvadrater (minsta kvadraterna), bristande anpassning i någon annan norm (minsta absoluta avvikelser) eller genom att minimera en straffad version av förlustfunktionen för minsta kvadraterna (ridge-regression).

F: Är det möjligt att modeller för linjär regression inte baseras på minsta kvadrat?

S: Ja, det är möjligt att modeller för linjär regression inte baseras på minsta kvadratmetoden utan i stället använda metoder som att minimera bristande anpassning i någon annan norm (minsta absoluta avvikelser) eller att minimera en straffad version av minsta kvadraternas förlustfunktion (ridge regression).

F: Är "linjär modell" och "minsta kvadrat" synonymer?

Svar: Nej, de är inte synonymer. Även om de är nära sammankopplade avser "linjär modell" specifikt att använda en rak linje medan "minsta kvadrat" specifikt avser att försöka minimera fel genom att se till att det finns ett minimalt vertikalt avstånd mellan linjen och datapunkterna.