Konfidensintervall

Inom statistiken är ett konfidensintervall en särskild form av uppskattning av en viss parameter. Med denna metod ges ett helt intervall av acceptabla värden för parametern i stället för ett enskilt värde, tillsammans med en sannolikhet för att det verkliga (okända) värdet av parametern kommer att ligga inom intervallet. Konfidensintervallet baseras på observationerna från ett urval och skiljer sig därför från urval till urval. Sannolikheten för att parametern kommer att ligga i intervallet kallas konfidensnivå. Mycket ofta anges den i procent. Konfidensintervallet anges alltid tillsammans med konfidensnivån. Man kan tala om "95 % konfidensintervall". Slutpunkterna i konfidensintervallet kallas konfidensgränser. För ett visst skattningsförfarande i en viss situation gäller att ju högre konfidensnivån är, desto bredare blir konfidensintervallet.

Beräkningen av ett konfidensintervall kräver i allmänhet antaganden om hur skattningsprocessen ser ut - det är i första hand en parametrisk metod. Ett vanligt antagande är att fördelningen av den population som urvalet kommer från är normal. Som sådant är konfidensintervall som diskuteras nedan inte robust statistik, även om ändringar kan göras för att öka robustheten.

Betydelse av termen "förtroende"

Termen förtroende har en liknande betydelse inom statistiken som i allmänt bruk. I vanligt språkbruk brukar ett påstående om att 95 % av en sak är säker anses vara en virtuell säkerhet. Inom statistiken innebär ett påstående om 95 % säkerhet helt enkelt att forskaren har sett ett möjligt intervall av ett stort antal möjliga intervall, där nitton av tjugo intervall innehåller parameterns sanna värde.

Praktiskt exempel

A factory assembly line fills margarine cups to a desired 250g +/- 5g

En maskin fyller koppar med margarin. I exemplet är maskinen inställd så att kopparna innehåller 250 g margarin. Eftersom maskinen inte kan fylla varje kopp med exakt 250 g, uppvisar innehållet i de enskilda kopparna en viss variation och betraktas som en slumpmässig variabel X. Denna variation antas vara normalfördelad runt det önskade genomsnittet på 250 g, med en standardavvikelse på 2,5 g. För att avgöra om maskinen är tillräckligt kalibrerad väljs ett slumpmässigt urval av n = 25 koppar margarin ut och kopparna vägs. Margarinets vikt är X1, ..., X25, ett slumpmässigt urval från X.

För att få en uppfattning om förväntningen μ räcker det att ge en uppskattning. Den lämpliga skattaren är urvalets medelvärde:

μ ^ = X ¯ = 1 n ∑ i = 1 n X i . {\displaystyle {\hat {\mu }}={\bar {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}. } {\displaystyle {\hat {\mu }}={\bar {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}.}

I provet visas faktiska vikter x1, ...,x25, med medelvärde:

x ¯ = 1 25 ∑ i = 1 25 x i = 250,2 gram . {\displaystyle {\bar {x}}={\frac {1}{25}}}\sum _{i=1}^{25}x_{i}=250.2\,{\text{gram}}. } {\displaystyle {\bar {x}}={\frac {1}{25}}\sum _{i=1}^{25}x_{i}=250.2\,{\text{grams}}.}

Om vi tar ett nytt prov på 25 koppar kan vi lätt förvänta oss att hitta värden som 250,4 eller 251,1 gram. Ett medelvärde på 280 gram skulle dock vara ytterst sällsynt om det genomsnittliga innehållet i kopparna faktiskt ligger nära 250 gram. Det finns ett helt intervall runt det observerade värdet 250,2 för provets medelvärde inom vilket, om hela populationens medelvärde faktiskt antar ett värde inom detta intervall, de observerade uppgifterna inte skulle betraktas som särskilt ovanliga. Ett sådant intervall kallas konfidensintervall för parametern μ. Hur beräknar vi ett sådant intervall? Intervallets ändpunkter måste beräknas från urvalet, så de är statistik, funktioner av urvalet X1, ..., X25 och därmed själva slumpvariabler.

I vårt fall kan vi bestämma slutpunkterna genom att beakta att medelvärdet X från ett normalfördelat urval också är normalfördelat, med samma förväntan μ, men med ett standardfel σ/√n = 0,5 (gram). Genom att standardisera får vi en slumpmässig variabel

Z = X ¯ - μ σ / n = X ¯ - μ 0.5 {\displaystyle Z={\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}={\frac {{\bar {X}}-\mu }{0.5}}} {\displaystyle Z={\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}={\frac {{\bar {X}}-\mu }{0.5}}}

som är beroende av parametern μ som ska uppskattas, men med en standardnormalfördelning som är oberoende av parametern μ. Därför är det möjligt att hitta tal -z och z som är oberoende av μ, där Z ligger däremellan med sannolikheten 1 - α, ett mått på hur säker vi vill vara. Vi tar 1 - α = 0,95. Så vi har:

P ( - z ≤ Z ≤ z ) = 1 - α = 0,95. {\displaystyle P(-z\leq Z\leq z)=1-\alpha =0,95.\,} {\displaystyle P(-z\leq Z\leq z)=1-\alpha =0.95.\,}

Antalet z följer av den kumulativa fördelningsfunktionen:

Φ ( z ) = P ( Z ≤ z ) = 1 - α 2 = 0,975 , z = Φ - 1 ( Φ ( z ) ) = Φ - 1 ( 0,975 ) = 1.96 , {\displaystyle {\begin{aligned}\Phi (z)&=P(Z\leq z)=1-{\tfrac {\alpha }{2}}}=0.975,\\[6pt]z&=\Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0.975)=1.96,\end{aligned}}} {\displaystyle {\begin{aligned}\Phi (z)&=P(Z\leq z)=1-{\tfrac {\alpha }{2}}=0.975,\\[6pt]z&=\Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0.975)=1.96,\end{aligned}}}

och vi får:

0,95 = 1 - α = P ( - z ≤ Z ≤ z ) = P ( - 1,96 ≤ X ¯ - μ σ / n ≤ 1,96 ) = P ( X ¯ - 1,96 σ n ≤ μ ≤ ≤ X ¯ + 1.96 σ n ) = P ( X ¯ - 1,96 × 0,5 ≤ μ ≤ X ¯ + 1,96 × 0,5 ) = P ( X ¯ - 0,98 ≤ μ ≤ X ¯ + 0,98 ) . {\displaystyle {\begin{aligned}0.95&=1-\alpha =P(-z\leq Z\leq z)=P\left(-1.96\leq {\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}\leq 1.96\right)\\[6pt]&=P\left({\bar {X}}-1.96{\frac {\sigma }{\sqrt {n}}}}\leq \mu \leq {\bar {X}}+1.96{\frac {\sigma }{\sqrt {n}}}\right)\\[6pt]&=P\left({\bar {X}}-1.96\times 0.5\leq \mu \leq \leq {\bar {X}}+1.96\times 0.5\right)\\[6pt]&=P\left({\bar {X}}-0.98\leq \mu \leq {\bar {X}}+0.98\right).\end{aligned}}} {\displaystyle {\begin{aligned}0.95&=1-\alpha =P(-z\leq Z\leq z)=P\left(-1.96\leq {\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}\leq 1.96\right)\\[6pt]&=P\left({\bar {X}}-1.96{\frac {\sigma }{\sqrt {n}}}\leq \mu \leq {\bar {X}}+1.96{\frac {\sigma }{\sqrt {n}}}\right)\\[6pt]&=P\left({\bar {X}}-1.96\times 0.5\leq \mu \leq {\bar {X}}+1.96\times 0.5\right)\\[6pt]&=P\left({\bar {X}}-0.98\leq \mu \leq {\bar {X}}+0.98\right).\end{aligned}}}

Detta kan tolkas som att vi med en sannolikhet på 0,95 kommer att hitta ett konfidensintervall där vi möter parametern μ mellan de stokastiska slutpunkterna

X ¯ - 0 . 98 {\displaystyle {\bar {\bar {X}}-0{.}98\,} {\displaystyle {\bar {X}}-0{.}98\,}

och

X ¯ + 0.98. {\displaystyle {\bar {X}}+0.98.\,} {\displaystyle {\bar {X}}+0.98.\,}

Detta betyder inte att det är 0,95 sannolikhet att parametern μ finns i det beräknade intervallet. Varje gång mätningarna upprepas kommer det att finnas ett annat värde för medelvärdet X för urvalet. I 95 % av fallen kommer μ att ligga mellan de slutpunkter som beräknats utifrån detta medelvärde, men i 5 % av fallen kommer det inte att göra det. Det faktiska konfidensintervallet beräknas genom att man anger de uppmätta vikterna i formeln. Vårt konfidensintervall på 0,95 blir:

( x ¯ - 0,98 ; x ¯ + 0,98 ) = ( 250,2 - 0,98 ; 250,2 + 0,98 ) = ( 249,22 ; 251,18 ) . {\displaystyle ({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,} {\displaystyle ({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,}

Eftersom det önskade värdet 250 för μ ligger inom det resulterande konfidensintervallet finns det ingen anledning att tro att maskinen är felkalibrerad.

Det beräknade intervallet har fasta slutpunkter, där μ kan ligga däremellan (eller inte). Denna händelse har alltså en sannolikhet på antingen 0 eller 1. Vi kan inte säga det: Vi kan inte säga: "Med sannolikhet (1 - α) ligger parametern μ i konfidensintervallet." Vi vet bara att genom upprepning i 100(1 - α) % av fallen kommer μ att ligga i det beräknade intervallet. I 100α % av fallen gör den det dock inte. Och tyvärr vet vi inte i vilka av fallen detta sker. Det är därför vi säger: "Med en konfidensnivå på 100(1 - α) % ligger μ i konfidensintervallet. "

Figuren till höger visar 50 realiseringar av ett konfidensintervall för ett givet populationsmedelvärde μ. Om vi slumpmässigt väljer en realisering är sannolikheten 95 % att vi i slutändan har valt ett intervall som innehåller parametern, men vi kan ha otur och ha valt fel. Vi kommer aldrig att få veta; vi sitter fast med vårt intervall.

De vertikala linjesegmenten representerar 50 realiseringar av ett konfidensintervall för μ.Zoom
De vertikala linjesegmenten representerar 50 realiseringar av ett konfidensintervall för μ.

Frågor och svar

F: Vad är ett konfidensintervall inom statistiken?


S: Ett konfidensintervall är ett särskilt intervall som används för att uppskatta en parameter, t.ex. populationsmedelvärdet, och som ger ett intervall av acceptabla värden för parametern i stället för ett enda värde.

F: Varför används ett konfidensintervall i stället för ett enskilt värde?


S: Ett konfidensintervall används i stället för ett enskilt värde för att ta hänsyn till osäkerheten vid uppskattning av en parameter baserat på ett urval, och för att ge en sannolikhet för att det verkliga värdet av parametern ligger inom intervallet.

F: Vad är en konfidensnivå?


S: En konfidensnivå är sannolikheten för att den uppskattade parametern ligger inom konfidensintervallet och anges ofta som en procentsats (t.ex. 95 % konfidensintervall).

F: Vad är konfidensgränser?


S: Konfidensgränser är slutpunkterna i ett konfidensintervall, som definierar intervallet av acceptabla värden för den parameter som uppskattas.

F: Hur påverkar konfidensnivån konfidensintervallet?


S: Ju högre konfidensnivån är, desto bredare blir konfidensintervallet i ett givet skattningsförfarande.

F: Vilka antaganden krävs för att beräkna ett konfidensintervall?


S: Beräkningen av ett konfidensintervall kräver i allmänhet antaganden om skattningsprocessens natur, t.ex. antagandet att fördelningen av den population som urvalet kommer från är normal.

F: Är konfidensintervall robust statistik?


S: Konfidensintervall, som diskuteras nedan, är inte robust statistik, även om justeringar kan göras för att öka robustheten.

AlegsaOnline.com - 2020 / 2023 - License CC3