Vad är konfidensintervall? Definition, tolkning och beräkning

Lär dig vad konfidensintervall är — tydlig definition, tolkning, beräkning och exempel (inkl. 95% CI). Praktisk guide för statistik, analys och korrekt tolkning.

Författare: Leandro Alegsa

Inom statistiken är ett konfidensintervall en särskild form av uppskattning av en viss parameter. Istället för att ange ett enda värde ges ett helt intervall av rimliga värden för parametern, tillsammans med en angiven sannolikhet (konfidensnivån) för att det sanna, okända värdet ligger i detta intervall. Konfidensintervallet beräknas från ett urval och varierar därför mellan olika urval. Sannolikheten för att parametern ligger i intervallet kallas konfidensnivå och anges ofta i procent, t.ex. "95 % konfidensintervall". Slutpunkterna kallas konfidensgränser. För ett givet skattningsförfarande gäller i allmänhet att ju högre konfidensnivån är, desto bredare blir intervallet.

Beräkningen av ett konfidensintervall bygger vanligen på antaganden om hur skattningsprocessen ser ut och är därför främst en parametrisk metod. Ett vanligt antagande är att populationen ur vilken urvalet kommer är normal. Därför är många standardmetoder inte särskilt robusta mot avvikande antaganden, även om det finns ändringar och alternativa metoder (t.ex. bootstrap) för att öka robustheten.

Vad menas med "95 % konfidensintervall"?

En korrekt tolkning i frekventistisk mening är: Om man upprepar urvals- och beräkningsproceduren många gånger och för varje urval bildar ett 95 % konfidensintervall, så kommer cirka 95 % av dessa intervall att innehålla det sanna parameter-värdet. Det är alltså ett uttalande om procedurens långsiktiga egenskaper, inte en sannolikhet för att ett redan beräknat intervall innehåller parametern. Det är en vanlig missuppfattning att man kan säga att "det finns 95 % sannolikhet att parametern ligger i det här specifika intervallet" — det är inte korrekt i strikt frekventistisk tolkning.

Vanliga konfidensintervall och formler

  • Medelvärde, känd varians: Om populationens standardavvikelse σ är känd och urvalet är slumpmässigt och tillräckligt stort (eller populationen normalfördelad) ges
    CI: x̄ ± z* · (σ/√n)
    där z* är kritiskt värde från normalfördelningen (t.ex. z* ≈ 1.96 för 95 %).
  • Medelvärde, okänd varians: Om σ är okänd används t-fördelningen:
    CI: x̄ ± t* · (s/√n)
    där s är stickprovsstandardavvikelsen och t* är kvantilen från t-fördelningen med n−1 frihetsgrader.
  • Proportion (binomial): För andelen p̂ i ett stort stickprov kan man ofta använda den aproximativa formeln
    CI: p̂ ± z* · √(p̂(1−p̂)/n).
    För små n eller extremt p̂ rekommenderas exakta intervall (t.ex. Clopper–Pearson) eller korrigerade approximationer.
  • Skillnad mellan två medelvärden eller två proportioner: Liknande formler finns där standardfel för skillnaden används och eventuellt pooled-varians eller t-fördelning anpassat efter frihetsgrader.

Val av konfidensnivå och kritiska värden

Vanliga konfidensnivåer är 90 %, 95 % och 99 %. De motsvarande z*-värdena är ungefär 1.645, 1.96 respektive 2.576. Högre konfidensnivå ger bredare intervall eftersom man kräver större säkerhet att proceduren täcker det sanna värdet.

Hur påverkas intervallets bredd?

  • Större sampelstorlek n minskar intervallets bredd (skalas ungefär med 1/√n).
  • Större variation i data (högre σ eller s) ger bredare intervall.
  • Högre konfidensnivå ger bredare intervall (större z* eller t*).

Beräkning av n för önskad precision

Om man vill att halva längden (felmarginalen) av ett konfidensintervall inte ska överstiga E kan man lösa för n. För medelvärdet (σ känd): n = (z* · σ / E)^2. För proportioner använder man n = p(1−p)(z*/E)^2; om p okänt tar man p = 0.5 för konservativt (störst n).

Antaganden och robustare alternativ

Standard-CI för medelvärde och proportion bygger på antaganden om slumpmässigt urval, oberoende observationer och i många fall normalfördelning (eller att n är stort nog för central limit theorem att gälla). Vid brott mot dessa antaganden kan täckningssannolikheten (den faktiska andelen intervall som innehåller parametern) skilja sig från den nominella konfidensnivån.

Alternativa metoder:

  • Bootstrap: Ickeparametrisk metod som bygger på upprepade resamplingar från de observerade data för att uppskatta fördelningen av skattaren och därmed konfidensintervall (t.ex. percentil-, BCa-intervall).
  • Exakta intervall: För binomialfördelningen används t.ex. Clopper–Pearson för att få exakta gränser med åtminstone nominell täckning.
  • Transformationer: För skeva data kan log- eller annan transformation ge bättre egenskaper innan man bildar CI för transformerad parameter och sedan inverterar transformationen.

Exempel (numeriskt)

Antag ett stickprov med medelvärde x̄ = 100, stickprovsstandardavvikelse s = 15 och n = 25. Ett 95 % konfidensintervall för medelvärdet (okänd σ) är:

t* (df=24) ≈ 2.064 → CI = 100 ± 2.064 · (15/√25) = 100 ± 2.064 · 3 = 100 ± 6.192 → (93.81, 106.19).

Vanliga missuppfattningar och viktiga rekommendationer

  • Konfidensintervallet visar inte sannolikhetsfördelningen för parametern i posterior-sinne (det kräver Bayesian metodik).
  • Att ett 95 % CI inte innehåller noll innebär ofta att ett tvåsidigt test på signifikansnivå 5 % skulle förkasta nollhypotesen, men tolkningen bör göras försiktigt beroende på testets karaktär.
  • Rapportera alltid både intervallet och konfidensnivån, samt relevanta antaganden (t.ex. normalitet, slumpmässigt urval, använd t- eller z-fördelning).
  • Tänk på praktisk betydelse: ett smalt CI nära noll kan vara statistiskt men kanske inte kliniskt relevant, och vice versa för ett brett CI.

Sammanfattning

Ett konfidensintervall ger ett intervall av rimliga värden för en okänd parameter tillsammans med en angiven konfidensnivå. Intervallets tolkning är frekventistisk: det beskriver en procedurs långsiktiga täckningsegenskap, inte sannolikheten för att parametern ligger i det specifika beräknade intervallet. Val av metod och antaganden påverkar både intervallets bredd och dess täckning. Vid avvikande förutsättningar finns robustare eller icke-parametriska alternativ, såsom bootstrap och exakta intervall.

Betydelse av termen "förtroende"

Termen förtroende har en liknande betydelse inom statistiken som i allmänt bruk. I vanligt språkbruk brukar ett påstående om att 95 % av en sak är säker anses vara en virtuell säkerhet. Inom statistiken innebär ett påstående om 95 % säkerhet helt enkelt att forskaren har sett ett möjligt intervall av ett stort antal möjliga intervall, där nitton av tjugo intervall innehåller parameterns sanna värde.

Praktiskt exempel

A factory assembly line fills margarine cups to a desired 250g +/- 5g

En maskin fyller koppar med margarin. I exemplet är maskinen inställd så att kopparna innehåller 250 g margarin. Eftersom maskinen inte kan fylla varje kopp med exakt 250 g, uppvisar innehållet i de enskilda kopparna en viss variation och betraktas som en slumpmässig variabel X. Denna variation antas vara normalfördelad runt det önskade genomsnittet på 250 g, med en standardavvikelse på 2,5 g. För att avgöra om maskinen är tillräckligt kalibrerad väljs ett slumpmässigt urval av n = 25 koppar margarin ut och kopparna vägs. Margarinets vikt är X1, ..., X25, ett slumpmässigt urval från X.

För att få en uppfattning om förväntningen μ räcker det att ge en uppskattning. Den lämpliga skattaren är urvalets medelvärde:

μ ^ = X ¯ = 1 n ∑ i = 1 n X i . {\displaystyle {\hat {\mu }}={\bar {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}. } {\displaystyle {\hat {\mu }}={\bar {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}.}

I provet visas faktiska vikter x1, ...,x25, med medelvärde:

x ¯ = 1 25 ∑ i = 1 25 x i = 250,2 gram . {\displaystyle {\bar {x}}={\frac {1}{25}}}\sum _{i=1}^{25}x_{i}=250.2\,{\text{gram}}. } {\displaystyle {\bar {x}}={\frac {1}{25}}\sum _{i=1}^{25}x_{i}=250.2\,{\text{grams}}.}

Om vi tar ett nytt prov på 25 koppar kan vi lätt förvänta oss att hitta värden som 250,4 eller 251,1 gram. Ett medelvärde på 280 gram skulle dock vara ytterst sällsynt om det genomsnittliga innehållet i kopparna faktiskt ligger nära 250 gram. Det finns ett helt intervall runt det observerade värdet 250,2 för provets medelvärde inom vilket, om hela populationens medelvärde faktiskt antar ett värde inom detta intervall, de observerade uppgifterna inte skulle betraktas som särskilt ovanliga. Ett sådant intervall kallas konfidensintervall för parametern μ. Hur beräknar vi ett sådant intervall? Intervallets ändpunkter måste beräknas från urvalet, så de är statistik, funktioner av urvalet X1, ..., X25 och därmed själva slumpvariabler.

I vårt fall kan vi bestämma slutpunkterna genom att beakta att medelvärdet X från ett normalfördelat urval också är normalfördelat, med samma förväntan μ, men med ett standardfel σ/√n = 0,5 (gram). Genom att standardisera får vi en slumpmässig variabel

Z = X ¯ - μ σ / n = X ¯ - μ 0.5 {\displaystyle Z={\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}={\frac {{\bar {X}}-\mu }{0.5}}} {\displaystyle Z={\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}={\frac {{\bar {X}}-\mu }{0.5}}}

som är beroende av parametern μ som ska uppskattas, men med en standardnormalfördelning som är oberoende av parametern μ. Därför är det möjligt att hitta tal -z och z som är oberoende av μ, där Z ligger däremellan med sannolikheten 1 - α, ett mått på hur säker vi vill vara. Vi tar 1 - α = 0,95. Så vi har:

P ( - z ≤ Z ≤ z ) = 1 - α = 0,95. {\displaystyle P(-z\leq Z\leq z)=1-\alpha =0,95.\,} {\displaystyle P(-z\leq Z\leq z)=1-\alpha =0.95.\,}

Antalet z följer av den kumulativa fördelningsfunktionen:

Φ ( z ) = P ( Z ≤ z ) = 1 - α 2 = 0,975 , z = Φ - 1 ( Φ ( z ) ) = Φ - 1 ( 0,975 ) = 1.96 , {\displaystyle {\begin{aligned}\Phi (z)&=P(Z\leq z)=1-{\tfrac {\alpha }{2}}}=0.975,\\[6pt]z&=\Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0.975)=1.96,\end{aligned}}} {\displaystyle {\begin{aligned}\Phi (z)&=P(Z\leq z)=1-{\tfrac {\alpha }{2}}=0.975,\\[6pt]z&=\Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0.975)=1.96,\end{aligned}}}

och vi får:

0,95 = 1 - α = P ( - z ≤ Z ≤ z ) = P ( - 1,96 ≤ X ¯ - μ σ / n ≤ 1,96 ) = P ( X ¯ - 1,96 σ n ≤ μ ≤ ≤ X ¯ + 1.96 σ n ) = P ( X ¯ - 1,96 × 0,5 ≤ μ ≤ X ¯ + 1,96 × 0,5 ) = P ( X ¯ - 0,98 ≤ μ ≤ X ¯ + 0,98 ) . {\displaystyle {\begin{aligned}0.95&=1-\alpha =P(-z\leq Z\leq z)=P\left(-1.96\leq {\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}\leq 1.96\right)\\[6pt]&=P\left({\bar {X}}-1.96{\frac {\sigma }{\sqrt {n}}}}\leq \mu \leq {\bar {X}}+1.96{\frac {\sigma }{\sqrt {n}}}\right)\\[6pt]&=P\left({\bar {X}}-1.96\times 0.5\leq \mu \leq \leq {\bar {X}}+1.96\times 0.5\right)\\[6pt]&=P\left({\bar {X}}-0.98\leq \mu \leq {\bar {X}}+0.98\right).\end{aligned}}} {\displaystyle {\begin{aligned}0.95&=1-\alpha =P(-z\leq Z\leq z)=P\left(-1.96\leq {\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}\leq 1.96\right)\\[6pt]&=P\left({\bar {X}}-1.96{\frac {\sigma }{\sqrt {n}}}\leq \mu \leq {\bar {X}}+1.96{\frac {\sigma }{\sqrt {n}}}\right)\\[6pt]&=P\left({\bar {X}}-1.96\times 0.5\leq \mu \leq {\bar {X}}+1.96\times 0.5\right)\\[6pt]&=P\left({\bar {X}}-0.98\leq \mu \leq {\bar {X}}+0.98\right).\end{aligned}}}

Detta kan tolkas som att vi med en sannolikhet på 0,95 kommer att hitta ett konfidensintervall där vi möter parametern μ mellan de stokastiska slutpunkterna

X ¯ - 0 . 98 {\displaystyle {\bar {\bar {X}}-0{.}98\,} {\displaystyle {\bar {X}}-0{.}98\,}

och

X ¯ + 0.98. {\displaystyle {\bar {X}}+0.98.\,} {\displaystyle {\bar {X}}+0.98.\,}

Detta betyder inte att det är 0,95 sannolikhet att parametern μ finns i det beräknade intervallet. Varje gång mätningarna upprepas kommer det att finnas ett annat värde för medelvärdet X för urvalet. I 95 % av fallen kommer μ att ligga mellan de slutpunkter som beräknats utifrån detta medelvärde, men i 5 % av fallen kommer det inte att göra det. Det faktiska konfidensintervallet beräknas genom att man anger de uppmätta vikterna i formeln. Vårt konfidensintervall på 0,95 blir:

( x ¯ - 0,98 ; x ¯ + 0,98 ) = ( 250,2 - 0,98 ; 250,2 + 0,98 ) = ( 249,22 ; 251,18 ) . {\displaystyle ({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,} {\displaystyle ({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,}

Eftersom det önskade värdet 250 för μ ligger inom det resulterande konfidensintervallet finns det ingen anledning att tro att maskinen är felkalibrerad.

Det beräknade intervallet har fasta slutpunkter, där μ kan ligga däremellan (eller inte). Denna händelse har alltså en sannolikhet på antingen 0 eller 1. Vi kan inte säga det: Vi kan inte säga: "Med sannolikhet (1 - α) ligger parametern μ i konfidensintervallet." Vi vet bara att genom upprepning i 100(1 - α) % av fallen kommer μ att ligga i det beräknade intervallet. I 100α % av fallen gör den det dock inte. Och tyvärr vet vi inte i vilka av fallen detta sker. Det är därför vi säger: "Med en konfidensnivå på 100(1 - α) % ligger μ i konfidensintervallet. "

Figuren till höger visar 50 realiseringar av ett konfidensintervall för ett givet populationsmedelvärde μ. Om vi slumpmässigt väljer en realisering är sannolikheten 95 % att vi i slutändan har valt ett intervall som innehåller parametern, men vi kan ha otur och ha valt fel. Vi kommer aldrig att få veta; vi sitter fast med vårt intervall.

De vertikala linjesegmenten representerar 50 realiseringar av ett konfidensintervall för μ.Zoom
De vertikala linjesegmenten representerar 50 realiseringar av ett konfidensintervall för μ.

Frågor och svar

F: Vad är ett konfidensintervall inom statistiken?


S: Ett konfidensintervall är ett särskilt intervall som används för att uppskatta en parameter, t.ex. populationsmedelvärdet, och som ger ett intervall av acceptabla värden för parametern i stället för ett enda värde.

F: Varför används ett konfidensintervall i stället för ett enskilt värde?


S: Ett konfidensintervall används i stället för ett enskilt värde för att ta hänsyn till osäkerheten vid uppskattning av en parameter baserat på ett urval, och för att ge en sannolikhet för att det verkliga värdet av parametern ligger inom intervallet.

F: Vad är en konfidensnivå?


S: En konfidensnivå är sannolikheten för att den uppskattade parametern ligger inom konfidensintervallet och anges ofta som en procentsats (t.ex. 95 % konfidensintervall).

F: Vad är konfidensgränser?


S: Konfidensgränser är slutpunkterna i ett konfidensintervall, som definierar intervallet av acceptabla värden för den parameter som uppskattas.

F: Hur påverkar konfidensnivån konfidensintervallet?


S: Ju högre konfidensnivån är, desto bredare blir konfidensintervallet i ett givet skattningsförfarande.

F: Vilka antaganden krävs för att beräkna ett konfidensintervall?


S: Beräkningen av ett konfidensintervall kräver i allmänhet antaganden om skattningsprocessens natur, t.ex. antagandet att fördelningen av den population som urvalet kommer från är normal.

F: Är konfidensintervall robust statistik?


S: Konfidensintervall, som diskuteras nedan, är inte robust statistik, även om justeringar kan göras för att öka robustheten.


Sök
AlegsaOnline.com - 2020 / 2025 - License CC3