Inom statistiken är ett konfidensintervall en särskild form av uppskattning av en viss parameter. Istället för att ange ett enda värde ges ett helt intervall av rimliga värden för parametern, tillsammans med en angiven sannolikhet (konfidensnivån) för att det sanna, okända värdet ligger i detta intervall. Konfidensintervallet beräknas från ett urval och varierar därför mellan olika urval. Sannolikheten för att parametern ligger i intervallet kallas konfidensnivå och anges ofta i procent, t.ex. "95 % konfidensintervall". Slutpunkterna kallas konfidensgränser. För ett givet skattningsförfarande gäller i allmänhet att ju högre konfidensnivån är, desto bredare blir intervallet.

Beräkningen av ett konfidensintervall bygger vanligen på antaganden om hur skattningsprocessen ser ut och är därför främst en parametrisk metod. Ett vanligt antagande är att populationen ur vilken urvalet kommer är normal. Därför är många standardmetoder inte särskilt robusta mot avvikande antaganden, även om det finns ändringar och alternativa metoder (t.ex. bootstrap) för att öka robustheten.

Vad menas med "95 % konfidensintervall"?

En korrekt tolkning i frekventistisk mening är: Om man upprepar urvals- och beräkningsproceduren många gånger och för varje urval bildar ett 95 % konfidensintervall, så kommer cirka 95 % av dessa intervall att innehålla det sanna parameter-värdet. Det är alltså ett uttalande om procedurens långsiktiga egenskaper, inte en sannolikhet för att ett redan beräknat intervall innehåller parametern. Det är en vanlig missuppfattning att man kan säga att "det finns 95 % sannolikhet att parametern ligger i det här specifika intervallet" — det är inte korrekt i strikt frekventistisk tolkning.

Vanliga konfidensintervall och formler

  • Medelvärde, känd varians: Om populationens standardavvikelse σ är känd och urvalet är slumpmässigt och tillräckligt stort (eller populationen normalfördelad) ges
    CI: x̄ ± z* · (σ/√n)
    där z* är kritiskt värde från normalfördelningen (t.ex. z* ≈ 1.96 för 95 %).
  • Medelvärde, okänd varians: Om σ är okänd används t-fördelningen:
    CI: x̄ ± t* · (s/√n)
    där s är stickprovsstandardavvikelsen och t* är kvantilen från t-fördelningen med n−1 frihetsgrader.
  • Proportion (binomial): För andelen p̂ i ett stort stickprov kan man ofta använda den aproximativa formeln
    CI: p̂ ± z* · √(p̂(1−p̂)/n).
    För små n eller extremt p̂ rekommenderas exakta intervall (t.ex. Clopper–Pearson) eller korrigerade approximationer.
  • Skillnad mellan två medelvärden eller två proportioner: Liknande formler finns där standardfel för skillnaden används och eventuellt pooled-varians eller t-fördelning anpassat efter frihetsgrader.

Val av konfidensnivå och kritiska värden

Vanliga konfidensnivåer är 90 %, 95 % och 99 %. De motsvarande z*-värdena är ungefär 1.645, 1.96 respektive 2.576. Högre konfidensnivå ger bredare intervall eftersom man kräver större säkerhet att proceduren täcker det sanna värdet.

Hur påverkas intervallets bredd?

  • Större sampelstorlek n minskar intervallets bredd (skalas ungefär med 1/√n).
  • Större variation i data (högre σ eller s) ger bredare intervall.
  • Högre konfidensnivå ger bredare intervall (större z* eller t*).

Beräkning av n för önskad precision

Om man vill att halva längden (felmarginalen) av ett konfidensintervall inte ska överstiga E kan man lösa för n. För medelvärdet (σ känd): n = (z* · σ / E)^2. För proportioner använder man n = p(1−p)(z*/E)^2; om p okänt tar man p = 0.5 för konservativt (störst n).

Antaganden och robustare alternativ

Standard-CI för medelvärde och proportion bygger på antaganden om slumpmässigt urval, oberoende observationer och i många fall normalfördelning (eller att n är stort nog för central limit theorem att gälla). Vid brott mot dessa antaganden kan täckningssannolikheten (den faktiska andelen intervall som innehåller parametern) skilja sig från den nominella konfidensnivån.

Alternativa metoder:

  • Bootstrap: Ickeparametrisk metod som bygger på upprepade resamplingar från de observerade data för att uppskatta fördelningen av skattaren och därmed konfidensintervall (t.ex. percentil-, BCa-intervall).
  • Exakta intervall: För binomialfördelningen används t.ex. Clopper–Pearson för att få exakta gränser med åtminstone nominell täckning.
  • Transformationer: För skeva data kan log- eller annan transformation ge bättre egenskaper innan man bildar CI för transformerad parameter och sedan inverterar transformationen.

Exempel (numeriskt)

Antag ett stickprov med medelvärde x̄ = 100, stickprovsstandardavvikelse s = 15 och n = 25. Ett 95 % konfidensintervall för medelvärdet (okänd σ) är:

t* (df=24) ≈ 2.064 → CI = 100 ± 2.064 · (15/√25) = 100 ± 2.064 · 3 = 100 ± 6.192 → (93.81, 106.19).

Vanliga missuppfattningar och viktiga rekommendationer

  • Konfidensintervallet visar inte sannolikhetsfördelningen för parametern i posterior-sinne (det kräver Bayesian metodik).
  • Att ett 95 % CI inte innehåller noll innebär ofta att ett tvåsidigt test på signifikansnivå 5 % skulle förkasta nollhypotesen, men tolkningen bör göras försiktigt beroende på testets karaktär.
  • Rapportera alltid både intervallet och konfidensnivån, samt relevanta antaganden (t.ex. normalitet, slumpmässigt urval, använd t- eller z-fördelning).
  • Tänk på praktisk betydelse: ett smalt CI nära noll kan vara statistiskt men kanske inte kliniskt relevant, och vice versa för ett brett CI.

Sammanfattning

Ett konfidensintervall ger ett intervall av rimliga värden för en okänd parameter tillsammans med en angiven konfidensnivå. Intervallets tolkning är frekventistisk: det beskriver en procedurs långsiktiga täckningsegenskap, inte sannolikheten för att parametern ligger i det specifika beräknade intervallet. Val av metod och antaganden påverkar både intervallets bredd och dess täckning. Vid avvikande förutsättningar finns robustare eller icke-parametriska alternativ, såsom bootstrap och exakta intervall.