Bayes' teorem är en grundläggande sats i sannolikhetsteori som beskriver hur man uppdaterar sannolikheten för en händelse när ny information blir tillgänglig. I sin enklaste form ger teoremet en relation mellan en villkorlig sannolikhet och dess omvända: sannolikheten för en hypotes givet observerade data kan uttryckas med hjälp av sannolikheten för samma data givet hypotesen.

Formel och huvudkomponenter

Den vanliga algebraiska formen skrivs kortfattat som: P(A|B) = P(B|A) · P(A) / P(B). Här betecknar P(A|B) den uppdaterade sannolikheten (posterior) för A när B observerats. De centrala delarna är:

  • Prior (P(A)) – den initiala sannolikheten för A innan ny data tas i beaktande.
  • Sannolikhet eller likelihood (P(B|A)) – hur troligt det är att observera B om A är sann.
  • Bevis eller marginal (P(B)) – totala sannolikheten för observationen B, ofta beräknad som summan eller integralen över alla möjliga hypoteser.
  • Posterior (P(A|B)) – den uppdaterade sannolikheten för A efter att B observerats.

Tolkningar och vidare generalisering

Bayes' teorem tolkas ofta som ett rationellt sätt att uppdatera tro eller osäkerhet. För kontinuerliga variabler används täthetsfunktioner i stället för diskreta sannolikheter, men principen är densamma. I praktiken används Bayesiansk inferens för att kombinera expertkunskap (prior) och data (likelihood) till en posterior för beslut eller för att skatta parametrar.

Kort historik

Teoremet är uppkallat efter Thomas Bayes och publicerades postumt under 1700‑talet. Begreppet utvecklades vidare av andra matematiker och statistiker och har blivit centralt i det som kallas bayesiansk statistik. I modern tid har beräkningsmetoder som Monte Carlo-simuleringar gjort bayesianska metoder praktiskt användbara i många komplexa problem.

Användningsområden och exempel

Bayes' teorem används i en rad fält där osäkerhet och stegvis uppdatering är viktiga. Några typiska tillämpningar:

  • Medicinsk diagnos: beräkna sannolikheten för en sjukdom givet ett testresultat, där prevalens fungerar som prior.
  • Spam-klassificering: naiv Bayes‑klassificerare kombinerar ordsannolikheter för att avgöra om ett mejl är skräppost.
  • Maskininlärning och statistisk modellering: bayesianska metoder används för parameterestimering, modelljämförelse och osäkerhetskvantifiering.
  • Rättsväsende och riskbedömning: tolkning av bevis och uppdatering av hypoteser när nya data framkommer.

Viktiga anmärkningar och begränsningar

Valet av prior kan påverka resultatet, särskilt vid liten datamängd, vilket gör det viktigt att vara transparent och pröva olika rimliga priorer. En vanlig förenkling i tillämpningar är antagandet om villkorlig oberoende ("naiv Bayes"), vilket gör beräkningar enklare men kan vara en dålig approximation i vissa problem. Fördjupningar och beräkningsmetoder finns i fackspråket för bayesiansk statistik och maskininlärning.

Sammanfattningsvis är Bayes' teorem ett enkelt men kraftfullt ramverk för att kombinera tidigare kunskap och ny data. För ytterligare tekniska detaljer och formella härledningar, se introduktioner i sannolikhetsteori och bayesiansk inferens samt resurser märkta med hypotes och relaterade koncept.