Statistik är en gren av den tillämpade matematiken som handlar om att samla in, organisera, analysera, läsa och presentera data. Beskrivande statistik gör sammanfattningar av uppgifter. Med hjälp av inferentiell statistik kan man göra förutsägelser. Statistik hjälper till vid studier av många andra områden, t.ex. vetenskap, medicin, ekonomi, psykologi, politik och marknadsföring. En person som arbetar med statistik kallas statistiker. Förutom att vara namnet på ett studieområde kan ordet "statistik" också betyda siffror som används för att beskriva data eller samband.
Grundläggande begrepp
- Population – den fullständiga mängden individer eller enheter som intresserar oss (t.ex. alla röstberättigade i ett land).
- Stickprov – en delmängd av populationen som undersöks för att dra slutsatser om hela populationen.
- Variabel – en egenskap som kan mätas eller kategoriseras (t.ex. ålder, kön, inkomst).
- Data – insamlade observationer eller mätvärden, antingen kvantitativa (tal) eller kvalitativa (kategorier).
Metoder inom statistik
Statistik delas ofta in i två huvudgrupper:
- Beskrivande statistik – metoder för att sammanfatta och presentera data, t.ex. medelvärde, median, typvärde, varians, standardavvikelse och diagram (staplar, histogram, lådagram).
- Inferentiell statistik – metoder för att dra slutsatser om en population utifrån ett stickprov, t.ex. hypotesprövning, konfidensintervall och regressionsanalys.
Vanliga mått och tekniker
- Centralmått: medelvärde (genomsnitt), median (mittenvärde), och typvärde (mest frekventa värdet).
- Spridningsmått: varians, standardavvikelse och interkvartilavstånd som beskriver hur utspridda värdena är.
- Korrelations- och regressionsanalyser: undersöker samband mellan variabler och kan användas för att modellera och förutsäga resultat.
- Hypotesprövningar: metoder för att avgöra om observerade skillnader eller samband kan förklaras av slumpen.
- Bayesianska metoder: använder sannolikheter för att uppdatera kunskap baserat på ny data.
Steg i en statistisk undersökning
- Formulera frågeställning eller hypotes.
- Välja population och stickprovsmetod (slumpmässigt urval, stratifierat urval, klusterurval etc.).
- Samla in data på ett systematiskt sätt (enkäter, mätningar, observationer, registerdata).
- Bearbeta och rengöra data (hantera saknad information, felaktiga värden).
- Använda lämpliga statistiska metoder och visualiseringar.
- Tolka resultaten med hänsyn till osäkerhet och möjliga felkällor.
- Rapportera slutsatser och, vid behov, rekommendationer eller beslut.
Sannolikhetsurval, bias och felkällor
För att slutsatser från ett stickprov ska vara tillförlitliga behöver urvalet vara representativt. Vanliga problem är:
- Urvals-bias – när stickprovet inte representerar populationen (t.ex. självorienterade enkäter).
- Observer- eller mätfel – fel i insamlingen av data.
- Konfunderande variabler – dolda faktorer som påverkar sambandet mellan två variabler.
- Slumpmässigt fel – ofrånkomlig osäkerhet som minskar med större stickprov.
Visualisering och programvara
Att visa data i diagram gör det enklare att förstå mönster och avvikelser. Vanliga verktyg och program för statistisk analys och visualisering inkluderar R, Python (pandas, matplotlib, seaborn), SPSS, SAS och Excel. Väl valda diagram (t.ex. linjediagram för tidsserier, stapeldiagram för kategorier, lådagram för spridning) underlättar tolkning.
Tillämpningar och exempel
Statistik används i praktiken överallt där data ska tolkas:
- Inom vetenskap för att testa teorier och analysera experiment.
- Inom medicin för att bedöma läkemedels effekt och risker.
- Inom ekonomi för prognoser och policyeffekter.
- Inom marknadsföring för att förstå kundbeteenden och kampanjers effekt.
Etik och tolkning
Statistik kan lätt missförstås eller missbrukas. Det är viktigt att:
- Redovisa osäkerhet (t.ex. konfidensintervall) och inte bara punktuppskattningar.
- Var transparent med datainsamling, urvalsmetod och eventuella antaganden.
- Undvika att påstå kausalitet när endast korrelation har visats.
Sammanfattningsvis är statistik ett kraftfullt verktyg för att omvandla data till kunskap. Rätt använd kan den ge välgrundade insikter och stödja beslut inom många områden, men den kräver noggrann metodik och kritisk tolkning.

