Frekvensfördelning: Definition, exempel och frekvenstabeller i statistik
Frekvensfördelning: Lär dig definition, praktiska exempel och tydliga frekvenstabeller i statistik — steg-för-steg för diskreta och kontinuerliga data.
Inom statistiken är en frekvensfördelning en lista över de värden som en variabel har i ett urval. Den visar hur många gånger varje värde förekommer och kan presenteras både som absoluta frekvenser (antal) och relativa frekvenser (andelar eller procent).
Typer av frekvenser
- Absolut frekvens (fi): antalet observationer för ett visst värde eller klass.
- Relativ frekvens (fi / n): andelen av totalen (ofta uttryckt i procent). Beräknas som fi dividerat med det totala antalet observationer n.
- Kumulativ frekvens (Fi): löpande summa av absoluta frekvenser upp till och med en viss klass eller värde.
- Kumulativ relativ frekvens: löpande summa av relativa frekvenser (kan också uttryckas i procent).
Enkel, diskret frekvenstabell — exempel (Likert)
Anta att 100 personer svarat på en femgradig Likertskala (1 = starkt instämmer, 5 = starkt avvikande). En möjlig frekvenstabell kan vara:
| Värde | Absolut frekvens (fi) | Relativ frekvens |
|---|---|---|
| 1 | 30 | 30/100 = 0,30 (30 %) |
| 2 | 25 | 25/100 = 0,25 (25 %) |
| 3 | 20 | 20/100 = 0,20 (20 %) |
| 4 | 15 | 15/100 = 0,15 (15 %) |
| 5 | 10 | 10/100 = 0,10 (10 %) |
| Totalt | 100 | 100 % |
Den här tabellen är enkel att göra när variabeln antar ett begränsat antal diskreta värden.
Gruppad (intervallbaserad) frekvenstabell — exempel (längd)
När variabeln är kontinuerlig eller har många olika värden används klasser (intervall). Exempelvis längd (cm) för 100 elever:
| Intervall (cm) | Absolut frekvens (fi) | Mittpunkt (mi) | Relativ frekvens | Kumulativ frekvens |
|---|---|---|---|---|
| 150–159 | 8 | 154.5 | 8/100 = 0,08 (8 %) | 8 |
| 160–169 | 22 | 164.5 | 22/100 = 0,22 (22 %) | 30 |
| 170–179 | 40 | 174.5 | 40/100 = 0,40 (40 %) | 70 |
| 180–189 | 25 | 184.5 | 25/100 = 0,25 (25 %) | 95 |
| 190–199 | 5 | 194.5 | 5/100 = 0,05 (5 %) | 100 |
| Totalt | 100 | 100 % |
För kontinuerliga data används klassgränser, klassbredd och klassmittpunkter (mi). Klassmittpunkten används ofta när man vill uppskatta medelvärde från grupperade data.
Beräkna medelvärde från grupperade data
Ungefärligt medelvärde för grupperade data beräknas med formeln:
x̄ ≈ (Σ mi · fi) / n
Där mi är klassens mittpunkt, fi är frekvensen i klassen och n är totalantalet observationer. I vårt längdexempel blir medelvärdet ungefär:
- Σ mi·fi = 154.5·8 + 164.5·22 + 174.5·40 + 184.5·25 + 194.5·5
- Dividera summan med n = 100 för att få x̄ (ungefärligt medelvärde).
Hur man skapar en bra frekvenstabell — praktiska råd
- Välj ett lämpligt antal klasser. En vanlig tumregel är Sturges' regel: k ≈ 1 + log2(n) (eller k ≈ 1 + 3.322·log10(n)).
- Använd lika breda klasser om möjligt för enklare tolkning och diagram.
- Täck hela värdeområdet och se till att klasser inte överlappar (använd öppna/ stängda gränser konsekvent, t.ex. 150–159, 160–169).
- Avrunda klassgränser så att de är lätta att tolka (t.ex. hela centimeter).
- Räkna ut både absoluta och relativa frekvenser. Relativa frekvenser gör det lättare att jämföra grupper med olika totala storlekar.
- Vid mycket ojämt fördelade data kan man överväga ojämna klassbredder eller transformationsmetoder, men var försiktig med tolkningen.
Grafiska representationer
- Stapeldiagram: lämpar sig för diskreta värden (t.ex. svarsfrekvenser på en Likertskala).
- Histogram: används för grupperade/ kontinuerliga data; staplarna visar frekvensen för varje klass och står intill varandra.
- Frekvenspolygon: linjediagram som förbinder klassmittpunkterna; bra för att jämföra fördelningar.
- Ogiv (kumulativ frekvenskurva): visar kumulativ frekvens eller andel och används för att läsa av percentiler.
- Cirkeldiagram: kan användas för att illustrera relativa frekvenser men blir snabbt svårlästa med många kategorier.
Vanliga fallgropar
- Att välja för många eller för få klasser — för få döljer variation, för många ger brus.
- Att blanda öppna och slutna klassgränser utan att ange konvention (till exempel om 159.5 ingår i första eller andra klassen).
- Att använda procent utan att ange totalen (n), vilket kan leda till missförstånd.
Sammanfattningsvis ger frekvensfördelningar en grundläggande men kraftfull bild av hur data är fördelade. Genom att välja lämplig tabelltyp (diskret eller grupperad), beräkna både absoluta och relativa frekvenser och använda lämpliga diagram kan du enkelt beskriva, analysera och kommunicera statistiska data.

Detta är Kinas befolkningspyramid för år 2005.

Exempel på en (absolut) frekvensfördelning. Detta är Angolas befolkningspyramid för år 2005.
Applikationer
Det är mycket enklare att hantera och bearbeta data i frekvenstabeller än att bearbeta rådata. Det finns enkla algoritmer för att beräkna median, medelvärde (statistik), standardavvikelse etc. från dessa tabeller.
Statistisk hypotesprövning bygger på en bedömning av skillnader och likheter mellan frekvensfördelningar. Denna bedömning omfattar mått på central tendens eller medelvärden, t.ex. medelvärde och median, och mått på variabilitet eller statistisk spridning, t.ex. standardavvikelse eller varians.
En frekvensfördelning sägs vara skev när dess medelvärde och median är olika. Kurtisen i en frekvensfördelning är koncentrationen av poäng vid medelvärdet, eller hur toppig fördelningen ser ut om den avbildas grafiskt - till exempel i ett histogram. Om fördelningen är mer spetsig än normalfördelningen sägs den vara leptokurtisk; om den är mindre spetsig sägs den vara platykurtisk.
Frekvensfördelningar används också i frekvensanalyser för att knäcka koder och avser den relativa frekvensen av bokstäver i olika språk.
| ||||||||||||||||||||||||
| ||||||||||||||||||||||||
| ||||||||||||||||||||||||
| ||||||||||||||||||||||||
| ||||||||||||||||||||||||
| ||||||||||||||||||||||||
| ||||||||||||||||||||||||
|
Frågor och svar
F: Vad är en frekvensfördelning?
S: En frekvensfördelning är en förteckning över de värden som en variabel antar i ett urval, ordnade efter kvantitet. Den visar hur många gånger varje värde förekommer.
F: Hur kan frekvensfördelningen av svaren på en femgradig Likertskala se ut?
S: Frekvensfördelningen av svaren på en femgradig Likertskala kan se ut som en enkel tabell som visar hur många personer som har betygsatt varje punkt på skalan.
F: Vilka är två nackdelar med att använda denna typ av tabell?
S: Två nackdelar med att använda denna typ av tabell är att det kan vara svårt eller till och med omöjligt att använda den när det gäller kontinuerliga värden eller när det finns för många möjliga värden.
F: På vilket sätt skiljer sig detta schema när man hanterar kontinuerliga värden eller ett stort antal möjliga värden?
S: När det gäller kontinuerliga värden eller ett stort antal möjliga värden kan man i stället använda ett något annorlunda system som bygger på värdeintervall.
F: Hur kan en frekvenstabell för elevernas längd se ut?
S: Frekvenstabellen för elevlängder kan visa intervall och hur många elever som faller inom varje intervall.
F: Vilken information ger frekvensfördelningen?
S: Frekvensfördelningen ger information om hur ofta vissa variabler förekommer i urvalet och hur de är fördelade över urvalet.
Sök