Frekvensfördelning: Definition, exempel och frekvenstabeller i statistik

Frekvensfördelning: Lär dig definition, praktiska exempel och tydliga frekvenstabeller i statistik — steg-för-steg för diskreta och kontinuerliga data.

Författare: Leandro Alegsa

Inom statistiken är en frekvensfördelning en lista över de värden som en variabel har i ett urval. Den visar hur många gånger varje värde förekommer och kan presenteras både som absoluta frekvenser (antal) och relativa frekvenser (andelar eller procent).

Typer av frekvenser

  • Absolut frekvens (fi): antalet observationer för ett visst värde eller klass.
  • Relativ frekvens (fi / n): andelen av totalen (ofta uttryckt i procent). Beräknas som fi dividerat med det totala antalet observationer n.
  • Kumulativ frekvens (Fi): löpande summa av absoluta frekvenser upp till och med en viss klass eller värde.
  • Kumulativ relativ frekvens: löpande summa av relativa frekvenser (kan också uttryckas i procent).

Enkel, diskret frekvenstabell — exempel (Likert)

Anta att 100 personer svarat på en femgradig Likertskala (1 = starkt instämmer, 5 = starkt avvikande). En möjlig frekvenstabell kan vara:

VärdeAbsolut frekvens (fi)Relativ frekvens
13030/100 = 0,30 (30 %)
22525/100 = 0,25 (25 %)
32020/100 = 0,20 (20 %)
41515/100 = 0,15 (15 %)
51010/100 = 0,10 (10 %)
Totalt100100 %

Den här tabellen är enkel att göra när variabeln antar ett begränsat antal diskreta värden.

Gruppad (intervallbaserad) frekvenstabell — exempel (längd)

När variabeln är kontinuerlig eller har många olika värden används klasser (intervall). Exempelvis längd (cm) för 100 elever:

Intervall (cm)Absolut frekvens (fi)Mittpunkt (mi)Relativ frekvensKumulativ frekvens
150–1598154.58/100 = 0,08 (8 %)8
160–16922164.522/100 = 0,22 (22 %)30
170–17940174.540/100 = 0,40 (40 %)70
180–18925184.525/100 = 0,25 (25 %)95
190–1995194.55/100 = 0,05 (5 %)100
Totalt100100 %

För kontinuerliga data används klassgränser, klassbredd och klassmittpunkter (mi). Klassmittpunkten används ofta när man vill uppskatta medelvärde från grupperade data.

Beräkna medelvärde från grupperade data

Ungefärligt medelvärde för grupperade data beräknas med formeln:

x̄ ≈ (Σ mi · fi) / n

Där mi är klassens mittpunkt, fi är frekvensen i klassen och n är totalantalet observationer. I vårt längdexempel blir medelvärdet ungefär:

  • Σ mi·fi = 154.5·8 + 164.5·22 + 174.5·40 + 184.5·25 + 194.5·5
  • Dividera summan med n = 100 för att få x̄ (ungefärligt medelvärde).

Hur man skapar en bra frekvenstabell — praktiska råd

  • Välj ett lämpligt antal klasser. En vanlig tumregel är Sturges' regel: k ≈ 1 + log2(n) (eller k ≈ 1 + 3.322·log10(n)).
  • Använd lika breda klasser om möjligt för enklare tolkning och diagram.
  • Täck hela värdeområdet och se till att klasser inte överlappar (använd öppna/ stängda gränser konsekvent, t.ex. 150–159, 160–169).
  • Avrunda klassgränser så att de är lätta att tolka (t.ex. hela centimeter).
  • Räkna ut både absoluta och relativa frekvenser. Relativa frekvenser gör det lättare att jämföra grupper med olika totala storlekar.
  • Vid mycket ojämt fördelade data kan man överväga ojämna klassbredder eller transformationsmetoder, men var försiktig med tolkningen.

Grafiska representationer

  • Stapeldiagram: lämpar sig för diskreta värden (t.ex. svarsfrekvenser på en Likertskala).
  • Histogram: används för grupperade/ kontinuerliga data; staplarna visar frekvensen för varje klass och står intill varandra.
  • Frekvenspolygon: linjediagram som förbinder klassmittpunkterna; bra för att jämföra fördelningar.
  • Ogiv (kumulativ frekvenskurva): visar kumulativ frekvens eller andel och används för att läsa av percentiler.
  • Cirkeldiagram: kan användas för att illustrera relativa frekvenser men blir snabbt svårlästa med många kategorier.

Vanliga fallgropar

  • Att välja för många eller för få klasser — för få döljer variation, för många ger brus.
  • Att blanda öppna och slutna klassgränser utan att ange konvention (till exempel om 159.5 ingår i första eller andra klassen).
  • Att använda procent utan att ange totalen (n), vilket kan leda till missförstånd.

Sammanfattningsvis ger frekvensfördelningar en grundläggande men kraftfull bild av hur data är fördelade. Genom att välja lämplig tabelltyp (diskret eller grupperad), beräkna både absoluta och relativa frekvenser och använda lämpliga diagram kan du enkelt beskriva, analysera och kommunicera statistiska data.



Detta är Kinas befolkningspyramid för år 2005.   Zoom
Detta är Kinas befolkningspyramid för år 2005.  

Exempel på en (absolut) frekvensfördelning. Detta är Angolas befolkningspyramid för år 2005.  Zoom
Exempel på en (absolut) frekvensfördelning. Detta är Angolas befolkningspyramid för år 2005.  

Applikationer

Det är mycket enklare att hantera och bearbeta data i frekvenstabeller än att bearbeta rådata. Det finns enkla algoritmer för att beräkna median, medelvärde (statistik), standardavvikelse etc. från dessa tabeller.

Statistisk hypotesprövning bygger på en bedömning av skillnader och likheter mellan frekvensfördelningar. Denna bedömning omfattar mått på central tendens eller medelvärden, t.ex. medelvärde och median, och mått på variabilitet eller statistisk spridning, t.ex. standardavvikelse eller varians.

En frekvensfördelning sägs vara skev när dess medelvärde och median är olika. Kurtisen i en frekvensfördelning är koncentrationen av poäng vid medelvärdet, eller hur toppig fördelningen ser ut om den avbildas grafiskt - till exempel i ett histogram. Om fördelningen är mer spetsig än normalfördelningen sägs den vara leptokurtisk; om den är mindre spetsig sägs den vara platykurtisk.

Frekvensfördelningar används också i frekvensanalyser för att knäcka koder och avser den relativa frekvensen av bokstäver i olika språk.

  • Översikt
  • Index

Beskrivande statistik

Kontinuerliga uppgifter

Centrum

  • Median
  • Läge

Spridning

  • Avvikelse
  • Standardavvikelse
  • Genomsnittlig absolut avvikelse
  • Variationskoefficient
  • Percentil
  • Utbud
  • Interkvartilområde

Form

    • Skewness
    • Kurtosis
    • L-moment

Räkna uppgifter

  • Spridningsindex

Sammanfattande tabeller

  • Grupperade uppgifter
  • Frekvensfördelning
  • Beredskapstabell

Beroende

  • Korrelation mellan Pearson och produktmomentet
  • Rangkorrelation
  • Partiell korrelation
  • Spridningsdiagram

Grafik

  • Stapeldiagram
  • Biplot
  • Box plot
  • Kontrolldiagram
  • Korrelogram
  • Fläktdiagram
  • Skogsplanering
  • Histogram
  • cirkeldiagram
  • Q-Q-ritning
  • Körkort
  • Spridningsdiagram
  • Uppvisning av stjälkar och blad
  • Radarkarta
  • Handlingen för violin

Insamling av uppgifter

Uppläggning av studien

  • Befolkning
  • Statistik
  • Effektstorlek
  • Statistisk styrka
  • Optimal utformning
  • Fastställande av stickprovsstorlek
  • Replikering
  • Saknade uppgifter

Undersökningsmetodik

    • stratifierad
    • kluster

Kontrollerade experiment

Anpassningsbara konstruktioner

  • Anpassad klinisk prövning
  • Upp-och-nedkonstruktioner
  • Stokastisk approximation

Observationsstudier

  • Tvärsnittsstudie
  • Kohortstudie
  • Naturligt experiment
  • Kvasiexperiment

Statistisk inferens

Statistisk teori

  • Befolkning
  • Statistik
  • Sannolikhetsfördelning
  • Provtagningsfördelning
    • Beställningsstatistik
  • Empirisk fördelning
    • Uppskattning av densitet
  • Statistisk modell
    • Modellspecifikation
    • Lp utrymme
  • Parameter
    • plats
    • skala
    • form
    • Sannolikhet (monotont)
    • Familj i platsskala
    • Exponentiell familj
  • Fullständighet
  • Tillräcklighet
  • Statistisk funktionell
    • Bootstrap
    • U
    • V
  • Optimalt beslut
    • Förlustfunktion.
  • Effektivitet
  • Statistiskt avstånd
    • divergens
  • Asymptotik
  • Robusthet

Frekvensbaserad slutsats

Punktuppskattning

  • Uppskattning av ekvationer
    • Maximal sannolikhet
    • Momentmetoden
    • M-estimator
    • Minsta avstånd
  • Skattare utan förförståelse
    • Medelvärde-oberäknad minsta varians
      • Rao-Blackwellization
      • Lehmann-Scheffé-satsen
    • Median utan fördomar
  • Plug-in

Intervallskattning

  • Konfidensintervall
  • Pivot
  • Sannolikhetsintervall
  • Prognosintervall
  • Toleransintervall
  • Återprovtagning
    • Bootstrap
    • Jackknife

Prövning av hypoteser

  • 1- och 2-svansar
  • Effekt
    • Det enhetligt mest kraftfulla testet
  • Permutationstest
    • Randomiseringstest
  • Flerfaldiga jämförelser

Parametriska tester

  • Sannolikhetsförhållande
  • Multiplikator för poäng/avstånd
  • Wald

Särskilda tester

  • Z-test (normal)
  • Studenternas t-test
  • F-test

Passformens kvalitet

  • Chi-kvadrat
  • G-test
  • Kolmogorov-Smirnov
  • Anderson-Darling
  • Lilliefors
  • Jarque-Bera
  • Normalitet (Shapiro-Wilk)
  • Test av sannolikhetsförhållandet
  • Val av modell
    • Korsvalidering
    • AIC
    • BIC

Statistik om rangordning

  • Skylt
    • Provets median
  • Signerad rang (Wilcoxon)
    • Hodges-Lehmann-estimator
  • Rangsumma (Mann-Whitney)
  • Icke-parametrisk anova
    • 1-vägs (Kruskal-Wallis)
    • 2-vägs (Friedman)
    • Beställt alternativ (Jonckheere-Terpstra)

Bayesiansk inferens

  • Bayesiansk sannolikhet
    • tidigare
    • Bakre delen av
  • Trovärdigt intervall
  • Bayes-faktor
  • Bayesiansk skattare
    • Maximal efterföljande skattning
  • Korrelation
  • Regressionsanalys

Korrelation

  • Pearson produkt-moment
  • Partiell korrelation
  • Förväxlingsvariabel
  • Bestämningskoefficient

Regressionsanalys

  • Fel och residualer
  • Validering av regression
  • Modeller med blandade effekter
  • Modeller med simultana ekvationer
  • Multivariata adaptiva regressionssplines (MARS).

Linjär regression

Icke-standardiserade prediktorer

  • Icke linjär regression
  • Icke-parametrisk
  • Semiparametrisk
  • Isotonisk
  • Robust
  • Heteroscedasticitet
  • Homoscedasticitet

Generaliserad linjär modell

  • Exponentialfamiljer
  • Logistiska (Bernoulli) / Binomial / Poisson-regressioner

Fördelning av variansen

  • Variansanalys (ANOVA, anova)
  • Analys av kovarians
  • Multivariat ANOVA
  • Frihetsgrader

Kategorisk / Multivariat / Tidsserier / Överlevnadsanalys

Kategorisk

  • Cohens kappa
  • Beredskapstabell
  • Grafisk modell
  • Log-lineär modell
  • McNemar-test
  • Cochran-Mantel-Haenszel-statistik

Multivariat

  • Regression
  • Manova
  • Huvudsakliga komponenter
  • Kanonisk korrelation
  • Diskriminantanalys
  • Klusteranalys
  • Klassificering
  • Strukturell ekvationsmodell
    • Faktoranalys
  • Multivariata fördelningar
    • Elliptiska fördelningar
      • Normal

Tidsserier

Allmänt

  • Nedbrytning
  • Trend
  • Stationäritet
  • Säsongsanpassning
  • Exponentiell utjämning
  • Samintegration
  • Strukturellt brott
  • Granger-kausalitet

Särskilda tester

  • Dickey-Fuller
  • Johansen
  • Q-statistik (Ljung-Box)
  • Durbin-Watson
  • Breusch-Godfrey

Tidsdomän

  • Autokorrelation (ACF)
    • delvis (PACF)
  • Korskorrelation (XCF)
  • ARMA-modell
  • ARIMA-modell (Box-Jenkins)
  • Autoregressiv betingad heteroskedasticitet (ARCH)
  • Vektorauktoregression (VAR)

Frekvensdomän

  • Skattning av spektraltäthet
  • Fourieranalys
  • Wavelet
  • Sannolikhet för Whittle

Överlevnad

Överlevnadsfunktion

  • Kaplan-Meier-skattare (produktgräns)
  • Modeller för proportionella risker
  • Modell för påskyndad feltid (AFT)
  • Första träningstiden

Riskfunktion

  • Nelson-Aalen-estimator

Test

  • Log-rank-test

Tillämpningar

Biostatistik

Teknisk statistik

  • Kemometri
  • Metoder för teknik
  • Probabilistisk utformning
  • Process-/kvalitetskontroll
  • Tillförlitlighet
  • Identifiering av systemet

Socialstatistik

  • Försäkringsmatematik
  • Folkräkning
  • Brottsstatistik
  • Demografi
  • Ekonometri
  • Jurimetrics
  • Nationalräkenskaper
  • Officiell statistik
  • Befolkningsstatistik
  • Psykometri

Rumslig statistik

  • Kartografi
  • Miljöstatistik
  • Geografiskt informationssystem
  • Geostatistik
  • Kriging


 

Frågor och svar

F: Vad är en frekvensfördelning?


S: En frekvensfördelning är en förteckning över de värden som en variabel antar i ett urval, ordnade efter kvantitet. Den visar hur många gånger varje värde förekommer.

F: Hur kan frekvensfördelningen av svaren på en femgradig Likertskala se ut?


S: Frekvensfördelningen av svaren på en femgradig Likertskala kan se ut som en enkel tabell som visar hur många personer som har betygsatt varje punkt på skalan.

F: Vilka är två nackdelar med att använda denna typ av tabell?


S: Två nackdelar med att använda denna typ av tabell är att det kan vara svårt eller till och med omöjligt att använda den när det gäller kontinuerliga värden eller när det finns för många möjliga värden.

F: På vilket sätt skiljer sig detta schema när man hanterar kontinuerliga värden eller ett stort antal möjliga värden?


S: När det gäller kontinuerliga värden eller ett stort antal möjliga värden kan man i stället använda ett något annorlunda system som bygger på värdeintervall.

F: Hur kan en frekvenstabell för elevernas längd se ut?


S: Frekvenstabellen för elevlängder kan visa intervall och hur många elever som faller inom varje intervall.


F: Vilken information ger frekvensfördelningen?


S: Frekvensfördelningen ger information om hur ofta vissa variabler förekommer i urvalet och hur de är fördelade över urvalet.


Sök
AlegsaOnline.com - 2020 / 2025 - License CC3