Frekvensfördelning | en lista över de värden som en variabel har i ett urval

Författare: Leandro Alegsa

20-04-2022 11:29

Inom statistiken är en frekvensfördelning en lista över de värden som en variabel har i ett urval. Det är vanligtvis en lista som är ordnad efter antal. Den visar hur många gånger varje värde förekommer. Om till exempel 100 personer betygsätter en femgradig Likertskala där de bedömer om de instämmer i ett påstående på en skala där 1 betecknar starkt instämmande och 5 starkt avvikande, kan frekvensfördelningen av deras svar se ut på följande sätt:

Denna enkla tabell har två nackdelar. När en variabel kan anta kontinuerliga värden i stället för diskreta värden eller när antalet möjliga värden är för stort är det svårt, om inte omöjligt, att konstruera tabellen. I sådana fall används ett något annorlunda schema som bygger på värdeintervallet. Om vi till exempel tar hänsyn till längden på eleverna i en klass kan frekvenstabellen se ut som nedan.

Detta är Kinas befolkningspyramid för år 2005.

Exempel på en (absolut) frekvensfördelning. Detta är Angolas befolkningspyramid för år 2005.

Applikationer

Det är mycket enklare att hantera och bearbeta data i frekvenstabeller än att bearbeta rådata. Det finns enkla algoritmer för att beräkna median, medelvärde (statistik), standardavvikelse etc. från dessa tabeller.

Statistisk hypotesprövning bygger på en bedömning av skillnader och likheter mellan frekvensfördelningar. Denna bedömning omfattar mått på central tendens eller medelvärden, t.ex. medelvärde och median, och mått på variabilitet eller statistisk spridning, t.ex. standardavvikelse eller varians.

En frekvensfördelning sägs vara skev när dess medelvärde och median är olika. Kurtisen i en frekvensfördelning är koncentrationen av poäng vid medelvärdet, eller hur toppig fördelningen ser ut om den avbildas grafiskt - till exempel i ett histogram. Om fördelningen är mer spetsig än normalfördelningen sägs den vara leptokurtisk; om den är mindre spetsig sägs den vara platykurtisk.

Frekvensfördelningar används också i frekvensanalyser för att knäcka koder och avser den relativa frekvensen av bokstäver i olika språk.

Statistik

Översikt
Index

Beskrivande statistik

Kontinuerliga uppgifter

Centrum	Medelvärde aritmetisk geometrisk harmonisk kubik generaliserad/kraft Median Läge
Spridning	Avvikelse Standardavvikelse Genomsnittlig absolut avvikelse Variationskoefficient Percentil Utbud Interkvartilområde
Form	Centrala gränsvärdessatsen Stunder Skewness Kurtosis L-moment

Räkna uppgifter

Spridningsindex

Sammanfattande tabeller

Grupperade uppgifter
Frekvensfördelning
Beredskapstabell

Beroende

Korrelation mellan Pearson och produktmomentet
Rangkorrelation

Spearmans ρ
Kendalls τ

Partiell korrelation
Spridningsdiagram

Grafik

Stapeldiagram
Biplot
Box plot
Kontrolldiagram
Korrelogram
Fläktdiagram
Skogsplanering
Histogram
cirkeldiagram
Q-Q-ritning
Körkort
Spridningsdiagram
Uppvisning av stjälkar och blad
Radarkarta
Handlingen för violin

Insamling av uppgifter

Uppläggning av studien	Befolkning Statistik Effektstorlek Statistisk styrka Optimal utformning Fastställande av stickprovsstorlek Replikering Saknade uppgifter
Undersökningsmetodik	Provtagning stratifierad kluster Standardfel Opinionsundersökning Frågeformulär
Kontrollerade experiment	Vetenskaplig kontroll Randomiserat experiment Randomiserad kontrollerad studie Slumpmässig fördelning Blockering av Interaktion Factoriellt experiment
Anpassningsbara konstruktioner	Anpassad klinisk prövning Upp-och-nedkonstruktioner Stokastisk approximation
Observationsstudier	Tvärsnittsstudie Kohortstudie Naturligt experiment Kvasiexperiment

Statistisk inferens

Statistisk teori

Befolkning
Statistik
Sannolikhetsfördelning
Provtagningsfördelning

Beställningsstatistik

Empirisk fördelning

Uppskattning av densitet

Statistisk modell

Modellspecifikation
L^p utrymme

Parameter

plats
skala
form

Parametrisk familj

Sannolikhet (monotont)
Familj i platsskala
Exponentiell familj

Fullständighet
Tillräcklighet
Statistisk funktionell

Bootstrap
U
V

Optimalt beslut

Förlustfunktion.

Effektivitet
Statistiskt avstånd

divergens

Asymptotik
Robusthet

Frekvensbaserad slutsats

Punktuppskattning	Uppskattning av ekvationer Maximal sannolikhet Momentmetoden M-estimator Minsta avstånd Skattare utan förförståelse Medelvärde-oberäknad minsta varians Rao-Blackwellization Lehmann-Scheffé-satsen Median utan fördomar Plug-in
Intervallskattning	Konfidensintervall Pivot Sannolikhetsintervall Prognosintervall Toleransintervall Återprovtagning Bootstrap Jackknife
Prövning av hypoteser	1- och 2-svansar Effekt Det enhetligt mest kraftfulla testet Permutationstest Randomiseringstest Flerfaldiga jämförelser
Parametriska tester	Sannolikhetsförhållande Multiplikator för poäng/avstånd Wald

Särskilda tester

Z-test (normal) Studenternas t-test F-test
Passformens kvalitet	Chi-kvadrat G-test Kolmogorov-Smirnov Anderson-Darling Lilliefors Jarque-Bera Normalitet (Shapiro-Wilk) Test av sannolikhetsförhållandet Val av modell Korsvalidering AIC BIC
Statistik om rangordning	Skylt Provets median Signerad rang (Wilcoxon) Hodges-Lehmann-estimator Rangsumma (Mann-Whitney) Icke-parametrisk anova 1-vägs (Kruskal-Wallis) 2-vägs (Friedman) Beställt alternativ (Jonckheere-Terpstra)

Bayesiansk inferens

Bayesiansk sannolikhet

tidigare
Bakre delen av

Trovärdigt intervall
Bayes-faktor
Bayesiansk skattare

Maximal efterföljande skattning

Korrelation
Regressionsanalys

Korrelation	Pearson produkt-moment Partiell korrelation Förväxlingsvariabel Bestämningskoefficient
Regressionsanalys	Fel och residualer Validering av regression Modeller med blandade effekter Modeller med simultana ekvationer Multivariata adaptiva regressionssplines (MARS).
Linjär regression	Enkel linjär regression Vanliga minsta kvadratmetoden Allmän linjär modell Bayesiansk regression
Icke-standardiserade prediktorer	Icke linjär regression Icke-parametrisk Semiparametrisk Isotonisk Robust Heteroscedasticitet Homoscedasticitet
Generaliserad linjär modell	Exponentialfamiljer Logistiska (Bernoulli) / Binomial / Poisson-regressioner
Fördelning av variansen	Variansanalys (ANOVA, anova) Analys av kovarians Multivariat ANOVA Frihetsgrader

Kategorisk / Multivariat / Tidsserier / Överlevnadsanalys

Kategorisk

Cohens kappa
Beredskapstabell
Grafisk modell
Log-lineär modell
McNemar-test
Cochran-Mantel-Haenszel-statistik

Multivariat

Regression
Manova
Huvudsakliga komponenter
Kanonisk korrelation
Diskriminantanalys
Klusteranalys
Klassificering
Strukturell ekvationsmodell

Faktoranalys

Multivariata fördelningar

Elliptiska fördelningar

Normal

Tidsserier

Allmänt	Nedbrytning Trend Stationäritet Säsongsanpassning Exponentiell utjämning Samintegration Strukturellt brott Granger-kausalitet
Särskilda tester	Dickey-Fuller Johansen Q-statistik (Ljung-Box) Durbin-Watson Breusch-Godfrey
Tidsdomän	Autokorrelation (ACF) delvis (PACF) Korskorrelation (XCF) ARMA-modell ARIMA-modell (Box-Jenkins) Autoregressiv betingad heteroskedasticitet (ARCH) Vektorauktoregression (VAR)
Frekvensdomän	Skattning av spektraltäthet Fourieranalys Wavelet Sannolikhet för Whittle

Överlevnad

Överlevnadsfunktion	Kaplan-Meier-skattare (produktgräns) Modeller för proportionella risker Modell för påskyndad feltid (AFT) Första träningstiden
Riskfunktion	Nelson-Aalen-estimator
Test	Log-rank-test

Tillämpningar

Biostatistik	Bioinformatik Kliniska prövningar/studier Epidemiologi Medicinsk statistik
Teknisk statistik	Kemometri Metoder för teknik Probabilistisk utformning Process-/kvalitetskontroll Tillförlitlighet Identifiering av systemet
Socialstatistik	Försäkringsmatematik Folkräkning Brottsstatistik Demografi Ekonometri Jurimetrics Nationalräkenskaper Officiell statistik Befolkningsstatistik Psykometri
Rumslig statistik	Kartografi Miljöstatistik Geografiskt informationssystem Geostatistik Kriging

Frågor och svar

F: Vad är en frekvensfördelning?

S: En frekvensfördelning är en förteckning över de värden som en variabel antar i ett urval, ordnade efter kvantitet. Den visar hur många gånger varje värde förekommer.

F: Hur kan frekvensfördelningen av svaren på en femgradig Likertskala se ut?

S: Frekvensfördelningen av svaren på en femgradig Likertskala kan se ut som en enkel tabell som visar hur många personer som har betygsatt varje punkt på skalan.

F: Vilka är två nackdelar med att använda denna typ av tabell?

S: Två nackdelar med att använda denna typ av tabell är att det kan vara svårt eller till och med omöjligt att använda den när det gäller kontinuerliga värden eller när det finns för många möjliga värden.

F: På vilket sätt skiljer sig detta schema när man hanterar kontinuerliga värden eller ett stort antal möjliga värden?

S: När det gäller kontinuerliga värden eller ett stort antal möjliga värden kan man i stället använda ett något annorlunda system som bygger på värdeintervall.

F: Hur kan en frekvenstabell för elevernas längd se ut?

S: Frekvenstabellen för elevlängder kan visa intervall och hur många elever som faller inom varje intervall.

F: Vilken information ger frekvensfördelningen?

S: Frekvensfördelningen ger information om hur ofta vissa variabler förekommer i urvalet och hur de är fördelade över urvalet.

Sök