Histogram i statistik – definition, tolkning och exempel

Histogram i statistik — lär dig vad ett histogram visar, hur du tolkar fördelningar och följ tydliga exempel för effektiv dataanalys.

Författare: Leandro Alegsa

Ett histogram är ett vanligt verktyg inom statistiken. Det är en grafisk bild som visar hur ofta olika värden eller intervall förekommer — alltså fördelningen i ett datamaterial. Ett histogram byggs ofta upp från en tabell där varje rad anger hur många observationer som ligger i respektive klass (intervall).

Definition och uppbyggnad

Grundläggande består ett histogram av staplar (”bars”) längs en vågrät axel. Varje stapel motsvarar ett klassintervall (kallas även bin) och höjden visar hur många observationer som faller i det intervallet. På x-axeln placeras variabelns värden, på y-axeln frekvensen (antalet) eller relativ frekvens (andelen).

Viktiga detaljer:

  • Staplarna ligger intill varandra (inga luckor) när datan är kontinuerlig — detta skiljer histogram från stapeldiagram för kategoriska variabler.
  • Om klassbredden varierar måste stapelns area (inte bara höjd) motsvara frekvensen. Vid varierande bin-bredd används ofta tätheten (frekvens / bredd) på y-axeln så att områdets storlek blir proportionell mot frekvensen.
  • Man kan visa absoluta frekvenser (antal), relativa frekvenser (procent) eller täthet (för att jämföra histogram med olika totalantal eller olika binbredder).

Tolkning — vad säger formen?

När du tolkar ett histogram letar du efter mönster i formen:

  • Central tendens: Var ligger mitten? (median, medelvärde)
  • Spridning: Hur utspridda är värdena? (bred och platt vs smal och spetsig)
  • Asymmetri (skevhet): Lång svans åt höger = positivt skev; lång svans åt vänster = negativt skev.
  • Modularitet: En topp = unimodal; två toppar = bimodal — kan tyda på två undergrupper i datan.
  • Avvikare: Enstaka staplar långt från huvudmassan kan vara outliers eller felregistreringar.

Praktiska exempel

Exempel 1 — lika breda klasser:

Anta att du har 100 mätvärden och grupperar dem i 10 klasser med lika bredd. Om fem av observationerna ligger i klass 3 får den stapeln höjden 5 (eller 5% om du använder relativa frekvenser). Eftersom klasserna är lika breda speglar stapelhöjden direkt frekvensen.

Exempel 2 — olika klassbredd (täthet):

Om en klass täcker intervallet 0–10 och en annan 10–30 kommer den senare att ha större bredd. För att staplarnas områden ska spegla antalet observationer används täthet (= frekvens / bredd). Då blir stapelns höjd = täthet och höjd * bredd = frekvens.

Vanliga former och vad de kan indikera

  • Normal (klockformad): kan tyda på många små oberoende påverkanfaktorer (approximation till normalfördelning).
  • Skewed (skev): produktionsdata, inkomstfördelning m.m. visar ofta högerskevhet.
  • Bimodal eller multimodal: kan signalera två eller flera underliggande grupper (t.ex. olika populationer i samma dataset).
  • Uniform: alla värden förekommer ungefär lika ofta.

Praktiska tips vid skapande

  • Välj antalet klasser med omsorg: för få klasser döljer detaljer, för många skapar brus. En tumregel är ungefär sqrt(n) klasser eller formeln enligt Sturges, men bästa valet beror på data.
  • Jämför alltid med flera binstorlekar för att se om mönstret är stabilt.
  • Använd relativa frekvenser eller densitet om du vill jämföra histogram med olika totalt antal observationer eller olika binbredder.
  • Var försiktig med extremvärden — kontrollera om de är korrekta innan du tolkar dem.

Skillnad mot stapeldiagram

Ett histogram används för kontinuerlig kvantitativ data och staplarna ligger intill varandra. Ett stapeldiagram används för kategoriska data där staplarna är separerade för att visa att kategorierna är diskreta och inte kontinuerliga.

Verktyg för att göra histogram

Histogram kan lätt skapas i vanliga verktyg som Excel, i statistikprogram som R (funktion hist()) och i Python (bibliotek som matplotlib eller seaborn: plt.hist(), seaborn.histplot()). De flesta program låter dig välja antal bin och om y-axeln ska visa frekvens, relativ frekvens eller täthet.

Ordet histogram kommer från histos och grammagrekiska. Histos betyder väv eller mast. Gramma betyder ritning, anteckning eller skrivning. Ett histogram av något är därför etymologiskt sett en ritning av detta väv — en bild av hur något är ”vävt” eller fördelat.

Exempel på ett histogram med 100 normalfördelade slumpmässiga värden.Zoom
Exempel på ett histogram med 100 normalfördelade slumpmässiga värden.

Liknande idéer

Histogrammet är ett av de sju grundläggande verktygen för kvalitetskontroll, som även omfattar Paretodiagram, kontrollblad, kontrolldiagram, orsaks- och effektdiagram, flödesschema och spridningsdiagram.

En generalisering av histogrammet är kärnutjämningstekniker. På så sätt konstrueras en jämn sannolikhetstäthetsfunktion från de tillhandahållna uppgifterna.

Frågor och svar

F: Vad är ett histogram?


S: Ett histogram är en grafisk display som berättar om fördelningen av de inblandade proverna.

F: Vad är syftet med ett histogram?


S: Syftet med ett histogram är att visa fördelningen av de aktuella proverna.

F: Vad betyder ordet histogram?


S: Ordet histogram kommer från grekiskans histos och gramma. Histos betyder väv eller mast. Gramma betyder ritning, protokoll eller skrift.

F: Vad betyder termen "histos" på grekiska?


S: Termen "histos" betyder väv eller mast på grekiska.

F: Vad betyder termen "gramma" på grekiska?


S: Termen "gramma" betyder ritning, uppteckning eller skrift på grekiska.

F: Vad är en vanlig egenskap hos ett histogram?


S: En vanlig egenskap hos ett histogram är att det är en bild som är gjord av en tabell med många kategorier.

F: Vilken information ger en histogramtabell?


S: En histogramtabell ger information om hur många prover det finns i varje kategori.


Sök
AlegsaOnline.com - 2020 / 2025 - License CC3