Operant konditionering – definition, Skinner, förstärkning och bestraffning

Operant konditionering — förklaring av Skinner, förstärkning, bestraffning och utrotning. Lär dig teorier, exempel och praktiska tillämpningar på ett enkelt sätt.

Författare: Leandro Alegsa

25-10-2025 22:05

Operant konditionering är en form av inlärning där en individ ändrar sitt beteende som följd av konsekvenserna av beteendet. Kort sagt lär sig personen eller djuret att ett visst beteende leder till något som antingen ökar eller minskar sannolikheten att beteendet upprepas.

Konsekvenser kan delas in i tre huvudtyper:

Förstärkning: en positiv eller belönande händelse. Detta får beteendet att uppträda oftare.
Bestraffning: en negativ eller bestraffande händelse. Detta får beteendet att uppträda mindre ofta.
Utrotning: ingen händelse följer, så beteendet har inga konsekvenser. När ett beteende inte har några konsekvenser kommer det att förekomma mer sällan.

Positivt och negativt — vad betyder det?

I operant konditionering används orden positiv och negativ inte som värdeomdömen utan beskriver om något läggs till eller tas bort:

Positiv förstärkning (ofta bara "förstärkning") uppstår när ett beteende belönas. Detta ökar frekvensen av beteendet. I experimentet med Skinner-lådan är belöningen i form av mat när råttan trycker på en spak.
Negativ förstärkning (ibland "flykt") inträffar när ett avskräckande stimulus avlägsnas. Detta ökar frekvensen av beteendet. I experimentet med Skinner-lådan fanns det ett högt ljud som försvann när råttan tryckte på spaken.
Positiv bestraffning sker när ett stimulus läggs till, vilket leder till att beteendet uppträder mindre ofta. Exempel på stimuli kan vara högt ljud, elchocker (råtta) eller smisk (barn).
Negativ bestraffning innebär att en stimulans tas bort, vilket leder till att beteendet uppträder mindre ofta. Ett exempel kan vara att man tar bort ett barns leksak när barnet gör ett oönskat beteende.

Historik och viktiga personer

Idén om operant betingning har sina rötter i Edward Thorndikes arbete i början av 1900‑talet, särskilt hans "Law of Effect" — att beteenden som följs av belöning tenderar att upprepas. Begreppet och många experiment utvecklades vidare av B.F. Skinner, som systematiskt studerade hur konsekvenser påverkar beteende med hjälp av den så kallade Skinner‑lådan (operant chamber).

Viktiga begrepp och fenomen

Utrotning (extinction): När förstärkning upphör minskar beteendet gradvis. Ofta följer en tillfällig ökning i beteendet, ett så kallat utsläckningsburst, innan det minskar.
Formning (shaping): Man förstärker successiva approximationer av ett önskat beteende. Används ofta vid djurträning och vid inlärning av nya färdigheter.
Generalisation och diskriminering: Generalisering innebär att ett beteende uppträder i liknande situationer; diskriminering betyder att individen lär sig skilja mellan situationer där beteendet förstärks och inte förstärks.
Primära och sekundära förstärkare: Primära (t.ex. mat, värme) är biologiskt betydelsefulla; sekundära (t.ex. pengar, beröm) har fått värde genom koppling till primära förstärkare.

Förstärkningsscheman

Hur ofta och när förstärkning ges påverkar hur snabbt beteende lärs in och hur motståndskraftigt det blir mot utrotning. Vanliga scheman:

Kontinuerlig förstärkning: Varje gång beteendet utförs följer förstärkning — leder till snabb inlärning men även snabb utrotning när förstärkningen upphör.
Partiell (intermittent) förstärkning: Förstärkning ges inte alltid. Detta ger ofta uthålligare beteende och större motståndskraft mot utrotning. Typer av partiella scheman:

Fast kvot (FR): Förstärkning efter ett bestämt antal responser (t.ex. var fjärde gång).
Variabel kvot (VR): Förstärkning efter ett genomsnittligt antal responser (t.ex. spelautomater) — mycket stabilt och starkt beteende.
Fast intervall (FI): Förstärkning efter en bestämd tid sedan senaste förstärkningen (t.ex. löneutbetalning varje månad).
Variabel intervall (VI): Förstärkning ges efter varierande tidsintervall — ger jämn responsnivå.

Tillämpningar

Operant konditionering används i många praktiska sammanhang:

Utbildning och undervisning: Positiv förstärkning (beröm, poäng, belöningar) används för att öka önskvärda studievanor och prestationer.
Terapi: Beteendeterapier för t.ex. fobier, tvångssyndrom och beroenden använder förstärkning och utsläckning för att förändra beteenden.
Djurträning: Klicker‑träning bygger på formning och förstärkning för att lära komplexa trick eller arbetsuppgifter.
Arbetsliv och organisationspsykologi: Incitamentssystem, bonusar och feedback påverkar medarbetares beteende.

Risker och begränsningar

Bestraffning kan snabbt få ned ett oönskat beteende men har flera nackdelar: den lär inte nödvändigtvis ett nytt önskvärt beteende, kan skapa rädsla, aggressivitet eller undvikande och kan skada relationer. Därför rekommenderas ofta att använda positiv förstärkning och tydlig, konsekvent återställning av regler framför hårda bestraffningar.

Operant vs klassisk konditionering

Operant konditionering skiljer sig från Pavlovs klassiska konditionering. Operant konditionering handlar om frivillig förändring av beteende där individen agerar för att påverka omgivningen, medan klassisk konditionering handlar om inlärning av en reflex eller automatisk respons (reflex) genom koppling mellan stimuli.

Praktiska råd för användning av förstärkning

Var konsekvent i början (särskilt med nyinlärda beteenden), sedan övergå till partiella scheman för ökad uthållighet.
Använd förstärkare som är betydelsefulla för individen — vad som fungerar varierar mellan personer och situationer.
Förebygg oönskat beteende genom att belöna alternativa, önskvärda beteenden snarare än att bara straffa.
Observera etiska aspekter och undvik bestraffningar som kan skada eller skapa rädsla.

Sammanfattningsvis är operant konditionering en central princip inom inlärningspsykologin med bred tillämpning. Förståelsen av förstärkning, bestraffning, scheman och fenomen som utrotning och forma gör det möjligt att både analysera och påverka beteenden på ett systematiskt sätt.

Thorndikes lag om effekt

Operant konditionering, ibland kallad instrumentell inlärning, studerades först av Edward L. Thorndike (1874-1949). Han observerade hur katter försökte fly från hemmagjorda pussellådor. När katterna först sattes i lådorna tog det lång tid för dem att fly. Med erfarenhet blev de framgångsrika svaren vanligare, vilket gjorde det möjligt för katterna att fly på kortare tid. I sin lag om effekt teoretiserade Thorndike att beteenden som följs av tillfredsställande konsekvenser tenderar att upprepas, medan beteenden som ger obehagliga konsekvenser är mindre benägna att upprepas. Kort sagt, vissa konsekvenser stärkte beteendet och vissa konsekvenser försvagade beteendet. Thorndike tog fram de första kända inlärningskurvorna genom detta förfarande.

B.F. Skinner (1904-1990) utarbetade en mer detaljerad analys av operant konditionering. Skinner uppfann den operanta konditioneringskammaren som gjorde det möjligt för honom att mäta svarsfrekvensen som en viktig beroende variabel. Han använde sig av en registrering av spaktryckningar eller tangentplockningar.

Principerna för operant betingning:

Diskriminering, generalisering och kontextens betydelse.

Lärandet sker i sammanhang.
De flesta beteenden är stimulusstyrda: en viss reaktion uppstår endast när ett lämpligt stimulus är närvarande.
Stimulanskontroll är effektiv även om stimulansen inte har någon betydelse för respondenten.

Utplåning: operant beteende utplånas när förstärkningen upphör.

Förstärkningarna kommer först när det korrekta svaret har kommit, och kanske inte ens då. Beteenden försvagas och försvinner inte på grund av detta.
Resultaten beror delvis på hur ofta man får förstärkning.

Schema för förstärkningar: Tidpunkten för förstärkningarna är avgörande.

Schema med fasta intervaller: förstärkare ges vid fasta tidsperioder, förutsatt att det lämpliga svaret ges.
Schema med varierande intervall: ett beteende förstärks baserat på den genomsnittliga tid som har gått sedan den senaste förstärkningen. Ratioschema: bygger på förhållandet mellan svaren på förstärkningar.
Schema med fasta intervall: förstärkning ges efter ett visst antal svar. Specialfallet där förstärkning ges efter varje svar kallas kontinuerlig förstärkning.
Schema med varierande intervall: Förstärkningen av leveransen baseras på ett visst genomsnittligt antal svar.

Frågor och svar

F: Vad är operant betingning?

S: Operativ betingning är en form av inlärning där en individ ändrar sitt beteende på grund av konsekvenserna (resultaten) av beteendet.

F: Vilka är de fyra kontexterna för operant betingning?

Svar: De fyra kontexterna för operant betingning är positiv förstärkning, negativ förstärkning, positiv bestraffning och negativ bestraffning.

F: Hur fungerar positiv förstärkning?

S: Positiv förstärkning uppstår när det finns en belöning för ett visst beteende, vilket ökar frekvensen av beteendet.

F: Hur fungerar negativ förstärkning?

Svar: Negativ förstärkning sker när ett avskräckande stimulus avlägsnas, vilket ökar frekvensen av beteendet.

F: Hur fungerar positiv bestraffning?

Svar: Positiv bestraffning sker när ett stimulus läggs till, vilket leder till att beteendet uppträder mindre ofta.
F: Hur fungerar negativ bestraffning? Svar: Negativ bestraffning sker när en stimulans tas bort, vilket leder till att beteendet inträffar mer sällan.

F: Vem upptäckte operant betingning först?

Svar: Edward Thorndike upptäckte först den operanta betingningen och den analyserades senare av B.F. Skinner.

Sök