Hollands schematsats, ofta kallad den grundläggande satsen för genetiska algoritmer, är en analytisk uppskattning som fångar en viktig mekanism bakom hur genetiska algoritmer arbetar. Schemateoremet säger i informella termer att korta, lågordnade scheman (mönster) som har högre fitness än populationsgenomsnittet tenderar att öka i frekvens i efterföljande generationer. Satsen föreslogs av John Holland på 1970‑talet och användes tidigt för att förklara varför genetiska algoritmer ofta hittar bra lösningar. Senare analyser har nyanserat den ursprungliga tolkningen; bland annat kan schemateoremet ses som ett specialfall av Price‑ekvationen när man använder schemaindikatorfunktionen som makroskopiskt mått, och flera studier har påpekat dess begränsningar i praktiska, stokastiska populationer.
Vad är ett schema?
Ett schema är ett mönster eller en mall som specificerar värden i vissa positioner i en bitsträng och lämnar andra positioner obestämda (vanligtvis betecknade med en jokertecken, t.ex. *). Ett enkelt exempel i binära strängar är schemat 1*0*, vilket beskriver alla strängar som har 1 i första positionen och 0 i tredje positionen, medan andra positioner kan vara antingen 0 eller 1. Formellt är scheman en specialform av cylindermängder och kan betraktas i ett topologiskt perspektiv som delar upp rymden av strängar i delmängder (delmängd), vilket också har samband med begrepp som topologiskt rum.
Formell version av schemateoremet
Schemateoremet uttrycks vanligen som en (nedre) ojämlikhet för det förväntade antalet kopior av ett schema H i nästa generation. I en vanlig formulering får man förväntat antal E[m(H,t+1)] minst
E[m(H,t+1)] ≥ m(H,t) · (f(H)/f_bar) · [1 − p_c · (δ(H)/(l−1))] · (1 − p_m)^{o(H)}
där
- m(H,t) = antal individer som matchar schemat H vid generation t
- f(H) = medelfitnessen bland individer som matchar H
- f_bar = medelfitnessen i hela populationen
- p_c = sannolikheten för korsning (crossover)
- p_m = mutationssannolikheten per bit
- δ(H) = definierande längd för H (avståndet mellan de yttre fasta positionerna)
- o(H) = ordningen för H (antalet fasta positioner)
- l = längden på kromosomerna (antal gener)
Formeln visar tre huvudmekanismer: selektion (f(H)/f_bar) som ökar frekvensen av bättre än medel‑schema, korsningsdisruption som är proportionell mot schemats definierande längd och mutationsdisruption som beror på schemats ordning.
Begrepp: ordning och definierande längd
- Ordning o(H): antalet bestämda (icke‑jokertecken) positioner i schemat. Högre ordning innebär större sårbarhet för mutation (fler positioner kan mutera).
- Definierande längd δ(H): avståndet mellan de första och sista bestämda positionerna i schemat. Ett schema med längre definierande längd löper större risk att brytas upp av crossover.
Byggstenshypotesen och tolkningar
Schemateoremet låg till grund för den så kallade byggstenshypotesen, som hävdar att genetiska algoritmer fungerar genom att kombinera korta, bra scheman ("byggstenar") till bättre och bättre lösningar över tiden. I denna tolkning samlas och rekombineras korta, lågordnade scheman selektivt för att bygga upp högkvalitativa individer.
Begränsningar och kritik
- Schemateoremet är en nedre gräns (ojämlikhet), inte en exakt prediktion. Det ger en förväntad tendens, inte en deterministisk lag.
- Det baseras vanligen på antaganden som proportionell selektion och förväntade värden; i ändliga populationer kan stokastiska effekter (genetisk drift) och urvalssampling ge stora avvikelser.
- Kritiker har påpekat att schemateoremet inte räcker för att garantera att en GA finner globala optima, särskilt i problem med stark epistasis eller "deceptive" fitnesslandskap där kombinationer av byggstenar inte leder till bättre lösningar.
- Analytiskt kan schemateoremet härledas inom en större ram, till exempel Price‑ekvationen; därför ses det numera ofta som en delkomponent i en mer allmän förklaringsmodell snarare än som en fristående förklaring.
Praktisk betydelse
Trots sina begränsningar har schemateoremet haft stor påverkan på hur man tänker kring representation och operatorer i evolutionära algoritmer. Det ger intuitiva riktlinjer:
- Föredra representationer där bra egenskaper kan beskrivas av korta, lågordnade scheman.
- Undvik onödigt höga mutationsnivåer som slår sönder ordningens bestämda positioner.
- Anpassa crossover‑operatorer så att de inte rutinmässigt splittrar korta byggstenar (t.ex. använd punktkorsning eller positionella korsningsmetoder beroende på representation).
Moderna analyser av evolutionära algoritmer använder ofta kompletterande verktyg (stokastiska processer, informationsteori, dynamiska system med mera) för att få en mer komplett bild av beteendet i praktiska, ändliga populationer.
Exempel
Anta 8‑bitars kromosomer och schemat H = 1*0***1 (ordning o(H)=3, definierande längd δ(H)=6). Om m(H,t) = 10 och f(H)/f_bar = 1.2, p_c = 0.7 och p_m = 0.001 ger schemateoremet en uppskattning av hur många exemplar av H vi kan förvänta oss i nästa generation, med avräkning för både korsnings‑ och mutationsdisruption.
Sammanfattningsvis: Hollands schemateorem ger en användbar, intuitiv och formellt härledd förklaring till varför korta, lågordnade och övergenomsnittliga mönster ofta förstärks i genetiska algoritmer. Det är dock en del av ett större analytiskt ramverk och bör användas tillsammans med förståelse för dess antaganden och begränsningar i praktiska tillämpningar.

