Simpsons paradox
Simpsons paradox är en paradox från statistiken. Den är uppkallad efter Edward H. Simpson, en brittisk statistiker som först beskrev den 1951. Statistikern Karl Pearson beskrev en mycket liknande effekt 1899. - Udny Yules beskrivning är från 1903. Ibland kallas den för Yule-Simpson-effekten. När man tittar på gruppers statistiska poäng kan dessa poäng förändras beroende på om man tittar på grupperna en och en eller om de kombineras till en större grupp. Detta fall förekommer ofta inom samhällsvetenskap och medicinsk statistik. Det kan förvirra människor, om frekvensdata används för att förklara ett orsakssamband. Andra namn på paradoxen är bland annat reversal paradox och amalgamationsparadox.
Exempel: Behandling av njursten
Detta är ett exempel från en medicinsk studie där man jämförde hur framgångsrika två behandlingar av njursten är.
Tabellen visar framgångsfrekvens och antal behandlingar för behandlingar av både små och stora njurstenar, där behandling A omfattar alla öppna ingrepp och behandling B är perkutan nefrolitotomi:
Behandling A | Behandling B | |||
framgång | misslyckande | framgång | misslyckande | |
Små stenar | Grupp 1 | Grupp 2 | ||
antal patienter | 81 | 6 | 234 | 36 |
93% | 7% | 87% | 13% | |
Stora stenar | Grupp 3 | Grupp 4 | ||
antal patienter | 192 | 71 | 55 | 25 |
73% | 27% | 69% | 31% | |
Båda | Grupp 1+3 | Grupp 2+4 | ||
antal patienter | 273 | 77 | 289 | 61 |
78% | 22% | 83% | 17% |
Den paradoxala slutsatsen är att behandling A är effektivare när den används på små stenar och även när den används på stora stenar, men att behandling B är effektivare när båda storlekarna behandlas samtidigt. I det här exemplet visste man inte att njurstens storlek påverkade resultatet. Detta kallas en dold variabel (eller lurande variabel) i statistik.
Vilken behandling som anses vara bäst bestäms av en ojämlikhet mellan två kvoter (framgång/total). Omvändningen av ojämlikheten mellan förhållandena, som skapar Simpsons paradox, beror på att två effekter inträffar samtidigt:
- Storleken på de grupper som kombineras när man inte tar hänsyn till den lurande variabeln är mycket olika. Läkare tenderar att ge de svåra fallen (stora stenar) den bättre behandlingen (A) och de mildare fallen (små stenar) den sämre behandlingen (B). Därför domineras totalerna av grupperna tre och två och inte av de två mycket mindre grupperna ett och fyra.
- Den lurande variabeln har en stor inverkan på förhållandena, dvs. att framgångskvoten påverkas starkare av fallets svårighetsgrad än av valet av behandling. Därför klarar sig gruppen patienter med stora stenar som använder behandling A (grupp tre) sämre än gruppen med små stenar, även om de senare använde den sämre behandlingen B (grupp två).