Paradoks Simpsona
Paradoks Simpsona jest paradoksem z dziedziny statystyki. Jego nazwa pochodzi od Edwarda H. Simpsona, brytyjskiego statystyka, który po raz pierwszy opisał go w 1951 roku. Statystyk Karl Pearson opisał bardzo podobny efekt w 1899 roku, - opis Udny'ego Yule'a pochodzi z 1903 roku. Czasami jest on nazywany efektem Yule'a-Simpsona. Przyglądając się statystycznym wynikom grup, wyniki te mogą się zmieniać w zależności od tego, czy grupy są rozpatrywane pojedynczo, czy też są łączone w większą grupę. Przypadek ten często występuje w naukach społecznych i statystyce medycznej. Może on dezorientować ludzi, jeśli dane dotyczące częstości są używane do wyjaśnienia związku przyczynowego. Inne nazwy tego paradoksu to paradoks odwrotności i paradoks amalgamacji.
Przykład: Leczenie kamieni nerkowych
Jest to przykład z życia wzięty z badania medycznego porównującego skuteczność dwóch metod leczenia kamieni nerkowych.
Tabela przedstawia wskaźniki sukcesu i liczbę zabiegów dla zabiegów obejmujących zarówno małe jak i duże kamienie nerkowe, gdzie zabieg A obejmuje wszystkie otwarte procedury, a zabieg B to przezskórna nefrolitotomia:
Obróbka A | Obróbka B | |||
sukces | awaria | sukces | awaria | |
Małe kamienie | Grupa 1 | Grupa 2 | ||
liczba pacjentów | 81 | 6 | 234 | 36 |
93% | 7% | 87% | 13% | |
Duże kamienie | Grupa 3 | Grupa 4 | ||
liczba pacjentów | 192 | 71 | 55 | 25 |
73% | 27% | 69% | 31% | |
Zarówno | Grupa 1+3 | Grupa 2+4 | ||
liczba pacjentów | 273 | 77 | 289 | 61 |
78% | 22% | 83% | 17% |
Paradoksalny wniosek jest taki, że leczenie A jest bardziej skuteczne, gdy jest stosowane na małych kamieniach, a także gdy jest stosowane na dużych kamieniach, ale leczenie B jest bardziej skuteczne, gdy rozważa się oba rozmiary w tym samym czasie. W tym przykładzie, nie było wiadomo, że rozmiar kamienia nerkowego wpływa na wynik. W statystyce nazywane jest to zmienną ukrytą (lub zmienną przyczajoną).
O tym, które leczenie jest uważane za lepsze, decyduje nierówność między dwoma stosunkami (sukcesy/ogółem). Odwrócenie nierówności między proporcjami, które tworzy paradoks Simpsona, zdarza się, ponieważ dwa efekty występują razem:
- Rozmiary grup, które są połączone, gdy ukryta zmienna jest ignorowana, są bardzo różne. Lekarze mają tendencję do dawania ciężkim przypadkom (duże kamienie) lepszego leczenia (A), a łagodniejszym przypadkom (małe kamienie) gorszego leczenia (B). Dlatego sumy są zdominowane przez grupę trzecią i drugą, a nie przez dwie znacznie mniejsze grupy pierwszą i czwartą.
- Zmienna przyczajona ma duży wpływ na współczynniki, tzn. na wskaźnik sukcesu silniej wpływa ciężkość przypadku niż wybór leczenia. Dlatego grupa pacjentów z dużymi kamieniami stosujących leczenie A (grupa trzecia) radzi sobie gorzej niż grupa z małymi kamieniami, nawet jeśli ci ostatni stosowali gorsze leczenie B (grupa druga).