Paradoks Simpsona

Paradoks Simpsona jest paradoksem z dziedziny statystyki. Jego nazwa pochodzi od Edwarda H. Simpsona, brytyjskiego statystyka, który po raz pierwszy opisał go w 1951 roku. Statystyk Karl Pearson opisał bardzo podobny efekt w 1899 roku, - opis Udny'ego Yule'a pochodzi z 1903 roku. Czasami jest on nazywany efektem Yule'a-Simpsona. Przyglądając się statystycznym wynikom grup, wyniki te mogą się zmieniać w zależności od tego, czy grupy są rozpatrywane pojedynczo, czy też są łączone w większą grupę. Przypadek ten często występuje w naukach społecznych i statystyce medycznej. Może on dezorientować ludzi, jeśli dane dotyczące częstości są używane do wyjaśnienia związku przyczynowego. Inne nazwy tego paradoksu to paradoks odwrotności i paradoks amalgamacji.

Przykład: Leczenie kamieni nerkowych

Jest to przykład z życia wzięty z badania medycznego porównującego skuteczność dwóch metod leczenia kamieni nerkowych.

Tabela przedstawia wskaźniki sukcesu i liczbę zabiegów dla zabiegów obejmujących zarówno małe jak i duże kamienie nerkowe, gdzie zabieg A obejmuje wszystkie otwarte procedury, a zabieg B to przezskórna nefrolitotomia:

	Obróbka A		Obróbka B
	sukces	awaria	sukces	awaria
Małe kamienie	Grupa 1		Grupa 2
liczba pacjentów	81	6	234	36
	93%	7%	87%	13%
Duże kamienie	Grupa 3		Grupa 4
liczba pacjentów	192	71	55	25
	73%	27%	69%	31%
Zarówno	Grupa 1+3		Grupa 2+4
liczba pacjentów	273	77	289	61
	78%	22%	83%	17%

Paradoksalny wniosek jest taki, że leczenie A jest bardziej skuteczne, gdy jest stosowane na małych kamieniach, a także gdy jest stosowane na dużych kamieniach, ale leczenie B jest bardziej skuteczne, gdy rozważa się oba rozmiary w tym samym czasie. W tym przykładzie, nie było wiadomo, że rozmiar kamienia nerkowego wpływa na wynik. W statystyce nazywane jest to zmienną ukrytą (lub zmienną przyczajoną).

O tym, które leczenie jest uważane za lepsze, decyduje nierówność między dwoma stosunkami (sukcesy/ogółem). Odwrócenie nierówności między proporcjami, które tworzy paradoks Simpsona, zdarza się, ponieważ dwa efekty występują razem:

Rozmiary grup, które są połączone, gdy ukryta zmienna jest ignorowana, są bardzo różne. Lekarze mają tendencję do dawania ciężkim przypadkom (duże kamienie) lepszego leczenia (A), a łagodniejszym przypadkom (małe kamienie) gorszego leczenia (B). Dlatego sumy są zdominowane przez grupę trzecią i drugą, a nie przez dwie znacznie mniejsze grupy pierwszą i czwartą.
Zmienna przyczajona ma duży wpływ na współczynniki, tzn. na wskaźnik sukcesu silniej wpływa ciężkość przypadku niż wybór leczenia. Dlatego grupa pacjentów z dużymi kamieniami stosujących leczenie A (grupa trzecia) radzi sobie gorzej niż grupa z małymi kamieniami, nawet jeśli ci ostatni stosowali gorsze leczenie B (grupa druga).

Paradoks Simpsona

Przykład: Leczenie kamieni nerkowych

Szukaj według litery