W statystyce przedział ufności jest specjalną formą szacowania pewnego parametru. Zamiast jednej punktowej estymaty podaje się cały przedział dopuszczalnych wartości parametru wraz z poziomem ufności, czyli z prawdopodobieństwem (wyrażanym najczęściej w procentach), że procedura szacowania obejmie prawdziwą (nieznaną) wartość parametru. Przedział ufności jest oparty na obserwacjach z próby, a więc różni się w zależności od próby. Prawdopodobieństwo, że parametr znajdzie się w przedziale nazywane jest poziomem ufności — np. „95% przedział ufności”. Punkty końcowe przedziału nazywane są granicami ufności. Dla danej procedury szacowania i danej sytuacji, im wyższy poziom ufności, tym szerszy będzie przedział.
Interpretacja
- Interpretacja często spotykana (częściowo potoczna): mówi się: „95% przedział ufności oznacza, że mamy 95% pewności, że prawdziwy parametr leży w tym przedziale”. To sformułowanie jest użyteczne w komunikacji, lecz może być mylące.
- Interpretacja formalna (częstościowa): przedział ufności opisuje właściwość metody: gdyby powtórzyć eksperyment wiele razy i dla każdej próby skonstruować przedział ufności tą samą procedurą, to w przybliżeniu 95% takich przedziałów obejmie prawdziwą wartość parametru. Nie oznacza to, że dla konkretnego jednego przedziału istnieje 95% „prawdopodobieństwa” dla parametru — prawdziwy parametr jest stały, a przedział jest losowy.
- Powszechne nieporozumienia: nie należy traktować granic jako punktów, które mają jedynie określone „wiarygodności” poza kontekstem procedury; nie wszystkie procedury mają dobrą własność przy małych próbach lub przy naruszeniu założeń.
Podstawowe założenia
- Przedziały ufności są zwykle konstruowane w ramach metod parametrycznych.
- Typowe założenia to niezależność obserwacji, identyczny rozkład próbki oraz (często) normalność rozkładu populacji. Jeśli te założenia są naruszone, wiarygodność przedziału może maleć.
- Przedziały wyprowadzone przy założeniu normalności nie są odporne na obserwacje odstające — w praktyce można stosować modyfikacje lub metody nieparametryczne (np. bootstrap).
Jak oblicza się przedziały ufności — najczęstsze przypadki
Poniżej podane są standardowe wzory i metody. W zapisie użyto α jako poziomu istotności, przy czym poziom ufności = 1 − α (np. dla 95%: α = 0.05).
- Przedział dla średniej, gdy znane jest odchylenie standardowe populacji σ:
x̄ ± z_{1−α/2} · (σ / √n)
gdzie z_{1−α/2} to kwantyl rozkładu normalnego standardowego (dla 95% ≈ 1.96). - Przedział dla średniej, gdy σ nie jest znane (mała/umiarkowana próba):
x̄ ± t_{1−α/2, n−1} · (s / √n)
gdzie s to odchylenie standardowe próbki, a t_{1−α/2, n−1} — kwantyl rozkładu Studenta z n−1 stopniami swobody. - Przedział dla odsetka (proporcji) p przy dużej próbie — tzw. przedział Wald:
p̂ ± z_{1−α/2} · √(p̂(1−p̂)/n)
Uwaga: dla małych n lub p̂ bliskich 0 lub 1 lepsze są metody Wilsona, Agresti–Coull lub dokładny przedział Clopper–Pearson. - Przedział dla różnicy średnich: istnieją warianty zależnie od tego, czy zakładamy równość wariancji (przedział „pooled”) czy nie (wersja Welcha). Dla dużych prób często używa się przybliżenia normalnego.
- Przedziały dla wariancji: wykorzystują rozkład χ²: ((n−1)s²) / χ²_{1−α/2, n−1} ≤ σ² ≤ ((n−1)s²) / χ²_{α/2, n−1}.
- Przedziały dla parametrów modeli regresyjnych: granice dla współczynników regresji zwykle korzystają z estymatorów i ich błędów standardowych oraz rozkładu t (dla klasycznej regresji liniowej).
- Metody nieparametryczne i komputerowe: bootstrap (np. percentylowy, BCa) pozwala oszacować przedziały ufności bez silnych założeń o rozkładzie populacji.
Przykłady obliczeń (95%)
- Średnia: n = 25, x̄ = 100, s = 15. Dla 95%: t_{0.975,24} ≈ 2.064.
Margin of error = 2.064 · (15 / √25) = 2.064 · 3 = 6.192.
95% CI ≈ [100 − 6.192, 100 + 6.192] = [93.81, 106.19]. - Proporcja: n = 400, p̂ = 0.12. Dla 95%: z_{0.975} ≈ 1.96.
SE = √(0.12·0.88/400) ≈ 0.0159. Margin ≈ 1.96·0.0159 ≈ 0.0312.
95% CI ≈ [0.0888, 0.1512].
Właściwości i praktyczne wskazówki
- Szerokość przedziału: zależy od poziomu ufności (wyższy → szerszy), od wariancji populacji (większa wariancja → szerszy) oraz od rozmiaru próby (większe n → węższy; szerokość spada w przybliżeniu jak 1/√n).
- Wybór metody: dla dużych prób i umiarkowanych odchyleń od normalności proste przybliżenia normalne działają dobrze. Dla małych prób, rozkładów skośnych lub dla proporcji bliskich 0/1 używaj metod poprawionych (t, Wilson, Clopper–Pearson, bootstrap).
- Raportowanie wyników: zawsze podaj poziom ufności (np. 95%), estymator (np. x̄ lub p̂), granice przedziału oraz metodę zastosowaną (np. t-Student, bootstrap, Clopper–Pearson) i rozmiar próby n.
- Jednostronne przedziały: zamiast dwustronnego przedziału można skonstruować przedział jednostronny (np. „do góry” lub „do dołu”) — użyteczne gdy interesuje nas tylko ograniczenie w jedną stronę.
- Wielokrotne porównania: przy konstruowaniu wielu przedziałów jednocześnie należy uwzględnić problem alfa-mnożenia; stosuje się korekty (np. Bonferroni) lub metody wielowymiarowe.
- Związek z testowaniem hipotez: jeżeli 95% przedział ufności dla różnicy średnich nie zawiera 0, to test t dla α = 0.05 odrzuci hipotezę zerową o równości średnich (w wielu typowych przypadkach relacja ta jest wzajemna).
Ograniczenia
- Przedziały ufności zależą od przyjętych założeń (np. normalność, niezależność). Naruszenie założeń może prowadzić do błędnych wniosków.
- W małych próbach przedziały mogą być bardzo szerokie i mało informatywne; metody dokładne lub bayesowskie mogą być w takich sytuacjach lepsze.
- Przedział ufności nie zastępuje pełnej analizy — warto analizować także rozkład reszt, wpływ obserwacji odstających i prowadzić weryfikację założeń.
Alternatywy i rozszerzenia
- Metody bayesowskie dostarczają tzw. przedziałów wiarygodności (credible intervals), które można interpretować bezpośrednio jako prawdopodobieństwo, że parametr leży w przedziale, ale wymagają określenia rozkładu apriorycznego.
- Bootstrap i metody resamplingowe — praktyczne i elastyczne, szczególnie gdy nie znamy rozkładu lub gdy estymator ma skomplikowany rozkład.
Podsumowując: przedział ufności to narzędzie do wyrażenia niepewności estymacji parametru. Kluczowe jest zrozumienie jego interpretacji (jako własności procedury szacowania), sprawdzenie założeń oraz dobranie odpowiedniej metody obliczeniowej dla danej sytuacji.


