W statystyce przedział ufności jest specjalną formą szacowania pewnego parametru. Zamiast jednej punktowej estymaty podaje się cały przedział dopuszczalnych wartości parametru wraz z poziomem ufności, czyli z prawdopodobieństwem (wyrażanym najczęściej w procentach), że procedura szacowania obejmie prawdziwą (nieznaną) wartość parametru. Przedział ufności jest oparty na obserwacjach z próby, a więc różni się w zależności od próby. Prawdopodobieństwo, że parametr znajdzie się w przedziale nazywane jest poziomem ufności — np. „95% przedział ufności”. Punkty końcowe przedziału nazywane są granicami ufności. Dla danej procedury szacowania i danej sytuacji, im wyższy poziom ufności, tym szerszy będzie przedział.

Interpretacja

  • Interpretacja często spotykana (częściowo potoczna): mówi się: „95% przedział ufności oznacza, że mamy 95% pewności, że prawdziwy parametr leży w tym przedziale”. To sformułowanie jest użyteczne w komunikacji, lecz może być mylące.
  • Interpretacja formalna (częstościowa): przedział ufności opisuje właściwość metody: gdyby powtórzyć eksperyment wiele razy i dla każdej próby skonstruować przedział ufności tą samą procedurą, to w przybliżeniu 95% takich przedziałów obejmie prawdziwą wartość parametru. Nie oznacza to, że dla konkretnego jednego przedziału istnieje 95% „prawdopodobieństwa” dla parametru — prawdziwy parametr jest stały, a przedział jest losowy.
  • Powszechne nieporozumienia: nie należy traktować granic jako punktów, które mają jedynie określone „wiarygodności” poza kontekstem procedury; nie wszystkie procedury mają dobrą własność przy małych próbach lub przy naruszeniu założeń.

Podstawowe założenia

  • Przedziały ufności są zwykle konstruowane w ramach metod parametrycznych.
  • Typowe założenia to niezależność obserwacji, identyczny rozkład próbki oraz (często) normalność rozkładu populacji. Jeśli te założenia są naruszone, wiarygodność przedziału może maleć.
  • Przedziały wyprowadzone przy założeniu normalności nie są odporne na obserwacje odstające — w praktyce można stosować modyfikacje lub metody nieparametryczne (np. bootstrap).

Jak oblicza się przedziały ufności — najczęstsze przypadki

Poniżej podane są standardowe wzory i metody. W zapisie użyto α jako poziomu istotności, przy czym poziom ufności = 1 − α (np. dla 95%: α = 0.05).

  • Przedział dla średniej, gdy znane jest odchylenie standardowe populacji σ:
    x̄ ± z_{1−α/2} · (σ / √n)
    gdzie z_{1−α/2} to kwantyl rozkładu normalnego standardowego (dla 95% ≈ 1.96).
  • Przedział dla średniej, gdy σ nie jest znane (mała/umiarkowana próba):
    x̄ ± t_{1−α/2, n−1} · (s / √n)
    gdzie s to odchylenie standardowe próbki, a t_{1−α/2, n−1} — kwantyl rozkładu Studenta z n−1 stopniami swobody.
  • Przedział dla odsetka (proporcji) p przy dużej próbie — tzw. przedział Wald:
    p̂ ± z_{1−α/2} · √(p̂(1−p̂)/n)
    Uwaga: dla małych n lub p̂ bliskich 0 lub 1 lepsze są metody Wilsona, Agresti–Coull lub dokładny przedział Clopper–Pearson.
  • Przedział dla różnicy średnich: istnieją warianty zależnie od tego, czy zakładamy równość wariancji (przedział „pooled”) czy nie (wersja Welcha). Dla dużych prób często używa się przybliżenia normalnego.
  • Przedziały dla wariancji: wykorzystują rozkład χ²: ((n−1)s²) / χ²_{1−α/2, n−1} ≤ σ² ≤ ((n−1)s²) / χ²_{α/2, n−1}.
  • Przedziały dla parametrów modeli regresyjnych: granice dla współczynników regresji zwykle korzystają z estymatorów i ich błędów standardowych oraz rozkładu t (dla klasycznej regresji liniowej).
  • Metody nieparametryczne i komputerowe: bootstrap (np. percentylowy, BCa) pozwala oszacować przedziały ufności bez silnych założeń o rozkładzie populacji.

Przykłady obliczeń (95%)

  • Średnia: n = 25, x̄ = 100, s = 15. Dla 95%: t_{0.975,24} ≈ 2.064.
    Margin of error = 2.064 · (15 / √25) = 2.064 · 3 = 6.192.
    95% CI ≈ [100 − 6.192, 100 + 6.192] = [93.81, 106.19].
  • Proporcja: n = 400, p̂ = 0.12. Dla 95%: z_{0.975} ≈ 1.96.
    SE = √(0.12·0.88/400) ≈ 0.0159. Margin ≈ 1.96·0.0159 ≈ 0.0312.
    95% CI ≈ [0.0888, 0.1512].

Właściwości i praktyczne wskazówki

  • Szerokość przedziału: zależy od poziomu ufności (wyższy → szerszy), od wariancji populacji (większa wariancja → szerszy) oraz od rozmiaru próby (większe n → węższy; szerokość spada w przybliżeniu jak 1/√n).
  • Wybór metody: dla dużych prób i umiarkowanych odchyleń od normalności proste przybliżenia normalne działają dobrze. Dla małych prób, rozkładów skośnych lub dla proporcji bliskich 0/1 używaj metod poprawionych (t, Wilson, Clopper–Pearson, bootstrap).
  • Raportowanie wyników: zawsze podaj poziom ufności (np. 95%), estymator (np. x̄ lub p̂), granice przedziału oraz metodę zastosowaną (np. t-Student, bootstrap, Clopper–Pearson) i rozmiar próby n.
  • Jednostronne przedziały: zamiast dwustronnego przedziału można skonstruować przedział jednostronny (np. „do góry” lub „do dołu”) — użyteczne gdy interesuje nas tylko ograniczenie w jedną stronę.
  • Wielokrotne porównania: przy konstruowaniu wielu przedziałów jednocześnie należy uwzględnić problem alfa-mnożenia; stosuje się korekty (np. Bonferroni) lub metody wielowymiarowe.
  • Związek z testowaniem hipotez: jeżeli 95% przedział ufności dla różnicy średnich nie zawiera 0, to test t dla α = 0.05 odrzuci hipotezę zerową o równości średnich (w wielu typowych przypadkach relacja ta jest wzajemna).

Ograniczenia

  • Przedziały ufności zależą od przyjętych założeń (np. normalność, niezależność). Naruszenie założeń może prowadzić do błędnych wniosków.
  • W małych próbach przedziały mogą być bardzo szerokie i mało informatywne; metody dokładne lub bayesowskie mogą być w takich sytuacjach lepsze.
  • Przedział ufności nie zastępuje pełnej analizy — warto analizować także rozkład reszt, wpływ obserwacji odstających i prowadzić weryfikację założeń.

Alternatywy i rozszerzenia

  • Metody bayesowskie dostarczają tzw. przedziałów wiarygodności (credible intervals), które można interpretować bezpośrednio jako prawdopodobieństwo, że parametr leży w przedziale, ale wymagają określenia rozkładu apriorycznego.
  • Bootstrap i metody resamplingowe — praktyczne i elastyczne, szczególnie gdy nie znamy rozkładu lub gdy estymator ma skomplikowany rozkład.

Podsumowując: przedział ufności to narzędzie do wyrażenia niepewności estymacji parametru. Kluczowe jest zrozumienie jego interpretacji (jako własności procedury szacowania), sprawdzenie założeń oraz dobranie odpowiedniej metody obliczeniowej dla danej sytuacji.