Przedział ufności
W statystyce przedział ufności jest specjalną formą szacowania pewnego parametru. W tej metodzie zamiast pojedynczej wartości podawany jest cały przedział dopuszczalnych wartości parametru wraz z prawdopodobieństwem, że prawdziwa (nieznana) wartość parametru znajdzie się w tym przedziale. Przedział ufności jest oparty na obserwacjach z próby, a więc różni się w zależności od próby. Prawdopodobieństwo, że parametr znajdzie się w przedziale nazywane jest poziomem ufności. Bardzo często jest on podawany jako procent. Przedział ufności jest zawsze podawany razem z poziomem ufności. Można mówić o "95% przedziale ufności". Punkty końcowe przedziału ufności są określane jako granice ufności. Dla danej procedury szacowania w danej sytuacji, im wyższy poziom ufności, tym szerszy będzie przedział ufności.
Obliczenie przedziału ufności wymaga na ogół przyjęcia założeń dotyczących charakteru procesu estymacji - jest to przede wszystkim metoda parametryczna. Jednym z powszechnych założeń jest to, że rozkład populacji, z której pochodzi próbka, jest normalny. Jako takie, przedziały ufności omówione poniżej nie są statystykami odpornymi, chociaż można dokonać zmian w celu dodania odporności.
Znaczenie terminu "zaufanie"
Termin "pewność" ma podobne znaczenie w statystyce, jak w powszechnym użyciu. W powszechnym użyciu, twierdzenie o 95% pewności czegoś jest zwykle traktowane jako wskazujące na wirtualną pewność. W statystyce, twierdzenie o 95% pewności oznacza po prostu, że badacz zaobserwował jeden możliwy przedział z dużej liczby możliwych, z których dziewiętnaście na dwadzieścia zawiera prawdziwą wartość parametru.
Przykład praktyczny
Maszyna napełnia kubki margaryną. W tym przykładzie maszyna jest tak ustawiona, że zawartość kubków wynosi 250g margaryny. Ponieważ maszyna nie może napełnić każdego kubka dokładnie 250g, zawartość dodawana do poszczególnych kubków wykazuje pewną zmienność i jest traktowana jako zmienna losowa X. Zakłada się, że zmienność ta ma rozkład normalny wokół pożądanej średniej 250g, z odchyleniem standardowym 2,5g. Aby określić, czy maszyna jest odpowiednio skalibrowana, wybrano losowo próbkę n = 25 kubków margaryny i zważono kubki. Wagi margaryny wynoszą X1, ..., X25, co stanowi losową próbkę z X.
Aby uzyskać wyobrażenie o wartości oczekiwanej μ, wystarczy podać jej oszacowanie. Właściwym estymatorem jest średnia z próby:
μ ^ = X ¯ = 1 n ∑ i = 1 n X i . {{displaystyle}}={bar {X}}={frac {1}{n}}suma _{i=1}^{n}X_{i}. }
Próbka przedstawia wagi rzeczywiste x1, ...,x25, o średniej:
x ¯ = 1 25 ∑ i = 1 25 x i = 250,2 gramów . W związku z tym, że x ¯ = 1 25 ∑ i = 1 25 x i = 250,2 gramów. }
Jeśli weźmiemy kolejną próbkę 25 filiżanek, możemy z łatwością oczekiwać, że znajdziemy wartości takie jak 250,4 lub 251,1 gramów. Średnia wartość próby wynosząca 280 gramów byłaby jednak niezwykle rzadka, gdyby średnia zawartość kubków była w rzeczywistości zbliżona do 250 gramów. Istnieje cały przedział wokół zaobserwowanej wartości 250,2 średniej z próby, w którym, jeśli średnia dla całej populacji rzeczywiście przyjmie wartość z tego przedziału, zaobserwowane dane nie będą uważane za szczególnie niezwykłe. Przedział taki nazywamy przedziałem ufności dla parametru μ. Jak obliczamy taki przedział? Punkty końcowe przedziału muszą być obliczone z próby, są więc statystykami, funkcjami próby X1, ..., X25, a więc zmiennymi losowymi.
W naszym przypadku możemy wyznaczyć punkty końcowe rozważając, że średnia z próby X z próby o rozkładzie normalnym jest również rozkładem normalnym, z tą samą wartością oczekiwaną μ, ale z błędem standardowym σ/√n = 0,5 (gramów). W wyniku standaryzacji otrzymujemy zmienną losową
Z = X Ż - μ σ / n = X Ż - μ 0,5 {{displaystyle Z={{sigma {{sqrt {{sigma}}}}}}
zależne od parametru μ, który ma być oszacowany, ale o standardowym rozkładzie normalnym niezależnym od parametru μ. Stąd możliwe jest znalezienie liczb -z i z, niezależnych od μ, gdzie Z leży pomiędzy z prawdopodobieństwem 1 - α, co jest miarą pewności, jaką chcemy mieć. Przyjmujemy 1 - α = 0,95. Mamy więc:
P ( - z ≤ Z ≤ z ) = 1 - α = 0,95. P(- z ≤ Z ≤ z)=1 - α =0,95.}
Liczba z wynika z funkcji rozkładu kumulatywnego:
Φ ( z ) = P ( Z ≤ z ) = 1 - α 2 = 0,975 , z = Φ - 1 ( Φ ( z ) = Φ - 1 ( 0,975 ) = 1.96 , { {begin{aligned}} } }Phi (z)&=P(Z ≤ z)=1-{tfrac {{alpha }{2}}=0,975,z&= P^{-1}(z))=Phi ^{-1}(0,975)=1,96,end{aligned}}.
i otrzymujemy:
0,95 = 1 - α = P ( - z ≤ Z ≤ z ) = P ( - 1,96 ≤ X ¯ - μ σ / n ≤ 1,96 ) = P ( X ¯ - 1,96 σ n ≤ μ ≤ X ¯ + 1,96 σ n ) = P ( X ¯ - 1,96 × 0,5 ≤ μ ≤ X ¯ + 1,96 × 0,5 ) = P ( X ¯ - 0,98 ≤ μ ≤ X ¯ + 0,98 ) . Displaystyle {{begin{aligned}0.95&=1-alfa =P(-z z)=P(-1.96}}} {{frac {{bar {X}}-}mu }{sigma /{sqrt {n}}}}}} 1.96)&=Pleft({{bar {X}}-1.96{frac {{sigma }{sqrt {n}}}}}leq {{bar {X}}+1.96} &=Pleft({{bar {X}}-1.96} razy 0.5}leq \mu {{bar {X}+1.
Można to zinterpretować w ten sposób, że z prawdopodobieństwem 0,95 znajdziemy przedział ufności, w którym pomiędzy stochastycznymi punktami końcowymi spotkamy parametr μ
X - 0 . 98 {{displaystyle {{bar {X}}-0{.}98}}.
oraz
X ¯ + 0.98. {{displaystyle}}+0,98.}
Nie oznacza to, że prawdopodobieństwo spełnienia parametru μ w obliczonym przedziale wynosi 0,95. Przy każdym powtórzeniu pomiarów pojawi się inna wartość średniej X z próby. W 95% przypadków μ znajdzie się pomiędzy punktami końcowymi obliczonymi na podstawie tej średniej, ale w 5% przypadków nie znajdzie się. Rzeczywisty przedział ufności obliczamy, wpisując do wzoru zmierzone wagi. Nasz przedział ufności 0,95 przyjmuje postać:
( x ż - 0,98 ; x ż + 0,98 ) = ( 250,2 - 0,98 ; 250,2 + 0,98 ) = ( 249,22 ; 251,18 ) . {\displaystyle ({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,}
Ponieważ pożądana wartość 250 μ mieści się w otrzymanym przedziale ufności, nie ma powodu, aby sądzić, że maszyna jest nieprawidłowo skalibrowana.
Obliczony przedział ma ustalone punkty końcowe, gdzie μ może być pomiędzy (lub nie). Zatem to zdarzenie ma prawdopodobieństwo albo 0 albo 1. Nie możemy powiedzieć: "z prawdopodobieństwem (1 - α) parametr μ leży w przedziale ufności". Wiemy tylko, że przez powtórzenie w 100(1 - α) % przypadków μ znajdzie się w obliczonym przedziale. W 100α % przypadków jednak tak nie jest. I niestety nie wiemy, w którym z tych przypadków tak się stanie. Dlatego mówimy: "z poziomem ufności 100(1 - α) %, μ leży w przedziale ufności. "
Rysunek po prawej stronie przedstawia 50 realizacji przedziału ufności dla danej średniej populacji μ. Jeśli losowo wybierzemy jedną realizację, prawdopodobieństwo, że wybierzemy przedział zawierający parametr wynosi 95%; możemy jednak mieć pecha i wybrać niewłaściwy przedział. Nigdy się tego nie dowiemy; utknęliśmy z naszym przedziałem.
Odcinki linii pionowych reprezentują 50 realizacji przedziału ufności dla μ.
Pytania i odpowiedzi
P: Co to jest przedział ufności w statystyce?
O: Przedział ufności to specjalny przedział używany do szacowania parametru, takiego jak średnia w populacji, podający zakres dopuszczalnych wartości parametru zamiast jednej wartości.
P: Dlaczego stosuje się przedział ufności zamiast pojedynczej wartości?
O: Przedział ufności stosuje się zamiast pojedynczej wartości, aby uwzględnić niepewność oszacowania parametru na podstawie próby i podać prawdopodobieństwo, że rzeczywista wartość parametru mieści się w przedziale.
P: Co to jest poziom ufności?
O: Poziom ufności to prawdopodobieństwo, że szacowany parametr mieści się w przedziale ufności i często podaje się go w procentach (np. 95% przedział ufności).
P: Co to są granice ufności?
O: Granice ufności to punkty końcowe przedziału ufności, które określają zakres dopuszczalnych wartości szacowanego parametru.
P: Jak poziom ufności wpływa na przedział ufności?
O: W danej procedurze szacowania, im wyższy poziom ufności, tym szerszy będzie przedział ufności.
P: Jakie założenia są wymagane do obliczenia przedziału ufności?
O: Obliczenie przedziału ufności wymaga na ogół przyjęcia założeń dotyczących charakteru procesu szacowania, takich jak założenie, że rozkład populacji, z której pochodzi próba, jest normalny.
P: Czy przedziały ufności są solidną statystyką?
O: Przedziały ufności, jak to omówiono poniżej, nie są solidnymi statystykami, chociaż można dokonać korekt w celu zwiększenia solidności.