Przedział ufności

W statystyce przedział ufności jest specjalną formą szacowania pewnego parametru. W tej metodzie zamiast pojedynczej wartości podawany jest cały przedział dopuszczalnych wartości parametru wraz z prawdopodobieństwem, że prawdziwa (nieznana) wartość parametru znajdzie się w tym przedziale. Przedział ufności jest oparty na obserwacjach z próby, a więc różni się w zależności od próby. Prawdopodobieństwo, że parametr znajdzie się w przedziale nazywane jest poziomem ufności. Bardzo często jest on podawany jako procent. Przedział ufności jest zawsze podawany razem z poziomem ufności. Można mówić o "95% przedziale ufności". Punkty końcowe przedziału ufności są określane jako granice ufności. Dla danej procedury szacowania w danej sytuacji, im wyższy poziom ufności, tym szerszy będzie przedział ufności.

Obliczenie przedziału ufności wymaga na ogół przyjęcia założeń dotyczących charakteru procesu estymacji - jest to przede wszystkim metoda parametryczna. Jednym z powszechnych założeń jest to, że rozkład populacji, z której pochodzi próbka, jest normalny. Jako takie, przedziały ufności omówione poniżej nie są statystykami odpornymi, chociaż można dokonać zmian w celu dodania odporności.

Znaczenie terminu "zaufanie"

Termin "pewność" ma podobne znaczenie w statystyce, jak w powszechnym użyciu. W powszechnym użyciu, twierdzenie o 95% pewności czegoś jest zwykle traktowane jako wskazujące na wirtualną pewność. W statystyce, twierdzenie o 95% pewności oznacza po prostu, że badacz zaobserwował jeden możliwy przedział z dużej liczby możliwych, z których dziewiętnaście na dwadzieścia zawiera prawdziwą wartość parametru.

Przykład praktyczny

A factory assembly line fills margarine cups to a desired 250g +/- 5g

Maszyna napełnia kubki margaryną. W tym przykładzie maszyna jest tak ustawiona, że zawartość kubków wynosi 250g margaryny. Ponieważ maszyna nie może napełnić każdego kubka dokładnie 250g, zawartość dodawana do poszczególnych kubków wykazuje pewną zmienność i jest traktowana jako zmienna losowa X. Zakłada się, że zmienność ta ma rozkład normalny wokół pożądanej średniej 250g, z odchyleniem standardowym 2,5g. Aby określić, czy maszyna jest odpowiednio skalibrowana, wybrano losowo próbkę n = 25 kubków margaryny i zważono kubki. Wagi margaryny wynoszą X1, ..., X25, co stanowi losową próbkę z X.

Aby uzyskać wyobrażenie o wartości oczekiwanej μ, wystarczy podać jej oszacowanie. Właściwym estymatorem jest średnia z próby:

μ ^ = X ¯ = 1 n ∑ i = 1 n X i . {{displaystyle}}={bar {X}}={frac {1}{n}}suma _{i=1}^{n}X_{i}. } {\displaystyle {\hat {\mu }}={\bar {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}.}

Próbka przedstawia wagi rzeczywiste x1, ...,x25, o średniej:

x ¯ = 1 25 ∑ i = 1 25 x i = 250,2 gramów . W związku z tym, że x ¯ = 1 25 ∑ i = 1 25 x i = 250,2 gramów. } {\displaystyle {\bar {x}}={\frac {1}{25}}\sum _{i=1}^{25}x_{i}=250.2\,{\text{grams}}.}

Jeśli weźmiemy kolejną próbkę 25 filiżanek, możemy z łatwością oczekiwać, że znajdziemy wartości takie jak 250,4 lub 251,1 gramów. Średnia wartość próby wynosząca 280 gramów byłaby jednak niezwykle rzadka, gdyby średnia zawartość kubków była w rzeczywistości zbliżona do 250 gramów. Istnieje cały przedział wokół zaobserwowanej wartości 250,2 średniej z próby, w którym, jeśli średnia dla całej populacji rzeczywiście przyjmie wartość z tego przedziału, zaobserwowane dane nie będą uważane za szczególnie niezwykłe. Przedział taki nazywamy przedziałem ufności dla parametru μ. Jak obliczamy taki przedział? Punkty końcowe przedziału muszą być obliczone z próby, są więc statystykami, funkcjami próby X1, ..., X25, a więc zmiennymi losowymi.

W naszym przypadku możemy wyznaczyć punkty końcowe rozważając, że średnia z próby X z próby o rozkładzie normalnym jest również rozkładem normalnym, z tą samą wartością oczekiwaną μ, ale z błędem standardowym σ/√n = 0,5 (gramów). W wyniku standaryzacji otrzymujemy zmienną losową

Z = X Ż - μ σ / n = X Ż - μ 0,5 {{displaystyle Z={{sigma {{sqrt {{sigma}}}}}} {\displaystyle Z={\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}={\frac {{\bar {X}}-\mu }{0.5}}}

zależne od parametru μ, który ma być oszacowany, ale o standardowym rozkładzie normalnym niezależnym od parametru μ. Stąd możliwe jest znalezienie liczb -z i z, niezależnych od μ, gdzie Z leży pomiędzy z prawdopodobieństwem 1 - α, co jest miarą pewności, jaką chcemy mieć. Przyjmujemy 1 - α = 0,95. Mamy więc:

P ( - z ≤ Z ≤ z ) = 1 - α = 0,95. P(- z ≤ Z ≤ z)=1 - α =0,95.} {\displaystyle P(-z\leq Z\leq z)=1-\alpha =0.95.\,}

Liczba z wynika z funkcji rozkładu kumulatywnego:

Φ ( z ) = P ( Z ≤ z ) = 1 - α 2 = 0,975 , z = Φ - 1 ( Φ ( z ) = Φ - 1 ( 0,975 ) = 1.96 , { {begin{aligned}} } }Phi (z)&=P(Z ≤ z)=1-{tfrac {{alpha }{2}}=0,975,z&= P^{-1}(z))=Phi ^{-1}(0,975)=1,96,end{aligned}}. {\displaystyle {\begin{aligned}\Phi (z)&=P(Z\leq z)=1-{\tfrac {\alpha }{2}}=0.975,\\[6pt]z&=\Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0.975)=1.96,\end{aligned}}}

i otrzymujemy:

0,95 = 1 - α = P ( - z ≤ Z ≤ z ) = P ( - 1,96 ≤ X ¯ - μ σ / n ≤ 1,96 ) = P ( X ¯ - 1,96 σ n ≤ μ ≤ X ¯ + 1,96 σ n ) = P ( X ¯ - 1,96 × 0,5 ≤ μ ≤ X ¯ + 1,96 × 0,5 ) = P ( X ¯ - 0,98 ≤ μ ≤ X ¯ + 0,98 ) . Displaystyle {{begin{aligned}0.95&=1-alfa =P(-z z)=P(-1.96}}} {{frac {{bar {X}}-}mu }{sigma /{sqrt {n}}}}}} 1.96)&=Pleft({{bar {X}}-1.96{frac {{sigma }{sqrt {n}}}}}leq {{bar {X}}+1.96} &=Pleft({{bar {X}}-1.96} razy 0.5}leq \mu {{bar {X}+1.

Można to zinterpretować w ten sposób, że z prawdopodobieństwem 0,95 znajdziemy przedział ufności, w którym pomiędzy stochastycznymi punktami końcowymi spotkamy parametr μ

X - 0 . 98 {{displaystyle {{bar {X}}-0{.}98}}. {\displaystyle {\bar {X}}-0{.}98\,}

oraz

X ¯ + 0.98. {{displaystyle}}+0,98.} {\displaystyle {\bar {X}}+0.98.\,}

Nie oznacza to, że prawdopodobieństwo spełnienia parametru μ w obliczonym przedziale wynosi 0,95. Przy każdym powtórzeniu pomiarów pojawi się inna wartość średniej X z próby. W 95% przypadków μ znajdzie się pomiędzy punktami końcowymi obliczonymi na podstawie tej średniej, ale w 5% przypadków nie znajdzie się. Rzeczywisty przedział ufności obliczamy, wpisując do wzoru zmierzone wagi. Nasz przedział ufności 0,95 przyjmuje postać:

( x ż - 0,98 ; x ż + 0,98 ) = ( 250,2 - 0,98 ; 250,2 + 0,98 ) = ( 249,22 ; 251,18 ) . {\displaystyle ({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,} {\displaystyle ({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,}

Ponieważ pożądana wartość 250 μ mieści się w otrzymanym przedziale ufności, nie ma powodu, aby sądzić, że maszyna jest nieprawidłowo skalibrowana.

Obliczony przedział ma ustalone punkty końcowe, gdzie μ może być pomiędzy (lub nie). Zatem to zdarzenie ma prawdopodobieństwo albo 0 albo 1. Nie możemy powiedzieć: "z prawdopodobieństwem (1 - α) parametr μ leży w przedziale ufności". Wiemy tylko, że przez powtórzenie w 100(1 - α) % przypadków μ znajdzie się w obliczonym przedziale. W 100α % przypadków jednak tak nie jest. I niestety nie wiemy, w którym z tych przypadków tak się stanie. Dlatego mówimy: "z poziomem ufności 100(1 - α) %, μ leży w przedziale ufności. "

Rysunek po prawej stronie przedstawia 50 realizacji przedziału ufności dla danej średniej populacji μ. Jeśli losowo wybierzemy jedną realizację, prawdopodobieństwo, że wybierzemy przedział zawierający parametr wynosi 95%; możemy jednak mieć pecha i wybrać niewłaściwy przedział. Nigdy się tego nie dowiemy; utknęliśmy z naszym przedziałem.

Odcinki linii pionowych reprezentują 50 realizacji przedziału ufności dla μ.Zoom
Odcinki linii pionowych reprezentują 50 realizacji przedziału ufności dla μ.

Pytania i odpowiedzi

P: Co to jest przedział ufności w statystyce?


O: Przedział ufności to specjalny przedział używany do szacowania parametru, takiego jak średnia w populacji, podający zakres dopuszczalnych wartości parametru zamiast jednej wartości.

P: Dlaczego stosuje się przedział ufności zamiast pojedynczej wartości?


O: Przedział ufności stosuje się zamiast pojedynczej wartości, aby uwzględnić niepewność oszacowania parametru na podstawie próby i podać prawdopodobieństwo, że rzeczywista wartość parametru mieści się w przedziale.

P: Co to jest poziom ufności?


O: Poziom ufności to prawdopodobieństwo, że szacowany parametr mieści się w przedziale ufności i często podaje się go w procentach (np. 95% przedział ufności).

P: Co to są granice ufności?


O: Granice ufności to punkty końcowe przedziału ufności, które określają zakres dopuszczalnych wartości szacowanego parametru.

P: Jak poziom ufności wpływa na przedział ufności?


O: W danej procedurze szacowania, im wyższy poziom ufności, tym szerszy będzie przedział ufności.

P: Jakie założenia są wymagane do obliczenia przedziału ufności?


O: Obliczenie przedziału ufności wymaga na ogół przyjęcia założeń dotyczących charakteru procesu szacowania, takich jak założenie, że rozkład populacji, z której pochodzi próba, jest normalny.

P: Czy przedziały ufności są solidną statystyką?


O: Przedziały ufności, jak to omówiono poniżej, nie są solidnymi statystykami, chociaż można dokonać korekt w celu zwiększenia solidności.

AlegsaOnline.com - 2020 / 2023 - License CC3