Błąd standardowy

Autor: Leandro Alegsa

03-04-2021 19:23

Błąd standardowy jest odchyleniem standardowym rozkładu próby dla danej statystyki. Termin ten może być również używany w odniesieniu do szacunku (dobrego przypuszczenia) tego odchylenia standardowego, pobranego z próbki całej grupy.

Średnia z pewnej części grupy (zwanej próbką) jest zwykłym sposobem oszacowania średniej dla całej grupy. Pomiar całej grupy jest często zbyt trudny lub kosztuje zbyt dużo pieniędzy. Jeśli jednak zmierzy się inną próbkę, jej średnia będzie się nieco różnić od średniej z pierwszej próbki. Błąd standardowy średniej to sposób, aby dowiedzieć się, jak blisko średnia z próbki jest do średniej całej grupy. Jest to sposób, aby wiedzieć, jak bardzo można być pewnym średniej z próbki.

W rzeczywistych pomiarach prawdziwa wartość odchylenia standardowego średniej dla całej grupy zwykle nie jest znana. Dlatego też termin błąd standardowy jest często używany w znaczeniu przybliżonego przypuszczenia co do prawdziwej liczby dla całej grupy. Im więcej pomiarów jest w próbce, tym bardziej przybliżone jest przypuszczenie do prawdziwej liczby dla całej grupy.

Dla wartości, która jest próbkowana z błędem o rozkładzie normalnym, powyższy wykres przedstawia proporcje próbek, które mieszczą się w przedziale 0, 1, 2 i 3 odchyleń standardowych powyżej i poniżej wartości rzeczywistej.

Jak znaleźć błąd standardowy średniej

Jednym ze sposobów na znalezienie standardowego błędu średniej jest posiadanie dużej ilości próbek. Po pierwsze, średnia dla każdej próbki jest znaleziony. Następnie znajduje się średnią i odchylenie standardowe tych średnich z próbki. Odchylenie standardowe dla wszystkich średnich z próbek to błąd standardowy średniej. To może być dużo pracy. Czasami jest to zbyt trudne lub kosztuje zbyt dużo pieniędzy, aby mieć wiele próbek.

Innym sposobem na znalezienie błędu standardowego średniej jest użycie równania, które wymaga tylko jednej próbki. Błąd standardowy średniej jest zwykle szacowany poprzez odchylenie standardowe dla próbki z całej grupy (odchylenie standardowe próbki) podzielone przez pierwiastek kwadratowy z wielkości próbki.

S E x ¯ = s n {displaystyle SE_{bar {x}} ={frac {s}{sqrt {n}}}} $SE_{\bar {x}}\ ={\frac {s}{\sqrt {n}}}$

gdzie

s jest odchyleniem standardowym próby (tzn. opartym na próbie oszacowaniem odchylenia standardowego populacji), oraz

n jest liczbą pomiarów w próbce.

Jak duża musi być próba, aby oszacowanie błędu standardowego średniej było zbliżone do rzeczywistego błędu standardowego średniej dla całej grupy? W próbie powinno być co najmniej sześć pomiarów. Wówczas błąd standardowy średniej dla próby będzie się mieścił w 5% błędu standardowego średniej, gdyby mierzono całą grupę.

Poprawki dla niektórych przypadków

Istnieje inne równanie, które należy zastosować, jeśli liczba pomiarów dotyczy 5% lub więcej całej grupy:

Istnieją specjalne równania, które należy stosować, jeśli próbka ma mniej niż 20 pomiarów.

Czasami próbka pochodzi z jednego miejsca, mimo że cała grupa może być rozproszona. Zdarza się również, że próba może być wykonana w krótkim okresie czasu, podczas gdy cała grupa obejmuje dłuższy okres czasu. W takim przypadku liczby w próbie nie są niezależne. Wówczas stosuje się specjalne równania, aby spróbować to skorygować.

Przydatność

Praktyczny wynik: Można nabrać większej pewności co do wartości średniej, mając więcej pomiarów w próbie. Wówczas błąd standardowy średniej będzie mniejszy, ponieważ odchylenie standardowe jest dzielone przez większą liczbę. Jednakże, aby niepewność (błąd standardowy średniej) wartości średniej była o połowę mniejsza, wielkość próby (n) musi być cztery razy większa. Dzieje się tak dlatego, że odchylenie standardowe jest dzielone przez pierwiastek kwadratowy z wielkości próby. Aby niepewność była o jedną dziesiątą większa, wielkość próby (n) musi być sto razy większa!

Błędy standardowe są łatwe do obliczenia i są często stosowane, ponieważ:

Jeżeli znany jest błąd standardowy kilku pojedynczych wielkości, to w wielu przypadkach można łatwo obliczyć błąd standardowy pewnej funkcji tych wielkości;
Jeżeli znany jest rozkład prawdopodobieństwa wartości, można go wykorzystać do obliczenia dobrego przybliżenia dokładnego przedziału ufności; oraz
Jeżeli rozkład prawdopodobieństwa nie jest znany, do oszacowania przedziału ufności można użyć innych równań
Gdy liczebność próby staje się bardzo duża, zasada centralnego twierdzenia granicznego pokazuje, że liczby w próbie są bardzo podobne do liczb w całej grupie (mają rozkład normalny).

Względny błąd standardowy

Względny błąd standardowy (RSE) to błąd standardowy podzielony przez średnią. Liczba ta jest mniejsza od jedności. Mnożąc ją przez 100% otrzymujemy wartość procentową średniej. To pomaga pokazać, czy niepewność jest istotna czy nie. Na przykład, rozważmy dwa badania dochodu gospodarstw domowych, z których oba dają średnią 50 000 USD. Jeśli jedno badanie ma błąd standardowy 10 000 $, a drugie 5 000 $, to względne błędy standardowe wynoszą odpowiednio 20% i 10%. Badanie z niższym względnym błędem standardowym jest lepsze, ponieważ ma bardziej precyzyjny pomiar (niepewność jest mniejsza).

W rzeczywistości ludzie, którzy potrzebują znać wartości średnie często decydują o tym, jak mała powinna być niepewność, zanim zdecydują się na wykorzystanie informacji. Na przykład, amerykańskie Narodowe Centrum Statystyk Zdrowotnych nie podaje średniej, jeśli względny błąd standardowy przekracza 30%. NCHS wymaga również co najmniej 30 obserwacji, aby można było podać szacunek. ^[]

Przykład

Na przykład, w wodach Zatoki Meksykańskiej jest wiele karmazynów. Aby dowiedzieć się, ile średnio waży karmazyn o długości 42 cm, nie można zmierzyć wszystkich karmazynów o długości 42 cm. Można za to zmierzyć niektóre z nich. Ryby, które zostały zmierzone nazywamy próbką. W tabeli przedstawiono wagi dwóch próbek karmazynów, z których wszystkie mają 42 cm długości. Średnia (średnia) waga pierwszej próbki wynosi 0,741 kg. Średnia waga drugiej próbki to 0,735 kg, nieco inna niż pierwszej próbki. Każda z tych średnich jest nieco inna od średniej, która wynikałaby z pomiaru każdego karmazyna o długości 42 cm (co i tak nie jest możliwe).

Niepewność średniej może być użyta, aby wiedzieć jak blisko średnia z próbek jest do średniej, która wynikałaby z pomiaru całej grupy. Niepewność średniej jest szacowana jako odchylenie standardowe dla próbki, podzielone przez pierwiastek kwadratowy z liczby próbek minus jeden. Tabela pokazuje, że niepewności w średnich dla dwóch próbek są bardzo zbliżone do siebie. Również niepewność względna jest niepewnością średniej podzieloną przez średnią, razy 100%. Niepewność względna w tym przykładzie wynosi 2.38% i 2.50% dla dwóch próbek.

Znając niepewność średniej, możemy wiedzieć jak blisko średnia z próby jest do średniej, która wynikałaby z pomiaru całej grupy. Średnia dla całej grupy znajduje się pomiędzy a) średnią dla próbki plus niepewność w średniej, a b) średnią dla próbki minus niepewność w średniej. W tym przykładzie oczekuje się, że średnia waga dla wszystkich karmazynów o długości 42 cm w Zatoce Meksykańskiej wyniesie 0,723-0,759 kg w oparciu o pierwszą próbkę i 0,717-0,753 w oparciu o drugą próbkę.

Przykład karmazyna (znanego również jako red drum, Sciaenops ocellatus) użytego w przykładzie.

Pytania i odpowiedzi

P: Co to jest błąd standardowy?

O: Błąd standardowy to odchylenie standardowe rozkładu próbkowania statystyki.

P: Czy termin błąd standardowy może być używany do oszacowania odchylenia standardowego?

O: Tak, termin błąd standardowy może być używany do oszacowania (dobrego przypuszczenia) tego odchylenia standardowego pobranego z próby całej grupy.

P: W jaki sposób można oszacować średnią dla całej grupy?

O: Średnia z pewnej części grupy (zwanej próbą) jest zwykłym sposobem oszacowania średniej dla całej grupy.

P: Dlaczego trudno jest zmierzyć całą grupę?

O: Pomiar całej grupy jest często zbyt trudny lub zbyt kosztowny.

P: Co to jest błąd standardowy średniej i co określa?

O: Błąd standardowy średniej to sposób na określenie, jak bliska jest średnia z próby do średniej całej grupy. Jest to sposób, aby dowiedzieć się, jak bardzo można być pewnym średniej z próby.

P: Czy prawdziwa wartość odchylenia standardowego średniej jest zwykle znana w rzeczywistych pomiarach?

O: Nie, prawdziwa wartość odchylenia standardowego średniej dla całej grupy zwykle nie jest znana w rzeczywistych pomiarach.

P: W jaki sposób liczba pomiarów w próbie wpływa na dokładność oszacowania?

O: Im więcej pomiarów jest w próbce, tym bliższe będzie oszacowanie prawdziwej wartości dla całej grupy.

Przeszukaj encyklopedię