Próba statystyczna

Autor: Leandro Alegsa

17-12-2020 09:21

W statystyce próba jest częścią populacji. Próba jest starannie dobrana. Powinna ona reprezentować całą populację sprawiedliwie, bez uprzedzeń. Powodem, dla którego próby są potrzebne jest to, że populacje mogą być tak duże, że liczenie wszystkich osobników może nie być możliwe lub nie być praktyczne.

Dlatego rozwiązanie problemu w statystyce zazwyczaj zaczyna się od próbkowania. Próbkowanie polega na wyborze danych, które należy wziąć do późniejszej analizy. Jako przykład, załóżmy, że zanieczyszczenie jeziora powinno być analizowane do celów badawczych. W zależności od tego, gdzie zostały pobrane próbki wody, badania mogą mieć różne wyniki. Zasadniczo próbki muszą być pobierane losowo. Oznacza to, że szansa lub prawdopodobieństwo wyboru jednej osoby jest taka sama jak szansa wyboru innej osoby.

W praktyce, losowe próbki są zawsze pobierane według ściśle określonej procedury. Procedura jest zbiorem zasad, sekwencją kroków zapisanych na papierze, po których następuje litera. Mimo to, w próbce mogą pozostać pewne odchylenia. Rozważ problem zaprojektowania próbki w celu przewidzenia wyniku głosowania wyborczego. Wszystkie znane metody mają swoje problemy, a wyniki wyborów często różnią się od przewidywań opartych na próbce. Jeżeli zbierasz opinie za pomocą telefonu lub spotykając się z ludźmi na ulicy, próbka zawsze ma tendencyjność. Dlatego w takich przypadkach nigdy nie jest możliwa całkowicie neutralna próba. W takich przypadkach statystyk pomyśli o tym, jak zmierzyć wielkość uprzedzeń, a istnieją sposoby, aby to oszacować.

Podobna sytuacja ma miejsce, gdy naukowcy mierzą daną właściwość fizyczną, np. wagę kawałka metalu lub prędkość światła. Jeśli zważymy obiekt z czułym sprzętem, otrzymamy zupełnie inne wyniki. Żaden system pomiarowy nie jest nigdy doskonały. Otrzymujemy serię szacunków, z których każdy jest pomiarem. Są to próbki, z pewnym stopniem błędu. Statystyka ma na celu opisanie błędu i przeprowadzenie analizy na tego typu danych.

Są różne rodzaje próbek:

Policja graniczna szuka nielegalnych narkotyków ze specjalnie wyszkolonym psem: Jeśli sprawdzą co dziesiąty samochód, pobierają bezstronną próbkę.

Stratyfikowana kontrola wyrywkowa

Jeżeli w danej populacji występują oczywiste subpopulacje, wówczas należy pobrać próbki z każdej z tych subpopulacji. Nazywa się to pobieraniem warstwowym. Próbkowanie warstwowe znane jest również jako warstwowe pobieranie próbek losowych. Próba warstwowa jest często przedstawiana jako proporcja, np. w procentach (%).

Załóżmy, że eksperyment ma na celu pobranie próbek z dochodów dorosłych. Oczywiście, dochody absolwentów szkół wyższych mogą się różnić od dochodów osób nie będących absolwentami. Załóżmy teraz, że liczba absolwentów wynosiła 30% ogółu dorosłych mężczyzn (dane wyimaginowane). Załóżmy, że 30% wszystkich absolwentów to mężczyźni wybierani losowo, a 70% to mężczyźni nie będący absolwentami. Powtórzyć ten proces dla kobiet, ponieważ odsetek absolwentek jest inny niż mężczyzn. Daje to próbę dorosłej populacji rozwarstwionej przez płeć i wykształcenie wyższe. Następnym krokiem byłoby podzielenie każdej z waszych subpopulacji według grup wiekowych, ponieważ (na przykład) absolwenci mogą uzyskać większy dochód w stosunku do osób nie będących absolwentami w średnim wieku.

Inny rodzaj próby warstwowej dotyczy zmienności. Tutaj większe próby są pobierane z bardziej zmiennych subpopulacji, dzięki czemu statystyki zbiorcze, takie jak środki i odchylenia standardowe, są bardziej wiarygodne.

Pytania i odpowiedzi

P: Co to jest próba w statystyce?

O: W statystyce próba to część populacji, która została starannie wybrana, aby sprawiedliwie i bezstronnie reprezentować całą populację.

P: Dlaczego próbki są potrzebne?

O: Próbki są potrzebne, ponieważ populacje mogą być tak duże, że policzenie wszystkich osób może być niemożliwe lub niepraktyczne. Dlatego rozwiązanie problemu w statystyce zwykle zaczyna się od doboru próby.

P: Jak przedstawia się próbkę?

O: Gdy traktuje się ją jako zbiór danych, próbę często przedstawia się dużymi literami, takimi jak X i Y, jej elementy małymi literami (np. x3), a wielkość próby literą n.

P: Jakie powinny być próbki?

O: Zgodnie z ogólną zasadą, próby muszą być losowe, co oznacza, że szansa lub prawdopodobieństwo wyboru jednej osoby jest takie samo jak szansa wyboru każdej innej osoby. W praktyce próby losowe są zawsze pobierane za pomocą dobrze zdefiniowanej procedury.

P: Czy w próbach może pozostać stronniczość?

O: Nawet w przypadku stosowania dobrze zdefiniowanych procedur doboru próby, w próbie może pozostać pewna stronniczość, wynikająca z takich czynników, jak to, kto odbiera telefony lub kto chodzi po pewnych ulicach podczas zbierania opinii do sondażu wyborczego. W takich przypadkach może być trudno uzyskać całkowicie neutralne próby, ale statystycy mogą zmierzyć, jak bardzo tendencyjność pozostaje obecna.

P: Czy istnieją różne rodzaje prób?

O: Tak, istnieją różne rodzaje próbek, w tym próbki kompletne, które zawierają wszystkie elementy mające dane właściwości i próbki bezstronne/prezentatywne, które polegają na wyborze elementów z próbek kompletnych bez zależności od ich właściwości. Sposób, w jaki uzyskuje się próbki, oraz ich wielkość wpływają na sposób postrzegania danych.

Przeszukaj encyklopedię