W statystyce, rozkład częstości jest listą wartości, które zmienna przyjmuje w próbce. Zazwyczaj jest to lista uporządkowana według ilości. Pokazuje on liczbę wystąpień każdej wartości. Na przykład, jeśli 100 osób oceni pięciopunktową skalę Likerta, oceniającą ich zgodę z pewnym stwierdzeniem na skali, na której 1 oznacza zdecydowaną zgodę, a 5 zdecydowaną niezgodę, rozkład częstości ich odpowiedzi może wyglądać następująco:

Ocena (skala 1–5)Częstość (f)Częstość względna (f/n)Procent
1100,1010%
2200,2020%
3300,3030%
4250,2525%
5150,1515%
Razem100100%

Ta prosta tabela ma dwie wady. Gdy zmienna może przyjmować wartości ciągłe zamiast dyskretnych lub gdy liczba możliwych wartości jest zbyt duża, konstrukcja tabeli jest trudna, jeśli nie niemożliwa. W takich przypadkach stosuje się nieco inny schemat oparty na przedziałach wartości. Na przykład, jeśli weźmiemy pod uwagę wzrost uczniów w pewnej klasie, tabela częstości może wyglądać jak poniżej.

Przedział wzrostu (cm)Częstość (f)Środek przedziału (m)Cz. względnaCz. skumulowana
150–15451520,055
155–159121570,1217
160–164201620,2037
165–169301670,3067
170–174231720,2390
175–179101770,10100
Razem1001,00100

Rodzaje rozkładów częstości

  • Częstość bezwzględna (f) — liczba obserwacji mających daną wartość lub należących do danego przedziału.
  • Częstość względna — f podzielone przez n (liczebność próby). Często wyrażana jako ułamek lub procent.
  • Częstość skumulowana (F) — suma częstości dla wszystkich wartości mniejszych lub równych danej; przydatna do odczytu kwartylów i mediany.
  • Częstość procentowa — częstość względna pomnożona przez 100%.

Przedziały klasowe — jak je tworzyć

  • Gdy wartości są ciągłe lub liczba różnych wartości jest duża, dzieli się zakres danych na równe przedziały (klasy). Dla każdej klasy oblicza się częstość.
  • Na ogół wybiera się liczbę klas k w sposób rozsądny — zbyt mała k ukryje szczegóły, zbyt duża uczyni tabelę nieczytelną. Dwie popularne zasady:
    • Reguła Sturgesa: k ≈ 1 + 3,322 log10(n). (Dobre przy umiarkowanych próbkach.)
    • Alternatywnie: k ≈ sqrt(n). (Prosta reguła przy dużych próbkach.)
  • Szerokość klasy obliczamy zwykle jako w ≈ (max − min) / k i zaokrąglamy do wygodnej wartości (np. 1, 2, 5, 10).
  • Zalecane są klasy o równej szerokości; granice przedziałów należy ustalić tak, aby nie występowały luki ani nakładanie się (np. 150–154, 155–159 itd.).
  • Dla danych miarowych ważne jest rozróżnienie między przedziałami zamkniętymi/otwartymi i granicami korygowanymi (granice rzeczywiste), szczególnie przy rysowaniu histogramu.

Obliczenia przy rozkładzie grupowanym

  • Środek przedziału (m) = (dolna granica + górna granica) / 2 — wykorzystywany do estymacji miar położenia.
  • Przybliżona średnia z danych grupowanych: średnia ≈ (Σ m_i·f_i) / n, gdzie m_i to środek i-tego przedziału.
  • Przybliżenie wariancji i odchylenia standardowego również można obliczyć na podstawie środków klasowych (stosuje się formuły klasyczne dla danych z wagami f_i).

W naszym przykładzie z wysokościami obliczamy średnią przybliżoną:

  • Σ m_i·f_i = 5·152 + 12·157 + 20·162 + 30·167 + 23·172 + 10·177 = 16 620
  • Średnia ≈ 16 620 / 100 = 166,2 cm

Wykresy i interpretacja

  • Histogram — wykres słupkowy dla danych grupowanych; wysokość słupka odpowiada częstości (lub częstości względnej) klasy. Przy zmiennych ciągłych słupki stykają się.
  • Wykres częstości skumulowanej (ogive) — przydatny do odczytu mediany i kwartyli.
  • Dla zmiennych dyskretnych (np. skala Likerta) zwykle używa się wykresu słupkowego z oddzielonymi słupkami.

Praktyczne wskazówki

  • Przy małych próbkach lepiej pokazywać listę wartości i bezpośrednie częstości niż grupowanie.
  • Przy grupowaniu wybieraj sensowny poziom zaokrąglenia granic, by tabele były czytelne.
  • Podawaj zarówno częstości bezwzględne, jak i względne — to ułatwia porównania między próbkami o różnych rozmiarach.
  • Histogram i tabela rozkładu częstości to podstawowe narzędzia eksploracji danych — pozwalają rozpoznać symetrię, skośność, outliery i przybliżyć miary tendencji centralnej.

W praktyce tabele częstości i histogramy łatwo tworzyć w programach takich jak Excel, R czy Python (biblioteki pandas/matplotlib), które automatyzują obliczanie klas i rysowanie wykresów.