Rozkład normalny (Gaussa) — definicja, wzór, przykłady

Rozkład normalny (Gaussa): definicja, wzory, objaśnienie parametrów oraz praktyczne przykłady zastosowań i standardowego rozkładu Z.

Rozkład normalny jest rozkładem prawdopodobieństwa. Jest on również nazywany rozkładem Gaussa, ponieważ został odkryty przez Carla Friedricha Gaussa. Rozkład normalny jest ciągłym rozkładem prawdopodobieństwa. Jest on bardzo ważny w wielu dziedzinach nauki. Rozkłady normalne są rodziną rozkładów o tej samej ogólnej postaci. Rozkłady te różnią się parametrami położenia i skali: średnia ("średnia") rozkładu określa jego położenie, a odchylenie standardowe ("zmienność") określa skalę.

Standardowy rozkład normalny (znany również jako rozkład Z) jest rozkładem normalnym ze średnią równą zero i wariancją równą jeden (zielone krzywe na wykresach po prawej stronie). Często nazywany jest krzywą dzwonową, ponieważ wykres jego gęstości prawdopodobieństwa wygląda jak dzwon.

Wiele wartości ma rozkład normalny. Dzieje się tak z powodu centralnego twierdzenia granicznego, które mówi, że jeśli zdarzenie jest sumą innych zdarzeń losowych, będzie miało rozkład normalny. Niektóre przykłady obejmują:

Przykłady

wzrosty ludzi w populacjach jednorodnych,
wyniki testów (np. standaryzowane testy) po odpowiednim skalowaniu,
błędy pomiarowe w eksperymentach fizycznych i inżynierskich,
fluktuacje niektórych zjawisk ekonomicznych w krótkim okresie (przy założeniach),
rozkład średnich z prób dzięki centralnemu twierdzeniu granicznemu.

Wzór — gęstość prawdopodobieństwa

Gęstość rozkładu normalnego o średniej μ i odchyleniu standardowym σ (gdzie σ > 0) wyraża się wzorem:

f(x) = 1 / (σ √(2π)) · exp( − (x − μ)² / (2 σ²) )

W szczególnym przypadku standardowego rozkładu normalnego mamy μ = 0 i σ = 1, więc gęstość upraszcza się do:

ϕ(x) = 1 / √(2π) · exp( − x² / 2 )

Funkcja dystrybuanty (CDF)

Funkcja dystrybuanty rozkładu normalnego to:

F(x) = ∫_−∞^x (1 / (σ √(2π))) · exp( − (t − μ)² / (2 σ²) ) dt

Nie ma prostej postaci elementarnej tej całki; wartości dystrybuanty standardowego rozkładu normalnego oznaczane są zwykle przez tablice statystyczne lub obliczane numerycznie (funkcja błędu erf pozwala zapisać ją w postaci specjalnej).

Własności rozkładu normalnego

Symetria: rozkład jest symetryczny względem μ (średnia = mediana = modalna).
Jednospiczastość (unimodalność): ma pojedynczy maksimum w μ.
Pełny opis przez dwa parametry: μ (położenie) i σ (skala). Wariancja to σ².
Moment generujący: M(t) = exp( μ t + ½ σ² t² ).
Zamkniętość względem liniowych kombinacji: jeżeli X ~ N(μ, σ²) i a, b są stałymi, to a + bX ~ N(a + bμ, (bσ)²).
Sumy niezależnych normalnych: suma niezależnych zmiennych normalnych jest normalna (z odpowiednią średnią i wariancją).
Ogony: rozkład ma „lekko grubsze” ogony niż wiele innych rozkładów, ale nadal maleją wykładniczo kwadratowo (ekstremalne wartości są rzadkie).

Standaryzacja i Z-score

Aby porównać obserwacje z różnych rozkładów normalnych lub posłużyć się tablicami standardowymi, stosuje się standaryzację:

z = (x − μ) / σ

Dzięki temu zmienna z ma standardowy rozkład normalny N(0, 1). Prawdopodobieństwa dla X przeliczamy na prawdopodobieństwa dla Z korzystając z dystrybuanty standardowej: P(a ≤ X ≤ b) = P((a−μ)/σ ≤ Z ≤ (b−μ)/σ).

Reguła 68–95–99,7

W praktyce często używa się przybliżeń:

około 68,27% obserwacji mieści się w przedziale μ ± 1σ,
około 95,45% w przedziale μ ± 2σ,
około 99,73% w przedziale μ ± 3σ.

Obliczanie prawdopodobieństw — przykłady

Przykład 1. Wzrosty w pewnej populacji: niech X ~ N(170 cm, 10² cm²) (średnia 170 cm, odchylenie standardowe 10 cm).

Prawdopodobieństwo, że osoba ma wzrost między 160 a 180 cm:

Standaryzujemy: z₁=(160−170)/10=−1, z₂=(180−170)/10=1. Z tablic: P(−1 ≤ Z ≤ 1) ≈ 0,6827 → ok. 68,27%.

Prawdopodobieństwo, że wzrost > 185 cm:

z = (185−170)/10 = 1,5. P(Z > 1,5) ≈ 0,0668 → ok. 6,68%.

Prawdopodobieństwo, że wzrost < 150 cm:

z = (150−170)/10 = −2. P(Z < −2) ≈ 0,0228 → ok. 2,28%.

Zastosowania w statystyce i nauce

Estymacja i przedziały ufności: przy założeniu normalności (lub dla średnich dzięki CLT) korzysta się z rozkładu normalnego do konstrukcji przedziałów ufności.
Testy statystyczne: testy z (z-test) i wiele testów parametrycznych opiera się na rozkładzie normalnym.
Modelowanie błędów: w eksperymentach i pomiarach przyjmuje się często, że błędy są normalne.
Symulacje i generowanie danych: generator wartości normalnych jest powszechnie używany w symulacjach Monte Carlo.

Obliczenia komputerowe

W praktyce wartości funkcji gęstości i dystrybuanty wyznacza się za pomocą oprogramowania. Przykłady funkcji:

Excel: NORM.DIST(x, mean, sd, TRUE) (CDF), NORM.S.DIST(z, TRUE) (standardowy CDF), NORM.INV(prob, mean, sd) (kwantyl).
R: dnorm(x, mean, sd) (gęstość), pnorm(x, mean, sd) (CDF), qnorm(p, mean, sd) (kwantyl), rnorm(n, mean, sd) (generowanie losowe).
Python (SciPy): scipy.stats.norm.pdf, .cdf, .ppf, .rvs.

Ograniczenia i uwagi praktyczne

Nie wszystkie zjawiska są ściśle normalne — przed zastosowaniem metod opartych na normalności warto sprawdzić dopasowanie (np. histogram, testy normalności, wykresy Q–Q).
Rozkład normalny ma nieskończone wsparcie (−∞, ∞), co dla pewnych wielkości fizycznych może być nieadekwatne; wtedy rozważa się inne modele lub transformacje.
Często obserwowane są skośności lub grubsze ogony niż w modelu normalnym — w takich przypadkach stosuje się rozkłady alternatywne (np. rozkład t-Studenta, rozkłady z cięższymi ogonami).

Podsumowanie

Rozkład normalny jest jednym z najważniejszych rozkładów w statystyce i naukach przyrodniczych ze względu na prosty opis dwoma parametrami, własności zamknięcia względem sum i rolę centralnego twierdzenia granicznego. Dzięki standaryzacji i tablicom (lub funkcjom komputerowym) można łatwo obliczać prawdopodobieństwa i stosować metody statystyczne oparte na tym rozkładzie.

Rozkład normalny (Gaussa) — definicja, wzór, przykłady

Przykłady

Wzór — gęstość prawdopodobieństwa

Funkcja dystrybuanty (CDF)

Własności rozkładu normalnego

Standaryzacja i Z-score

Reguła 68–95–99,7

Obliczanie prawdopodobieństw — przykłady

Zastosowania w statystyce i nauce

Obliczenia komputerowe

Ograniczenia i uwagi praktyczne

Podsumowanie

Pytania i odpowiedzi

P: Co to jest rozkład normalny?

P: Kto odkrył rozkład normalny?

P: Co oznaczają parametry położenia i skali w rozkładzie normalnym?

P: W jaki sposób reprezentowane są parametry położenia i skali rozkładów normalnych?

P: Czym jest standardowy rozkład normalny?

P: Dlaczego standardowy rozkład normalny jest często nazywany krzywą dzwonową?

P: Dlaczego wiele wartości ma rozkład normalny?