Rozkład normalny (Gaussa) — definicja, wzór, przykłady

Rozkład normalny (Gaussa): definicja, wzory, objaśnienie parametrów oraz praktyczne przykłady zastosowań i standardowego rozkładu Z.

Autor: Leandro Alegsa

Rozkład normalny jest rozkładem prawdopodobieństwa. Jest on również nazywany rozkładem Gaussa, ponieważ został odkryty przez Carla Friedricha Gaussa. Rozkład normalny jest ciągłym rozkładem prawdopodobieństwa. Jest on bardzo ważny w wielu dziedzinach nauki. Rozkłady normalne są rodziną rozkładów o tej samej ogólnej postaci. Rozkłady te różnią się parametrami położenia i skali: średnia ("średnia") rozkładu określa jego położenie, a odchylenie standardowe ("zmienność") określa skalę.

Standardowy rozkład normalny (znany również jako rozkład Z) jest rozkładem normalnym ze średnią równą zero i wariancją równą jeden (zielone krzywe na wykresach po prawej stronie). Często nazywany jest krzywą dzwonową, ponieważ wykres jego gęstości prawdopodobieństwa wygląda jak dzwon.

Wiele wartości ma rozkład normalny. Dzieje się tak z powodu centralnego twierdzenia granicznego, które mówi, że jeśli zdarzenie jest sumą innych zdarzeń losowych, będzie miało rozkład normalny. Niektóre przykłady obejmują:

Przykłady

  • wzrosty ludzi w populacjach jednorodnych,
  • wyniki testów (np. standaryzowane testy) po odpowiednim skalowaniu,
  • błędy pomiarowe w eksperymentach fizycznych i inżynierskich,
  • fluktuacje niektórych zjawisk ekonomicznych w krótkim okresie (przy założeniach),
  • rozkład średnich z prób dzięki centralnemu twierdzeniu granicznemu.

Wzór — gęstość prawdopodobieństwa

Gęstość rozkładu normalnego o średniej μ i odchyleniu standardowym σ (gdzie σ > 0) wyraża się wzorem:

f(x) = 1 / (σ √(2π)) · exp( − (x − μ)² / (2 σ²) )

W szczególnym przypadku standardowego rozkładu normalnego mamy μ = 0 i σ = 1, więc gęstość upraszcza się do:

ϕ(x) = 1 / √(2π) · exp( − x² / 2 )

Funkcja dystrybuanty (CDF)

Funkcja dystrybuanty rozkładu normalnego to:

F(x) = ∫−∞x (1 / (σ √(2π))) · exp( − (t − μ)² / (2 σ²) ) dt

Nie ma prostej postaci elementarnej tej całki; wartości dystrybuanty standardowego rozkładu normalnego oznaczane są zwykle przez tablice statystyczne lub obliczane numerycznie (funkcja błędu erf pozwala zapisać ją w postaci specjalnej).

Własności rozkładu normalnego

  • Symetria: rozkład jest symetryczny względem μ (średnia = mediana = modalna).
  • Jednospiczastość (unimodalność): ma pojedynczy maksimum w μ.
  • Pełny opis przez dwa parametry: μ (położenie) i σ (skala). Wariancja to σ².
  • Moment generujący: M(t) = exp( μ t + ½ σ² t² ).
  • Zamkniętość względem liniowych kombinacji: jeżeli X ~ N(μ, σ²) i a, b są stałymi, to a + bX ~ N(a + bμ, (bσ)²).
  • Sumy niezależnych normalnych: suma niezależnych zmiennych normalnych jest normalna (z odpowiednią średnią i wariancją).
  • Ogony: rozkład ma „lekko grubsze” ogony niż wiele innych rozkładów, ale nadal maleją wykładniczo kwadratowo (ekstremalne wartości są rzadkie).

Standaryzacja i Z-score

Aby porównać obserwacje z różnych rozkładów normalnych lub posłużyć się tablicami standardowymi, stosuje się standaryzację:

z = (x − μ) / σ

Dzięki temu zmienna z ma standardowy rozkład normalny N(0, 1). Prawdopodobieństwa dla X przeliczamy na prawdopodobieństwa dla Z korzystając z dystrybuanty standardowej: P(a ≤ X ≤ b) = P((a−μ)/σ ≤ Z ≤ (b−μ)/σ).

Reguła 68–95–99,7

W praktyce często używa się przybliżeń:

  • około 68,27% obserwacji mieści się w przedziale μ ± 1σ,
  • około 95,45% w przedziale μ ± 2σ,
  • około 99,73% w przedziale μ ± 3σ.

Obliczanie prawdopodobieństw — przykłady

Przykład 1. Wzrosty w pewnej populacji: niech X ~ N(170 cm, 10² cm²) (średnia 170 cm, odchylenie standardowe 10 cm).

  • Prawdopodobieństwo, że osoba ma wzrost między 160 a 180 cm:
  • Standaryzujemy: z1=(160−170)/10=−1, z2=(180−170)/10=1. Z tablic: P(−1 ≤ Z ≤ 1) ≈ 0,6827 → ok. 68,27%.

  • Prawdopodobieństwo, że wzrost > 185 cm:
  • z = (185−170)/10 = 1,5. P(Z > 1,5) ≈ 0,0668 → ok. 6,68%.

  • Prawdopodobieństwo, że wzrost < 150 cm:
  • z = (150−170)/10 = −2. P(Z < −2) ≈ 0,0228 → ok. 2,28%.

Zastosowania w statystyce i nauce

  • Estymacja i przedziały ufności: przy założeniu normalności (lub dla średnich dzięki CLT) korzysta się z rozkładu normalnego do konstrukcji przedziałów ufności.
  • Testy statystyczne: testy z (z-test) i wiele testów parametrycznych opiera się na rozkładzie normalnym.
  • Modelowanie błędów: w eksperymentach i pomiarach przyjmuje się często, że błędy są normalne.
  • Symulacje i generowanie danych: generator wartości normalnych jest powszechnie używany w symulacjach Monte Carlo.

Obliczenia komputerowe

W praktyce wartości funkcji gęstości i dystrybuanty wyznacza się za pomocą oprogramowania. Przykłady funkcji:

  • Excel: NORM.DIST(x, mean, sd, TRUE) (CDF), NORM.S.DIST(z, TRUE) (standardowy CDF), NORM.INV(prob, mean, sd) (kwantyl).
  • R: dnorm(x, mean, sd) (gęstość), pnorm(x, mean, sd) (CDF), qnorm(p, mean, sd) (kwantyl), rnorm(n, mean, sd) (generowanie losowe).
  • Python (SciPy): scipy.stats.norm.pdf, .cdf, .ppf, .rvs.

Ograniczenia i uwagi praktyczne

  • Nie wszystkie zjawiska są ściśle normalne — przed zastosowaniem metod opartych na normalności warto sprawdzić dopasowanie (np. histogram, testy normalności, wykresy Q–Q).
  • Rozkład normalny ma nieskończone wsparcie (−∞, ∞), co dla pewnych wielkości fizycznych może być nieadekwatne; wtedy rozważa się inne modele lub transformacje.
  • Często obserwowane są skośności lub grubsze ogony niż w modelu normalnym — w takich przypadkach stosuje się rozkłady alternatywne (np. rozkład t-Studenta, rozkłady z cięższymi ogonami).

Podsumowanie

Rozkład normalny jest jednym z najważniejszych rozkładów w statystyce i naukach przyrodniczych ze względu na prosty opis dwoma parametrami, własności zamknięcia względem sum i rolę centralnego twierdzenia granicznego. Dzięki standaryzacji i tablicom (lub funkcjom komputerowym) można łatwo obliczać prawdopodobieństwa i stosować metody statystyczne oparte na tym rozkładzie.

Pytania i odpowiedzi

P: Co to jest rozkład normalny?


O: Rozkład normalny to rozkład prawdopodobieństwa, który jest bardzo ważny w wielu dziedzinach nauki.

P: Kto odkrył rozkład normalny?


O: Rozkład normalny został po raz pierwszy odkryty przez Carla Friedricha Gaussa.

P: Co oznaczają parametry położenia i skali w rozkładzie normalnym?


Średnia ("przeciętność") rozkładu określa jego położenie, a odchylenie standardowe ("zmienność") określa skalę rozkładu normalnego.

P: W jaki sposób reprezentowane są parametry położenia i skali rozkładów normalnych?


O: Średnia i odchylenie standardowe rozkładu normalnego są reprezentowane odpowiednio przez symbole μ i σ.

P: Czym jest standardowy rozkład normalny?


O: Standardowy rozkład normalny (znany również jako rozkład Z) to rozkład normalny ze średnią równą zero i odchyleniem standardowym równym jeden.

P: Dlaczego standardowy rozkład normalny jest często nazywany krzywą dzwonową?


O: Standardowy rozkład normalny jest często nazywany krzywą dzwonową, ponieważ wykres jego gęstości prawdopodobieństwa wygląda jak dzwon.

P: Dlaczego wiele wartości ma rozkład normalny?


O: Wiele wartości ma rozkład normalny ze względu na centralne twierdzenie graniczne, które mówi, że jeśli zdarzenie jest sumą identycznych, ale losowych zdarzeń, to będzie miało rozkład normalny.


Przeszukaj encyklopedię
AlegsaOnline.com - 2020 / 2025 - License CC3