Prawo Zipfa

Prawo Zipfa to prawo empiryczne, sformułowane na podstawie statystyki matematycznej, nazwane na cześć lingwisty George'a Kingsleya Zipfa, który jako pierwszy zaproponował to prawo.

Prawo Zipf stanowi, że przy dużej próbie użytych słów, częstotliwość występowania każdego słowa jest odwrotnie proporcjonalna do jego rangi w tabeli częstotliwości. Tak więc słowo numer n ma częstotliwość proporcjonalną do 1/n.

Tak więc najczęściej pojawiające się słowo będzie pojawiać się około dwa razy częściej niż drugie, trzy razy częściej niż trzecie najczęściej pojawiające się słowo, itp. Na przykład, w jednej z prób słów w języku angielskim, najczęściej występujące słowo "the" stanowi prawie 7% wszystkich słów (69.971 z nieco ponad 1 miliona). Zgodnie z Prawem Zipfa, drugie miejsce wśród słów "z" stanowi nieco ponad 3,5% (36 411 wystąpień), a następne jest "i" (28 852). Tylko około 135 słów wystarcza, aby stanowić połowę próby słów w dużej próbie.

Ta sama zależność występuje w wielu innych rankingach, niezwiązanych z językiem, jak np. rankingi ludności miast w różnych krajach, wielkości korporacji, rankingi dochodów itp. Pojawienie się rozkładu w rankingach miast według ludności po raz pierwszy zauważył Felix Auerbach w 1913 roku.

Nie wiadomo, dlaczego prawo Zipfa obowiązuje dla większości języków.

Pytania i odpowiedzi

P: Czym jest prawo Zipfa?


O: Prawo Zipfa to prawo empiryczne, które mówi, że częstotliwość występowania słowa w dużej próbie jest odwrotnie proporcjonalna do jego rangi w tabeli częstotliwości.

P: Kto zaproponował prawo Zipfa?


O: Prawo Zipfa zostało po raz pierwszy zaproponowane przez George'a Kingsleya Zipfa, językoznawcę.

P: W jaki sposób prawo Zipfa wyjaśnia częstotliwość występowania słów w próbce angielskich słów?


O: Zgodnie z prawem Zipfa, najczęstsze słowo w próbce angielskich słów występuje około dwa razy częściej niż drugie najczęstsze słowo, trzy razy częściej niż trzecie najczęstsze słowo itd. Tendencja ta utrzymuje się wraz ze spadkiem rangi słowa.

P: Jaki procent wszystkich słów stanowi najczęściej występujące słowo w jednej próbce angielskich słów?


O: W jednej próbce angielskich słów, najczęściej występujące słowo ("the") stanowi prawie 7% wszystkich słów.

P: Jaki jest związek między liczbą słów potrzebnych do pokrycia połowy próby a częstotliwością występowania tych słów?


O: Zgodnie z prawem Zipfa, tylko około 135 słów jest potrzebnych do uwzględnienia połowy próby słów w dużej próbie.

P: Jakie inne rankingi wykazują prawo Zipfa?


O: Ta sama zależność, którą opisuje prawo Zipfa w odniesieniu do częstotliwości występowania słów, występuje w innych rankingach niezwiązanych z językiem, takich jak rankingi populacji miast w różnych krajach, rankingi wielkości korporacji i rankingi dochodów.

P: Kto zauważył pojawienie się rozkładu w rankingach miast według liczby ludności?


O: Pojawienie się rozkładu w rankingach miast według populacji zostało po raz pierwszy zauważone przez Felixa Auerbacha w 1913 roku.

AlegsaOnline.com - 2020 / 2023 - License CC3