Lemat (forma słownikowa): definicja, przykłady i różnica od leksemu
Lemat vs leksem: definicja, przykłady i kluczowe różnice — jasne wyjaśnienie form słownikowych i jednostek znaczeniowych dla uczących się języka.
Lemat (forma słownikowa, forma podstawowa) to ta forma wyrazu, która została wybrana przez konwencję jako reprezentant całego zestawu jego odmian i która występuje jako hasło w słowniku. Wszystkie słowa główne w słowniku są lematami — to właśnie pod tymi formami użytkownik zwykle znajdzie informację o znaczeniu i odmianie wyrazu.
Definicja i sens pojęcia
Lemat to pojedyncza, konkretna forma wyrazu przyjęta jako forma cytatywna (citation form). W praktyce: dla rzeczowników w języku polskim lematem jest zazwyczaj mianownik liczby pojedynczej (kot), dla czasowników — bezokolicznik (biegać), dla przymiotników — forma męska, liczba pojedyncza, mianownik (dobry). Lemat służy jako etykieta reprezentująca cały zbiór form fleksyjnych (odmian).
Lemat a leksem (leksem)
Leksem to jednostka znaczeniowa — abstrakcyjny zbiór form językowych, które realizują tę samą część znaczenia. Innymi słowy, leksem obejmuje wszystkie odmiany danego znaczenia (formy fleksyjne, czasami także formy złożone), podczas gdy lemat to konkretna forma wybrana do reprezentowania tego leksemu w słowniku.
Przykład w języku angielskim: run, runs i running są formami tego samego leksemu, a jako lemat funkcjonuje najczęściej run. W języku polskim analogicznie: formy biega, biegałem, biegać należą do tego samego leksemu, a lematem jest biegać (bezokolicznik).
Przykłady polskie
- Rzeczownik: lemat kot reprezentuje formy kot, kota, koty, kotów.
- Czasownik: lemat pisać reprezentuje formy piszę, pisałeś, napisali, itp.
- Przymiotnik: lemat duży reprezentuje formy duża, duże, dużego.
- Wyrażenia wielowyrazowe: leksemy mogą obejmować też frazy (np. phrasal verbs w angielskim). Lemat dla takiego leksemu zwykle zapisuje się w formie cytatywnej całej frazy.
Różnice i niuanse
- Lemat to konkretna forma (forma cytatywna) zapisana w słowniku.
- Leksem to abstrakcyjna jednostka znaczeniowa obejmująca wszystkie formy danego wyrazu.
- Jeden leksem ma zwykle jeden lemat (konwencjonalny reprezentant), ale ta sama forma może należeć do różnych leksemów (homonimia). Przykład: zamek — leksem „zamek (budowla)” i leksem „zamek (mechanizm)”. Oba leksemy mogą mieć ten sam lemat orthograficzny zamek.
- Polityka wyboru lematu zależy od języka i słownika: w językach fleksyjnych (np. polski) wybiera się formę podstawową (mianownik, bezokolicznik), w angielskim zwykle formę podstawową czasownika (np. run zamiast ran).
Zastosowania i problemy praktyczne
Lematyzacja (automatyczne sprowadzanie formy wyrazowej do lematu) jest ważna w przetwarzaniu języka naturalnego (NLP), w wyszukiwarkach i w korpusach językowych — pozwala grupować różne formy tego samego słowa, co ułatwia indeksowanie i analizę. Do problemów należą: nieregularne formy (np. iść — poszedł), wieloznaczność (forma przypisana różnym leksemom), złożenia i formy klityczne oraz rozróżnianie form fleksyjnych od form leksykalnie różnych.
Podsumowanie
Lemat to forma słownikowa — konkretna forma przyjęta jako reprezentant zbioru odmian, zaś leksem to abstrakcyjny zbiór form mających wspólne znaczenie. W praktyce słownikowej i w NLP lemat służy do uporządkowania i reprezentacji leksemu, co ułatwia wyszukiwanie, analizę i opis fleksji.
Morfologia
W języku angielskim, lemma rzeczownika jest w liczbie pojedynczej: np. mouse zamiast mice. W językach z płcią, słowo główne regularnych przymiotników i rzeczowników jest zazwyczaj w liczbie pojedynczej rodzaju męskiego. Jeżeli język posiada również przypadki, lematem jest często rodzaj męski w mianowniku liczby pojedynczej.
W wielu językach, formą przytoczenia czasownika jest bezokolicznik: Francuski aller, niemiecki gehen, hiszpański ir. W angielskim zazwyczaj jest to pełny bezokolicznik (to go), chociaż alfabetycznie bez 'to' (go).
Różnica między rdzeniem a lematem
W lingwistyce obliczeniowej, rdzeń jest częścią słowa, która nigdy się nie zmienia, nawet gdy używane są różne formy tego słowa. Lemma jest podstawową formą czasownika. Na przykład, z "produced", lematem jest "produce", ale rdzeń jest "produc-". Dzieje się tak dlatego, że istnieją słowa takie jak produkcja. Kiedy bierze się pod uwagę dźwięk (fonologię), definicja nieodmiennej części słowa nie jest już tak użyteczna. Zwróć uwagę na brzmienie słów w przykładzie: "wyprodukowany" /prəˈdjuːst/ versus "produkcja" /prəˈdʌkʃən/.
Niektóre leksemy mają kilka rdzeni, ale jeden lemat. Na przykład "to go" (lemma) ma trzony "go" i "went". Tutaj, czas przeszły jest oparty na innym czasowniku, "to wend". Przyrostek "-t" jest równoważny "-ed".
Przeszukaj encyklopedię