Twierdzenie Hollanda o schematach (również nazywane fundamentalnym twierdzeniem algorytmów genetycznych) jest nierównością wynikającą z gruboziarnistego modelu dynamiki populacji w algorytmach genetycznych. Twierdzenie formułuje warunki, przy których krótkie, niskiego rzędu schematy o ponadprzeciętnej średniej kondycji mają tendencję do wzrostu liczebności w kolejnych pokoleniach. Zostało zaproponowane przez Johna Hollanda w latach 70. XX wieku i przez długi czas bywało cytowane jako podstawowy argument wyjaśniający działanie algorytmów genetycznych, choć jego interpretacja i zakres zastosowań zostały później poddane krytycznej analizie.
W uproszczonej i często podawanej postaci twierdzenie można zapisać za pomocą oczekiwanej liczby wystąpień schematu H w populacji. Oznaczając m(H,t) liczbę osobników zgodnych ze schematem H w pokoleniu t, f(H) średnią kondycję tych osobników, f̄ średnią kondycję całej populacji, p_c prawdopodobieństwo wykonania krzyżowania jednopunktowego, p_m prawdopodobieństwo mutacji pojedynczego genu, o(H) rząd schematu (liczba określonych pozycji) oraz δ(H) długość definiującą schematu (odległość między pierwszą a ostatnią określoną pozycją, przy długości łańcucha l), uzyskuje się klasyczną nierówność:
E[m(H,t+1)] ≥ m(H,t) · (f(H)/f̄) · (1 − p_c · (δ(H)/(l − 1))) · (1 − p_m)^{o(H)}.
W praktyce często stosuje się liniaryzowaną przybliżoną postać (dla małych p_c i p_m):
E[m(H,t+1)] ≈ m(H,t) · (f(H)/f̄) · [1 − p_c · (δ(H)/(l − 1)) − o(H) · p_m].
Obie formy należy rozumieć jako wynik przyjętych założeń modelowych: reprezentacja binarna, proporcjonalny dobór reprodukcyjny, jednopunktowe krzyżowanie i niezależna mutacja bitowa oraz analiza oczekiwanej wartości w modelu dużej (w praktyce często zakładanej nieskończonej) populacji. W rzeczywistych populacjach skończonych działanie doboru i operatorów losowych oraz różne warianty operatorów (np. krzyżowania wielopunktowego, selekcji turniejowej) mogą istotnie zmieniać zachowanie systemu.
Definicje i własności schematów
- Schemat to wzorzec (szablon) określający wartości w wybranych pozycjach łańcucha genotypowego; zbiór wszystkich łańcuchów zgodnych ze schematem tworzy podzbiór łańcuchów.
- Rząd schematu o(H) to liczba określonych (nie‑joker) pozycji.
- Długość definiująca δ(H) to odległość między pierwszą a ostatnią określoną pozycją; od niej zależy podatność schematu na zniszczenie przez krzyżowanie.
- Schematy można traktować jako specjalne zbiory walcowe, które nadają strukturę przestrzenną, przez co tworzą naturalną przestrzeń topologiczną wzorców w zbiorze łańcuchów.
Ocena i rozwój koncepcji
- Twierdzenie dostarcza użytecznej, intuicyjnej reguły mówiącej, że krótkie i niskiego rzędu schematy o relatywnie wysokiej średniej kondycji mają większe szanse na utrzymanie lub wzrost liczebności w kolejnych pokoleniach, o ile nie zostaną zbyt często zniszczone przez operatory genetyczne.
- Nie jest to jednak dowód, że algorytmy genetyczne zawsze efektywnie odkrywają lub łączą „najlepsze budulce” ani że są lepsze od innych metod optymalizacji — takie interpretacje są nadmiernym uproszczeniem. Krytycy zwracali uwagę na ograniczenia założeń i na to, że nierówność dotyczy oczekiwanej wartości, a więc nie uwzględnia w pełni wariancji i efektów dyskretnych przy skończonych populacjach.
- Późniejsze analizy powiązały twierdzenie schematu z równaniem Price'a i innymi uogólnieniami matematycznymi, co pozwoliło lepiej zrozumieć jego zakres i granice stosowalności w analizie ewolucyjnej.
- W literaturze powstały także precyzyjniejsze i alternatywne sformułowania opisujące propagację wzorców w populacjach, a także prace empiryczne badające praktyczne skutki założeń twierdzenia.
Znaczenie praktyczne
Współcześnie twierdzenie Hollanda o schematach bywa używane przede wszystkim jako heurystyczne narzędzie do rozumienia mechanizmów, które mogą sprzyjać tworzeniu lepszych rozwiązań w algorytmach genetycznych (np. wpływ długości kodowania, częstości krzyżowania i mutacji). Jednocześnie projektanci algorytmów powinni pamiętać o ograniczeniach twierdzenia i opierać decyzje także na analizie eksperymentalnej oraz na innych ramach teoretycznych.

