Twierdzenie Hollanda o schematach (również nazywane fundamentalnym twierdzeniem algorytmów genetycznych) jest nierównością wynikającą z gruboziarnistego modelu dynamiki populacji w algorytmach genetycznych. Twierdzenie formułuje warunki, przy których krótkie, niskiego rzędu schematy o ponadprzeciętnej średniej kondycji mają tendencję do wzrostu liczebności w kolejnych pokoleniach. Zostało zaproponowane przez Johna Hollanda w latach 70. XX wieku i przez długi czas bywało cytowane jako podstawowy argument wyjaśniający działanie algorytmów genetycznych, choć jego interpretacja i zakres zastosowań zostały później poddane krytycznej analizie.

W uproszczonej i często podawanej postaci twierdzenie można zapisać za pomocą oczekiwanej liczby wystąpień schematu H w populacji. Oznaczając m(H,t) liczbę osobników zgodnych ze schematem H w pokoleniu t, f(H) średnią kondycję tych osobników, f̄ średnią kondycję całej populacji, p_c prawdopodobieństwo wykonania krzyżowania jednopunktowego, p_m prawdopodobieństwo mutacji pojedynczego genu, o(H) rząd schematu (liczba określonych pozycji) oraz δ(H) długość definiującą schematu (odległość między pierwszą a ostatnią określoną pozycją, przy długości łańcucha l), uzyskuje się klasyczną nierówność:

E[m(H,t+1)] ≥ m(H,t) · (f(H)/f̄) · (1 − p_c · (δ(H)/(l − 1))) · (1 − p_m)^{o(H)}.

W praktyce często stosuje się liniaryzowaną przybliżoną postać (dla małych p_c i p_m):

E[m(H,t+1)] ≈ m(H,t) · (f(H)/f̄) · [1 − p_c · (δ(H)/(l − 1)) − o(H) · p_m].

Obie formy należy rozumieć jako wynik przyjętych założeń modelowych: reprezentacja binarna, proporcjonalny dobór reprodukcyjny, jednopunktowe krzyżowanie i niezależna mutacja bitowa oraz analiza oczekiwanej wartości w modelu dużej (w praktyce często zakładanej nieskończonej) populacji. W rzeczywistych populacjach skończonych działanie doboru i operatorów losowych oraz różne warianty operatorów (np. krzyżowania wielopunktowego, selekcji turniejowej) mogą istotnie zmieniać zachowanie systemu.

Definicje i własności schematów

  • Schemat to wzorzec (szablon) określający wartości w wybranych pozycjach łańcucha genotypowego; zbiór wszystkich łańcuchów zgodnych ze schematem tworzy podzbiór łańcuchów.
  • Rząd schematu o(H) to liczba określonych (nie‑joker) pozycji.
  • Długość definiująca δ(H) to odległość między pierwszą a ostatnią określoną pozycją; od niej zależy podatność schematu na zniszczenie przez krzyżowanie.
  • Schematy można traktować jako specjalne zbiory walcowe, które nadają strukturę przestrzenną, przez co tworzą naturalną przestrzeń topologiczną wzorców w zbiorze łańcuchów.

Ocena i rozwój koncepcji

  • Twierdzenie dostarcza użytecznej, intuicyjnej reguły mówiącej, że krótkie i niskiego rzędu schematy o relatywnie wysokiej średniej kondycji mają większe szanse na utrzymanie lub wzrost liczebności w kolejnych pokoleniach, o ile nie zostaną zbyt często zniszczone przez operatory genetyczne.
  • Nie jest to jednak dowód, że algorytmy genetyczne zawsze efektywnie odkrywają lub łączą „najlepsze budulce” ani że są lepsze od innych metod optymalizacji — takie interpretacje są nadmiernym uproszczeniem. Krytycy zwracali uwagę na ograniczenia założeń i na to, że nierówność dotyczy oczekiwanej wartości, a więc nie uwzględnia w pełni wariancji i efektów dyskretnych przy skończonych populacjach.
  • Późniejsze analizy powiązały twierdzenie schematu z równaniem Price'a i innymi uogólnieniami matematycznymi, co pozwoliło lepiej zrozumieć jego zakres i granice stosowalności w analizie ewolucyjnej.
  • W literaturze powstały także precyzyjniejsze i alternatywne sformułowania opisujące propagację wzorców w populacjach, a także prace empiryczne badające praktyczne skutki założeń twierdzenia.

Znaczenie praktyczne

Współcześnie twierdzenie Hollanda o schematach bywa używane przede wszystkim jako heurystyczne narzędzie do rozumienia mechanizmów, które mogą sprzyjać tworzeniu lepszych rozwiązań w algorytmach genetycznych (np. wpływ długości kodowania, częstości krzyżowania i mutacji). Jednocześnie projektanci algorytmów powinni pamiętać o ograniczeniach twierdzenia i opierać decyzje także na analizie eksperymentalnej oraz na innych ramach teoretycznych.