Warunkowanie instrumentalne

Autor: Leandro Alegsa

17-12-2020 09:21

Klimatyzacja operacyjna jest formą nauki. W niej jednostka zmienia swoje zachowanie ze względu na konsekwencje (wyniki) tego zachowania.

Osoba lub zwierzę dowiaduje się, że jego zachowanie ma konsekwencje. Konsekwencją tego może być

Wzmocnienie: pozytywne lub satysfakcjonujące wydarzenie. Powoduje to częstsze występowanie zachowań
Kara: zdarzenie negatywne lub karne. Powoduje to, że zachowania te występują rzadziej
Wyginięcie: nie następuje żadne zdarzenie, więc zachowanie nie ma żadnych konsekwencji. Gdy zachowanie nie ma żadnych konsekwencji, będzie się pojawiać rzadziej.

Istnieją cztery różne konteksty w warunkach operacyjnych. Tutaj terminy "pozytywny" i "negatywny" nie są używane w ich podstawowym znaczeniu; pozytywny oznacza, że coś jest dodawane, a negatywny, że coś jest odbierane:

Pozytywne wzmocnienie (często tylko "wzmocnienie") występuje wtedy, gdy istnieje nagroda za jakąś formę zachowania. W ten sposób zwiększa się częstotliwość występowania danego zachowania. W eksperymencie z pudełkiem Skinnera nagroda występuje w postaci pokarmu, gdy szczur naciska dźwignię.
Negatywne wzmocnienie (czasami "ucieczka") następuje po usunięciu bodźca awersyjnego. Zwiększa to częstotliwość występowania tego zachowania. W eksperymencie z pudełkiem Skinnera pojawił się głośny hałas, który został usunięty, gdy szczur naciskał dźwignię.
Kara pozytywna występuje w przypadku dodania bodźca, co powoduje, że zachowania te występują rzadziej. Przykładowymi bodźcami mogą być głośny hałas, porażenie prądem (szczur) lub klapsy (dziecko).
Negatywna kara występuje w przypadku odebrania bodźca, co powoduje, że zachowania te występują rzadziej. Przykładem może być zabawka zabierana dziecku po tym, jak dziecko dokona niepożądanego zachowania.

Pomysł kondycjonowania operowego został po raz pierwszy odkryty przez Edwarda Thorndike'a, a następnie przeanalizowany przez B.F. Skinnera.

Klimatyzacja operacyjna różni się od klasycznej klimatyzacji Pawłowa. Operantna kondycjonowanie zajmuje się dobrowolną modyfikacją zachowań; klasyczna kondycjonowanie z treningiem odruchu.

Prawo skuteczności Thorndike'a

Kondycjonowanie optyczne, nazywane czasem uczeniem się instrumentalnym, było po raz pierwszy studiowane przez Edwarda L. Thorndike'a (1874-1949). Obserwował on zachowanie się kotów próbujących uciec z domowej roboty puzzli. Po pierwszym włożeniu do pudełek, koty długo uciekały. Z doświadczenia wynika, że udane reakcje pojawiały się częściej, pozwalając kotom na ucieczkę w krótszym czasie. W swoim prawie efektu Thorndike teoretyzował, że zachowania, po których następują satysfakcjonujące konsekwencje, mają tendencję do powtarzania się, a te, które wywołują nieprzyjemne konsekwencje, są mniej prawdopodobne. W skrócie, niektóre konsekwencje wzmocniły zachowanie, a niektóre konsekwencje osłabiły zachowanie. Dzięki tej procedurze Thorndike stworzył pierwsze znane krzywe uczenia się.

B.F. Skinner (1904-1990) opracował bardziej szczegółową analizę kondycjonowania operowego. Skinner wynalazł komorę do kondycjonowania operowego, która pozwalała mu mierzyć szybkość reakcji jako kluczową zmienną zależną. Używał zapisu naciśnięć dźwigni lub dziurkaczy klawiszy.

Zasady kondycjonowania operującego:

Dyskryminacja, uogólnienie i znaczenie kontekstu.

Nauka odbywa się w kontekstach.
Większość zachowań jest pod kontrolą bodźca: konkretna reakcja pojawia się tylko wtedy, gdy obecny jest odpowiedni bodziec.
Kontrola bodźców jest skuteczna nawet wtedy, gdy bodziec nie ma dla respondenta żadnego znaczenia.

Wyginięcie: zachowanie operanta ulega wyginięciu, gdy zbrojenie ustaje.

Wzmocnienia pojawiają się tylko wtedy, gdy następuje właściwa reakcja i mogą nie wystąpić nawet wtedy. Zachowania nie osłabiają się i nie gasną z tego powodu.
Wyniki zależą częściowo od tego, jak często odbierane jest zbrojenie.

Harmonogramy wzmocnień: decydujące znaczenie ma czas trwania wzmocnień.

Stały harmonogram przedziałów czasowych: wzmacniacze są przedstawiane w stałych przedziałach czasowych, pod warunkiem uzyskania odpowiedniej reakcji.
Harmonogram zmiennego interwału: zachowanie jest wzmocnione na podstawie średniego czasu, który upłynął od ostatniego wzmocnienia. Harmonogramy proporcji: oparte na stosunku odpowiedzi do wzmocnień.
Stały harmonogram interwałów: wzmocnienie jest dostarczane po wykonaniu określonej liczby odpowiedzi. Szczególnym przypadkiem przedstawiania zbrojenia po każdej odpowiedzi jest zbrojenie ciągłe.
Harmonogram zmiennego przedziału czasowego: wzmocnienie dostawy opiera się na określonej średniej liczbie odpowiedzi.

Pytania i odpowiedzi

P: Czym jest warunkowanie operacyjne?

O: Warunkowanie operacyjne to forma uczenia się, w której jednostka zmienia swoje zachowanie pod wpływem konsekwencji (wyników) tego zachowania.

P: Jakie są cztery konteksty warunkowania operacyjnego?

O: Cztery konteksty warunkowania operacyjnego to wzmocnienie pozytywne, wzmocnienie negatywne, kara pozytywna i kara negatywna.

P: Jak działa wzmocnienie pozytywne?

O: Wzmocnienie pozytywne występuje wtedy, gdy za jakieś zachowanie jest nagroda, która zwiększa częstotliwość występowania tego zachowania.

P: Jak działa wzmocnienie negatywne?

O: Wzmocnienie negatywne występuje wtedy, gdy usuwany jest bodziec awersyjny, co zwiększa częstotliwość występowania danego zachowania.

P: Jak działa kara pozytywna?

O: Kara pozytywna polega na dodaniu bodźca, który powoduje, że dane zachowanie występuje rzadziej.
P: Jak działa kara negatywna? O: Kara negatywna polega na odebraniu bodźca, co powoduje, że zachowanie występuje rzadziej.

P: Kto pierwszy odkrył warunkowanie operacyjne?

O: Edward Thorndike odkrył najpierw warunkowanie operacyjne, a następnie zostało ono przeanalizowane przez B.F. Skinnera.

Przeszukaj encyklopedię