Operant Conditioning: Definicja, charakterystyka i przykłady

Kondycjonowanie operacyjne lub Uwarunkowania instrumentalne to rodzaj uczenia się, w którym zachowanie jest kontrolowane z konsekwencjami.

Opiera się na założeniu, że wzmacnianie zachowań ma tendencję do pojawiania się przy większej liczbie okazji, podczas gdy kary, które są karane, wygasają.

Jaka jest różnica między warunkowaniem operantowym a warunkowaniem klasycznym? W warunkowaniu operacyjnym po dobrowolnej odpowiedzi następuje wzmocnienie. W ten sposób dobrowolna odpowiedź (na przykład nauka na egzamin) jest bardziej prawdopodobna w przyszłości. Wręcz przeciwnie, w klasycznym warunkowaniu bodziec automatycznie aktywuje mimowolną odpowiedź.

Kondycjonowanie operacyjne można opisać jako proces, który próbuje zmodyfikować zachowanie za pomocą wzmocnienia dodatniego i ujemnego. Dzięki warunkowaniu operantu jednostka łączy związek między określonym zachowaniem a konsekwencją. Przykłady:

Rodzice nagradzają dobre oceny dla dziecka cukierkiem lub inną nagrodą.
Nauczyciel nagradza tych uczniów, którzy są spokojni i wykształceni. Uczniowie zdają sobie sprawę, że zachowując się w ten sposób, otrzymują więcej punktów.
Zwierzęciu podaje się pokarm za każdym naciśnięciem dźwigni.

BF Skinner (1938) ukuł termin warunkowanie operanta. Skinner zidentyfikował trzy typy odpowiedzi lub argumentów, które mogą śledzić zachowanie:

Operatory neutralne : odpowiedzi ze środowiska, które nie zwiększają ani nie zmniejszają prawdopodobieństwa powtórzenia zachowania.
Wzmacniacze : reakcje ze środowiska, które zwiększają prawdopodobieństwo powtórzenia się zachowania. Wzmacniacze mogą być dodatnie lub ujemne.
Kary : odpowiedzi ze środowiska, które zmniejszają prawdopodobieństwo powtórzenia się zachowania. Kara osłabia zachowanie.

Czynniki warunkujące operanty

Thorndike jako pierwszy uznał, że to uwarunkowanie obejmuje coś więcej niż tylko odpowiedź i wzmocnienie. Odpowiedź udzielana jest w obecności pewnych bodźców, z uwzględnieniem trzech zdarzeń: bodźca, odpowiedzi i konsekwencji odpowiedzi lub wzmocnienia.

Ta struktura ułatwia rozwój różnych powiązań, takich jak związek między bodźcem a odpowiedzią, który był dla Thorndike'a kluczem do sformułowania prawa efektu. Dzięki temu potwierdził, że odpowiedzi, po których następują wzmacniające konsekwencje, będą bardziej prawdopodobne, gdy bodziec pojawi się ponownie.

Przeciwnie, te reakcje, po których następują negatywne konsekwencje, będą miały mniejsze prawdopodobieństwo wystąpienia, gdy bodziec pojawi się ponownie. Prawo skutku jest poprzednikiem warunkowania operacyjnego lub warunkowania instrumentalnego, jak to nazwał Thorndike.

Jednak dla Skinnera, psychologa behawiorystycznego, uwarunkowanie było wzmocnieniem zachowań zgodnie z wcześniejszymi konsekwencjami.

W tej linii istnieją dwie formy warunkowania:

Klasyczny lub Pavlovian: opiera się na asocjacji bodźców bezwarunkowych i warunkowych, będących reakcjami kontrolowanymi przez poprzedzające bodźce.
Kondycjonowanie operacyjne: bodźce wynikające lub wzmacniające powodują wydanie pewnego zachowania. Skinner wyjaśnia, że jeśli po zachowaniu następuje pozytywne wzmocnienie, zwiększyłoby to prawdopodobieństwo wydania takiego zachowania w przyszłości. Wręcz przeciwnie, jeśli po odpowiedzi nie następuje wzmocnienie lub wzmocnienie jest negatywne, prawdopodobieństwo wydania takiego zachowania w przyszłości będzie niższe.

Podstawowe pojęcia warunkowania operanta

Wzmocnienie

Jest odpowiedzialny za wydawanie odpowiedzi, to znaczy prawdopodobieństwo, że się zdarzą, niezależnie od tego, czy będą większe czy mniejsze w przyszłości. Jest to wzmacniający i konsekwentny bodziec, ponieważ pojawia się po wystąpieniu odpowiedzi.

Nie można wiedzieć, czy dany wzmacniacz wpływa na zachowanie, dopóki nie zostanie odpowiednio przedstawiony z odpowiedzią i sprawdzono, czy zachowanie się zmienia w konsekwencji wzmocnienia.

Istnieją dwa rodzaje zbrojenia: pozytywne i negatywne. Oba mają ten sam cel - zwiększenie prawdopodobieństwa, że odpowiedź zostanie wydana w przyszłych sytuacjach. Dodatkowo, wzmacniacze Skinnera są definiowane przez zachowania, które są obserwowalne i mierzalne.

Pozytywne wzmocnienie

Pozytywne wzmocnienie wzmacnia zachowanie, zapewniając konsekwencję, którą jednostka osiąga satysfakcję.

Ujemne wzmocnienie

Usunięcie nieprzyjemnego wzmocnienia może również wzmocnić zachowanie. Jest to znane jako wzmocnienie negatywne, ponieważ jest to eliminacja niekorzystnego bodźca, który „wynagradza” zwierzę lub osobę. Wzmocnienie negatywne wzmacnia zachowanie, ponieważ zatrzymuje lub eliminuje nieprzyjemne doświadczenie.

Wzmocnienia podstawowe

To byłyby wszystkie podstawowe wzmacniacze, które nie potrzebują historii wcześniejszego warunkowania, aby funkcjonować jako takie. Niektóre przykłady to woda, jedzenie i seks.

Wzmocnienia wtórne

Wzmocnienia wtórne, jeśli byłyby oparte na wcześniejszych historiach warunkowania dzięki skojarzeniu z bodźcami nieuwarunkowanymi. Niektóre przykłady to pieniądze i kwalifikacje.

Zdolność trzech terminów

Jest to podstawowy model warunkowania operantowego i składa się z trzech komponentów: bodźca dyskryminacyjnego, odpowiedzi i bodźca wzmacniającego.

Bodziec dyskryminacyjny będzie tym, który wskaże podmiotowi, że wzmacniacz jest dostępny, wskazując, że jeśli wykona pewne zachowanie, może uzyskać wspomniane wzmocnienie. W przeciwieństwie do tego mamy bodziec delta lub bodźce, które wskazują, że zachowanie nie doprowadzi do uzyskania jakiegokolwiek wzmocnienia.

Odpowiedzią byłoby zachowanie, które wykona podmiot, którego wykonanie doprowadzi lub nie do uzyskania bodźca wzmacniającego.

Wzmacniający bodziec, jak wspomniano powyżej, jest odpowiedzialny za emisję zachowania, ponieważ dzięki jego pojawieniu się prawdopodobieństwo wydania odpowiedzi wzrośnie lub spadnie w przyszłości.

Koncepcje, które należy znać na temat warunkowania operantów

Kara

Kara jest również mierzona jej wpływem na zachowanie podmiotu. Z drugiej strony, w przeciwieństwie do wzmocnienia, zamierzone jest zmniejszenie lub zniesienie określonego zachowania.

Kara zmniejsza prawdopodobieństwo wydania zachowania w późniejszych sytuacjach. Nie eliminuje jednak odpowiedzi, ponieważ jeśli zagrożenie karą maleje, zachowanie może się ponownie pojawić.

W ramach kary istnieją również dwa różne rodzaje lub procedury, kara dodatnia i kara negatywna.

Pozytywna kara

Obejmuje to prezentację awersyjnego bodźca po wykonaniu określonego zachowania. Jest on uzależniony od odpowiedzi udzielonej przez podmiot.

Kara negatywna

Polega ona na wyeliminowaniu bodźca jako konsekwencji określonego zachowania, to znaczy polega na wycofaniu bodźca pozytywnego po wykonaniu określonego zachowania.

Wymieranie

Podczas wygaszania odpowiedź zostaje zatrzymana, ponieważ wzmacniacz już się nie pojawia. Proces ten opiera się na niedostarczeniu odpowiedniego wzmocnienia, które zgodnie z oczekiwaniami zostanie osiągnięte, co spowodowało utrzymanie tego zachowania w czasie.

Gdy reakcja wygasa, bodziec dyskryminacyjny staje się bodźcem wymierania. Procesu tego nie należy mylić z zapominaniem, które pojawia się, gdy siła zachowania maleje, gdy nie zostało wydane w określonym czasie.

Uogólnienie

W odpowiedzi na określoną sytuację lub bodziec uwarunkowana jest odpowiedź, która może pojawić się przed innymi bodźcami lub podobnymi sytuacjami.

Dyskryminacja

Ten proces jest przeciwieństwem uogólnienia, w którym reaguje inaczej w zależności od bodźca i kontekstu.

Programy wzmacniające

Skinner ustanowił również kilka programów wzmacniających, w tym programy ciągłego wzmacniania i programy okresowego wzmacniania.

Programy ciągłego wzmacniania

Opierają się one na ciągłym wzmacnianiu odpowiedzi za każdym razem, gdy jest prezentowana, to znaczy za każdym razem, gdy podmiot wykonuje pożądane zachowanie, otrzyma wzmacniający lub pozytywny bodziec.

Programy przerywanego wzmacniania

W przeciwieństwie do tego, podmiot nie zawsze uzyskuje wzmocnienie podczas wykonywania pożądanego zachowania. Są one definiowane na podstawie liczby udzielonych odpowiedzi lub odstępu czasu między odpowiedziami, co prowadzi do różnych procedur.

Programy o stałym stosunku

W tych programach wzmacniacz jest dostarczany, gdy podmiot generuje stałe i stałe odpowiedzi. Na przykład w programie o stosunku 10 osoba otrzymuje wzmocnienie po wykonaniu dziesięciu odpowiedzi, gdy bodziec jest prezentowany.

Programy o różnych przyczynach

Jest to skonstruowane jak poprzedni, ale w tym przypadku liczba odpowiedzi, które podmiot musi podać, aby uzyskać wzmocnienie, jest zmienna.

Wzmocnienie nadal zależałoby od liczby odpowiedzi emitowanych przez podmiot, ale ze zmiennym powodem, dzięki czemu podmiot nie może przewidzieć, kiedy zostanie uzyskane wzmocnienie.

Naprawiono programy interwałowe

W programach interwałowych uzyskanie wzmocnienia nie zależy od liczby odpowiedzi, które daje podmiot, ale zależy od czasu, jaki upłynął. W konsekwencji wzmocniona zostaje pierwsza reakcja wytworzona po minięciu pewnego okresu czasu.

W programach z ustalonym interwałem czas między wzmocnieniem a wzmocnieniem jest zawsze taki sam.

Zmienne programy interwałowe

W tych programach wzmocnienie jest uzyskiwane po pewnym czasie, chociaż czas jest inny dla każdego otrzymanego wzmocnienia.

Zmiana behawioralna

Kolejne przybliżenia lub kształtowanie

Formowanie polega na zmianie zachowania poprzez formowanie zachowań lub wzmacnianie różnicowe kolejnych przybliżeń.

Wykonano szereg kroków, aby ukształtować konkretne zachowanie. Po pierwsze, początkowe zachowanie, które ma być uformowane, jest identyfikowane, aby wiedzieć, do którego z nich chcesz dotrzeć.

Następnie możliwe są wzmacniacze, które będą używane, a proces jest rozdzielany etapami lub etapami, aby osiągnąć ostateczne zachowanie, wzmacniając każdy krok lub kolejne podejście, aż do osiągnięcia ostatniego.

Dzięki tej dynamicznej procedurze oba zachowania i ich konsekwencje są przekształcane. W tym sensie wzmacniane są kolejne podejścia do obiektywnego zachowania.

Jednakże, aby można było je przeprowadzić, należy zacząć od wcześniejszego zachowania, które podmiot już prowadzi, aby stopniowo wzmocnić swoje zachowanie, aż osiągną cel.

Łańcuch

Dzięki temu powstaje nowe zachowanie od rozkładu do prostszych kroków lub sekwencji, wzmacniając każdą odpowiedź podaną w każdym z kroków, aby doprowadzić do ustanowienia bardziej złożonej odpowiedzi w repertuarze behawioralnym podmiotu.

Długie łańcuchy odpowiedzi można formować za pomocą uzbrojonych wzmacniaczy, przyjmując jednostkę funkcjonalną, której ustanowienie prowadzi do zdobycia i zdefiniowania określonej umiejętności.