Wikipedia - hasło oraz jego uzupełnienie



Warunkowanie instrumentalne - 
hasło na Wikipedii




      Jak wszyscy wiemy, typowy internauta weryfikuje swoją wiedzę w pierwszej kolejności w Wikipedii. Jako znawcy warunkowania sprawczego poczuliśmy się więc zobligowani do sprawdzenia, co Wikipedia podaje na jego temat oraz czy są to informacje rzetelne. Z radością musimy stwierdzić, że hasło jest tam bardzo dobrze opracowane. Poniżej możecie zapoznać się z jego treścią. Jedyne czego nam zabrakło, to zgrabne podsumowanie. Stworzyliśmy więc kilka tabelek, które czytelnik może uznać za pomocne w zrozumieniu teorii.


Warunkowanie instrumentalne


Warunkowanie instrumentalne (ang. operant conditioning) zwane jest także warunkowaniem sprawczym. Jest to forma uczenia się o konsekwencjach, która polega na modyfikowaniu frekwencji pojawiania się jakiegoś zachowania poprzez jego nagradzanie lub karanie. Relacja między zachowaniem a jego konsekwencją została nazwana przez Thorndike’a prawem efektu(ang. law of effect), które wskazuje na dwie zależności:  wystąpienie w przyszłości reakcji, po której następują satysfakcjonujące konsekwencje, staje się bardziej prawdopodobna, zaś reakcji, po której następują niezadowalające konsekwencje, mniej prawdopodobne. Pierwszymi badaczami warunkowania instrumentalnego byli Jerzy Konorski oraz Stefan Miller, lecz najbardziej znanymi badaczami byli B.F. Skinner, Edward Thorndike, Edward Tolman.

Rys historyczny
Za twórcę procedur warunkowania instrumentalnego przyjmuje się B.F. Skinner’a, uważał on, że czynnikami najsilniej wpływającymi na zachowanie są jego konsekwencje, czyli to, co następuje bezpośrednio po zachowaniu. Jednak nie był on pierwszym psychologiem, który zwrócił uwagę na koncepcję nagród i kar. Swoją ideę Skinner zapożyczył od Edwarda Thorndike’a – Skinner oczyścił je z subiektywnych i nienaukowych spekulacji na temat uczuć, zamiarów czy celów organizmu. Jako radykalny behawiorysta, Skinner odrzucił myślenie o tym, co dzieje się w psychice danego organizmu, ponieważ niemożliwe było to do sprawdzenia podczas obserwacji.

Skrzynka Skinnera

Technikę wzmacniania Skinner opracował przy użyciu „komory sprawczej” zwanej również skrzynką Skinnera, w której znajdowała się dźwignia, przy naciśnięciu której zwierzę otrzymywało pokarm.

Jej główną zaletą była możliwość kontrolowania układu wzmocnień, czasu i częstości występowania, które to czynniki wywierają znaczny wpływ na zachowanie.


Wzmocnienia i kary
W otaczającym świecie możemy spotkać trzy rodzaje bodźców: apetytywne, obojętne i awersyjne. W warunkowaniu sprawczym wykorzystywane są bodźce apetytywne i awersyjne, które mogą modyfikować częstotliwość późniejszych zachowań.



  BODZIEC APETYTYWNY     BODZIEC AWERSYJNY


WZMOCNIENIE POZYTYWNE (1)

KARANIE POZYTYWNE (2)

KARANIE NEGATYWNE (3)

WZMOCENIENIE NEGATYWNE (4)



Wzmocnienie to podanie czynnika wzmacniającego po wykonaniu reakcji, który zwiększy prawdopodobieństwo jej ponownego wystąpienia. W przypadku wzmocnienia pozytywnego (1) po pewnym zachowaniu następuje podanie bodźca apetytywnego, np. osoba będzie opowiadała żarty, gdy ich konsekwencją będzie śmiech słuchaczy, który jest dla jednostki wyrazem uznania. Wzmocnienie negatywne (4) opiera się na usunięciu bodźca awersyjnego po danym zachowaniu osobnika. Są dwa główne rodzaje sytuacji uczenia się, w których zastosowanie to ma wzmocnienie, a są to: warunkowanie ucieczki i warunkowanie unikania.  W warunkowaniu ucieczki organizm uczy się reakcji, która pozwala oddalić się od awersyjnego bodźca. Przykładem tego warunkowania może być otworzenie parasola podczas ulewy, który ochroni nas przed zimnymi kroplami deszczu. Warunkowanie unikania z kolei polega na tym, że organizm uczy się reakcji, które pomogą mu zapobiec awersyjnym bodźcom, zanim jeszcze zaczną one działać. Na podstawie tej teorii powstały nieprzyjemne brzęczki w samochodach, które wydają nieprzyjemny dźwięk, dopóki pasażer nie zapnie pasów bezpieczeństwa. W ten sposób jednostka nauczy się zapinać pasy, aby uniknąć nieprzyjemnego dźwięku. Wzmocnienia negatywne i pozytywne zwiększają prawdopodobieństwo reakcji, która je poprzedza. Karanie polega na podaniu czynnika karzącego po danej reakcji, które ma zmniejszyć częstotliwość jej występowania. Karanie pozytywne (2) występuje wtedy, gdy po danym zachowaniu następuje podanie bodźca awersyjnego. Przykładem może być dotknięcie gorącej kuchenki, które powoduje ból, który w tym przypadku jest karą za poprzedzającą go reakcję. Skutkiem tej kary jest mniejsze prawdopodobieństwo dotknięcia gorącej kuchenki ponownie. Natomiast kiedy po pewnym zachowaniu następuje usunięcie bodźca apetytywnego, mamy do czynienia z karaniem negatywnym (3). Kiedy na przykład rodzice odbiorą synowi kieszonkowe za to, że uderzył swoją młodszą siostrzyczkę, chłopczyk prawdopodobnie więcej tego nie uczyni. Karanie zawsze zmniejsza prawdopodobieństwo, że dana reakcja wystąpi ponownie, a wzmocnienie zawsze to prawdopodobieństwo zwiększa. Należy także pamiętać, że słowa „pozytywne” i „negatywne” łączą się odpowiednio ze słowami „podaj” i „usuń” a nie z ich pozytywną czy negatywną konsekwencją.



Wzmocnienie lub karanie
Przykład
Wzmocnienie pozytywne
Za wykonaną pracę co miesiąc dostaję wypłatę.
Wzmocnienie negatywne
Za dobre wyniki w nauce dziecko nie zostaje na zajęciach wyrównawczych.
Karanie pozytywne
Za złamanie przepisów dostajemy punkty karne.
Karanie negatywne
Za nieodpowiednie zachowanie dziecku zostaje odebrana ulubiona zabawka.




Wzorce związków między zachowaniem a wzmocnieniem
Czyli ustalenie związków między reakcją, a zmianami w sytuacji, które następują po tek reakcji.

Możliwe sposoby łączenia reakcji z czynnikami wzmacniającymi
Wzmocnienia ciągłe jest to typ rozkładu wzmocnień, w którym wzmacniane są wszystkie poprawne reakcje. Użyteczny sposób na początku procesu uczenie się, ponieważ pojawiająca się nagroda, za poprawną reakcję i jej brak za niepoprawną, są informacją zwrotną. Znajduje on też zastosowanie w procesie kształtowania – technika uczenia się sprawczego, która prowadzi do pojawienia się nowych zachowań, poprzez wzmacnianie reakcji podobnych do reakcji pożądanej (np. nauka czytania w szkole). Negatywną stroną tego rozkładu jest fakt, że każde jednorazowe nie nagrodzenie pozytywnej reakcji prowadzi do interpretacji, że jest ona reakcją niepoprawną. Ponadto, wraz z coraz większym nasyceniem organizmu nagrodami maleje ich moc sprawcza. Wzmocnienia sporadyczne zwane także wzmocnieniem częściowym – jest to typ rozkładu wzmocnienia, w którym wzmacniane są niektóre, lecz nie wszystkie reakcje poprawne, stosowany, gdy pożądana reakcja została już dobrze wyuczona. Taki rozkład wzmocnień jest najskuteczniejszym sposobem na podtrzymanie wyuczonych wcześniej zachowań. Jego zaletą jest odporność na wygaszanie, czyli proces, w którym wyuczona reakcja zostaje osłabiona ze względu na brak wzmocnień. Wzmocnienie sporadyczne może przebiegać w dwóch głównych formach w rozkładzie stosunkowym i w rozkładzie interwałowym. Rozkład stosunkowy to taki program, w którym nagroda pojawia się po jakiejś liczbie poprawnych reakcji. Można wyróżnić dwie subkategorie w obrębie tego konstruktu: rozkłady wzmocnień według stałych proporcji, gdzie wzmocnienie pojawia się po pewnej niezmiennej liczbie poprawnych reakcji oraz rozkłady wzmocnień według zmiennych proporcji, gdzie liczba reakcji potrzebnych do uzyskania wzmocnienia zmienia się z próby na próbę. Drugą możliwą formą są rozkłady interwałowe, gdzie pojawianie się wzmocnienia zależy od czasu, jaki upłynął od ostatniego wzmocnienia. Istnieją dwie formy takiego rozkładu. Pierwszą z nich są rozkłady wzmocnienia o stałych odstępach czasowych, gdzie nagroda pojawia się po upływie stałego czasu. Drugą zaś są rozkłady wzmocnienia o zmiennych odstępach czasowych, w których wzmocnienie pojawia się po pewnym czasie, który zmienia się z próby na próbę.



Rozkłady stosunkowe
Przykład
Według stałych proporcji
Dziecko otrzymuje od rodziców 5 złotych za każdą zdobytą piątkę (praca na akord)
Według zmiennych proporcji
Headhunter – jego wynagrodzenie (prowizja) zależy od tego, czy i ile osób namówi do zmiany pracodawcy,nawiązania współpracy.
Rozkłady interwałowe

O stałych odstępach czasowych
Comiesięczna wypłata; rozliczenie semestralne/roczne na studiach.
O zmiennych odstępach czasowych
Wizyty sanepidu w restauracjach, niezapowiedziane kartkówki w szkołach.


Gerrig, R.I. i Zimbardo, P. G. (2009). Psychologia i życie. Warszawa: Wydawnictwo Naukowe PWN 


Zimbardo, P. G., Johnson, R. L., i McCann, V. (2010). Psychologia: kluczowe koncepcje. Motywacja i uczenie się. Warszawa: Wydawnictwo Naukowe PWN

Brak komentarzy:

Prześlij komentarz