La teoria del rinforzo è il processo di formazione del comportamento attraverso il controllo delle conseguenze del comportamento. Nella teoria del rinforzo una combinazione di premi e/o punizioni è usata per rinforzare il comportamento desiderato o estinguere il comportamento indesiderato. Qualsiasi comportamento che suscita una conseguenza è chiamato comportamento operante, perché l’individuo opera sul suo ambiente. La teoria del rinforzo si concentra sulla relazione tra il comportamento operante e le conseguenze associate, ed è talvolta chiamata condizionamento operante.
BACKGROUND E SVILUPPO DELLA TEORIA DEL RINFORZO
Le teorie comportamentali dell’apprendimento e della motivazione si concentrano sull’effetto che le conseguenze del comportamento passato hanno sul comportamento futuro. Questo è in contrasto con il condizionamento classico, che si concentra sulle risposte che sono innescate da stimoli in modo quasi automatico. La teoria del rinforzo suggerisce che gli individui possono scegliere tra diverse risposte a un dato stimolo, e che gli individui generalmente selezioneranno la risposta che è stata associata a risultati positivi in passato. E.L. Thorndike ha articolato questa idea nel 1911, in quella che è diventata nota come la legge dell’effetto. La legge dell’effetto afferma fondamentalmente che, a parità di altre condizioni, le risposte agli stimoli che sono seguite da soddisfazione saranno rafforzate, ma le risposte che sono seguite da disagio saranno indebolite.
B.F. Skinner ha contribuito in modo determinante allo sviluppo delle idee moderne sulla teoria del rinforzo. Skinner sosteneva che i bisogni e le pulsioni interne degli individui possono essere ignorati perché le persone imparano ad esibire certi comportamenti in base a ciò che accade loro come risultato del loro comportamento. Questa scuola di pensiero è stata definita la scuola comportamentista, o comportamentista radicale.
RAFFORZAMENTO, PUNIZIONE ED ESTINZIONE
Il principio più importante della teoria del rinforzo è, naturalmente, il rinforzo. In generale, ci sono due tipi di rinforzo: positivo e negativo. Il rinforzo positivo risulta quando il verificarsi di una conseguenza comportamentale apprezzata ha l’effetto di rafforzare la probabilità che il comportamento venga ripetuto. La conseguenza comportamentale specifica è chiamata rinforzatore. Un esempio di rinforzo positivo potrebbe essere un venditore che esercita uno sforzo extra per raggiungere una quota di vendite (comportamento) e viene poi premiato con un bonus (rinforzatore positivo). La somministrazione del rinforzatore positivo dovrebbe rendere più probabile che il venditore continui ad esercitare lo sforzo necessario in futuro.
Il rinforzo negativo risulta quando una conseguenza comportamentale indesiderabile viene negata, con l’effetto di rafforzare la probabilità che il comportamento venga ripetuto. Il rinforzo negativo è spesso confuso con la punizione, ma non sono la stessa cosa. La punizione cerca di diminuire la probabilità di comportamenti specifici; il rinforzo negativo cerca di aumentare il comportamento desiderato. Così, sia il rinforzo positivo che quello negativo hanno l’effetto di aumentare la probabilità che un particolare comportamento venga appreso e ripetuto. Un esempio di rinforzo negativo potrebbe essere un venditore che esercita lo sforzo di aumentare le vendite nel suo territorio di vendita (comportamento), che è seguito da una decisione di non riassegnare il venditore ad un percorso di vendita indesiderabile (rinforzo negativo). La somministrazione del rinforzatore negativo dovrebbe rendere più probabile che il venditore continui ad esercitare lo sforzo necessario in futuro.
Come menzionato sopra, la punizione cerca di diminuire la probabilità di esibire determinati comportamenti. La punizione è la somministrazione di una conseguenza comportamentale indesiderabile al fine di ridurre il verificarsi del comportamento indesiderato. La punizione è una delle strategie della teoria del rinforzo più comunemente usata, ma molti esperti di apprendimento suggeriscono che dovrebbe essere usata solo se il rinforzo positivo e negativo non può essere usato o ha già fallito, a causa degli effetti collaterali potenzialmente negativi della punizione. Un esempio di punizione potrebbe essere il declassamento di un dipendente che non raggiunge gli obiettivi di performance o la sospensione di un dipendente senza stipendio per aver violato le regole del lavoro.
L’estinzione è simile alla punizione in quanto il suo scopo è quello di ridurre il comportamento indesiderato. Il processo di estinzione inizia quando una conseguenza comportamentale apprezzata viene negata per diminuire la probabilità che un comportamento appreso continui. Con il tempo, è probabile che questo porti alla cessazione di quel comportamento. L’estinzione può alternativamente servire a ridurre un comportamento desiderato, come quando un rinforzatore positivo non viene più offerto quando si verifica un comportamento desiderabile. Per esempio, se un impiegato viene continuamente lodato per la prontezza con cui completa il suo lavoro per diversi mesi, ma non riceve alcuna lode nei mesi successivi per tale comportamento, i suoi comportamenti desiderabili possono diminuire. Quindi, per evitare l’estinzione indesiderata, i manager potrebbero dover continuare ad offrire conseguenze comportamentali positive.
PROGRAMMI DI RAFFORZAMENTO
La tempistica delle conseguenze comportamentali che seguono un dato comportamento è chiamata programma di rinforzo. Fondamentalmente, ci sono due grandi tipi di programmi di rinforzo: continuo e intermittente. Se un comportamento viene rinforzato ogni volta che si verifica, si parla di rinforzo continuo. La ricerca suggerisce che il rinforzo continuo è il modo più veloce per stabilire nuovi comportamenti o per eliminare comportamenti indesiderati. Tuttavia, questo tipo di rinforzo non è generalmente pratico in un ambiente organizzativo. Perciò, di solito vengono impiegati programmi intermittenti. Il rinforzo intermittente significa che ogni istanza di un comportamento desiderato non viene rinforzato. Ci sono almeno quattro tipi di programmi di rinforzo intermittente: intervallo fisso, rapporto fisso, intervallo variabile e rapporto variabile.
I programmi di rinforzo a intervallo fisso si verificano quando i comportamenti desiderati sono rinforzati dopo periodi di tempo stabiliti. L’esempio più semplice di un programma a intervallo fisso è una busta paga settimanale. Un programma di rinforzo a intervallo fisso non sembra essere un modo particolarmente forte per suscitare il comportamento desiderato, e il comportamento appreso in questo modo può essere soggetto a rapida estinzione. Il programma di rinforzo a rapporto fisso applica il rinforzatore dopo un certo numero di occorrenze dei comportamenti desiderati. Un esempio organizzativo di questo programma è una commissione di vendita basata sul numero di unità vendute. Come il programma a intervallo fisso, il programma a rapporto fisso può non produrre un cambiamento comportamentale coerente e duraturo.
I programmi di rinforzo a intervallo variabile sono impiegati quando i comportamenti desiderati sono rinforzati dopo periodi di tempo variabili. Esempi di programmi a intervallo variabile sono i riconoscimenti speciali per prestazioni di successo e le promozioni a posizioni di livello superiore. Questo programma di rinforzo sembra suscitare un cambiamento comportamentale desiderato che è resistente all’estinzione.
Infine, il programma di rinforzo a rapporto variabile applica il rinforzo dopo che un certo numero di comportamenti desiderati si sono verificati, con il numero che cambia da situazione a situazione. L’esempio più comune di questo programma di rinforzo è la slot machine in un casinò, in cui un numero diverso e sconosciuto di comportamenti desiderati (ad esempio, inserire un quarto di dollaro nella macchina) è richiesto prima che il premio (ad esempio, un jackpot) sia realizzato. Esempi organizzativi di programmi a rapporto variabile sono bonus o premi speciali che vengono applicati dopo un numero variabile di comportamenti desiderati. I programmi a rapporto variabile sembrano produrre un cambiamento comportamentale desiderato che è coerente e molto resistente all’estinzione.
TEORIA DEL RINFORZO APPLICATA ALLE IMPOSTAZIONI ORGANIZZATIVE
Probabilmente l’applicazione più conosciuta dei principi della teoria del rinforzo alle impostazioni organizzative è chiamata modifica comportamentale, o gestione della contingenza comportamentale. Tipicamente, un programma di modifica comportamentale consiste di quattro passi:
- Specificare il comportamento desiderato nel modo più oggettivo possibile.
- Misurare l’incidenza attuale del comportamento desiderato.
- Fornire conseguenze comportamentali che rinforzano il comportamento desiderato.
- Determinare l’efficacia del programma valutando sistematicamente il cambiamento comportamentale.
La teoria del rinforzo è un’importante spiegazione di come le persone imparano il comportamento. È spesso applicata alle impostazioni organizzative nel contesto di un programma di modifica del comportamento. Anche se i presupposti della teoria del rinforzo sono spesso criticati, i suoi principi continuano ad offrire importanti intuizioni sull’apprendimento e la motivazione individuale.
Tim Barnett
Rivisto da Marcia Simmering