Reinforcement theory is het proces van het vormen van gedrag door het beheersen van de gevolgen van het gedrag. In de bekrachtigingstheorie wordt een combinatie van beloningen en/of straffen gebruikt om gewenst gedrag te bekrachtigen of ongewenst gedrag uit te doven. Elk gedrag dat een gevolg uitlokt wordt operant gedrag genoemd, omdat het individu op zijn of haar omgeving inwerkt. De bekrachtigingstheorie concentreert zich op de relatie tussen het operante gedrag en de bijbehorende gevolgen, en wordt soms aangeduid als operante conditionering.
ACHTERGROND EN ONTWIKKELING VAN DE REINFORCEMENT THEORIE
Gedragstheorieën over leren en motivatie richten zich op het effect dat de gevolgen van gedrag in het verleden hebben op toekomstig gedrag. Dit staat in contrast met de klassieke conditionering, die zich richt op reacties die op een bijna automatische manier door stimuli worden uitgelokt. De bekrachtigingstheorie suggereert dat individuen kunnen kiezen uit verschillende reacties op een gegeven stimulus, en dat individuen over het algemeen de reactie zullen kiezen die in het verleden met positieve uitkomsten werd geassocieerd. E.L. Thorndike verwoordde dit idee in 1911, in wat bekend is geworden als de wet van het effect. De wet van het effect stelt in feite dat, als alle andere dingen gelijk zijn, reacties op stimuli die worden gevolgd door tevredenheid, zullen worden versterkt, maar reacties die worden gevolgd door ongemak, zullen worden verzwakt.
B.F. Skinner heeft een belangrijke bijdrage geleverd aan de ontwikkeling van moderne ideeën over de versterkingsleer. Skinner betoogde dat de interne behoeften en driften van individuen kunnen worden genegeerd omdat mensen leren bepaald gedrag te vertonen op basis van wat er met hen gebeurt als gevolg van hun gedrag. Deze school van denken wordt de behavioristische, of radicale behavioristische, school genoemd.
REINFORCEMENT, PUNISHMENT, AND EXTINCTION
Het belangrijkste principe van de bekrachtigingstheorie is, uiteraard, bekrachtiging. In het algemeen zijn er twee soorten bekrachtiging: positieve en negatieve. Positieve bekrachtiging ontstaat wanneer het optreden van een gewaardeerd gedragsgevolg tot gevolg heeft dat de waarschijnlijkheid van herhaling van het gedrag wordt vergroot. Het specifieke gedragsgevolg wordt een bekrachtiger genoemd. Een voorbeeld van positieve bekrachtiging zou een verkoper kunnen zijn die extra inspanning levert om een verkoopquota (gedrag) te bereiken en dan wordt beloond met een bonus (positieve bekrachtiger). De toediening van de positieve bekrachtiger zou het waarschijnlijker moeten maken dat de verkoper in de toekomst de nodige inspanning zal blijven leveren.
Negatieve bekrachtiging ontstaat wanneer een ongewenste gedragsconsequentie wordt onthouden, met als effect dat de waarschijnlijkheid van herhaling van het gedrag wordt versterkt. Negatieve bekrachtiging wordt vaak verward met bestraffing, maar ze zijn niet hetzelfde. Straf probeert de waarschijnlijkheid van bepaald gedrag te verminderen; negatieve bekrachtiging probeert gewenst gedrag te vergroten. Dus, zowel positieve als negatieve bekrachtiging hebben het effect van het vergroten van de waarschijnlijkheid dat een bepaald gedrag zal worden aangeleerd en herhaald. Een voorbeeld van negatieve bekrachtiging kan een verkoper zijn die zich inspant om de verkoop in zijn of haar verkoopsgebied te verhogen (gedrag), wat gevolgd wordt door een beslissing om de verkoper niet opnieuw toe te wijzen aan een ongewenste verkoopsroute (negatieve bekrachtiger). Het toedienen van de negatieve bekrachtiger moet het waarschijnlijker maken dat de verkoper in de toekomst de nodige inspanning zal blijven leveren.
Zoals hierboven vermeld, tracht straf de waarschijnlijkheid te verminderen dat bepaald gedrag wordt vertoond. Straf is het toedienen van een ongewenste gedragsconsequentie om het optreden van het ongewenste gedrag te verminderen. Straf is een van de meest gebruikte strategieën uit de versterkingstheorie, maar veel leerexperts suggereren dat het alleen moet worden gebruikt als positieve en negatieve bekrachtiging niet kunnen worden gebruikt of eerder hebben gefaald, vanwege de mogelijk negatieve bijwerkingen van straf. Een voorbeeld van bestraffing zou kunnen zijn het degraderen van een werknemer die niet aan de prestatiedoelen voldoet of het schorsen van een werknemer zonder loon voor het overtreden van de werkregels.
Uitdoving is vergelijkbaar met straf in die zin dat het doel ervan is ongewenst gedrag te verminderen. Het proces van uitdoving begint wanneer een gewaardeerd gedragsgevolg wordt onthouden om de waarschijnlijkheid te verminderen dat een aangeleerd gedrag zal blijven voortduren. Na verloop van tijd zal dit waarschijnlijk resulteren in het stoppen van dat gedrag. Extinctie kan ook dienen om een gewenst gedrag te verminderen, zoals wanneer een positieve bekrachtiger niet langer wordt aangeboden wanneer een gewenst gedrag zich voordoet. Bijvoorbeeld, als een werknemer gedurende een aantal maanden voortdurend wordt geprezen voor de stiptheid waarmee hij zijn werk afmaakt, maar in de daaropvolgende maanden geen lof meer krijgt voor dergelijk gedrag, kan zijn gewenste gedrag afnemen. Dus, om ongewenste uitdoving te voorkomen, moeten managers misschien positieve gedragsconsequenties blijven aanbieden.
VERSTERKINGSPLANNEN
De timing van de gedragsconsequenties die volgen op een bepaald gedrag wordt het versterkingsschema genoemd. In principe zijn er twee hoofdtypen versterkingsschema’s: continu en intermitterend. Als een gedrag wordt versterkt elke keer dat het voorkomt, wordt het continue bekrachtiging genoemd. Onderzoek suggereert dat continue bekrachtiging de snelste manier is om nieuw gedrag te ontwikkelen of ongewenst gedrag te elimineren. Echter, dit type van bekrachtiging is over het algemeen niet praktisch in een organisatorische setting. Daarom worden gewoonlijk intermitterende schema’s gebruikt. Intermitterend bekrachtigen betekent dat niet elke keer dat een gewenst gedrag zich voordoet, bekrachtigd wordt. Er zijn tenminste vier soorten intermitterende versterkingsschema’s: vast interval, vaste verhouding, variabel interval, en variabele verhouding.
Beloningsschema’s met vaste intervallen komen voor wanneer gewenst gedrag wordt versterkt na vaste perioden van tijd. Het eenvoudigste voorbeeld van een schema met een vast interval is een wekelijks loonstrookje. Een vast interval schema van bekrachtiging lijkt niet een bijzonder sterke manier te zijn om gewenst gedrag uit te lokken, en gedrag dat op deze manier is aangeleerd kan snel uitsterven. Het vaste verhoudingsschema van bekrachtiging past de bekrachtiger toe na een vastgesteld aantal voorvallen van het gewenste gedrag. Een organisatorisch voorbeeld van dit schema is een verkoopcommissie gebaseerd op het aantal verkochte eenheden. Net als het schema met vaste intervallen, kan het schema met vaste verhoudingen geen consistente, langdurige gedragsverandering teweegbrengen.
Beloningsschema’s met variabele intervallen worden gebruikt wanneer gewenst gedrag wordt versterkt na verschillende perioden van tijd. Voorbeelden van variabele interval schema’s zijn speciale erkenning voor succesvolle prestaties en promoties naar hogere posities. Dit bekrachtigingsschema lijkt een gewenste gedragsverandering uit te lokken die bestand is tegen uitdoving.
Ten slotte, het versterkingsschema met variabele ratio past de bekrachtiger toe nadat een aantal gewenste gedragingen heeft plaatsgevonden, waarbij het aantal varieert van situatie tot situatie. Het meest voorkomende voorbeeld van dit bekrachtigingsschema is de gokautomaat in een casino, waar een verschillend en onbekend aantal gewenste gedragingen (bijv. een kwartje in de automaat stoppen) vereist is voordat de beloning (d.w.z. een jackpot) wordt gerealiseerd. Organisatorische voorbeelden van variabele verdeelschema’s zijn bonussen of speciale beloningen die worden toegekend nadat een verschillend aantal gewenste gedragingen heeft plaatsgevonden. Variabele ratio schema’s blijken gewenste gedragsverandering te produceren die consistent is en zeer resistent tegen uitdoving.
REINFORCEMENT THEORY TOEPASSED TO ORGANIZATIONAL SETTINGS
Waarschijnlijk de bekendste toepassing van de principes van de versterkingstheorie op organisatorische settings wordt gedragsmodificatie genoemd, of behavioral contingency management. Een gedragsaanpassingsprogramma bestaat gewoonlijk uit vier stappen:
- Het zo objectief mogelijk specificeren van het gewenste gedrag.
- Het meten van de huidige incidentie van het gewenste gedrag.
- Het geven van gedragsconsequenties die het gewenste gedrag versterken.
- Het bepalen van de effectiviteit van het programma door het systematisch beoordelen van gedragsverandering.
De bekrachtigingstheorie is een belangrijke verklaring van hoe mensen gedrag leren. Het wordt vaak toegepast op organisatorische settings in de context van een gedragsaanpassingsprogramma. Hoewel de veronderstellingen van de bekrachtigingstheorie vaak worden bekritiseerd, bieden de principes ervan nog steeds belangrijke inzichten in individueel leren en motivatie.
Tim Barnett
Herzien door Marcia Simmering