Lernen durch Verknüpfen

Grafikerin: Meike Ufer

Author: Dr. Christian Wolf

Hunde, denen beim Klang einer Glocke das Wasser im Maul zusammenläuft. Babys, die beim Anblick einer weißen Maus weinen. Meeresschnecken, die auf einen Reiz die Kiemen einziehen: Beim assoziativen Lernen erhalten neutrale Reize neue Bedeutung.

Scientific support: Prof. Dr. Alfons Hamm

Published: 28.11.2023

Difficulty: intermediate

Das Wichtigste in Kürze

Werden zwei Ereignisse miteinander verknüpft, die natürlicherweise nicht im Zusammenhang zueinander stehen, spricht man von assoziativem Lernen.
Bei der so genannten klassischen Konditionierung verbindet sich ein Reiz, der eine messbare Reaktion auslöst, mit einem Reiz, der diese auf natürlichem Wege nicht herbeiführt. Wichtig ist, dass beide Reize unmittelbar aufeinander folgen.
Beim operanten Konditionieren lernt ein Individuum einen Reiz mit einer Belohnung oder Bestrafung zu verbinden. Es ändert sein Verhalten als Folge der Konsequenzen.

Allein das Verhalten zählt

Inspiriert unter anderem durch Pawlows Experimente zur Klassischen Konditionierung, hob der amerikanische Psychologe John B. Watson zu Beginn des 20. Jahrhunderts den Behaviorismus aus der Taufe. Diese Denkschule dominierte viele Jahrzehnte lang die amerikanische Psychologie. Alleine das beobachtbare Verhalten galt Forschern wie Watson oder Skinner als Gegenstand wissenschaftlicher Erforschung. Mit Spekulationen über innere mentale Zustände wollten die Behavioristen nichts zu tun haben.

Viel von dieser Haltung spiegelte sich auch in ihrem Verständnis vom Lernen wider. Lernen zeigte sich demnach in einer umweltbedingten Verhaltensveränderung. Für Behavioristen ist der Lernende im Wesentlichen passiv und reagiert lediglich auf Reize aus seiner Umgebung. Er knüpft Reiz-Reiz- und Reiz-Reaktions-Verbindungen. Der Mensch kam für Vertreter dieser Denkschule als unbeschriebenes Blatt auf die Welt, das allmählich durch Erfahrung mit Inhalten gefüllt wird.

Diese Sichtweise fand ihre Kritiker in Vertretern eines kognitiven Ansatzes. Sie gingen nicht nur von äußerlich beobachtbaren Reizen und Reaktionen aus, sondern auch von einer inneren Informationsverarbeitung. Zumindest höhere Organismen seien dazu in der Lage, Informationen zu erwerben und zu speichern. Neue Informationen können mit gespeicherten verknüpft werden und so zu neuem Verhalten führen. So lassen sich schnell Lösungen für Probleme finden – ohne dass es einer wiederholten Reaktion auf einen Reiz bedarf.

Wie so oft in der Forschung begann alles mit einem großen Zufall – und diesmal waren es die Schritte eines Laborassistenten. Der russische Mediziner und Physiologe Iwan Pawlow (1846 – 1936) untersuchte seit geraumer Zeit den Verdauungsprozess bei Hunden – Forschungsarbeiten, für die er später mit dem Nobelpreis ausgezeichnet werden sollte. Dabei machte er eine überraschende Entdeckung: Der Verdauungsprozess seines Versuchstiers begann nicht erst, wenn es sein Futter im Maul hatte. Der Speichel begann bereits zu fließen, wenn der Hund die Schritte des Laborassistenten hörte – für das Tier offensichtlich das Signal für herannahendes Fressen.

Pawlows Interesse war geweckt, und er ging diesem Phänomen systematisch auf den Grund. Der Forscher implantierte Hunden eine Röhre an der Speicheldrüse, um den Speichelfluss zu messen. Fortan kündigte er den Tieren mit einer Glocke das Futter an. Zunächst ließ das Geräusch die Hunde kalt. Das ist wenig überraschend, denn es gibt keinerlei natürlichen Zusammenhang zwischen Glockenklang und Fressen. Doch nach einigen Malen hatte das Klingeln für die Tiere eine Bedeutung gewonnen und löste auch ohne Futter den Speichelfluss aus. Die Hunde hatten gelernt, dass sich im Anschluss an das Geräusch der Futternapf füllt. Und Pawlow hatte einen wichtigen Lernmechanismus entdeckt: die klassische Konditionierung.

Iwan Pavlov (weißer Vollbart, um 1905) entdeckte im Experiment die klassische Konditionierung: Bereits Glockenklang genügte, um den Verdauungsprozess der Versuchshunde anzuregen.

Aus neutralem wird konditionierter Reiz

Bevor die Tiere begannen, den Klang der Glocke mit Futter zu verbinden, war das Klingeln ein neutraler Reiz – ohne konkrete Bedeutung für die Hunde. Nun aber hatten sie durch assoziatives Lernen zwei Ereignisse miteinander verknüpft. Man spricht von klassischer Konditionierung: Ein von Natur aus bedeutsamer Reiz (in diesem Fall schmackhafte Nahrung), der eine messbare Reaktion auslöst, wird mit einem weiteren in Zusammenhang gebracht, der dieses Verhalten normalerweise nicht herbeiführen würde.

Den ersten Reiz, also das Futter, bezeichnete Pawlow als unbedingten oder unkonditionierten Reiz. Hier wird der Speichelfluss durch einen „appetitiven vagalen Reflex“ ausgelöst, der angeboren ist und den Transport der Nahrung in den Magen erleichtert. Der bedingte oder konditionierten Reiz - der Klang der Glocke - kann nun aufgrund des assoziativen Lernprozesses, ebenfalls diese appetitive Reaktion auslösen. Wie Pawlow feststellte, kommt es dabei aufs Timing an: Man muss dem Tier die beiden Reize möglichst gleichzeitig oder rasch aufeinanderfolgend präsentieren. Je geringer die Verzögerung zwischen dem konditionierten und dem unkonditionierten Reiz ausfällt, desto besser gelingt die Assoziation und desto schneller und langfristiger erwirbt das Tier die konditionierte Reaktion.

Nicht nur Hunden, auch Menschen mag bereits das Wasser im Munde zusammenlaufen, wenn sie nur an den leckeren Braten denken, der da in der Röhre schmort, oder wenn sie seinen köstlichen Duft schnuppern, der durch die Küche zieht – lange bevor das Fleisch auf dem Teller und schließlich im Mund landet. Dass die klassische Konditionierung auch bei Homo sapiens funktioniert, entdeckte der amerikanische Psychologe John B. Watson (1878 – 1959) im Jahr 1920 – in seinem berühmtesten, aber auch höchst umstrittenen Experiment. Watson lehrte ein Baby namens Albert das Fürchten – vor einer weißen Maus. Das gelang ihm, indem er den Kleinen wiederholt beim Anblick einer weißen Maus mit einem lauten Hammerschlag auf eine Metallstange erschreckte und so zum Weinen brachte. Nach einiger Zeit war das Nagetier für den kleinen Albert kein neutraler Reiz mehr: Er fürchtete den Anblick, auch ohne den krachenden Hammerschlag zu hören. Das Baby begann zu weinen und versuchte wegzukrabbeln. In diesem Fall wird also reflexartiges defensives Verhalten mit einem vorher neutralen Reiz assoziiert.

Zuckerbrot und Peitsche

Wirklich neues Verhalten vermittelt die klassische Konditionierung allerdings nicht. Vielmehr werden natürliche motivationale Reaktionsmuster (welche als Reaktionsprogramme auf Hirnstammebene angelegt sind) an neue Reize und Kontexte gebunden. Soll nun aber beispielsweise ein Hund ein Kunststückchen lernen, sagen wir, auf Kommando eine Rolle zu machen, bedarf es einer anderen Form des Lernens: der operanten Konditionierung. Dabei bringt man den Hund zunächst dazu, den Trick auszuführen. Gelingt ihm das, so erwartet ihn eine Belohnung, ein Leckerli oder besondere Aufmerksamkeit. Soll sich der Hund einprägen, was er nicht machen darf – etwa die Zeitung seines Herrchens zerfetzen – funktioniert das auch per Bestrafung. Das ist allerdings mühsamer. Man spricht daher auch vom „Lernen durch Belohnung beziehungsweise Bestrafung“ oder vom „Lernen am Erfolg“. Das Verhalten ändert sich als Folge der Konsequenzen.

Als erster studierte der Psychologe Edward Thorndike (1874 – 1949) von der Columbia University um die Wende zum 20. Jahrhundert die operante Konditionierung ausführlich – wenn er ihr auch noch nicht diese Bezeichnung gab. Thorndike setzte hungrige Katzen in einen speziell konstruierten Käfig und bot ihnen ein Stück Fisch an – außerhalb des Gefängnisses. Um in die Freiheit und schließlich auch ans begehrte Fressen zu gelangen, mussten die Katzen dem Mechanismus der Box auf die Schliche kommen und einen Riegel betätigen. Das fiel den Tieren anfangs sichtlich schwer. Rein durch Zufall gerieten sie irgendwann beim ziellosen Umherwandern an den Riegel, die Tür öffnete sich, und sie konnten sich über die Belohnung hermachen. Nach einigen Versuchsdurchläufen begannen sie, zielstrebig den Riegel zu öffnen, sobald sie in die Box gesetzt wurden. Sie hatten etwas gelernt. Von einer plötzlichen Einsicht, einem Aha-Erlebnis der Katzen, konnte allerdings keine Rede sein, dazu tasteten sie sich zu langsam an des Rätsels Lösung heran. Vielmehr entdeckten die Tiere den Riegel nach dem Prinzip Versuch und Irrtum. Thorndike vermutete, dass sich die Assoziation zwischen dem Käfig und den Bewegungsmustern, die den Katzen in die Freiheit verhalfen, mit jeder Flucht verstärkte.

In der Skinner-Box

Den Begriff "operante Konditionierung" prägte schließlich der amerikanische Psychologe Burrhus Frederic Skinner (1904 – 1990), Erfinder der berühmten Skinner-Box. In ihrer ursprünglichen, einfachen Form handelt es sich dabei um eine Kiste, ausgestattet mit einem herausstehenden Hebel und einem darunter platzierten Futternapf. Drückt das Tier – Skinner bevorzugte hungrige Ratten und Tauben – zufällig den Hebel, bekommt es Futterkugeln. Diese Belohnung ist Anreiz, den Hebel mit der Zeit immer öfter zu betätigen. Umgekehrt lässt sich das konditionierte Verhalten auch wieder löschen, indem man den Futterhahn zudreht. Allgemein gilt: Eine Belohnung, ein so genannter positiver Verstärker, erhöht die Wahrscheinlichkeit, dass sich ein bestimmtes Verhalten einspielt. Bestrafung, etwa ein Stromstoß, senkt sie. Beim Menschen kann beispielsweise das Schulterklopfen als sozialer Verstärker dienen, oder auch ein per Kurznachricht verschicktes Symbol – der hochgereckte Daumen – damit der Adressat eine bestimmte Verhaltensweise fortan öfter an den Tag legt.

Recommended articles

Heureka – Lernen durch Einsicht

Mit Hilfe von mentalen Abbildern lernen wir komplexe Sachverhalte.

Wie Schnecken lernen

Assoziatives Lernen als relativ elementare Form des Lernens ist aber keine Domäne höherer Tiere: Man kann es bereits bei Insekten, Würmern oder Meeresschnecken beobachten. So dient etwa die Meeresschnecke Aplysia californica Wissenschaftlern seit Jahrzehnten als Modellorganismus, um den Geheimnissen von Lernen und Gedächtnis auf die Spur zu kommen (Die Moleküle der Erinnerung).

Forscher entdeckten in den 1980er Jahren, dass sich der Rückziehreflex der Kiemen konditionieren lässt. Als bedingter Reiz genügt dazu ein feiner Wasserstrahl gegen den Siphon – ein kleines Rohr, durch das das Weichtier Meerwasser und Exkremente abstößt. Man geht dabei so sanft vor, dass das Tier unter normalen Umständen kaum reagieren würde. Im Experiment aber koppelten die Wissenschaftler diesen schwachen natürlichen Reiz mit einem starken unkonditionierten: einem Stromstoß am Fuß der Schnecke. Dieser, zunächst unabhängige Reiz führt zu einer Freisetzung des Neurotransmitters Serotonin – und zwar an derselben Nervenzelle, die auch durch den Wasserstrahl am Siphon aktiviert wird und für den Kiemenrückziehreflex verantwortlich zeichnet. Dadurch wird die synaptische Verbindung verstärkt, so dass schließlich bereits der sanfte Wasserstrahl auf den Siphon genügt, damit an der Nervenverbindung Serotonin ausgeschüttet wird und das Tier die Kiemen einzieht. Voraussetzung für die erfolgreiche Konditionierung ist, dass beide Reize zeitlich eng gekoppelt erfolgen: Zwischen Wasserstrahl und Stromstoß darf höchstens eine halbe Sekunde verstreichen.

Erwartungshaltung und Belohnungssystem

ist aber nicht der einzige Botenstoff, der beim assoziativen Lernen eine Rolle spielt. Auch kann insbesondere bei der operanten Konditionierung einiges bewirken. Wir erinnern uns: Bei dieser Form des Lernens spielt die Belohnung eine wichtige Rolle, genauer gesagt, die Erwartung einer Belohnung. Und genau hier kommt das Dopamin ins Spiel. Als wichtiger des mesocortikolimbischen dient es als Botenstoff der Vorfreude. Dopamin wird bereits beim Anblick eines saftigen Stückchens Schokotorte ausgeschüttet, durch den Duft des Bratens in der Röhre oder eben, wenn ein Hund für sein Kunststückchen eine Belohnung erwartet – und es generiert ein Verlangen. So wird das angekurbelt, lange bevor sich der Erfolg überhaupt eingestellt hat. Dopamin wird damit zum wichtigen Motivator. Blockiert man im Experiment die Dopaminrezeptoren mit einem Hemmstoff, klappt es auch mit dem Erlernen von konditioniertem Verhalten schlechter. Assoziatives Lernen ist eine elementare Form des Lernens, macht allerdings nur einen Bruchteil seines Spektrums aus. Menschen und Tiere lernen schließlich nicht nur durch Versuch und Irrtum, sondern auch durch echte Einsichten. Doch das ist eine andere Geschichte (Heureka – Lernen durch Einsicht).

zum Weiterlesen:

Nargeot R., Simmers J.: Neural mechanisms of operant conditioning and learning-induced behavioral plasticity in Aplysia. Cellular and Molecular Life Sciences. 2011; 68:803 – 816 (zum Abstract).

Veröffentlicht: 27.12.2012
Aktualisiert: 28.11.2023

Subjects