Lernen durch Verknüpfen
Hunde, denen beim Klang einer Glocke das Wasser im Maul zusammenläuft. Babys, die beim Anblick einer weißen Maus weinen. Meeresschnecken, die auf einen Reiz die Kiemen einziehen: Beim assoziativen Lernen erhalten neutrale Reize neue Bedeutung.
Scientific support: Prof. Dr. Alfons Hamm
Published: 28.11.2023
Difficulty: intermediate
- Werden zwei Ereignisse miteinander verknüpft, die natürlicherweise nicht im Zusammenhang zueinander stehen, spricht man von assoziativem Lernen.
- Bei der so genannten klassischen Konditionierung verbindet sich ein Reiz, der eine messbare Reaktion auslöst, mit einem Reiz, der diese auf natürlichem Wege nicht herbeiführt. Wichtig ist, dass beide Reize unmittelbar aufeinander folgen.
- Beim operanten Konditionieren lernt ein Individuum einen Reiz mit einer Belohnung oder Bestrafung zu verbinden. Es ändert sein Verhalten als Folge der Konsequenzen. Dopamin ist ein wichtiger Botenstoff des assoziativen Lernens und kurbelt die Erwartungshaltung an. Es ist als Neurotransmitter der Vorfreude ein wichtiger Motivator.
Dopamin
Dopamin/-/dopamine
Dopamin ist ein wichtiger Botenstoff des zentralen Nervensystems, der in die Gruppe der Catecholamine gehört. Es spielt eine Rolle bei Motorik, Motivation, Emotion und kognitiven Prozessen. Störungen in der Funktion dieses Transmitters spielen eine Rolle bei vielen Erkrankungen des Gehirns, wie Schizophrenie, Depression, Parkinsonsche Krankheit, oder Substanzabhängigkeit.
Neurotransmitter
Neurotransmitter/-/neurotransmitter
Ein Neurotransmitter ist ein chemischer Botenstoff, eine Mittlersubstanz. An den Orten der Zell-Zellkommunikation wird er vom Senderneuron ausgeschüttet und wirkt auf das Empfängerneuron erregend oder hemmend.
Inspiriert unter anderem durch Pawlows Experimente zur Klassischen Konditionierung, hob der amerikanische Psychologe John B. Watson zu Beginn des 20. Jahrhunderts den Behaviorismus aus der Taufe. Diese Denkschule dominierte viele Jahrzehnte lang die amerikanische Psychologie. Alleine das beobachtbare Verhalten galt Forschern wie Watson oder Skinner als Gegenstand wissenschaftlicher Erforschung. Mit Spekulationen über innere mentale Zustände wollten die Behavioristen nichts zu tun haben.
Viel von dieser Haltung spiegelte sich auch in ihrem Verständnis vom Lernen wider. Lernen zeigte sich demnach in einer umweltbedingten Verhaltensveränderung. Für Behavioristen ist der Lernende im Wesentlichen passiv und reagiert lediglich auf Reize aus seiner Umgebung. Er knüpft Reiz-Reiz- und Reiz-Reaktions-Verbindungen. Der Mensch kam für Vertreter dieser Denkschule als unbeschriebenes Blatt auf die Welt, das allmählich durch Erfahrung mit Inhalten gefüllt wird.
Diese Sichtweise fand ihre Kritiker in Vertretern eines kognitiven Ansatzes. Sie gingen nicht nur von äußerlich beobachtbaren Reizen und Reaktionen aus, sondern auch von einer inneren Informationsverarbeitung. Zumindest höhere Organismen seien dazu in der Lage, Informationen zu erwerben und zu speichern. Neue Informationen können mit gespeicherten verknüpft werden und so zu neuem Verhalten führen. So lassen sich schnell Lösungen für Probleme finden – ohne dass es einer wiederholten Reaktion auf einen Reiz bedarf.
Wie so oft in der Forschung begann alles mit einem großen Zufall – und diesmal waren es die Schritte eines Laborassistenten. Der russische Mediziner und Physiologe Iwan Pawlow (1846 – 1936) untersuchte seit geraumer Zeit den Verdauungsprozess bei Hunden – Forschungsarbeiten, für die er später mit dem Nobelpreis ausgezeichnet werden sollte. Dabei machte er eine überraschende Entdeckung: Der Verdauungsprozess seines Versuchstiers begann nicht erst, wenn es sein Futter im Maul hatte. Der Speichel begann bereits zu fließen, wenn der Hund die Schritte des Laborassistenten hörte – für das Tier offensichtlich das Signal für herannahendes Fressen.
Pawlows Interesse war geweckt, und er ging diesem Phänomen systematisch auf den Grund. Der Forscher implantierte Hunden eine Röhre an der Speicheldrüse, um den Speichelfluss zu messen. Fortan kündigte er den Tieren mit einer Glocke das Futter an. Zunächst ließ das Geräusch die Hunde kalt. Das ist wenig überraschend, denn es gibt keinerlei natürlichen Zusammenhang zwischen Glockenklang und Fressen. Doch nach einigen Malen hatte das Klingeln für die Tiere eine Bedeutung gewonnen und löste auch ohne Futter den Speichelfluss aus. Die Hunde hatten gelernt, dass sich im Anschluss an das Geräusch der Futternapf füllt. Und Pawlow hatte einen wichtigen Lernmechanismus entdeckt: die klassische Konditionierung.
Aus neutralem wird konditionierter Reiz
Bevor die Tiere begannen, den Klang der Glocke mit Futter zu verbinden, war das Klingeln ein neutraler Reiz – ohne konkrete Bedeutung für die Hunde. Nun aber hatten sie durch assoziatives Lernen zwei Ereignisse miteinander verknüpft. Man spricht von klassischer Konditionierung: Ein von Natur aus bedeutsamer Reiz (in diesem Fall schmackhafte Nahrung), der eine messbare Reaktion auslöst, wird mit einem weiteren in Zusammenhang gebracht, der dieses Verhalten normalerweise nicht herbeiführen würde.
Den ersten Reiz, also das Futter, bezeichnete Pawlow als unbedingten oder unkonditionierten Reiz. Hier wird der Speichelfluss durch einen „appetitiven vagalen Reflex“ ausgelöst, der angeboren ist und den Transport der Nahrung in den Magen erleichtert. Der bedingte oder konditionierten Reiz - der Klang der Glocke - kann nun aufgrund des assoziativen Lernprozesses, ebenfalls diese appetitive Reaktion auslösen. Wie Pawlow feststellte, kommt es dabei aufs Timing an: Man muss dem Tier die beiden Reize möglichst gleichzeitig oder rasch aufeinanderfolgend präsentieren. Je geringer die Verzögerung zwischen dem konditionierten und dem unkonditionierten Reiz ausfällt, desto besser gelingt die Assoziation und desto schneller und langfristiger erwirbt das Tier die konditionierte Reaktion.
Nicht nur Hunden, auch Menschen mag bereits das Wasser im Munde zusammenlaufen, wenn sie nur an den leckeren Braten denken, der da in der Röhre schmort, oder wenn sie seinen köstlichen Duft schnuppern, der durch die Küche zieht – lange bevor das Fleisch auf dem Teller und schließlich im Mund landet. Dass die klassische Konditionierung auch bei Homo sapiens funktioniert, entdeckte der amerikanische Psychologe John B. Watson (1878 – 1959) im Jahr 1920 – in seinem berühmtesten, aber auch höchst umstrittenen Experiment. Watson lehrte ein Baby namens Albert das Fürchten – vor einer weißen Maus. Das gelang ihm, indem er den Kleinen wiederholt beim Anblick einer weißen Maus mit einem lauten Hammerschlag auf eine Metallstange erschreckte und so zum Weinen brachte. Nach einiger Zeit war das Nagetier für den kleinen Albert kein neutraler Reiz mehr: Er fürchtete den Anblick, auch ohne den krachenden Hammerschlag zu hören. Das Baby begann zu weinen und versuchte wegzukrabbeln. In diesem Fall wird also reflexartiges defensives Verhalten mit einem vorher neutralen Reiz assoziiert.
Zuckerbrot und Peitsche
Wirklich neues Verhalten vermittelt die klassische Konditionierung allerdings nicht. Vielmehr werden natürliche motivationale Reaktionsmuster (welche als Reaktionsprogramme auf Hirnstammebene angelegt sind) an neue Reize und Kontexte gebunden. Soll nun aber beispielsweise ein Hund ein Kunststückchen lernen, sagen wir, auf Kommando eine Rolle zu machen, bedarf es einer anderen Form des Lernens: der operanten Konditionierung. Dabei bringt man den Hund zunächst dazu, den Trick auszuführen. Gelingt ihm das, so erwartet ihn eine Belohnung, ein Leckerli oder besondere Aufmerksamkeit. Soll sich der Hund einprägen, was er nicht machen darf – etwa die Zeitung seines Herrchens zerfetzen – funktioniert das auch per Bestrafung. Das ist allerdings mühsamer. Man spricht daher auch vom „Lernen durch Belohnung beziehungsweise Bestrafung“ oder vom „Lernen am Erfolg“. Das Verhalten ändert sich als Folge der Konsequenzen.
Als erster studierte der Psychologe Edward Thorndike (1874 – 1949) von der Columbia University um die Wende zum 20. Jahrhundert die operante Konditionierung ausführlich – wenn er ihr auch noch nicht diese Bezeichnung gab. Thorndike setzte hungrige Katzen in einen speziell konstruierten Käfig und bot ihnen ein Stück Fisch an – außerhalb des Gefängnisses. Um in die Freiheit und schließlich auch ans begehrte Fressen zu gelangen, mussten die Katzen dem Mechanismus der Box auf die Schliche kommen und einen Riegel betätigen. Das fiel den Tieren anfangs sichtlich schwer. Rein durch Zufall gerieten sie irgendwann beim ziellosen Umherwandern an den Riegel, die Tür öffnete sich, und sie konnten sich über die Belohnung hermachen. Nach einigen Versuchsdurchläufen begannen sie, zielstrebig den Riegel zu öffnen, sobald sie in die Box gesetzt wurden. Sie hatten etwas gelernt. Von einer plötzlichen Einsicht, einem Aha-Erlebnis der Katzen, konnte allerdings keine Rede sein, dazu tasteten sie sich zu langsam an des Rätsels Lösung heran. Vielmehr entdeckten die Tiere den Riegel nach dem Prinzip Versuch und Irrtum. Thorndike vermutete, dass sich die Assoziation zwischen dem Käfig und den Bewegungsmustern, die den Katzen in die Freiheit verhalfen, mit jeder Flucht verstärkte.
Aufmerksamkeit
Aufmerksamkeit/-/attention
Aufmerksamkeit dient uns als Werkzeug, innere und äußere Reize bewusst wahrzunehmen. Dies gelingt uns, indem wir unsere mentalen Ressourcen auf eine begrenzte Anzahl von Bewusstseinsinhalten konzentrieren. Während manche Stimuli automatisch unsere Aufmerksamkeit auf sich ziehen, können wir andere kontrolliert auswählen. Unbewusst verarbeitet das Gehirn immer auch Reize, die gerade nicht im Zentrum unserer Aufmerksamkeit stehen.
In der Skinner-Box
Den Begriff "operante Konditionierung" prägte schließlich der amerikanische Psychologe Burrhus Frederic Skinner (1904 – 1990), Erfinder der berühmten Skinner-Box. In ihrer ursprünglichen, einfachen Form handelt es sich dabei um eine Kiste, ausgestattet mit einem herausstehenden Hebel und einem darunter platzierten Futternapf. Drückt das Tier – Skinner bevorzugte hungrige Ratten und Tauben – zufällig den Hebel, bekommt es Futterkugeln. Diese Belohnung ist Anreiz, den Hebel mit der Zeit immer öfter zu betätigen. Umgekehrt lässt sich das konditionierte Verhalten auch wieder löschen, indem man den Futterhahn zudreht. Allgemein gilt: Eine Belohnung, ein so genannter positiver Verstärker, erhöht die Wahrscheinlichkeit, dass sich ein bestimmtes Verhalten einspielt. Bestrafung, etwa ein Stromstoß, senkt sie. Beim Menschen kann beispielsweise das Schulterklopfen als sozialer Verstärker dienen, oder auch ein per Kurznachricht verschicktes Symbol – der hochgereckte Daumen – damit der Adressat eine bestimmte Verhaltensweise fortan öfter an den Tag legt.
Recommended articles
Wie Schnecken lernen
Assoziatives Lernen als relativ elementare Form des Lernens ist aber keine Domäne höherer Tiere: Man kann es bereits bei Insekten, Würmern oder Meeresschnecken beobachten. So dient etwa die Meeresschnecke Aplysia californica Wissenschaftlern seit Jahrzehnten als Modellorganismus, um den Geheimnissen von Lernen und Gedächtnis auf die Spur zu kommen (Die Moleküle der Erinnerung).
Forscher entdeckten in den 1980er Jahren, dass sich der Rückziehreflex der Kiemen konditionieren lässt. Als bedingter Reiz genügt dazu ein feiner Wasserstrahl gegen den Siphon – ein kleines Rohr, durch das das Weichtier Meerwasser und Exkremente abstößt. Man geht dabei so sanft vor, dass das Tier unter normalen Umständen kaum reagieren würde. Im Experiment aber koppelten die Wissenschaftler diesen schwachen natürlichen Reiz mit einem starken unkonditionierten: einem Stromstoß am Fuß der Schnecke. Dieser, zunächst unabhängige Reiz führt zu einer Freisetzung des Neurotransmitters Serotonin – und zwar an derselben Nervenzelle, die auch durch den Wasserstrahl am Siphon aktiviert wird und für den Kiemenrückziehreflex verantwortlich zeichnet. Dadurch wird die synaptische Verbindung verstärkt, so dass schließlich bereits der sanfte Wasserstrahl auf den Siphon genügt, damit an der Nervenverbindung Serotonin ausgeschüttet wird und das Tier die Kiemen einzieht. Voraussetzung für die erfolgreiche Konditionierung ist, dass beide Reize zeitlich eng gekoppelt erfolgen: Zwischen Wasserstrahl und Stromstoß darf höchstens eine halbe Sekunde verstreichen.
Gedächtnis
Gedächtnis/-/memory
Gedächtnis ist ein Oberbegriff für alle Arten von Informationsspeicherung im Organismus. Dazu gehören neben dem reinen Behalten auch die Aufnahme der Information, deren Ordnung und der Abruf.
Serotonin
Serotonin/-/serotonin
Ein Neurotransmitter, der bei der Informationsübertragung zwischen Neuronen an deren Synapsen als Botenstoff dient. Er wird primär in den Raphé-Kernen des Mesencephalons produziert und spielt eine maßgebliche Rolle bei Schlaf und Wachsamkeit, sowie der emotionalen Befindlichkeit.
Erwartungshaltung und Belohnungssystem
Serotonin
Serotonin/-/serotonin
Ein Neurotransmitter, der bei der Informationsübertragung zwischen Neuronen an deren Synapsen als Botenstoff dient. Er wird primär in den Raphé-Kernen des Mesencephalons produziert und spielt eine maßgebliche Rolle bei Schlaf und Wachsamkeit, sowie der emotionalen Befindlichkeit.
Dopamin
Dopamin/-/dopamine
Dopamin ist ein wichtiger Botenstoff des zentralen Nervensystems, der in die Gruppe der Catecholamine gehört. Es spielt eine Rolle bei Motorik, Motivation, Emotion und kognitiven Prozessen. Störungen in der Funktion dieses Transmitters spielen eine Rolle bei vielen Erkrankungen des Gehirns, wie Schizophrenie, Depression, Parkinsonsche Krankheit, oder Substanzabhängigkeit.
Neurotransmitter
Neurotransmitter/-/neurotransmitter
Ein Neurotransmitter ist ein chemischer Botenstoff, eine Mittlersubstanz. An den Orten der Zell-Zellkommunikation wird er vom Senderneuron ausgeschüttet und wirkt auf das Empfängerneuron erregend oder hemmend.
Mesolimbisches System
Mesolimbisches System/-/mesolimbic pathway
Ein System aus Neuronen, die Dopamin als Botenstoff verwenden und das entscheidend an der Entstehung positiver Gefühle beteiligt ist. Die Zellkörper liegen im unteren Tegmentums und ziehen unter anderem in die Amygdala, den Hippocampus und – besonders wichtig – den Nucleus accumbens, wo sie ihre Endköpfchen haben.
Mesolimbisches System
Mesolimbisches System/-/mesolimbic pathway
Ein System aus Neuronen, die Dopamin als Botenstoff verwenden und das entscheidend an der Entstehung positiver Gefühle beteiligt ist. Die Zellkörper liegen im unteren Tegmentums und ziehen unter anderem in die Amygdala, den Hippocampus und – besonders wichtig – den Nucleus accumbens, wo sie ihre Endköpfchen haben.
zum Weiterlesen:
- Nargeot R., Simmers J.: Neural mechanisms of operant conditioning and learning-induced behavioral plasticity in Aplysia. Cellular and Molecular Life Sciences. 2011; 68:803 – 816 (zum Abstract).
Veröffentlicht: 27.12.2012
Aktualisiert: 28.11.2023