Myers - Kapitel 8: Lernen | Lehrbuch Psychologie

David G. Myers

Inhalt

8.1 Wie lernen wir?
8.2 Klassische Konditionierung
- 8.2.1 Pawlows Experimente
- 8.2.2 Pawlows Erbe
8.3 Operante Konditionierung
- 8.3.1 Skinners Experimente
- 8.3.2 Skinners Erbe
- 8.3.3 Gegenüberstellung von klassischer und operanter Konditionierung
8.4 Biologische Veranlagungen, Kognition und Lernen
- 8.4.1 Biologische Veranlagungen
- 8.4.2 Der Einfluss von Kognitionen auf die Konditionierung
8.5 Beobachtungslernen
- 8.5.1 Spiegelneurone und Beobachtungslernen im Gehirn
- 8.5.2 Anwendungsbereiche des Beobachtungslernens
8.6 Kapitelrückblick
- 8.6.1 Verständnisfragen
- 8.6.2 Schlüsselbegriffe
- 8.6.3 Weiterführende deutsche Literatur

Zusammenfassung

Wie lernen wir?

Lernen ist eine relativ dauerhafte Veränderung im Verhalten eines Lebewesens, die auf Erfahrung zurückgeht. Beim assoziativen Lernen lernen wir, zwei Reize (bei der klassischen Konditionierung) oder eine Reaktion mit den Folgen (bei der operanten Konditionierung) zu assoziieren. Beim Beobachtungslernen lernen wir, indem wir uns die Erfahrungen und Beispiele anderer ansehen.

Klassische Konditionierung

Klassische Konditionierung ist eine Form des Lernens, bei der ein Organismus allmählich Reize koppelt. Pawlows Arbeit über klassische Konditionierung schaffte die Grundlage für den Behaviorismus, die Auffassung, die Psychologie solle eine objektive Wissenschaft sein, die das Verhalten ohne Bezug auf mentale Prozesse untersucht. Bei der klassischen Konditionierung ist ein UR ein Ereignis, das natürlicherweise in Reaktion auf irgendeinen Reiz (wie Speichelfluss) auftritt. Ein US ist etwas, was natürlicherweise und automatisch die nicht erlernte Reaktion auslöst (wie Essen im Mund Speichelfluss auslöst). Ein CS ist in der klassischen Konditionierung ein ursprünglich neutraler Reiz (wie eine Glocke), der durch Lernen allmählich mit irgendeiner nicht gelernten Reaktion (Speichelfluss) gekoppelt wird. Eine CR ist eine gelernte Reaktion (Speichelfluss) auf einen ursprünglich neutralen, aber nun konditionierten Reiz.

Zeitlichen Voraussetzungen für eine Reiz-Reaktions-Verbindung: Zur klassischen Konditionierung kommt es am ehesten, wenn ein CS kurz vor einem US (idealerweise etwa ein halbe Sekunde vorher) dargeboten wird, wodurch der Organismus auf das bevorstehende Ereignis vorbereitet wird. Dieser Befund stützt die Auffassung, dass die klassische Konditionierung eine biologische Anpassung ist.

Bei der klassischen Konditionierung besteht Löschung in einer abgeschwächten Reaktion, wenn der CS nicht mehr als Signal für einen bevorstehenden US dient. Die spontane Erholung ist das Auftreten einer zuvor gelöschten Reaktion nach einer Ruhepause. Die Reizgeneralisierung ist die Tendenz, auf Reize zu reagieren, die einem CS ähnlich sind. Die Reizdiskrimination ist die erlernte Fähigkeit, zwischen einem CS und irrelevanten Reizen zu unterscheiden.

Die Reizgeneralisierung hat einen Wert für das Überleben, weil sie es uns ermöglicht, eine erlernte Reaktion auf andere Reize innerhalb einer bestimmten Reizkategorie zu erweitern - wie etwa, vor allen gefährlichen Tieren zu fliehen. Reizdiskrimination (unsere erlernte Fähigkeit, zwischen einem CS und anderen, irrelevanten Reizen zu unterscheiden) hat ebenfalls einen Wert für das Überleben, weil sie uns erlaubt, unsere erlernten Reaktionen auf angemessene Reize zu beschränken - wie auf die Flucht vor einem wütenden Löwen, nicht aber vor einer spielenden kleinen Katze.

Bedeutung kognitiver Prozesse für klassische Konditionierung: Der Optimismus der frühen Behavioristen, dass sich die Lernprinzipien von einer Reaktion auf eine andere und von einer Spezies auf eine andere generalisieren ließen, hat sich nicht aufrechterhalten lassen. Heute ist man allgemein der Auffassung, dass die Konditionierungsprinzipien durch unsere Gedanken, Wahrnehmungen und Erwartungen beeinflusst werden. Bei der klassischen Konditionierung lernen Menschen und andere Lebewesen, wann sie einen US erwarten können. Wenn sie sich der Verbindung zwischen Reizen und Reaktionen bewusst werden, kann dies dazu führen, dass die Kopplung schwächer wird.

Die frühen Behavioristen waren der Meinung, jegliche natürliche Reaktion ließe sich in jedem lebenden Organismus auf jeglichen neutralen Reiz konditionieren. Die Lerntheoretiker haben diese Auffassung aufgegeben. Jede Spezies ist biologisch bedingt darauf vorbereitet, Kopplungen zu lernen, die ihre Überlebenschancen verbessern - wie bei den Menschen die Furcht vor Spinnen und Schlangen und bei den Ratten die Abneigung gegen Geschmacksrichtungen, die mit Übelkeit in Zusammenhang gebracht werden. Außerhalb des Versuchslabors hat ein CS gewöhnlich eine natürliche Kopplung an den US, der sich aufgrund des CS vorhersagen lässt.

Pawlow lehrte uns, dass bedeutende psychologische Phänomene objektiv untersucht werden können und dass Konditionierungsprinzipien wichtige praktische Anwendungen finden (wie etwa, dass einige Phobien erlernt sind und behandelt werden können). Er hat auch gezeigt, dass Lernprinzipien über die Spezies hinweg angewandt werden können und dass biologische Prädispositionen dem assoziativen Lernen Grenzen setzen.

Die Methoden der klassischen Konditionierung werden bei Behandlungsprogrammen für diejenigen genutzt, die versuchen, vom Alkohol und Drogenmissbrauch wegzukommen, und um in der Therapie angemessenere Reaktionen bei emotionalen Störungen zu konditionieren.

Operante Konditionierung

Die beiden Hauptmerkmale durch die sich die klassische Konditionierung von der operanten Konditionierung: Bei der klassischen Konditionierung bilden die Organismen Assoziationen zwischen Verhaltensweisen, über die sie keine Kontrolle haben; zu dieser Form der Konditionierung gehört das respondente Verhalten (automatische Reaktionen auf einen Reiz). Bei der operanten Konditionierung lernen die Organismen Kopplungen zwischen ihrem eigenen Verhalten und den sich daraus ergebenden Ereignissen; zu dieser Form der Konditionierung gehört das operante Verhalten (ein Verhalten, das auf die Umwelt einwirkt und dadurch Konsequenzen hervorruft).

Thorndikes Effektgesetz besagt, dass belohntes Verhalten wahrscheinlich wieder auftreten wird. Von diesem Gesetz ausgehend beschäftigte sich Skinner sein ganzes Leben lang damit, die Prinzipien und Bedingungen zu erkunden, unter denen es zum Lernen durch operante Konditionierung kommt.

Beim Shaping werden Verstärker eingesetzt, um das Verhalten einer Person oder eines Tieres in Richtung auf das erwünschte Ziel hin zu lenken. Man baut auf bestehendem Verhalten auf und belohnt sukzessive Annäherungen an irgendein erwünschtes Verhalten. Weil Tiere und Babys nicht sprechen können und nur auf das reagieren, was sie wahrnehmen, zeigen ihre Reaktionen, zwischen welchen Ereignissen sie unterscheiden können.

Bei der positiven Verstärkung kommt etwas Wünschenswertes hinzu, um die Häufigkeit eines Verhaltens zu vergrößern. Bei der negativen Verstärkung wird etwas nicht Wünschenswertes entfernt, um die Häufigkeit eines Verhaltens zu vergrößern. Primäre Verstärker (etwa Essen bekommen, wenn man hungrig ist, oder dafür sorgen, dass das unangenehme Gefühl im Bauch vorübergeht, wenn einem übel ist) sind von Geburt an befriedigend - dafür ist kein Lernen erforderlich. Konditionierte (oder sekundäre) Verstärker (wie etwa Bargeld) sind zufriedenstellend, weil wir gelernt haben, sie mit grundlegenderen Belohnungen zu assoziieren (wie etwa das Essen oder die Medizin, die wir damit kaufen können). Unmittelbare Verstärker (wie etwa die Zigarette für den Nikotinsüchtigen) geben sofort etwas zurück; verzögerte Verstärker (wie etwa die monatliche Gehaltsüberweisung) setzen die Fähigkeit voraus, die Bedürfnisbefriedigung aufzuschieben.

Bei der kontinuierlichen Verstärkung (man verstärkt die erwünschten Reaktionen jedes Mal, wenn sie auftreten) lernt man rasch, aber auch die Löschung geschieht schnell, wenn die Belohnung des Verhaltens eingestellt wird. Die kontinuierliche Verstärkung ist die Methode der Wahl, bis ein Verhalten gelernt ist. Bei der partiellen Verstärkung (man verstärkt die Reaktionen nicht immer) ist der anfängliche Lernprozess langsamer, aber das Verhalten ist widerstandsfähiger gegen Löschung. Verstärkungspläne können unterschiedlich sein, je nach der Anzahl der belohnten Reaktionen und dem zeitlichen Abstand zwischen den Reaktionen.

Bei festen Quotenplänen bietet man Belohnungen nach einer festgesetzten Anzahl von Reaktionen an,
bei variablen Quotenplänen nach einer unvorhersagbaren Anzahl von Reaktionen.
Bei festen Intervallplänen bietet man Belohnungen nach festgesetzten Zeitintervallen an,
bei variablen Intervallplänen nach unvorhersagbaren Zeitintervallen.

Sowohl bei positiver Bestrafung (Verabreichung einer unerwünschten Konsequenz, beispielsweise einem Klaps) als auch bei negativer Bestrafung (Entfernung von etwas Wünschenswertem, wie etwa einer Puppe) wird versucht, die Häufigkeit eines Verhaltens (Ungehorsam eines Kindes) abnehmen zu lassen. Bei negativer Verstärkung (wie etwa Einnahme von Aspirin) wird etwas Unerwünschtes (wie etwa Kopfweh) entfernt, um die Häufigkeit eines Verhaltens zunehmen zu lassen. Zu den nicht erwünschten Nebenwirkungen der Bestrafung kann gehören, dass nicht gewollte Verhaltensweisen eher unterdrückt als verändert werden: Man lehrt, aggressiv zu sein, man erzeugt Furcht, man fördert die Diskrimination (so dass das unerwünschte Verhalten auftritt, wenn der Bestrafer nicht anwesend ist), und man fördert Depressionen und Gefühle der Hilflosigkeit.

Latentes Lernen (wie es sich etwa bei Ratten zeigen lässt, die kognitive Landkarten lernen, oder bei Kindern, die das Verhalten anderer zeitverzögert nachahmen) deutet darauf hin, dass wir aufgrund von Erfahrung ohne offensichtliche Verstärkung lernen können. Es besteht die Möglichkeit, dass eine äußere Belohnung unser Interesse und unseren Spaß an einer Aktivität abnehmen lässt. Das ist die Kehrseite der Vorstellung, dass Verhaltensweisen, die belohnt werden, in ihrer Häufigkeit zunehmen werden.

Biologische Einschränkungen prädisponieren Organismen dazu, Kopplungen zu lernen, die Teil der natürlichen Anpassung sind. Ein Trainingsprogramm, das versucht, diese Tendenzen außer Kraft zu setzen, wird wahrscheinlich keine dauerhafte Wirkung haben, weil die Lebewesen zu ihren biologisch prädisponierten Mustern zurückkehren werden.

Die Kontroverse um Skinners Auffassungen zum Verhalten des Menschen: Viele Psychologen kritisierten Skinner dahingehend, dass er die Bedeutung der Kognition und von biologischen Beschränkungen beim Lernen unterschätze. Es gab auch eine heftige Debatte mit ihm darüber, was die Freiheit des Menschen im Kern ist und welche Strategien und ethischen Vorstellungen beim Umgang mit Menschen angemessen sind.

Vorgehensweisen, bei denen man die Prinzipien der operanten Konditionierung in der Schule, im Sport, bei der Arbeit und zu Hause anwenden kann:

In der Schule können Lehrer Shaping-Verfahren dazu verwenden, die Verhaltensweisen der Schüler zu lenken. Interaktive Software und Webseiten können Schülern unmittelbares Feedback geben.
Im Sport können Trainer die Fertigkeit und das Selbstvertrauen der Spieler aufbauen, indem sie kleinere Verbesserungen belohnen.
Im Beruf können Vorgesetzte die Produktivität und die Arbeitsmoral wesentlich erhöhen, indem sie klar definierte und erreichbare Verhaltensweisen belohnen.
Zu Hause können wir unseren Energieverbrauch steuern, indem wir den aktuellen Verbrauch mit dem im letzten Jahr vergleichen. Eltern können Verhaltensweisen belohnen, die ihrer Meinung nach erwünscht sind, und nicht erwünschte nicht belohnen.
Individuell können wir unser eigenes erwünschtes Verhalten verstärken und unerwünschtes löschen, indem wir uns Ziele setzen, die Häufigkeit des erwünschten Verhaltens beobachten und die Anreize dafür langsam zurücknehmen, wenn das Verhalten zur Gewohnheit wird.

Klassische und operante Konditionierung sind insofern einander ähnlich, als sie beide Formen assoziativen Lernens sind. Zu beiden gehören Erwerb, Löschung, spontane Erholung, Generalisierung und Diskrimination. Und beide sind von kognitiven Prozessen und biologischen Prädispositionen beeinflusst - und manchmal auch dadurch beschränkt. Diese beiden Formen des Lernens unterscheiden sich in einem wichtigen Punkt: Bei der klassischen Konditionierung assoziiert ein Organismus unterschiedliche Reize, die er nicht kontrolliert und auf die er automatisch reagiert (respondentes Verhalten), bei der operanten Konditionierung koppelt ein Organismus seine eigenen Verhaltensweisen mit ihren Konsequenzen.

Beobachtungslernen

Beim Beobachtungslernen beobachten wir und ahmen andere nach. Die Spiegelneuronen, die sich in den Frontallappen des Gehirns befinden, zeigen, dass es eine neuronale Grundlage für Beobachtungslernen gibt. Sie sind aktiv, wenn wir bestimmte Handlungen ausführen (wie etwa auf Schmerz reagieren oder den Mund bewegen, um Wörter zu bilden) oder wenn wir jemanden beobachten, der diese Handlungen ausführt.

Bandura et al. zeigten, dass wir mit einer gewissen Wahrscheinlichkeit Handlungen nachahmen, die nicht bestraft werden. Und wir neigen dazu, Vorbilder nachzuahmen, die wir als uns ähnlich, als erfolgreich und als bewundernswert wahrnehmen.

Der Einfluss prosozialer Vorbilder: Die Forschung zeigt, dass Kinder dazu neigen, nachzuahmen, was ein Vorbild macht und sagt, ganz gleichgültig, ob das Verhalten prosozial (positiv, konstruktiv und hilfsbereit) oder antisozial ist. Wenn die Handlungen und die Worte eines Vorbilds nicht zueinander passen, ahmen Kinder möglicherweise die Heuchelei nach, die sie beobachten.

Korrelationen sind ein Hinweis auf Zusammenhänge, aber nicht auf die Richtung des Einflusses. Korrelationsstudien zeigen, dass das Betrachten von Gewalt und gewalttätiges Verhalten zusammenhängen. Doch lässt sich so nicht nachweisen, dass das Betrachten von Gewalt im Fernsehen Kinder dazu verleitet, gewalttätig zu werden. Kinder, die sich gewalttätig verhalten, mögen Spaß daran haben, sich Gewalt im Fernsehen anzuschauen. Oder irgendein dritter Faktor bringt die Kinder möglicherweise dazu, sich sowohl gewalttätig zu verhalten als auch sich vorzugsweise Gewaltsendungen anzusehen. Um nachzuweisen, was die Ursache und was die Wirkung ist, haben Forscher Experimente entworfen, bei denen einige Versuchsteilnehmer Gewalt sehen und andere nicht. Wenn man ihnen später die Gelegenheit gab, Gewalt zum Ausdruck zu bringen (bei groben Spielen oder bei verbalen Reaktionen auf Videos), neigten Menschen, die Gewalt gesehen hatten, dazu, aggressiver und weniger mitfühlend zu sein. Zwei Faktoren - Nachahmung und Desensibilisierung - scheinen etwas zur Auswirkung der beobachteten Gewalt beizutragen.

Zurück zur Übersicht