Apprendimento Corso di Psicologia Generale – Gruppo 3 Lezione 4 PARTE 2 Dott.ssa Francesca Conte francesca.conte@unicampania.it
Rinforzi e punizioni Stimolo Definizione Effetto Esempio Rinforzo positivo somministrazione di uno stimolo appetitivo INCREMENTA il comportamento ? Rinforzo negativo eliminazione di uno stimolo avversivo Punizione positiva somministrazione di uno stimolo avversivo RIDUCE il comportamento Punizione negativa eliminazione di uno stimolo appetitivo Punizione negativa = costo della risposta
Rinforzi e punizioni Stimolo Definizione Effetto Esempio Rinforzo positivo somministrazione di uno stimolo appetitivo INCREMENTA il comportamento Voto alto all’esame aumenta lo studio Rinforzo negativo eliminazione di uno stimolo avversivo Evitamento di un rumore aumenta tempo trascorso fuori dalla stanza Punizione positiva somministrazione di uno stimolo avversivo RIDUCE il comportamento Ricevere una critica riduce domande fatte in classe Punizione negativa eliminazione di uno stimolo appetitivo Non ricevere il dessert riduce i capricci
Esempio nell’educazione Williams, 1959 Un bambino sviluppava eccessi di ira se non riceveva sufficiente attenzione dai genitori prima di andare a letto Ai genitori venne consigliato di ignorare le sue proteste Eliminando il rinforzo positivo (attenzione) il comportamento si estingue; inoltre qui c’è anche una punizione negativa (l’eliminazione dell’attenzione desiderabile per il bambino riduce il pianto) Il tempo trascorso dal bambino a piangere nel letto diminuì da 45 min a 0, in soli 7 giorni
Contingenze Il rapporto tra risposta e rinforzo (o punizione) è mediato da regole di contingenza: Contingenza positiva: qualcosa viene dato, ad es. schiacciare una leva produce cibo/scossa elettrica (rinforzi e punizioni positive) Contingenza negativa: qualcosa viene tolto, ad es. schiacciare una leva termina o previene una scossa elettrica/l’erogazione di cibo (rinforzi e punizioni negative)
Modellaggio (shaping) metodo di insegnamento graduale di un comportamento nuovo complesso che consiste nel far avvicinare progressivamente il soggetto al comportamento meta rinforzando volta per volta i comportamenti che si avvicinano ad esso Es. insegnare al nostro cane a prendere la posta piccioni addestrati a trovare persone disperse in mare delfini addestrati a recuperare attrezzature sottomarine Breland e Breland (2 psicologi) negli anni 60 addestrarono migliaia di animali di specie differenti per spettacoli e fiere: “Priscilla” (un maiale) accendeva la TV, faceva colazione a tavola, radunava gli indumenti sporchi, passava l’aspirapolvere!
ANCHE IL CONDIZIONAMENTO OPERANTE è MODULATO DA VINCOLI BIOLOGICI Non tutti i comportamenti sono modellabili Breland e Breland hanno avuto difficoltà ad addestrare i procioni a infilare le monete in un salvadanaio: i procioni tendevano a sfregare le monete l’una con l’altra (comportamento che normalmente mettono in atto col cibo) ANCHE IL CONDIZIONAMENTO OPERANTE è MODULATO DA VINCOLI BIOLOGICI
Rinforzi condizionati E’ possibile condizionare un rinforzo tramite condizionamento classico Quando il ratto preme la leva sente un suono subito prima dell’erogazione del cibo Quindi si procede all’estinzione (quando il ratto preme la leva non ne consegue né il suono né il cibo) Dopo l’estinzione si inserisce nuovamente il suono (ma non il cibo) alla pressione della leva: quando il ratto scopre che la pressione produce il suono, il comportamento aumenta sensibilmente sebbene non si ottenga cibo
Rinforzi naturali vs. condizionati rinforzi primari o naturali: soddisfano bisogni biologici fondamentali (es. cibo, sonno, acqua, calore, ecc.) rinforzi secondari o condizionati: uno stimolo che è ripetutamente abbinato ad un rinforzo primario (molto più comuni dei primari negli esseri umani, es. soldi, lodi, la scritta “ristorante”) In realtà la lode risponde a un bisogno fondamentale che è quello della stima di sè
Generalizzazione e discriminazione Anche nel condizionamento operante le risposte rinforzate possono generalizzarsi (es. se una bambina è rinforzata dai genitori quando coccola il cane di casa, aumenterà la probabilità che ella coccoli anche altri cani) L’addestramento alla discriminazione prevede la presenza di uno stimolo discriminante che distingua i casi in cui la risposta sarà rinforzata da quelli in cui non lo sarà (es. i genitori rinforzano la piccola solo quando il cane che sta coccolando scodinzola)
Stimoli discriminanti positivi e negativi Stimoli discriminanti positivi: indicano che la risposta probabilmente verrà rinforzata Stimoli discriminanti negativi: indicano che la risposta probabilmente NON verrà rinforzata
Programmi di rinforzo fisso variabile continuo parziale a intervallo a rapporto
Programmi a rinforzo continuo Programmi a rinforzo continuo (ogni risposta corretta è seguita da rinforzo): apprendimento rapido (curva ripida) bassa resistenza all’estinzione bassa validità ecologica (scarso riscontro in natura di conseguenze costantemente rinforzanti) Può essere utile per periodi limitati in ambito didattico
Programmi a rinforzo parziale/intermittente Programmi a rinforzo parziale/intermittente (solo una parte delle risposte corrette è seguita da rinforzo): apprendimento meno rapido (curva meno ripida) elevata resistenza all’estinzione (richiede giorni interi in piccioni rinforzati ogni 5 min, mentre bastano pochi min per estinguere la stessa risposta se precedentemente rinforzata in modo continuo) elevata validità ecologica (frequente riscontro in natura di conseguenze saltuariamente rinforzanti)
Programmi di rinforzo a rapporto e a intervallo Modelli di rinforzo in funzione delle risposte (a rapporto fisso o variabile): l’erogazione del rinforzo avviene dopo un certo numero di risposte fornite (es. ogni 5 o 10 risposte) Modelli di rinforzo in funzione del tempo (a intervallo fisso o variabile): l’erogazione del rinforzo avviene dopo un certo tempo dall’ultima risposta rinforzata (es. ogni 4 o 8 minuti)
Programmi a rapporto Fisso (programma RF): il num delle risposte che deve essere dato per provocare l’erogazione del rinforzo è fisso (es. lavoro a cottimo) Variabile (programma RV): il num delle risposte tra un rinforzo e un altro è variabile (di solito intorno a una media, es. un programma RV 5 – in media ogni 5 risposte; es. slot machines) - è il programma che genera le più alte frequenze di risposta
Programmi a intervallo Fisso (programma IF): il tempo che deve trascorrere tra un rinforzo e un altro è fisso (es. lavoro a ore) Variabile (programma IV): il tempo tra un rinforzo e un altro è variabile (di solito intorno a una media, es. in media ogni 5 min; es. interrogazione casuale, pesca, ripetere un num telefonico occupato) – tasso di risposta sempre alto ma non quanto quello del programma RV
Caratteristiche dei programmi Nei programmi a rapporto la frequenza di risposta è superiore rispetto ai programmi a intervalli – perché solo in un programma a rapporto un’elevata frequenza di risposta fa aumentare il num di rinforzi (maggiore controllabilità dei rinforzi) Nei programmi fissi (sia RF che IF) si osserva una “pausa della risposta” subito dopo ogni rinforzo perché è prevedibile che le risposte immediatamente successive a un rinforzo non vengono mai rinforzate, mentre nei programmi variabili non ci sono pause perché è imprevedibile quanto lontano sia il prossimo rinforzo La pausa è maggiore nel programma IF e poi la frequenza di risposta aumenta verso la fine dell’intervallo (es. distribuzione della posta – si ricomincia a controllare la cassetta quando si avvicina l’orario della nuova consegna) (es. l’operaio che prende una pausa prima di cominciare un nuovo gruppo di pezzi, appena dopo averne terminato un numero sufficiente ad ottenere il compenso)
Frequenza di risposta nei vari programmi di rinforzo
Svantaggi delle punizioni Skinner, come Thorndike, predilige i rinforzi alle punizioni: I suoi effetti di soppressione del comportamento indesiderato sono spesso temporanei Siccome la punizione è a sua volta uno stimolo, può produrre un “rispondente” contrario al desiderato, es. punire un bambino perché piange può indurre reazione emotiva negativa – il bambino piange ancora di più Possono crearsi risposte emotive negative condizionate a stimoli legati alla punizione, es. genitore o insegnante, scuola Ha effetti più imprevedibili del rinforzo: mentre la ricompensa dice: “ripeti quello che hai fatto”, il castigo dice solo “smettila!” ma non fornisce l’alternativa “giusta” – il soggetto può scegliere una risposta ancor meno desiderabile di prima
Fattori cognitivi prevedibilità controllabilità Per Skinner la contiguità temporale tra risposta operante e rinforzo rende possibile il condizionamento Secondo i cognitivisti, una risposta è condizionata solo quando l’organismo interpreta il rinforzo come controllato dalla sua risposta condizionamento classico condizionamento operante prevedibilità controllabilità
Esperimento di Maier e Seligman, 1976 FASE 1 2 cani sono posti in una gabbia imbracati da un giogo che li tiene legati insieme e ne limita i movimenti Di quando in quando ricevono una scossa elettrica che solo uno dei 2 (cane di controllo) può interrompere premendo un pulsante Entrambi i cani subiscono lo stesso num di scosse ma il cane sperimentale non può averne controllo
Esperimento di Maier e Seligman, 1976 (2) I cani vengono posti in 2 gabbie separate (“shuttle box”) Un suono precede una scossa elettrica nello scomparto della gabbia occupato dal cane Per evitare la scossa il cane deve imparare a saltare nell’altro scomparto quando sente il suono FASE 2
Esperimento di Maier e Seligman, 1976 (3) IMPOTENZA APPRESA (LEARNED HELPLESSNESS) RISULTATI: I cani di controllo imparano rapidamente mentre i cani sperimentali esibiscono un comportamento passivo (non tentano di saltare) e col progredire delle prove si abbandonano a terra senza far nulla A un umano adulto posso dire a posteriori bravo per una cosa fatta molte ore fa, ad un animale e un bambino piccolo no, devo rinforzare subito Il condizionamento operante si realizza solo quando percepiamo di essere in grado di controllare il rinforzo (ovvero che il rinforzo dipende dal nostro comportamento)
Condizionamento classico Condizionamento operante Natura della risposta involontaria, automatica volontaria Timing dello stimolo precede la risposta segue la risposta Timing della risposta dopo lo stimolo prima dello stimolo Ruolo del soggetto passivo attivo Num di risposte possibili limitato a una specifica non limitato Complessità della risposta fissa (elementare) modulabile Fonte del comportamento “elicitato” dallo stimolo “emesso” dall’organismo
Condizionamento classico Condizionamento operante Acquisizione abbinamenti ripetuti dello stimolo da condizionare con quello incondizionato Rinforzo ripetuto del comportamento desiderato Estinzione rimozione dello stimolo incondizionato rimozione del rinforzo Aspetti cognitivi Sviluppo di un’aspettativa di prevedibilità (lo SC predice lo SI) Sviluppo dell’aspettativa che un certo comportamento sarà seguito da certi effetti (controllabilità)
Tolman Già nel 1930, aveva introdotto, nella descrizione dei meccanismi di apprendimento, gli aspetti cognitivi, considerati come VARIABILI INTERVENIENTI che è necessario inferire per comprendere la relazione tra stimolo e risposta L’organismo non si limita a rispondere agli stimoli, ma agisce in base alle proprie conoscenze, credenze, aspettative e obiettivi. Il comportamento e l’apprendimento non possono essere compresi se non in relazione agli obiettivi del soggetto.
Tolman (2) Introduce il FINALISMO nel processo di apprendimento: il comportamento non ha solo un “perché” ma anche un “a che scopo” Introduce il termine “rappresentazione cognitiva”
L’apprendimento latente FASE 1 2gruppi di ratti vengono posti in un labirinto: solo il Gruppo 1 viene ricompensato quando trova l’uscita I ratti del Gr. 1 migliorano gradualmente (trovano l’uscita sempre più velocemente); gli altri (Gr. 2) mostrano pochissimi miglioramenti
L’apprendimento latente (2) FASE 2: Viene introdotta una ricompensa anche per i ratti del Gr. 2: la loro prestazione sale immediatamente a livello di quella del Gr. 1! I ratti del Gr. 2 possedevano una “conoscenza latente” del labirinto, ne avevano sviluppato una “mappa cognitiva” (nonostante l’assenza di rinforzi), ma non avevano fatto uso di tale conoscenza finché non era stato dato loro un motivo per farlo
Apprendimento osservativo Anche gli esseri umani imparano molto senza necessità che i loro comportamenti vengano rinforzati nell’immediato, ed es. come fare una presentazione come cucinare qualcosa come si ordina al ristorante come si organizza una festa come si fa un certo mestiere ….. “apprendimento osservativo” (per imitazione/vicario) o modeling (Bandura & Walters, 1963)
Apprendimento sociale La teoria di Bandura è detta dell’apprendimento sociale perché si fonda sulla identificazione dell’osservatore col modello da imitare L’apprendimento è efficace quanto più il modello è saliente: risalta rispetto agli altri è gradito all’osservatore l’osservatore percepisce una somiglianza del modello con lui il comportamento del modello è rinforzato
Bandura et al, 1961 Un gruppo di bambini doveva osservare dei modelli adulti che si comportano in modo aggressivo verso il pupazzo Bobo, mentre un altro gruppo era esposto a comportamenti non aggressivi Quindi i bambini venivano lasciati liberi nella stanza I bambini del primo gruppo mostravano più comportamenti aggressivi verso Bobo rispetto agli altri
Studi successivi Risultati simili sono stati ottenuti anche quando il modello era presentato per via video (Bandura et al., 1963) È stato riportato un aumento dei comportamenti aggressivi dopo esposizione a contenuti violenti nei mass media sia in studi di laboratorio (es. Andreson et al., 2003) che longitudinali (es. Huesman et al., 2003) Bambini col pupazzo Bobo
Importanza della teoria di Bandura La teoria di Bandura segna l’ingresso dello studio dell’apprendimento nell’era del cognitivismo. Egli infatti enfatizza l’importanza delle abilità e delle caratteristiche cognitive del soggetto per l’efficacia dell’apprendimento osservativo.
Variabili cognitive Chi apprende deve essere in grado di: prestare attenzione al comportamento del modello e osservarne le conseguenze ricordare ciò che è stato osservato riprodurre il comportamento osservato essere motivato a farlo I PENSIERI e le INTENZIONI sono essenziali
Caratteristiche del soggetto che apprende Bandura considera gli individui come capaci di auto-regolarsi, di essere proattivi, generando azioni mirate a determinati scopi, piuttosto che organismi reattivi modellati da forze ambientali o mossi da pulsioni interne. Concetti chiave: agenticità: capacità di agire attivamente e trasformativamente nel proprio contesto autoefficacia: valutazione soggettiva sulla propria efficacia nell’intervenire sull’ambiente determinismo reciproco: l’agente opera in un sistema complesso in cui il comportamento è influenzato da a) fattori personali, b) ambiente, c) comportamento stesso del soggetto