1. Che cos’è la docimologia Definizione, aspetti epistemologici e metodologici, campi di ricerca 1. Che cos’è la docimologia Seconda parte
Il problema degli esami Le origini della docimologia e alcune tappe del suo sviluppo. La ricerca italiana
Riproponiamo l’etimo scienza degli esami docimo (dal verbo dokimázo = esamino) logia (da logos = discorso, o, in senso lato “ragionamento scientifico”), scienza degli esami Ma, cos’è l’esame?
Dal latino examen-inis. Dal verbo exigere (esigere) Dal latino examen-inis. Dal verbo exigere (esigere). In origine indicava il controllo del peso L’esame Accertamento finalizzato alla valutazione di un grado di preparazione di un candidato per selezionarlo per un lavoro certificarne la competenza (valutazione sommativa e certificativa) conferirgli un titolo di studio stimare la sua attitudine nel prosieguo (valutazione predittiva) consentirgli la prosecuzione degli studi
Largo degli esami. 7500 cellette. Guandong, Cina 1873
Cina, 1540 circa. Candidati che si affollano per leggere i risultati degli esami.
Esami cinesi Prove scritte Testi ricopiati Perché? Due correttori. Se in disaccordo tre. Perché?
Critiche agli esami Strumenti di selezione e di cooptazione sociale Inaffidabilità delle prove Arbitrarietà del giudizio
Positività degli esami Accountability Rispetto dei criteri di attendibilità e validità. No all’autore-ferenzialità. Autoanalisi e autovalutazione d’istituto Autovalutazione del docente Autovalutazione del candidato Dialogicità, riflessività, criticità
Lacroix e la critica agli esami il sapere autentico in matematica non è dato dallo sforzo di memoria per cui è ingiustificata la prassi di un esame orale e mnemonico 1805: Lacroix: Saggio sull’insegnamento in generale e su quello della matematica «Giacché il sapere autentico in matematica non è costituito dallo sforzo di memoria in quale, più che dilatarle, restringe le facoltà, del tutto ingiustificata è la prassi di un esame orale e mnemonico per appurare la capacità dei giovani che si dedicano allo studio delle scienze. Per questo è accaduto che gli uomini più colti hanno concordemente ed onestamente riconosciuto le loro perplessità circa una loro promozione, ove fossero stati sottoposti ad un siffatto esame», e ancora: «Si ignora il tempo che si fa loro perdere nel rivedere o nel ripetere incessantemente la materia d’esame, al solo scopo di tenerli in esercizio ed in condizioni di rispondere su tutto ciò che hanno imparato?» (F. Lacroix in Henri Pieron, Examens et docimologie, Paris, P.U.F., 1963, edizione italiana Esami e docimologia, a cura di Norberto Galli, Roma, Armando Armando, 1965). Come si vedrà più avanti la critica agli esami, di cui Lacroix fu antesignano, fu avanzata da una miriade di ricercatori, da docenti, da pedagogisti, da genitori.
dell’indagine di Boston 1840: Horace Mann, segretario di Stato per l’educazione del Massachusetts. 154 domande a 530 studenti (su 7526) di circa 13 anni. Alcune domande dell’indagine di Boston -Che cosa s’intende per “Conquista normanna?” - Definisci la “monodia” - Spiega la pressione idrostatica - Qual è la causa di un’eclisse di sole? Si tratta della prima prova con caratteristiche docimologiche (domande inequivocabili, campione rappresentativo dell’universo d’indagine, tabulazione dei risultati in maniera tale che si potessero facilmente desumere i risultati di ciascun alunno a ciascuna domanda e le risposte date da tutto il campione a ciascuna domanda ) prima che la docimologia nascesse. Il risultato fu deludente (differenze notevoli tra le scuole e tra gruppi di alunni) e dette ragione a Mann, che riconobbe la correttezza della metodologia adottata per l'accertamento delle prestazioni degli studenti. Domande inequivocabili, campione rappresentativo, risultati tabulati
Altri precursori 1842 George Fisher Scale book Modello della variabilità dei punteggi “The statistics of examinations”,-Qui per la prima volta s’èmesso in luce il problema della scarsa attendibilità dei voti assegnati ai candidati nelle prove di esame. 1888 Ysidro Edgeworth Spelling. Prova di ortografia 1895 Rice Inaffidabilità esami. Misura. Test 1898 … Binet Metodi statistici. Ricorso ai test 1904 … Edward Thorndike
Primi decenni del 1900 Vari studi sulle divergenze nelle valutazioni, tra cui 1922: ricerca sugli esami di licenza elementare di Piéron (e moglie) – Laugier: scarsa predittività dell’esame – effetto alone Ricerche Laugier – Weiberg: esame di prove scritte di concorsi sottoposte a duplici correzioni (disaccordo). Tre correttori valutano una prova di fisiologia. Disaccordo tra i tre e disaccordo di un correttore con sé stesso a distanza di tre anni. Una studentessa non competente in fisiologia mostra lo stesso grado di disaccordo fatto registrare dai competenti. Nel 1931 avvio di un’inchiesta internazionale della Carnegie Corporation di New York Introduzione dei test Ricerche docimologiche in questi anni si compiono in vari stati europei e non: dalla Francia, alla Svizzera, al Belgio, agli Stati Uniti, all’India, tanto per citarne alcuni. I risultati registravano sempre disaccordi tra i correttori e, dunque, mancanza di valide correlazioni, che si caratterizzavano più positivamente quando agli esaminandi si somministravano test al posto dell’esame tradizionale. Dovunque si avanzavano severe critiche all’esame tradizionale, incapace di «determinare le capacità intellettuali» (Michael Sadler, 1932). Vertecchi così sintetizza gli interrogativi che da queste ricerche emergevano: «Quanto ci si può fidare dei giudizi che formulano le commissioni?; Le prove sono tecnicamente congegnate in modo da fornire dati coerenti con gli intenti della verifica?; Quanto incide sul risultato la personalità degli esaminatori?; Quanta parte dell’esito di un esame è da attribuirsi alle capacità degli allievi, e quanta al caso?» Piéron, in collaborazione con la moglie e con Henri Laugier condusse nel 1922 un’indagine sull’esame di licenza elementare, somministrando una batteria di 6 test a 117 scolari, rilevando le valutazioni dello scrutinio e i voti riportati nelle varie prove, esaminando le correlazioni tra i voti conseguiti nei tre gruppi in cui erano stati suddivisi. Risultò che «sembrava esistere un fattore generale atto a contraddistinguere un buon candidato, con un certo effetto di “alone” negli esaminatori, notissimo effetto d’iperestimazione o d’ipoestimazione generale dei buoni e dei cattivi». La ricerca si concluse con questa affermazione: «La licenza elementare, esame scolastico, può fornire indicazioni su un tratto, non certamente trascurabile, dell’individualità infantile: l’attitudine scolastica, funzione complessa di tratti di carattere (buona volontà, docilità) e di capacità d’acquisizione e d’istruzione. Si tratta però sostanzialmente d’un dato alquanto povero e del tutto insufficiente. Ove si voglia praticare un orientamento razionale ed avvalersi di utili selezioni in questa o quella direzione, quando ad esempio si accede agli studi dell’ordine medio – superiore, è pacifico che non ci si può assolutamente limitare a un siffatto esame di tipo tradizionale e neppure si può ad esso attribuire valore decisamente eliminatorio» (H. Piéron, op. cit, pag. 13) Dalle parole di Piéron emerge in tutta la sua pregnanza la scarsa, se non nulla, predittività di quel tipo d’esame (meglio di quel tipo di valutazione) ed emerge anche l’influenza che sull’esaminatore (ma diremmo noi anche su chi valuta) ha l’effetto alone. Laugier e Weiberg ebbero la possibilità di esaminare duplici correzioni di prove scritte somministrate a concorsi. Erano 166 elaborati di storia e geografia. Al di là dell’analisi puntuale, che qui non è il caso di riportare, «certe divergenze erano flagranti: un medesimo candidato, classificatosi secondo con un correttore, diventava penultimo con l’altro» (H. Piéron, op. cit, pag. 13), palesando un’evidente soggettività nella correzione di una medesima prova. La ricerca dei due studiosi continuò sperimentalmente. Tre correttori furonon chiamati a valutare 37 elaborati di fisiologia. Uno di loro fu chiamato a rivalutarli dopo 10 mesi e un altro dopo tre anni. Ebbene oltre a registrare alla prima correzione valutazioni diverse, si rilevò addirittura che il terzo correttore a distanza dei tre anni era in disaccordo con se stesso con un grado di diversità simile a quello fatto registrare nei confronti degli altri due colleghi in occasione della prima correzione. E ancora: i medesimi elaborati furono assegnati alla correzione di una brava studentessa che però nulla sapeva di fisiologia. Rispetto alla correzione dei docenti competenti il grado di disaccordo tra la ragazza e i competenti risultò mediamente abbastanza vicino al grado di disaccordo registrato tra le correzioni di questi ultimi. La competenza dei correttori in qualche modo non condiziona il disaccordo con i propri giudizi a distanza di un certo tempo. Nel 1931 si tenne la prima riunione per l’avvio di una grande ricerca internazionale su Le concezioni, i metodi, la tecnica e l’importanza pedagogica e sociale degli esami e dei concorsi. Finanziata dall’americana Carnegie Corporation , la ricerca fu condotta dall’Istituto Internazionale per l’Educazione del Teacher’s College dell’Università Columbia. S’insediarono varie commissioni nazionali (tedesca, americana, inglese, scozzese, finlandese francese e svizzera). La commissione inglese e quella francese vagliarono i voti assegnati ai candidati agli esami da due gruppi di esaminatori e pervennero a risultati per lo più identici, rilevando la difformità dei voti assegnati.
L’indagine sul baccalauréat: il piano di ricerca Formazione di sei gruppi di cinque esaminatori competenti (commissari in varie sedute d’esame); Prelevamento dagli archivi degli uffici del baccalauréat di 100 prove d’esame, con scelta causale tra quelli di una medesima commissione: una versione dal latino, una composizione in francese e una in inglese, una prova di matematica, una dissertazione di filosofia e una composizione di fisica; Tre prove di composizione francese assegnati a 76 correttori; Obbligo di assegnare voti in ventesimi.
L’indagine sul baccalauréat: i risultati Scarto medio dei voti tra i vari correttori abbastanza alto; Gamme di voti diverse tra i vari correttori; Discordanze anche elevate tra i vari correttori; Per assicurare un voto attendibile sarebbe stato necessario un altissimo numero di correttori I risultati dell’indagine sono riportati analiticamente nel più volte citato Esami e docimologia di Piéron. Per ciascun dei punti della diapositiva si danno alcune informazioni: Scarto medio dei voti. Fu calcolato esaminando a due a due i voti assegnati dai cinque correttori. In nessun caso fu possibile rilevare un voto identico. La tabella degli scarti che riporta Piéron è la seguente: Gamme dei voti. Ogni correttore faceva registrare una propria frequenza d’uso di alcuni voti e una propria gamma, il che dava luogo a diverse distribuzioni, a una grande variabilità non solo secondo le materie ma anche secondo i correttori medesimi. Le curve dei voti si presentavano a volte raggruppate intorno a un voto centrale, a volte dilatate. Parimenti il punto di massima densità era a volte spostato verso i voti positivi a volte spostato verso quelli negativi. Insomma, come scrive Vertecchi, «ogni correttore interpretava a modo suo una scala di voti, conferendo ai singoli punti un particolare significato»; Discordanze tra i correttori. Pur ricorrendo a diverse frequenze nell’uso di voti, in linea teorica sarebbe possibile assegnare il medesimo valore a ciascun elaborato nella graduatoria di ciascun correttore, cosa che potrebbe far presupporre una comunanza di consensi tra correttori diversi. Dalla ricerca emerse che non v’erano concordanze tra le graduatorie redatte dai vari correttori per cui si poteva verificare che una prova per un correttore aveva un valore positivo e per un altro molto di meno. Insomma, era evidente che nelle votazioni si rifletteva la personalità del correttore. La conclusione di Piéron: «Siccome non si trattava d’un concorso, sia pure con certe concordanze di graduatoria, gli scarti dei voti reali insieme con le differenze nelle scale dei valori adducono, nella determinazione di un’ammissibilità o di un’ammissione, divergenze effettive anche assai notevoli.» Le fluttuazioni dei voti potevano compensarsi moltiplicando il numero dei correttori, per cui ciò che veniva chiamato il voto vero, o il valore vero, poteva essere dato dalla media dei voti di un numero molto elevato di esaminatori. La ricerca cercò di determinare il numero minimo dei correttori a cui si sarebbe dovuto ricorrere per ottenere una valutazione affidabile. Risultò che per la prova di matematica sarebbero stati necessari 13 correttori e ben 127 per la prova di filosofia.
L’indagine sul baccalauréat: gli scarti
Scarto E’ la differenza tra i voti assegnati da correttori diversi a una medesima prova. Lo scarto è zero se i voti sono identici. Lo scarto medio è dato dalla media degli scarti (si sommano tutti gli scarti e si divide il totale per il numero dei compiti)
Gamma E’ l’intervallo tra il risultato (voto) più alto e quello più basso. E’ una misura grezza della variabilità o dispersione. Si calcola sottraendo il punteggio minimo da quello massimo. Es.: voti: 3 – 3 – 5 – 7 – 7 – 8. G = 8 – 3 = 5
Esercizio Cinque compiti vengono affidati a tre correttori diversi, designati rispettivamente con C1, C2 e C3, con l’obbligo di assegnare i voti in ventesimi. I voti assegnati sono i seguenti: Compito n C1 C2 C3 1 17 15 16 2 19 18 3 20 4 12 8 10 5 14 11
Continua esercizio precedente Calcola lo scarto medio tra i voti assegnati dai tre correttori Com-pito n C1 C2 C3 Xc1-Xc2 Xc1-Xc3 Xc2-Xc3 1 17 15 16 2 19 18 3 20 4 12 8 10 5 14 11 Calcolo dello scarto medio
Dopo le indagini Inadeguatezza delle pratiche valutative tradizionali per cui bisognava individuare ciò che Vertecchi chiama: La definizione di criteri di «lettura» delle prove il più possibili uniformi; L’adeguamento del tipo di prova da proporre al tipo di prestazione che si vuol sollecitare Dichiarare gli elementi utili a rilevare informazioni validi e attendibili. Utilizzare strumenti validi e attendibili Fino agli anni 50 circa: ricerche docimologiche indirizzate ad affinare le tecniche di rilevazione, di lettura e di assegnazione di punteggi alle prestazioni degli allievi: testing e misura. Anche se l’inadeguatezza delle pratiche valutative tradizionali era stata già rilevata sul finire dell’800, la ricerca della Carnagie Corporation pose l’accento in maniera severa su questo problema. Evidentemente il sistema formativo non era adeguato ai cambiamenti sociali, all’allargamento della scolarizzazione, alle sfide di un’educazione che tende a diventare sempre più planetaria (se ne discuterà più avanti). Non bastava più la figura dell’insegnante che non deve giustificare il suo operato, ma diveniva necessario esplicitare tutti gli elementi su cui fondare i giudizi di valutazione, elementi e strumenti in grado di rilevare informazioni validi e attendibili e, quindi, a loro volta essere validi e attendibili. Validità. Dice Gattullo: «Le misurazioni educative sono valide se misurano quel che devono misurare». In altre parole la misurazione (e ovviamente l’informazione che se ne ricava) è tanto più valida quanto più: a) si sa con esattezza l’aspetto che dev’essere misurato, b) la procedura sia idonea a rilevare quell’aspetto e solo quello, separando gli elementi di disturbo; c) i dati rilevati siano paragonabili ad altri ad essi omogenei. «E’ valida la misurazione educativa, il cui oggetto s’identifica o è collegato con gli scopi perseguiti dal processo educativo, ch’essa contribuisce a concludere, nel caso in cui quegli scopi siano già validi per conto loro» (M. Gattullo, op. cit, pag. 79). Riferendosi alle prove di profitto, di cui si dirà più avanti, la validità consiste nella corrispondenza tra la prova medesima e la variabile che s’intende misurare (quel che deve misurare). La prova di verifica deve sollecitare prestazioni direttamente collegate agli obiettivi di cui s’intende accertare il livello di padronanza da parte degli allievi. Attendibilità. L’informazione è tanto più attendibile quanto più è oggettiva, ossia quanto più è sottratta alla soggettività del rilevatore, perciò essa dev’essere rilevata con strumenti e criteri ben definiti che siano in grado di rilevare le medesime informazioni sia in condizioni uniformi sia con somministrazioni da parte di rilevatori diversi. In altre parole è condizione di attendibilità la stabilità delle informazioni rilevate sia da parte di un medesimo rilevatore a distanza di tempo sia da parte di rilevatori diversi. La ricerca docimologiche fino agli 60 del secolo scorso sono indirizzate ad affinare le tecniche di rilevazione, di lettura e di assegnazione dei punteggi alle prestazioni degli allievi, con ricorso a test di vario tipo. Un fervore in questo senso caratterizzò vari paesi europei e non. Tra i vari studiosi è opportuno ricordare almeno Thorndike in USA e Burt in Inghilterra, impegnati a stabilire criteri per la misurazione obiettiva del profitto, a costruire scale di misurazione dei vari aspetti della situazione educativa (edifici scolastici, rendimento dei docenti, delle lezioni eccetera.) Parallelamente l’editoria s’impegno a pubblicare vari manuali per la costruzione di test oggettivi di profitto. Da notare che in questi anni la ricerca era più che altro indirizzata ad assicurare oggettività alla misurazione del profitto. Come si vedrà più avanti questa linea d’indagine sotto l’influsso delle scuole attive fu di molto ripensata. Da sottolineare, comunque, che la ricerca di modalità più oggettive di misurazione e di valutazione era (ed è) particolarmente sentita per svariati motivi, che possiamo sinteticamente sintetizzare come segue: Soggettività del giudizio da parte di chi valuta, che può essere influenzato da fattori estranei all’oggetto di valutazione (effetto alone, aspettative, effetto Pigmalione, interazioni personali, condizioni in cui viene espresso il giudizio etc); Enunciazioni di traguardi formativi difficilmente misurabili in campo strettamente didattico, quali possono essere, ad esempio, la creatività, la personalità, il livello di maturazione etc. Da evidenziare, infine, che gli effetti di una valutazione ambigua non solo possono influenzare negativamente l’azione didattica in sé ma anche i processi di autovalutazione dell’alunno, che non disporrebbe d’informazioni inequivocabili sul suo percorso formativo in generale e didattico in particolare.
La docimologia classica Si sofferma sui metodi con cui si esprimono i giudizi con lo scopo di verificarne l’attendibilità (come assicurare l’oggettività, con quali strumenti?).
Le prospettive internazionali dell’educazione e l’indagine IEA Accelerazione di cambiamenti sociali negli anni 70 (intensificarsi dei contatti internazionali, accelerazione di scambi culturali, spostamento di popolazioni, pianificazione economica. In breve: società in trasformazione); Ricaduta di questi fenomeni sul sistema scolastico, con relativi problemi (rischio di omologazione versus necessità di salvaguardare le culture di appartenenza); Inchieste internazionali, tra cui l’indagine IEA International Association for the Evaluation Achievment), consentono non solo di raccogliere dati su sistemi scolastici nazionali ma anche di predisporre idonei metodi d’indagine e di trattamento di dati. Una profonda trasformazione sociale investì gli anni 70. I rapidi cambiamenti (esposti magistralmente sin dal 1934 da Lewis Mumford in Tecnica e cultura, per l’Italia edito dal Saggiatore di Milano nel 1961) e, soprattutto, le prospettive internazionali resero necessario un diverso governo della scuola e dei sistemi di formazione. Da sottolineare che in quegli anni la stretta interdipendenza tra i vari paesi (prodromi della globalizzazione di oggi?) richiedeva che i sistemi scolastici fossero anch’essi interdipendenti, segnale che si andava verso una comunità mondiale o planetaria in cui la tecnologia dovrà fare i conti con problemi comuni per trovare risposte comuni. Problemi comuni di cui si ha percezione nell’incipiente villaggio globale di cui parla McLuhan. Nel 1969 Mauro Laeng pubblicò L’educazione nella civiltà tecnologica (Roma, Armando) in cui disegna un efficace quadro delle trasformazioni in atto in quegli anni e sottolinea il compito che deve svolgere l’educazione nel tempo allora presente e in quello futuro (che poi è anche quello nostro di oggi): pensare criticamente per ipotesi. Sul finire degli anni 60 Gaston Mialaret pubblicò Introduzione alla pedagogia; definito da alcuni sessantottini il libro rosso della pedagogia, è stato edito per la seconda volta a Parigi nel 1967 e per la prima volta in Italia dalla casa editrice Armando di Roma nel 1970. Un intero capitolo del libro tracciava un quadro delle nuove frontiere dell’educazione, mettendo in avviso sui rischi di omologazione culturale insiti nei processi d’internazionalizzazione e introduceva la pedagogia comparata e la geografia dell’educazione tra le scienze dell’educazione medesima. Il pedagogista per Mialaret sarebbe dovuto essere in grado di prevedere e governare il cambiamento, nell’ottica della cooperazione internazionale da fondare sulla conoscenza dei vari aspetti dei sistemi formativi nazionali, che dovevano essere rilevati perché, tra l’altro, oggetti di studio per la pedagogia comparata. In quegli anni, s’è detto ma conviene ritornarci, la pedagogia comparata ha cercato di fornire un quadro complessivo dei sistemi formativi nei vari paesi, la cui analisi (system analysis), allora come oggi, si muoveva e si muove lungo tre direttrici: una, che potremmo definire globale, considera complessivamente il sistema di un paese rispetto a quelli degli altri, un’altra considera il sistema complessivo in relazione alle condizioni sociali, economiche e culturali del medesimo paese, e la terza, infine, considera il sistema di un paese in relazione alle sue articolazioni interne: sono anticipati gli sviluppi attuali della docimologia. Si spiegano così varie inchieste internazionali che hanno rilevato dati per l’UNESCO e per gruppi internazionali. Tra queste è da annoverare quella promossa dalla International Association for the Evaluation of Educational Achievement (IEA). Promuovere indagini internazionali a tappeto poneva una miriade di problemi sia per le tecniche di reperimento dei dati sia per la loro tabulazione e lettura. La massa di dati era enorme. Basti pensare che la prima indagine IEA, risalente al 1964 e condotta sulle conoscenze in matematica, coinvolse 130.000 studenti di tredici anni, 5.000 scuole e 12 paesi. Si apriva un nuovo campo per la ricerca e bisognava predisporre la strumentazione adatta: metodi d’indagine e tecniche statistiche e trattamento automatici. Bisognava infatti tenere conto non solo del trattamento dei dati ma anche e delle modalità della loro rilevazione, soprattutto in ambiti disciplinari, come quello linguistico (comprensione della lettura), in cui bisognava assicurare ciò che Vertecchi chiama «neutralità» della forma linguistica per prevenire disturbi di fondo che avrebbero reso i dati influenzati dalla culture di appartenenza degli studenti e, quindi, non comparabili. Le indagini IEA, l’uso di strumenti oggettivi appositamente predisposti, il ricorso massiccio a nuove tecnologie consentivano comparazioni del tutto attendibili. Tutto questo consentì alla ricerca docimologica di compiere un notevole passo avanti non solo nel metodo ma anche negli oggetti di rilevazione. Basti pensare che dalle analisi delle comparazioni e delle rilevazioni non solo emersero differenze significative tra i vari sistemi scolastici nazionali ma anche tra diverse aree geografiche di uno stessa nazione (dispersione interne ai vari sistemi), con evidente possibilità di studio delle relazioni tra le prestazioni rilevate e le condizioni sociali, economiche e culturali delle corrispondenti aree geografiche. Il che, a un’attenta e accorta lettura da parte dei responsabili dei sistemi di formazione, permette di cogliere molte indicazioni sia per una politica scolastica che eguagli le opportunità sia per la messa in atto di metodi e strategie didattiche che evitino selezioni derivanti dalle condizioni socio – culturali ed economiche degli ambienti di provenienza in direzione di una sostanziale ed effettiva uguaglianza dei cittadini (garantire il successo scolastico). In altre parole per dare risposta alla domanda che sin dal 1961 John W. Gardner si poneva: «Si può essere nello stesso tempo uguali e più bravi?» (John W. Gardner, Execellence. Can we be equal and excellent too?, New York and Evanston, Harper & Row, 1961 [trad. it. Democrazia e talenti, Roma, Armando Armando Editore, 1967]).
Gli sviluppi Autonomia della docimologia nel quadro delle scienze dell’educazione; Le critiche alla mera misurazione del profitto (R. Tyler. Mov. Evaluation). La valutazione educativa. Gli attuali filoni di ricerca e d’intervento: Sugli aspetti qualitativi dei processi di formazione; Sulle procedure di autovalutazione delle unità scolastiche; Sugli indicatori sia nazionali sia internazionali della qualità dell’istruzione. I progressi compiuti dagli anni venti in poi legittimano uno statuto espistemologico della nuova disciplina. Acquista, la docimologia, un suo specifico oggetto di studio, un suo linguaggio, una sua metodologia nel quadro complessivo delle scienze dell’educazione, tra cui, necessariamente devono esserci continue interazioni. Gattullo pubblica nel 1968 Didattica e docimologia: misurazione e valutazione nella scuola, Roma, Armando Mialaret (1976) colloca le scienze della valutazione tra “le scienze che studiano il rapporto pedagogico e lo specifico atto educativo”, tracciandone il profilo evolutivo, i cui tratti essenziali sono stati e continueranno ad essere da noi richiamati. Usa, Mialaret, il plurale “scienze della valutazione” per indicare non solo la docimologia ma anche la “docinomastica” (tecnica degli esami, di cui già aveva parlato Piéron) e la “doxologia” (definita studio sistematico della funzione che ha la valutazione scolastica). Al fine di fornire un’informazione più esaustiva il quadro sinottico delle scienze dell’educazione tracciato da Mialaret (in Le scienze dell’educazione, op. cit,) è il seguente: --------------------------------------------- De Landsheere in Evaluation continue et examens, op. cit. non si limita agli aspetti tecnici ma si riferisce anche a quelli socio – culturali che possono determinare comportamenti e sostiene che la docimologia oramai ha lasciato il ristretto campo d’indagine sugli esami per interessarsi proporre rigorosi e obiettivi metodi di valutazione. Insomma c’è un notevole fervore di ricerca e di pubblicazioni, di cui abbiamo citato solo una minima parte. Si cerca di assicurare quanta più obiettività possibile alle rilevazioni del profitto degli alunni. Si tassonomizzano gli obiettivi dell’educazione, ricorrendo alla gerarchia che sin dal 1954 Bloom aveva pubblicato a Chicago. Si costruiscono prove oggettive Lo sviluppo della docimologia, comunque, risente di notevoli critiche e perplessità sulla opportunità della riduzione dell’indagine ai soli aspetti del profitto. Le critiche sono avanzate non solo dal movimento pedagogico delle cosiddette “scuole attive” ma da larghi settori della ricerca pedagogica. Nasce negli USA il movimento della evaluation: sostiene che i criteri e gli strumenti della valutazione devono essere molteplici perché complessa è la persona umana e perché è necessario valutare non solo il profitto ma anche, e forse soprattutto, i cambiamenti indotti dall’istruzione e dall’educazione nel soggetto che apprende. Ne è sostenitore Ralph Tyler. Ci si rende conto che una valutazione sul profitto è una valutazione finale (sommativa), che ha sì il pregio sia di indicare i traguardi raggiunti in relazione agli obiettivi prefissi sia di certificare pubblicamente i risultati ma ha anche l’inconveniente d’intervenire al termine di un processo d’apprendimento non rettificandolo né sostenendo l’allievo durante il percorso. Si va verso un più stretto rapporto tra la didattica e la valutazione. S’introduce il principio di valutazione formativa. Vertecchi nel 1975 per i tipi delle edizioni Loescher di Torino pubblica Valutazione formativa. Sommariamente si possono individuare in tre gli attuali ambiti della ricerca docimologica (cfr: Introduzione di Gaetano Domenici a Le prove semistrutturate di verifica degli apprendimenti, a cura dello stesso. Testo d’esame): Sugli aspetti qualitativi dei processi di formazione. Il suo campo d’indagine è la ricerca e la messa a punto di strumenti per rilevare non solo gli esiti ma anche l’affidabilità dei processi di formazione. Su questo specifico aspetto ci si soffermerà sul prossimo punto del corso. Sulle procedure di autovalutazione delle unità scolastiche. Filone di ricerca e di messa a punto di strumenti sia per “l’assessment (verifica e valutazione degli apprendimenti fatti conseguire agli allievi [da ogni unità scolastica]) ma anche, se non soprattutto, [per] l’evaluation, cioè [per la] valutazione delle caratteristiche organizzative della scuola» (Domenici, pag. XII). Sulla determinazione «di indicatori nazionali e internazionali della qualità dell’istruzione, in grado di consentire valutazioni di sistemi interni a ciascun Paese e più o meno corrette analisi comparative internazionali.» Svariate indagini internazionali, oltre a quella già citata, si muovono in questa direzione (Progetti come INES - Indicatori Internazionali dell'Educazione Scolastica - voluto dall’ OCSE - Organizzazione per la Cooperazione e lo Sviluppo Economico- sugli indicatori internazionali dell'istruzione (1991) e PISA - Programme for International Student Assessment, un anch’esso voluto dall’OCSE (1997), le cui caratteristiche si possono leggere scaricando la brochure dal sito www.portal-stat.admin.ch/pisa/download/kompetenzmessung_i.pdf ). Committenti di queste indagini spesso sono organismi internazionali e i vari governi, mossi da necessità di politica scolastica (- conoscere le eventuali carenze dell’insegnamento; -razionalizzare la spesa degli investimenti scolastici al fine di avere un ritorno in termini di qualità e di occupazione, che indagini internazionali vedono collegata a un livello di formazione alto; - elevazione della domanda d’istruzione e controllo sociale sulla qualità di quest’ultima; - globalizzazione dei mercati e delle economie. Tutte cose, queste, che investono anche i sistemi scolastici e le relazioni tra la qualità dei processi formativi, le economie, i livelli di qualità della vita di un paese, il suo stato di ricchezza). Non più e non solo, quindi, indicatori di quantità ma anche e soprattutto di qualità in grado di descrivere organizzazione, efficacia, efficienza e funzionamento, dei sistemi formativi. L’OCSE con il progetto INES individuò i seguenti tre comprati d’indicatori: - il contesto dell’insegnamento; - i costi e le modalità d’insegnamento; - i risultati dell'istruzione. In seguito ad alcune difficoltà emerse nel terzo comparto (riserve in ordine agli strumenti e alle modalità di rilevazione dei risultati del sistema educativo e delle conseguenze a lungo termine dell’azione educativa, in tutta la sua complessità, per l'individuo, per la famiglia, per la società; critiche in ordine al ricorso ai test, con i quali non si riusciva a misurare aspetti della personalità dell’allievo, della metacognizione e della motivazione (definite dall’OCSE, le ultime due, come competenze cross curricolari, con richiamo evidente all’attraverso il curricolo), eccetera) l’OCSE nel 1995, intraprese così uno studio di fattibilità sulle competenze cross-curricolari. Vi aderirono nove paesi: Austria, Belgio (comunità francofona e fiamminga), Italia, Norvegia, Paesi Bassi, Stati Uniti, Svizzera, Ungheria. Furono considerati i seguenti ambiti: - Competenze politiche, economiche e sociali; - Concetto di Sé; - Strategie di risoluzione dei problemi; - Competenze comunicative. I risultati dello studio di fattibilità sull’area relativa al concetto di sé furono utilizzati per le aree della lettura, delle scienze e della matematica che il progetto PISA (sarebbe partito nel 1999) aveva individuato per rilevare il rendimento scolastico dei ragazzi di 15 anni.
Un quadro riepilogativo (Santelli Beccegato) Prima generazione dalle origini agli anni 50 Finalità Processo didattico come realizzazione del programma Valutazione come giudizio sugli alunni (come controllo degli alunni) Risultati
Un quadro riepilogativo (Santelli Beccegato) Seconda generazione dagli anni 50 agli anni 70 Finalità - obiettivi Valutazione come controllo dell’apprendimento Processo didattico come attuazione di una programmazione Risultati
Un quadro riepilogativo (Santelli Beccegato) Terza generazione dagli anni 70 Finalità - obiettivi Valutazione come sostegno per l’apprendimento Processo didattico come attuazione di una programmazione e come progetto di ricerca (e come una sua eventuale revisione) Risultati
Programma Programmazione Progetto
Programma Dal latino programma. Scrivere prima “Enunciazione particolareggiata, verbale o scritta, di ciò che si vuol fare, di una linea di condotta da seguire, degli obiettivi a cui si mira e dei mezzi con cui s’intende raggiungerli […]” b. “Piano di lavoro che l’insegnante si propone di svolgere o che le autorità scolastiche stabiliscono venga svolto in uno o più corsi successivi di un dato ordine di scuole” Vocabolario Treccani
Scuola del programma Definiti a livello centrale. Disposizioni ministeriali. Uniformità sull’intero territorio nazionale. Cultura prestabilita. Docente trasmettitore. Alunno vaso da riempire Staticità Cose da insegnare Contenuti Itinerari Valutazione: controllo del risultato, degli alunni
Programmazione Da Programmare (a sua volta da programma). “Con riferimento all’organizzazione curricolare dell’azione educativa, attività di promozione, coordinamento, organizzazione e verifica dei diversi fattori educativi operanti all’interno di un’unità scolastica” Vocabolario Treccani
Scuola della programmazione Scuola in situazione Rapporto: programma – situazione locale (alunno, classe, istituto, realtà locale) Coordinamento intenzionale degli apprendimenti nel curricolo Docente che reinterpreta il programma Valutazione: controllo degli apprendimenti Osservazione dei processi d’insegnamento/apprendimento Pilotaggio
Progetto Ideazione, piano, proposta per l’esecuzione di un lavoro o di una serie di lavori Idea, proposito più o meno definito, riguardo a qualcosa che si ha intenzione di fare o d’intraprendere Vocabolario Treccani
Scuola del progetto Espressione dell’apprendimento reticolare Maggiore autonomia Saperi come mezzi e non come fini Formulazione di ipotesi da verificare e non di obiettivi da raggiungere Allievi co-costruttori della conoscenza Organizzazione aperta e flessibile Laboratorio (ricerca, creatività ecc.)
Programmazione e progetto Progettazione espressione del modello lineare o controllo tende a stabilire a priori i percorsi per raggiungere gli obiettivi tende a controllare il sistema dall’esterno Tende a chiudere i problemi espressione del punto di vista reticolare o dell’autonomia È aperta al possibile e al futuro senza percorsi precostituiti Crea perturbazioni che originano nuove organizzazione, senza pretendere di determinarle totalmente Costruisce problemi (da Azzali, Cristanini, Programmare oggi, Milano, Fabbri editori, 2001 (II rist)) Valutazione: sostegno per l’apprendimento
Un altro quadro riepilogativo: Vertecchi Fase sistematica: Aspetti metrologici della valutazione Sviluppo dello strumentario valutativo Fase didattica: Collocazione funzionale della valutazione nel processo di istruzione Fase progettuale: La valutazione si qualifica come attività orientata all’assunzione di decisioni 1930 1950 1970 1990 Fonte: Vertecchi, Valutazione analogica e istruzione individualizzata
Attenzione! Ogni fase non rinnega la precedente. La ingloba, la sviluppa, la integra con nuove acquisizioni in un nuovo quadro di riferimento Dalla psicotecnica (applicazione dei metodi della psicologia per migliorare l’orientamento, la qualificazione e la selezione del personale) alla Ricerca metodologica Fine della docimologia – Edumetria – Nuova docimologia
Le fasi e le interpretazione della didattica - 1 Fonte: Vertecchi
Le fasi e le interpretazione della didattica - 2 Fonte: Vertecchi
Le fasi e le interpretazioni della didattica – 2 a – La v. formativa Previene il Valuta-zione diagnostica iniziale deficit cumulativo Istruzione individualizzata Mastery learning Fonte: Vertecchi
Valutazione formativa e mastery learning Asse y o delle ordinate: numero di alunni Asse x o delle ascisse: livello di lettura Fonte: De Landsheere Dalla curva a i alla curva a J Fonte: Domenici
In Italia: alle origini 1954 – 1955 Aldo Visalberghi e Luigi Calonghi 1) ricerca della obiettività nelle votazioni 2) verificazione degli strumenti di controllo Norberto Galli (1964)
In Italia: Aldo Visalberghi Distinzione tra misurazione e valutazione La misurazione nasce dalla valutazione e in essa confluisce La valutazione educativa 1955 - Misurazione e valutazione nel processo educativo. giudizio motivato sull’intera personalità dell’allievo I test «in generale […] servono come materiale sulla cui base è possibile pronunciare giudizi più attendibili»
In Italia: Luigi Calonghi - formulazione degli obiettivi in prospettiva evolutiva (il pieno raggiungimento degli obiettivi si raggiunge nel tempo, per tappe) in prospettiva differenziale (secondo le caratteristiche individuali di ciascuno) - necessità di una valutazione continua (accompagna il processo educativo e quello di apprendimento per guidare e motivare quanti vi operano, in forme diverse, e per fornire loro una verifica sicura e puntuale) 1954 - L’insufficienza e la soggettività delle valutazioni scolastiche degli insegnanti. 1956 - Tests ed esperimenti. Metodologia della ricerca pedagogica-didattica 1961 - Reattivi nella scuola 1976 - Valutazione
In Italia: Mario Gattullo Controllo scolastico SCHEMA RIASSUNTIVO DELLE FASI DEL PROCESSO DEL CONTROLLO SCOLASTICO I Determinazione dell’oggetto della misurazione (opera di valutazione) II Processo della misurazione che prevede: A) L’utilizzazione di uno strumento con la funzione di: 1. stimolare1 (nel caso in cui le situazioni fossero artificiali); 2. registrare1 i comportamenti degli scolari. B) L’intervento dell’esaminatore col compito di leggere (analiticamente e sinteticamente) i comportamenti registrati. III Valutazione dei risultati registrati e letti, la quale: A) Può implicare la presa in considerazione 1. del rendimento del gruppo (ristretto o rappresentativo) di cui il soggetto fa parte e/o 2. delle capacità del soggetto o del suo rendimento iniziale B) Implica l’utilizzazione d’un sistema di simboli (o di giudizi) entro una gamma prestabilita 1Le funzioni di stimolazione e di registrazione possono esser compiute direttamente dall’esaminatore Fonte: M. Gattullo, Didattica e docimologia, pag. 51 Approccio quantitativo 1968 – Didattica e docimologia. Il controllo scolastico è «l’accertamento, tramite specifiche procedure e tecniche, dei risultati di un determinato processo formativo»
In Italia: Vertecchi, Domenici Istruzione individualizzata - Valutazione formativa Valutazione - decisione Vertecchi Regolazione dell’intero sistema scolastico, dal macro al micro Domenici Verifica e valutazione degli apprendimenti scolastici in rapporto con le molteplici finalità della didattica e degli obiettivi complessivi che s'intende perseguire all'interno del macrosistema e con il particolare microsistema che ci si è dati
In Italia: alcuni nuovi orientamenti approcci «integrati, di tipo interpretativo-costruttivista ed emancipatorio» Varisco Santelli Beccegato valutazione nel rapporto individualizzazione-personalizzazione dell'offerta formativa Bertagna pratiche riflessive proprie dell'etnografia del pensiero e dell'idiograficità dei processi valutativi Loretta Fabbri Federico Batini Autovalutazione: riflessività, dialogicità e criticità. Autovalutazione. Paradigma della formazione Piu a altri