Gli strumenti della valutazione estratto da Gaetano Domenici, Manuale della valutazione scolastica, Laterza, Bari, 2002
La gran parte delle caratteristiche degli strumenti valutativi tradizionali sono tali da rendere poco affidabili le informazioni raccolte Le prove orali possono non essere esaustive per ciascun allievo. Spesso le domande ai primi non saranno le stesse di quelle rivolte successivamente agli altri. Il peso delle diverse domande potrebbe essere diverso. E dunque le informazioni raccolte saranno differenti. A cosa corrisponde la sufficienza?
La gran parte delle caratteristiche degli strumenti valutativi tradizionali sono tali da rendere poco affidabili le informazioni raccolte Le prove scritte (Il tema, per es.) avendo uno stimolo non del tutto strutturato, genereranno risposte soggettive e trattazioni non esaustive. (se si tralascia una parte, come facciamo a sapere se lo studente ha le conoscenze relative?) Anche se volessimo controllare la correttezza grammaticale per es., lo studente incerto sull’uso del congiuntivo potrebbe trasformare la frase usando l’indicativo. Il docente, usando il tema classico, perderebbe l’informazione su quella abilità
I dati valutativi raccolti non sono dunque omogenei e possono causare errori di valutazione. Gli stimoli sono aperti (perciò non di univoca interpretazione da parte degli studenti) Le risposte sono aperte (con peso e punteggio di difficile predeterminazione da parte del docente)
Ci sono poi effetti distorsivi noti: effetto alone (ti giudico influenzato dai miei giudizi precedenti) effetto di contrasto (soprastima o sottostima della prova rispetto a standard di prestazioni ideali precedenti o successive. Due interrogazioni molto diverse, in assenza di misurazioni più oggettive, sono influenzate dal contrasto tra esse) effetto di stereotipia (scarsa modificabilità - alterabilità dell’opinione che ci siamo fatti dello studente), pregiudizio, empatia. effetto Pigmalione (a certe predizioni di successo o insuccesso corrispondono atteggiamenti che concorrono alla realizzazione della “profezia”) distribuzione forzata dei risultati (secondo la curva di Gauss)
La Docimologia (Scienza della valutazione) nacque perché negli anni ’30 le indagini mostrarono che: lo scarto tra i correttori era altissimo le gamme di voti erano molto diverse e indicavano diversi gradi di severità esisteva un diverso concetto di sufficienza per avere concordanza su una medesima prestazione ci vorrebbero moltissime classificazioni e moltissimi correttori La conclusione era/è che con gli strumenti tradizionali di controllo degli apprendimenti il caso aveva un peso troppo elevato nel determinare gli esiti.
Validità: grado di corrispondenza tra una rilevazione, una misura, un giudizio e l’oggetto che si vuole misurare. Non useremmo una bilancia per misurare un’altezza, o una squadretta per misurare una temperatura!!. Nel caso delle conoscenze e delle capacità da misurare ci vuole lo strumento che effettivamente le può misurare! Usare lo strumento adatto. Attendibilità: La rilevazione è attendibile se è la stessa chiunque sia il soggetto che la rileva.
Ci vuole un’analisi della tipologia degli stimoli e delle risposte richieste. Dalla qualità degli stimoli e delle risposte deriverà il grado di validità e di attendibilità dei dati e delle informazioni che si ricavano da una prova. Quanto sono più chiusi, circoscritti, precisi, gli stimoli tanto più tenderà a zero la loro ambiguità interpretativa per chi sostiene una prova. Quanto più saranno chiuse le risposte tanto più sarà univoca l’interpretazione degli esiti. Qualunque sia la struttura dello strumento valutativo impiegato per verificare le conoscenze si presume che chi somministra le prove sappia con sicurezza cosa intende rilevare, quali sono gli obiettivi della verifica che sta compiendo.