Il vocabolario Vocabolario e lemma Nel vocabolario, per citare una parola che può avere più forme flessive si usano alcuni criteri di lemmatizzazione. Lemmatizzare un testo significa individuare un unico lemma (cioè un’unica forma grammaticale) per i vocaboli che, nelle lingue naturali, sono caratterizzati dall’essere forme “flesse”: quindi i tempi dei verbi semplici e composti, i sostantivi, gli aggettivi, gli articoli, i pronomi, cioè tutte le parti del discorso declinabili al maschile o al femminile, al singolare o al plurale. La lemmatizzazione ha come obiettivo il ricondurre a unità queste forme raccogliendole sotto un’unica forma base, quella che appare cioè come riferimento nei vocabolari. Così, convenzionalmente, nel vocabolario italiano, i nomi e gli aggettivi sono indicati al maschile singolare, i verbi all’infinito.
Il vocabolario latino Varietà vs lemma Nel vocabolario della lingua latina la lemmatizzazione è complessa. In latino, i nomi, gli aggettivi, i pronomi variano non solo nel genere (maschile, femminile, neutro) e nel numero (singolare e plurale), ma anche nella funzione logica; i verbi variano nel genere (transitivo/intransitivo), nella forma (attiva, passiva, media), nel modo, nel tempo, nella persona e nel numero. Tutte queste informazioni grammaticali sono fornite dai morfemi flessivi, variabili in relazione alle mutevoli funzioni svolte dalle parole nel contesto di una frase.
Il vocabolario latino Criteri Quali i criteri di lemmatizzazione? Le parole latine sono citate nella concretezza della loro forma flessa, cioè come parole dotate già di morfema, quindi come portatrici anche di significato grammaticale. Per i nomi è riportata la forma flessa il cui morfema indica, contemporaneamente, il numero singolare e la funzione logica di soggetto; ad es.: ancilla “l’ancella” (I decl.); lupus “il lupo” (II decl.); lepus “la lepre” (III decl.). Per i verbi è riportata la forma flessa della I persona singolare dell’indicativo presente; ad es.: laudo “io lodo”; doceo “io insegno”; audio “io sento”. Accanto a tali forme, però, se ne leggono altre. Per i nomi, infatti, è aggiunta una seconda forma flessa, il cui morfema, cumulativamente, reca una duplice informazione: indica ancora il numero singolare, ma fornisce un diverso dato relativo alla funzione logica assunta dalla parola, ovvero la funzione logica di complemento di specificazione; ad es.: ancilla, ancillae, “l’ancella, dell’ancella”; lupus, lupi, “il lupo, del lupo”; lepus, leporis, “la lepre; della lepre”. Per i verbi è riportata la forma flessa anche della II persona singolare dell’indicativo presente; ad es.: laudo, laudas, ”io lodo, tu lodi”; doceo, doces, ”io insegno, tu insegni”; audio, audis , ”io sento, tu senti”.
Il vocabolario latino Perché una doppia citazione? Se il vocabolario latino riportasse un’unica forma flessa, questa, da sola, non consentirebbe di cogliere la diversità esistente tra le parole e di prevedere il comportamento morfologico di esse. Citando, per es., pario “pareggiare” e pario “partorire”, dunque solo le prime persone singolari dell’indicativo presente, non si riuscirebbe a cogliere la differenza tra i due verbi. La doppia citazione del vocabolario latino è dunque un espediente necessario per poter prevedere la flessione delle parole. Tra l’altro, tale sistema appare poco economico, poiché postula due forme, anziché una, come base di un paradigma. In conclusione, le parole flesse, come le forme citate dai vocabolari latini, non possono essere ritenute le unità di base per il funzionamento della morfologia. Esse sono troppo “concrete” poiché la presenza della desinenza flessiva maschera le caratteristiche della base astratta sottostante.