La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

IL VOCABOLARIO DI INDICIZZAZIONE nellindicizzazione verbale Linsieme controllato e strutturato dei termini (termini di indicizzazione) selezionati dalla.

Presentazioni simili


Presentazione sul tema: "IL VOCABOLARIO DI INDICIZZAZIONE nellindicizzazione verbale Linsieme controllato e strutturato dei termini (termini di indicizzazione) selezionati dalla."— Transcript della presentazione:

1 IL VOCABOLARIO DI INDICIZZAZIONE nellindicizzazione verbale Linsieme controllato e strutturato dei termini (termini di indicizzazione) selezionati dalla lingua naturale per rappresentare in un indice, uniformemente e univocamente, il contenuto dei documenti dimensioni: sottoinsieme del vocabolario della lingua naturale significati: scelta tra sinonimi, CONTROLLO disambiguazione degli omografi, relazioni semantiche forme: solo sostantivi o sintagmi nominali, ognuno con ununica grafia e in un unico caso e/o numero

2 CONTROLLO DEL VOCABOLARIO: ANALISI CATEGORIALE 1.Categorie semantiche: serie di categorie generali, tale che ognuno dei termini da sottoporre a controllo morfologico e semantico possa appartenere, per lessenza del suo significato, ad una e non più di una delle categorie individuate 2.Norme: regole generali per il controllo del vocabolario, riferite non ai singoli termini, ma alle singole categorie 3.Analisi: riconoscimento della categoria di appartenenza del termine da sottoporre a controllo, e suo trattamento morfologico e semantico secondo quanto stabilito per la categoria di appartenenza Il metodo dellanalisi categoriale permette un controllo del vocabolario coerente (predittività del sistema) ed efficiente (efficacia ed economicità del sistema)

3 CONTROLLO DEL VOCABOLARIO: SCOMPOSIZIONE Possono essere accolti come termini di indicizzazione: sostantivi singoli (termini semplici) sintagmi nominali (termini composti) Sintagma nominale: locuzione composta da un sostantivo (focus o testa) seguito da aggettivi o altri sostantivi (differenza o modificatore) che restringono il significato del sostantivo di testa Non dovrebbero essere accolti come singoli termini di indicizzazione, ma andrebbero scomposti e riespressi con più termini, i sintagmi nei quali: il focus indichi un materiale, una proprietà o una parte dellentità rappresentata dalla differenza il focus indichi unazione transitiva (o lagente di unazione transitiva) il cui oggetto è espresso dalla differenza il focus indichi unazione il cui agente è espresso dalla differenza

4 CONTROLLO DEL VOCABOLARIO: SINGOLARE E PLURALE Principio della numerabilità al plurale: termini che rappresentano entità numerabili al singolare: termini che rappresentano entità non numerabili categorie plurali categorie singolari aree geografiche attività, processi, discipline avvenimenti credenze e sistemi ideologici istituzioni materiali e sostanze oggetti proprietà, condizioni, caratteristiche organismi viventi parti uniche di organismi parti plurime di organismi Lappartenenza ad una categoria plurale o singolare è un criterio di riferimento e di verifica, ma non prevale sul principio della numerabilità; ne consegue che alcuni termini, pur appartenendo ad una categoria plurale, dovranno essere accolti nel vocabolario in forma singolare, e viceversa

5 CONTROLLO DEL VOCABOLARIO: NOMI PROPRI La forma preferita dei nomi propri deve corrispondere alla forma corretta e prevalente nellespressione in lingua naturale, sia per quanto attiene al numero, sia per quanto attiene alla grafia e alleventuale abbreviazione per sigla; linversione degli elementi componenti un nome proprio è di norma ammessa solo per i nomi propri di persona, in presenza di un cognome che è presumibile costituisca lelemento di accesso più certo. Lunicità del catalogo, ed in particolare del catalogo informatizzato, impone unapplicazione assoluta e generale del principio di uniformità; ne consegue che in tutti i tipi di indicizzazione (per soggetto, per autori, per opere, ecc.) va impiegata, per ogni nome proprio, la medesima forma.

6 CONTROLLO DEL VOCABOLARIO: POLISEMI E OMOGRAFI Per il principio di univocità non possono essere ammesse come termini di indicizzazione le forme verbali che abbiano più significati (polisemi). Qualora concetti diversi siano espressi in lingua naturale con sostantivi o sintagmi di identica forma grafica (omografi), questi sostantivi o sintagmi, per essere ammessi nel vocabolario di indicizzazione, debbono essere tra loro formalmente distinti (disambiguati), in modo che a ciascuna forma grafica corrisponda un solo significato. Metodo tipico di disambiguazione è linserimento nel termine di indicizzazione, dopo il sostantivo o sintagma polisemo, di un ulteriore sostantivo o sintagma, posto tra parentesi, che ne distingua e individui il significato. Come elemento disambiguante va di norma utilizzato il termine che nel medesimo vocabolario indica la classe di appartenenza del concetto da designare.

7 CONTROLLO DEL VOCABOLARIO: RELAZIONI SEMANTICHE relazione di equivalenza: tra termini di uguale significato Relazioni semantiche: relazione gerarchica: le relazioni di significato tra termini di significato affine, che sussistono tra i ma di diversa estensione termini accolti nel vocabolario relazione associativa: tra termini il cui significato si interseca Perché sia stabilita ed espressa nel vocabolario una relazione semantica tra due termini è necessario e sufficiente che uno dei due termini sia indispensabile a definire laltro, o ne condivida la definizione (criterio definitorio). Poiché non dipendendo dalla compresenza dei termini in un enunciato, le relazioni semantiche sono dette a priori.

8 CONTROLLO DEL VOCABOLARIO: RELAZIONE DI EQUIVALENZA La relazione tra il termine da impiegare costantemente nellindicizzazione dei documenti (termine preferito) e gli eventuali altri sostantivi e sintagmi di significato equivalente (sinonimi e quasi sinonimi), che, per il principio di uniformità, non possono essere impiegati nelle voci dindice (termini non preferiti), ma dai quali deve essere comunque possibile iniziare la consultazione dellindice (termini di accesso) simboli standard: USE UF

9 CONTROLLO DEL VOCABOLARIO: RELAZIONE GERARCHICA simboli standard: BT NT Genere / specie (relazione generica): le caratteristiche logiche che definiscono linsieme (genere) sono tutte presenti nella definizione di ognuno dei sottoinsiemi (specie), unite ad almeno una ulteriore caratteristica, diversa e distintiva per ciascuna specie Classe / individuo (relazione esemplificativa): le caratteristiche che definiscono la classe sono tutte possedute dal singolo individuo (nome proprio) Intero / parte (relazione partitiva): la parte è componente costante dellintero, lintero è ambito di appartenenza esclusivo della parte (parti di organismi, aree geografiche, discipline, strutture sociali) La relazione tra un termine che designa un insieme (termine sovrordinato) e i termini che indicano i sottoinsiemi o i singoli individui che compongono quellinsieme (termini subordinati). La relazione gerarchica sussiste solo tra termini appartenenti alla stessa categoria.

10 CONTROLLO DEL VOCABOLARIO: RELAZIONE ASSOCIATIVA La relazione tra termini che, pur non legati da una relazione di equivalenza o gerarchica, hanno tuttavia significato o fortemente correlato, essendo luno di norma necessario alla definizione dellaltro, o parzialmente coincidente simboli standard: RT Termini appartenenti alla medesima categoria: - contrari - quasi sinonimi non ritenuti equivalenti Termini appartenenti a categorie distinte: - attività / oggetto - attività / agente o strumento, o agente contrario - azione / prodotto - strumento / oggetto - proprietà / possessore

11 SOGGETTI SEMPLICI E SOGGETTI COMPOSTI Soggetti semplici: i temi definiti esaustivamente da un unico concetto, e che quindi possono essere espressi con precisione mediante un unico termine di indicizzazione Soggetti composti: i temi definiti dalla correlazione logica di più concetti, e che quindi possono essere espressi con precisione solo formulando un enunciato contenente più termini Lindicizzazione precoordinata dei soggetti composti comporta il riconoscimento delle relazioni logico-funzionali tra i concetti che definiscono il tema (relazioni sintattiche), e la loro espressione mediante lordinamento normalizzato e la connessione formale dei termini allinterno della stringa di soggetto (sintassi)

12 SINTASSI: ORDINE DI CITAZIONE E CONNETTIVI Ordine di citazione: la successione dei singoli termini allinterno della stringa di soggetto; tale successione deve realizzare sia il requisito dellespressività (deve cioè rappresentare le relazioni logico-funzionali tra i concetti che definiscono il tema indicizzato), sia il requisito della predittività, e deve essere quindi regolata da norme generali coerenti e costanti Connettivi: preposizioni e congiunzioni, o locuzioni con funzione analoga, introdotte nella stringa al fine di evitare ambiguità nellinterpretazione delle relazioni sintattiche tra i concetti che definiscono il tema

13 SINTASSI: PRINCIPIO DELLA RELAZIONE UNO A UNO non deve essere citato nessun altro concetto tra due concetti la cui relazione sintattica sia diretta e in sé esplicita se la relazione sintattica tra due concetti è mediata e resa esplicita da un terzo concetto, questo terzo concetto deve essere citato tra gli altri due Il principio della relazione uno a uno è fondamentale e imprescindibile, poiché garantisce lintelligibilità ed una effettiva strutturazione logica delle stringhe; esso impone che tra i concetti che definiscono un tema siano citati in immediata successione quelli legati da un più stretto nesso logico- funzionale, in modo che siano preservate ed evidenziate le relazioni dirette (uno a uno) che sussistono tra loro. Questo principio, essendo parimenti attuato in successioni esattamente inverse dei medesimi termini, non è però sufficiente a realizzare il requisito della predittività nellordine di citazione.

14 SINTASSI: ANALISI CATEGORIALE 1.Categorie sintattiche: serie di categorie logico-funzionali generali, alle quali i singoli concetti sono riferiti non in assoluto, ma solo in relazione alla funzione logica assunta nella definizione di un determinato tema, e quindi limitatamente alla loro presenza nel corrispondente enunciato di soggetto 2.Norme: regole generali per la sintassi delle stringhe di soggetto, riferite non ai singoli termini o a tipi di soggetti, ma alle categorie sintattiche 3.Analisi: riconoscimento delle relazioni sintattiche che definiscono un tema e della funzione logica assunta da ciascun concetto coinvolto in quelle relazioni, individuazione della categoria sintattica corrispondente a ciascuna funzione, e citazione dei singoli concetti nella stringa secondo quanto stabilito per la categoria sintattica cui ognuno è assegnato Il metodo dellanalisi categoriale permette un controllo e unespressione delle relazioni sintattiche coerente (predittività del sistema) ed efficiente (efficacia ed economicità del sistema)

15 SINTASSI: RELAZIONE TRANSITIVA oggetto/meta: il concetto che nellenunciato subisce o riceve lattività concetto transitivo: attività, proprietà o entità che agisce sulloggetto/meta, che è diretta verso loggetto/meta beneficiario: il concetto destinatario dellattività esercitata sulloggetto/meta agente strumento La relazione logico-funzionale tra unattività e/o unentità agente, e lentità che subisce o riceve lattività Alla relazione transitiva corrispondono le seguenti categorie sintattiche: In presenza di una relazione transitiva lordine di citazione è determinato dal principio della dipendenza dalloggetto/meta, che stabilisce che la stringa di soggetto inizi con il termine che rappresenta loggetto/metà, seguito dagli altri termini, ordinati secondo il principio della relazione uno a uno

16 SINTASSI: RELAZIONE DI APPARTENENZA intero/possessore: il concetto cui è riferita la parte/proprietà, che ne rappresenta lambito di appartenenza parte/proprietà: lentità o la caratteristica appartenente o attribuita allintero/possessore, compresa, in assenza di un oggetto/meta, lattività pertinente al possessore La relazione logico-funzionale tra un unentità, concreta o astratta, e una sua componente o caratteristica Alla relazione di appartenenza corrispondono le seguenti categorie sintattiche: In presenza di una relazione di appartenenza, lordine di citazione è determinato dal principio della dipendenza dallintero/possessore, che stabilisce che la stringa di soggetto inizi con il termine che rappresenta lintero/possessore, seguito dagli altri termini, ordinati secondo il principio della relazione uno a uno

17 SINTASSI: NUCLEO E RELAZIONI COMPLEMENTARI luogo: territorio o località tempo forma intellettuale: aspetti particolari del tema, approccio generale o disciplinare caso: esemplificazione particolare di quanto espresso nel tema destinazione/forma bibliografica forma materiale Nucleo del soggetto: tra i concetti che definiscono un tema, linsieme di quelli coinvolti in una relazione transitiva o di appartenenza, o, quando la definizione del tema non presenti tali relazioni, il singolo concetto che rappresenta la componente semantica fondamentale della definizione del tema Relazioni complementari: le differenti relazioni logico-funzionali tra il nucleo del soggetto e gli eventuali altri singoli concetti che indicano una limitazione spaziale o temporale del tema espresso nel nucleo, o ne contestualizzano la trattazione Alle relazioni complementari corrispondono le seguenti categorie sintattiche, citate, di norma, in questordine:


Scaricare ppt "IL VOCABOLARIO DI INDICIZZAZIONE nellindicizzazione verbale Linsieme controllato e strutturato dei termini (termini di indicizzazione) selezionati dalla."

Presentazioni simili


Annunci Google