informatica di base per le discipline umanistiche vito pirrelli Istituto di Linguistica Computazionale CNR Pisa Dipartimento di linguistica Università di Pavia
prima lezione introduzione: computer e linguaggio vito pirrelli Istituto di Linguistica Computazionale CNR Pisa Dipartimento di linguistica Università di Pavia
schema del corso 30 ore di lezione 20 ore di esercitazione una verifica scritta (per 10 punti complessivi) esame orale (rimanenti 20 punti) lezione 1
orari lezioni esercitazioni (a partire dal 18 marzo) lunedì: 16.45 - 18.30 (aula L2) martedì: 9.15 - 10.45 (aula L2) esercitazioni (a partire dal 18 marzo) martedì: 15 - 16.45 (aula L3) ricevimento studenti martedì: 11.30 – 13.30 Dipartimento di Linguistica lezione 1
servizi web mailing list del corso per iscriversi: http://mail.ilc.cnr.it/mailman/listinfo/informatica_unipv sito web del corso: http://webilc.ilc.cnr.it/~pirrelli contiene descrizione del corso presentazioni delle lezioni letture consigliate altro materiale utile lezione 1
si richiedono ... nozioni di linguistica teorica di base (elementi di morfologia e sintassi) familiarità col computer come strumento di base per la casa/ufficio: sistema operativo a finestre gestione cartelle creazione e gestione di documenti testo (word processing), creazione e gestione di documenti di dati non testuali (fogli elettronici, database), navigazione del web con un browser lezione 1
non si richiedono ... familiarità con l’architettura concettuale e funzionale di un computer familiarità con infrastrutture hardware e software familiarità con un linguaggio di programmazione (Pascal, C, C++, Java ecc.) nozioni di base di linguistica computazionale familiarità con applicazioni del computer al trattamento automatico del testo (correttori grammaticali, correttori di stile, strumenti per le concordanze ecc.) lezione 1
si vuole offrire... familiarità con l’architettura concettuale e funzionale di un computer familiarità con infrastrutture hardware e software nozioni di base di linguistica computazionale operazioni di base del calcolatore sul testo alcuni esempi d’uso di queste operazioni riflessioni metodologiche lezione 1
non si offriranno... nozioni di programmazione dettagli sui modelli e sui metodi per il trattamento automatico del linguaggio (NLP) competenze specifiche per l’uso di software commerciale lezione 1
le domande a cui saprete rispondere ... su che tipo di dati linguistici il calcolatore è in grado di operare? quali operazioni è capace di eseguire su questi dati? come si organizzano queste operazioni e quali problemi possono ragionevolmente aiutarci a risolvere? che cosa vuol dire analizzare un testo al computer e in che misura il computer può migliorare la nostra comprensione di un testo? quale impatto ha avuto la tecnologia informatica sulle discipline umanistiche e sul modo in cui oggi studiamo il linguaggio? lezione 1
schema del corso Parte prima: Introduzione - computer e linguaggio Parte seconda: Il testo in formato digitale (per saperne di più clicca sulle icone!) lezione 1
parte prima: introduzione computer e linguaggio Cos’è un computer? Come funziona? Il linguaggio e il computer: “calcolatrice” o “cervello elettronico”? lezione 1
parte seconda: il testo in formato digitale Le parole come numeri elementi strutturali del testo ortografico il corpus l’analisi linguistica del testo: livelli di annotazione XML archivi elettronici testuali e lessicali lezione 1
(parte terza: computer e cervello) acquisizione di informazione linguistica da basi di dati testuali le parole come stimoli il linguaggio e il tempo: apprendimento e mutamento lezione 1
durata del corso il corso consiste di un modulo unico di 50 ore complessive (tra lezioni frontali e esercitazioni) che si articola tra il terzo e quarto trimestre i primi appelli di esame utili sono quelli relativi al quarto trimestre lezione 1
computer e discipline umanistiche perché? per imparare a usare il computer per studiare usando il computer corsi multimediali ricerche sul www ricerche su archivi digitali ricerche su insiemi di dati non strutturati ... per comunicare usando il computer creare un ipertesto creare un sito web strutturare un percorso didattico o narrativo per e-learning lezione 1
computer e discipline umanistiche (continua…) perché? per fare ricerca usando il computer potenziando i nostri strumenti: creare e consultare basi di dati acquisire nuovi dati da materiale non strutturato strutturare il materiale acquisito fare esperimenti su grandi quantità di dati attraverso analisi e simulazioni... rielaborando i nostri concetti: impatto delle tecnologie informatiche sul modo in cui oggi guardiamo al linguaggio per crearsi una “nuova professione” MERCATO DEL LAVORO Un laureato in Informatica umanistica possiede competenze richieste nei seguenti settori: web agencies (scrittura professionale + capacità di “messa in forma” di contenuti per il web + editing + grafica-elaborazione di immagini); case editrici e agenzie redazionali multimediali (scrittura professionale + capacità di “messa in forma” multimediale di contenuti + grafica-elaborazione di immagini); giornalismo on line (scrittura professionale + competenza multimediale); aziende produttrici di software (interfaccia uomo-macchina, usability); aziende localizzatrici di software (conoscenze informatiche + conoscenze linguistiche + scrittura professionale); aziende operanti nella “industria delle lingue” (linguistica computazionale); biblioteche e musei (biblioteche digitali + information retrieval + elaborazione di immagini, grafica); scuole di ogni genere e grado (e-learning = applicazione di tecnologie dell’informazione e della comunicazione ai processi di apprendimento); agenzie di formazione professionale (e-learning); università (e-learning, management didattico); università e centri di ricerca (basi dati per progetti di ricerca, biblioteche digitali, information retrieval); grandi aziende: formazione del personale (e-learning); grandi aziende: comunicazione interna ed esterna (scrittura professionale + capacità di “messa in forma” di contenuti per il web); amministrazioni lezione 1
computer e discipline umanistiche come? creando e consultando basi di dati testuali digitalizzati navigando sul web per reperire nuovi materiali “annotando” automaticamente dati testuali non strutturati utilizzando strumenti software commerciali traduttori automatici correttori automatici classificatori automatici editor multimediali motori di ricerca interfacce uomo-macchina ipertesti sviluppando nuovi strumenti software lezione 1
computer e discipline umanistiche in che ambiti disciplinari? linguistica computazionale trattamento automatico del linguaggio scritto trattamento automatico del linguaggio parlato stilo-statistica lessicografia computazionale filologia computazionale linguistica del corpus (corpus linguistics) biblioteche digitali didattica computerizzata (e-learning) ... lezione 1
computer e discipline umanistiche da quando? anni 50 primi esperimenti di traduzione automatica negli stessi anni, in Italia, a Gallarate, P. Busa lavora sulle prime concordanze dell’opera di S.Tommaso prodotte con calcolatori IBM impulso allo studio del linguaggio col computer dato dalla rivoluzione chomskyana (gerarchia di grammatiche) anni 60 Humanistic Text Processing Natural Language Processing anni 70 sviluppo parser/grammatiche di media copertura lezione 1
computer e discipline umanistiche (continua) da quando? anni 80 le “risorse linguistiche” anni 90 linguistica computazionale e “industria delle lingue” 2000-? linguistica computazionale e “contenuto digitale” lezione 1
mercato del lavoro ... agenzie web case editrici e agenzie redazionali multimediali giornalismo in linea (on-line) aziende produttrici di software aziende localizzatrici di software aziende operanti nella “industria delle lingue” biblioteche e musei scuole di ogni genere e grado agenzie di formazione professionale (e-learning); università e centri di ricerca grandi aziende amministrazioni http://compass.di.unipi.it/didattica/infouma/ lezione 1
linguaggio, mente e computer operazioni logico-matematiche apprendimento e uso modelli della facoltà linguistica linguaggio linguaggio come flusso di stimoli linguaggio come repertorio di dati discreti facoltà linguistica per saperne di più, clicca sul computer! lezione 1
il calcolatore: una definizione dispositivo elettronico programmabile finalizzato alla gestione delle informazioni hardware tutto quanto non possiamo trasmettere per telefono... software tutto quanto possiamo trasmettere per telefono... (per saperne di più clicca sulle parole evidenziate!) lezione 1
prima lezione introduzione: computer e linguaggio fine prima lezione (lezione 2)
gestione delle informazioni... (torna indietro…) gestione delle informazioni... raccolta, acquisizione archiviazione, conservazione elaborazione, trasformazione, produzione distribuzione, comunicazione, scambio lezione 1 (continua…)
il calcolatore: funzionalità di base ... (torna indietro…) il calcolatore: funzionalità di base ... per approfondire, lascia la lezione 1 per la 2 lezione 1
il calcolatore: modello architetturale ... (torna indietro…) il calcolatore: modello architetturale ... (per saperne di più clicca sulle icone!) lezione 1
(torna indietro…) la cpu è la parte "pensante" di ogni computer, costituita da un sottile cristallo di silicio. Su un processore (p.e. di un cm2) vengono impressi diodi, transistor e circuiti. Esegue le istruzioni ed elabora i dati dei programmi presenti nella memoria RAM e nei registri interni al processore. (per approfondire, lascia la lezione 1 per la 2) lezione 1
(torna indietro…) la memoria centrale la RAM (random access memory) o memoria centrale serve a memorizzare un programma in esecuzione o i dati in corso di elaborazione è l’unità di memoria con la quale interagisce la cpu attraverso i bus la memoria centrale è volatile, nel senso che i dati/programmi in essa contenuti vengono cancellati al termine dei processi di esecuzione/elaborazione e comunque non sopravvivono a computer spento... lezione 1
(torna indietro…) la memoria di massa lezione 1
le periferiche di input/output (torna indietro…) le periferiche di input/output lezione 1
(torna indietro…) i bus il bus di un computer è un insieme di collegamenti in rame localizzati sulla scheda madre che connettono tra loro tutti i dispositivi dell’elaboratore ... lezione 1
scheda libro (torna indietro…) titolo: Informatica di Base autori: Curtin D.P., Foley K., Sen K., Morin C. edizione: seconda anno: 2002 editore: McGraw-Hill costo: 29 euro capitoli rilevanti per il corso: (2), 3, 4, 5, 6, 8 lezione 1