La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Corso SPAD Roberto Galasso Università Federico II di Napoli Lezione I – Introduzione.

Presentazioni simili


Presentazione sul tema: "Corso SPAD Roberto Galasso Università Federico II di Napoli Lezione I – Introduzione."— Transcript della presentazione:

1 Corso SPAD Roberto Galasso Università Federico II di Napoli Lezione I – Introduzione

2 SPAD E’ un potente software di analisi statistica E’ un software specifico per l’analisi esplorativa di dati

3 Caratteristiche Metodi applicabili a dati numerici Metodi applicabili a dati testuali Caratteristiche operative: Procedure, moduli e file

4 I Moduli SPAD base Analisi univariata Analisi fattoriale Classificazione SPAD.D : Decision Regressione – analisi della varianza Modelli log-liniari Reti neurali SPAD.S : Segmentation Segmentazione e classificazione

5 I Moduli SPAD Tableaux Multiples : Consente di applicare tecniche di analisi Multy-way come l’analisi Fattoriale multipla SPAD Amado : Applica l’analisi dei dati utilizzando l’approccio grafico proposto da Bertin SPAD Question : Consente di predisporre questionari, impostando domande e modalità di risposta. SPAD.T : applica tecniche multidimensionali a dati testuali seguendo un approccio lessicometrico

6 La finestra principale

7 La finestra della filiera Per inserire il data-set fare doppio click sull’icona della base dati. I file associati ai database di SPAD sono i file.SBA Il nome del file apparirà affianco all’icona.

8 Metodi e filiere I metodi sono tutti i possibili “modelli” di analisi dei dati che SPAD permette di utilizzare Le filiere sono una serie di metodi concatenati.

9 Inserire filiere e metodi Per inserire una filiera predefinita è sufficiente fare click sul menu: Modèle  Filière prédéfinie N.B. È possibile inserire i metodi ad uno ad uno nella filiera, attraverso il menu Méthode  Insérer méthode. Approfondiremo questo sistema più avanti.

10 Inserire filiere e metodi Apparirà dunque una finestra dove è possibile scegliere tra le varie filiere predefinite suddivise in diversi gruppi. Per continuare il nostro esempio introduttivo sceglieremo la filiera predefinita per l’analisi delle corrispondenze multiple.

11 Inserire filiere e metodi Una volta inseriti i metodi, le icone risulteranno di colore grigio. Ciò vuol dire che i metodi non sono ancora eseguibili. Quando i metodi sono parametrizzati (sono state scelte le variabili di interesse, i parametri e le opzioni desiderate) essi divengono operativi e l’icona diverrà di colore giallo. Per scegliere i parametri di un metodo basta cliccare due volte sulla sua icona. I riquadri che contengono l’ordine dei metodi possono assumere tre colori : Bianco se il metodo non è stato parametrizzato Verde se il metodo è parametrizzato e verrà eseguito Rosso se il metodo è parametrizzato ma non verrà eseguito Facendo doppio click sul riquadro è possibile passare da verde a rosso

12 Finestra dei metodi Nelle finestre dei vari metodi solitamente è possibile selezionare le variabili su cui vogliamo effettuare l’analisi, modificare alcune opzioni e parametri. N.B. Le finestre relative ai parametri dei moduli possono essere molto diverse tra loro, vedremo poi, più approfonditamente, le finestre dei metodi più comuni.

13 Finestra dei metodi La selezione delle variabili avviene tramite questi tasti : Seleziona una variabile Seleziona tutte le variabili Deseleziona una variabile Deseleziona tutte le variabili La selezione e deselezione di una variabile è possibile anche tramite il doppio click del mouse su di essa N.B. In alcune finestre questi tasti potrebbero essere ruotati.

14 Salvare ed eseguire una filiera Per eseguire una filiera è necessario che essa sia stata antecedentemente salvata (menu Filière  Sauvegarder filière) I file associati alle filiere sono i file.FIL Dopo aver salvato la filiera è possibile eseguirla dallo stesso menu.

15 Gli output Una volta eseguita la filiera sarà possibile consultare gli output tramite le icone apparse affianco a quelle dei metodi Output numerici Output Grafici Riepilogo Output in Excel Facendo doppio click sulle icone sarà possibile entrare nelle finestre degli output

16 Gli output numerici Nella finestra degli output numerici sarà possibile consultare tutti gli output in un formato testuale. Sarà possibile esplorare tutti i tabulati con facilità, in quanto essi vengono organizzati in una struttura ad albero. Utilizzando questa icona sarà possibile visualizzare altri rami dell’albero Utilizzando questa icona sarà, invece, possibile nascondere la ramificazione Tramite questa icona è possibile allargare a tutto schermo i tabulati dei dati e nascondere l’albero. Facendo nuovamente click l’albero riapparirà

17 Gli output grafici Aperta la finestra dell’output grafico, per prima cosa bisogna aprire un nuovo grafico dal menu : Graphique  Noveau

18 Gli output grafici Una volta aperto il nuovo grafico sarà possibile scegliere cosa visualizzare. Sarà possibile visualizzare sullo stesso grafico sia individui che variabili. Per continuare, nel nostro esempio è stato scelto di visualizzare solo le variabili.

19 Gli output grafici Qui sotto vediamo come si presenterà il grafico. Per ora ci limiteremo a capire l’utilizzo delle sue opzioni principali.

20 Gli output grafici Vediamo dunque il funzionamento di alcune delle icone inerenti al grafico. Permette di selezionare e deselezionare, ad uno ad uno, i punti del grafico. Permette di selezionare tutti i punti del grafico interni o esterni ad una sezione definita con il mouse. Permette di deselezionare tutto.

21 Gli output grafici Permette di visualizzare l’etichetta associata ai punti selezionati. Nasconde l’etichetta associata ai punti selezionati. Nasconde i punti selezionati. Rende nuovamente visibili tutti i punti nascosti.

22 Gli output grafici Permette di visualizzare maggiori informazioni su un punto del grafico. (Coordinate sugli assi, contributo, distanza dall’origine, ecc.) Aggiorna e pulisce il grafico dopo eventuali modifiche Traslano simmetricamente, rispettivamente in verticale e orizzontale, il grafico Amplia una sezione di grafico, selezionata con il mouse

23 Corso SPAD Roberto Galasso Università Federico II di Napoli Lezione II – Importare i dati

24 Definizioni principali La tabella dei dati si distingue innanzitutto in :  Individui (le unità su cui viene effettuata l’indagine) – sulle righe  Variabili – sulle colonne SPAD distingue le variabili in :  Nominali (variabili qualitative) – sono definite mediante classificazione in categorie discrete, i valori sono definiti Modalità.  Continue (variabili quantitative) – sono misurate su una scala continua, sulla quale possono assumere un numero infinito di valori.

25 Etichette e codifiche  Ogni variabile dispone della possibilità di apporre un’etichetta di massimo 60 caratteri.  Le modalità delle variabili nominali possono avere una codifica breve di massimo 4 caratteri e una codifica estesa di massimo 20 caratteri  Ogni individuo dispone di un’etichetta di massimo 60 caratteri. Se questa non è stato definita al momento dell’importazione dei dati, SPAD utilizza una numerazione da 1 a N

26 I dati mancanti  Se un’unità campionaria risponde a molte domande, ma non a tutte, o se la risposta è giudicata non corretta e cancellata, si ha uno (o più) dati mancanti  In SPAD ai dati mancanti di una variabile nominale viene attribuito uno 0, mentre ai dati mancanti di una variabile continua viene attribuito un valore scelto dall’utente al momento dell’importazione dei dati (solitamente 999999).

27 Tipi di Importazione dati  Da file di testo delimitato o tabulato  Da file di testo in formato fisso  Da file SAS  Da file SPSS  Da file ODCB (formato per i database)

28 Importazione da file tabulato L’importazione da file di testo tabulato è il metodo più semplice per importare un file excel. Per prima cosa è necessario salvare il file excel con : File -> Salva con nome -> Testo(delimitato da tabulazione) Dopo di che seguiamo le seguenti operazioni: Base -> Importer -> Importation Ascii

29 Importazione da file tabulato Cliccando su Nouveau Apparirà una nuova finestra in cui è necessario inserire il nome della nuova importazione. Nell’esempio chiameremo la nuova importazione EXCEL Dopo aver cliccato su ok potremo scegliere il file.txt che vogliamo importare. Nell’esempio utilizziamo il file EXCEL.TXT presente tra le basi di SPAD

30 Importazione da file tabulato Formato del file importato Tipo di delimitazioneIndicatore dei decimali Opzioni sulle etichette

31 Importazione da file tabulato Una volta scelto il file sarà necessario associare ad ogni variabile un tipo. Dalla finestra sarà anche possibile inserire le etichette delle variabili e delle modalità delle stesse (Nel caso in cui esse non fossero presenti nella prima riga del file, SPAD assegnerà automaticamente le etichette C1,C2, …, CN)

32 Importazione da file tabulato Possiamo definire le variabili secondo i seguenti tipi :  Identificativa – Di solito assegnata alla colonna che identifica gli individui  Nominale – Da applicare a variabili nominali già codificate. Sono accettati solo valori positivi. Il numero di modalità sarà pari al numero più grande presente nella variabile.  Nominale con ricodifica – Da applicare a variabili nominali già codificate. Sono accettati solo valori positivi. Il numero di modalità sarà pari al numero più valori diversi presenti nella variabile  Alfabetica – Da applicare a variabili nominali espresse in caratteri alfanumerici.  Continua – i valori non numerici verranno considerati valori mancanti  Abbandonata – Se non si vuole importare la variabile

33 Importazione da file tabulato Una volta completata l’attribuzione di un tipo ad ogni variabile è possibile eseguire l’importazione e salvare il tutto in un file.SBA Dopo di che sarà sufficiente richiamare il file come visto in precedenza per iniziare la nostra indagine.

34 Importazione da file SPSS Per importare un file SPSS bisogna aprire l’editor dei dati di SPAD. Dalla barra degli strumenti : Base -> Nouvelle Base

35 Importazione da file SPSS Dalla finestra dell’editor dei dati: Fichier -> Fermer Poi Fichier ->Ouvrir Dalla finestra di esplora risorse scegliere di importare un file.SAV e poi il file SPSS che si desidera importare. Nel nostro caso è stato scelto il file GSS.SAV già presente nelle basi di dati di SPAD. Il file verrà inserito nell’editor di dati, dopo di che sarà sufficiente salvare il file in formato.SBA con l’opzione: Fichier ->Enregistrer sous

36 Importazione da file SPSS Ricordiamo che SPSS non fa la distinzione tra variabili nominali e continue come SPAD, per questo la distinzione in fase di importazione viene fatta da SPAD seguendo le seguenti regole: La variabili che contengono valori interi da 1 a 300 sono considerate nominali Tutte le altre variabili numeriche sono considerate continue, incluse tutte le variabili che contengano uno 0 I valori mancanti vengono tradotti automaticamente in un 0 per le variabili nominali e in 9999999 per le variabili continue Le variabili alfanumeriche non sono prese in considerazione nella conversione. Se si vuole che vengano convertite in variabili nominali utilizzare la funzione “Ranger automatiquement” nel menu Calcul.

37 L’Editor dei dati Vediamo ora l’utilizzo dell’editor dei dati. Come già visto in precedenza, possiamo entrare nell’editor dei dati dal menu: Base -> Nouvelle Base. L’icona “Var” apre la finestra delle variabili da dove è possibile inserire le variabili e definirle L’icona “Mod” apre la finestra della modalità dove è possibile inserire e definire le modalità delle singole variabili L’icona “Val” apre la finestra dei valori dove è possibile inserire i singoli valori per ogni individuo

38 L’Editor dei dati Nella Finestra della variabili abbiamo i campi : Ident – è l’etichetta breve della variabile (max 4 caratteri) Libel – è l’etichetta estesa della variabile (max 60 caratteri) Type – è la tipologia di variabile (T per testuale, N per nominale, C per continua) Min – è il valore minimo che può assumere la variabile, è modificabile per le variabili continue Max – è il valore massimo che può assumere la variabile. Per le variabili nominali è il numero delle modalità.

39 L’Editor dei dati Nella Finestra delle modalità abbiamo i campi : Ident – è l’etichetta breve della modalità (max 4 caratteri) Libel – è l’etichetta estesa della modalità (max 20 caratteri)

40 L’Editor dei dati Nella Finestra delle modalità abbiamo i campi relativi a tutte le variabili definite in precedenza. Dalle varie finestre descritte fin ora è possibile utilizzare le seguenti icone per : Aggiungere una riga prima di quella selezionata Aggiungere una riga dopo di quella selezionata Cancellare la riga in uso Cancellare le righe selezionate


Scaricare ppt "Corso SPAD Roberto Galasso Università Federico II di Napoli Lezione I – Introduzione."

Presentazioni simili


Annunci Google