La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Formati tipici dei dati

Presentazioni simili


Presentazione sul tema: "Formati tipici dei dati"— Transcript della presentazione:

0 Gestione dei dati di Progetto
2.1 Struttura dei dati SAS 2.2 Importazione di file di dati diversi dai file SAS 2.3 Accesso ai dati mediante librerie SAS

1 Formati tipici dei dati
Obiettivi Specificare la definizione di un data set SAS. Illustrare come sono memorizzati i dati in un data set SAS.

2 Formati tipici dei dati
SAS Enterprise Guide è in grado di leggere e utilizzare dati con formati diversi, inclusi i seguenti: Data set SAS Microsoft Excel e Access Tabelle DBMS File di testo HTML SPSS

3 Data set SAS Righe (osservazioni) Colonne (variabili)
Un data set SAS è una tabella rettangolare di righe e colonne. SAS Enterprise Guide fornisce origini dati per processi e query sotto forma di tabelle (un insieme di righe e colonne). Una riga è una occorrenza di una entità. Una entità può essere un prodotto, un cliente, una vendita o altro. Ogni colonna descrive una caratteristica dell'entità, come l’ID del prodotto, il nome del cliente o la quantità venduta Righe (osservazioni) Colonne (variabili)

4 I nomi possono avere una lunghezza variabile da 1 a 32 caratteri.
Data set SAS Tutte le colonne devono avere un nome, un tipo e una lunghezza. I nomi delle colonne iniziano con una lettera o un underscore includono soltanto lettere, underscore e numeri. Le etichette delle colonne possono avere una lunghezza massima di 256 caratteri I nomi possono avere una lunghezza variabile da 1 a 32 caratteri.

5 alfanumerici sono lunghi da 1 a
Data set SAS Il tipo di una colonna è alfanumerico (stringa) o numerico e influisce sulla sua lunghezza. I valori alfanumerici sono lunghi da 1 a caratteri (byte). I valori numerici sono 8 byte di memorizzazione in virgola mobile: Numerici Valuta Data (giorni da 01 gennaio 1960) Ora (secondi dalla mezzanotte)

6 Data set SAS Formato: MMDDYY Formato: DOLLAR Larghezza: 10
Un formato viene utilizzato per controllare il modo in cui i valori sono visualizzati senza influire sul modo in cui sono memorizzati. Formato: MMDDYY Larghezza: Valore memorizzato: Formato: DOLLAR Larghezza: Posizioni decimali: Valore memorizzato:

7 Formati Un formato di output (formato di visualizzazione) è un’istruzione che viene applicata a una colonna. Il formato indica a SAS Enterprise Guide come visualizzare i valori. I formati vengono utilizzati per controllare l’aspetto dei valori o per raggruppare i valori per l’analisi. Un formato di input (formato di lettura) è un’istruzione che SAS Enterprise Guide utilizza per leggere i valori in una variabile. Per esempio, il seguente valore contiene un segno di dollaro e virgole: $1,000,000 Per rimuovere il segno di dollaro ($) e le virgole (,) prima di memorizzare il valore numerico in una variabile, leggere questo valore con il formato di input DOLLAR10. .

8 Formati

9 Quiz Quale dei seguenti attributi delle variabili non è obbligatorio?
Nome Tipo Lunghezza Formato

10 Quiz - Risposta Corretta
Quale dei seguenti attributi delle variabili non è obbligatorio? Nome Tipo Lunghezza Formato

11 Proprietà del data set SAS
La visualizzazione delle proprietà di un data set consente di esaminare gli attributi del data set e delle colonne.

12 Proprietà del data set SAS
Gli attributi di un data set SAS sono memorizzati nelle proprietà e includono: • il nome del data set • il percorso di memorizzazione • la data dell’ultima modifica • tutti gli attributi delle colonne (come nome, tipo e lunghezza) • il numero di righe e colonne • il server su cui risiedono i dati. Per visualizzare le proprietà di un’origine dati, fare clic con il pulsante destro del mouse sull’elemento nella Struttura del progetto o nel Flusso dei processi e selezionare Proprietà... dal menu. Nella documentazione SAS, si parla delle proprietà di un data set come della parte descrittiva.

13 Quiz Fare clic con il pulsante destro sul data set employee_organization nel progetto e selezionare Proprietà  Colonne. Qual è la lunghezza della variabile Job_Title? 8 9 25 40 Type answer here

14 Quiz – Risposta Corretta
Fare clic con il pulsante destro sul data set employee_organization nel progetto e selezionare Proprietà  Colonne. Qual è la lunghezza della variabile Job_Title? 8 9 25 40 Type answer here

15 Valori mancanti Un valore non presente in una specifica riga di una colonna viene considerato come mancante. Un valore alfanumerico mancante è visualizzato come spazio. Un valore numerico mancante è visualizzato come punto. .

16 2.2 Importazione di file di dati diversi dai file SAS
Importazione di dati 2.1 Struttura dei dati SAS 2.2 Importazione di file di dati diversi dai file SAS 2.3 Accesso ai dati mediante librerie SAS

17 Importazione di dati OBIETTIVI
Importare un foglio di lavoro Excel e creare un data set SAS. Importare un file di testo a larghezza fissa e creare un data set SAS. Visualizzare le proprietà dei dati. SCENARIO Orion contiene un file Microsoft Excel denominato products e un file di testo a larghezza fissa denominato orders. Per utilizzare tali file in SAS Enterprise Guide, bisogna prima importarli.

18 Importazione di dati Quando si aggiunge un data set SAS a un progetto, SAS Enterprise Guide può subito aprire e leggere i dati. Viene aggiunto al progetto un collegamento ai dati.

19 Quiz Selezionare File  Apri  Dati e posizionarsi nel percorso dei dati del corso. Che cosa succede quando si apre il file Excel products? Type answer here

20 Quiz – Risposta corretta
Selezionare File  Apri  Dati e posizionarsi nel percorso dei dati del corso, se necessario. Che cosa succede quando si apre il file Excel products? Si apre automaticamente il processo Importa dati. Type answer here

21 Importazione di dati non in un data set SAS
La procedura guidata Import Data può essere usata per leggere file di testo, HTML, PC-base (inclusi Microsoft Excel e Microsoft Access) e per creare dataset SAS.

22 Passo 1: Specificare i dati
Il primo passo consiste nel confermare l’origine dati e specificare nome e percorso del data set SAS di output. Si può modificare la libreria predefinita selezionando Strumenti – Opzioni - Libreria di output Verificare il file da importare. Cambiare il nome e il percorso (Libreria) del data set SAS di output.

23 Passo 2: Selezionare l’origine dati
Quando si leggono dati strutturati come Microsoft Excel o Access, scegliere il foglio dati da leggere e indicare se la prima riga contiene i nomi dei campi. L’opzione Rinomina colonne rispettando convenzioni di denominazione SAS può convertire i nomi delle colonne secondo le seguenti regole: i nomi devono iniziare con una lettera o un carattere di sottolineatura. I caratteri successivi possono essere lettere, cifre o caratteri di sottolineatura. i nomi non possono contenere spazi, caratteri speciali, fatta eccezione per il carattere di sottolineatura.

24 Passo 2: Selezionare l’origine dati
Quando si leggono dati non strutturati come un file di testo, scegliere il formato del testo e indicare la modalità di suddivisione delle colonne.

25 Quiz Se viene selezionata l’opzione Rinomina colonne per rispettare convenzioni SAS per i nomi, quali intestazioni di colonne vengono modificate nel data set importato? Product_Category Product Name Discount% Supplier-Country Type answer here

26 Quiz – Risposte corrette
Se è selezionata l’opzione Rinomina colonne per rispettare convenzioni SAS per i nomi, quali intestazioni di colonne vengono modificate nel data set importato? Product_Category Product Name Discount% Supplier-Country Gli spazi e i simboli speciali vengono sostituiti da un carattere di sottolineatura. Type answer here

27 Passo 3: Definire gli attributi di campo
Definire gli attributi per le colonne incluse nel data set SAS importato. Per cambiare gli attributi di più variabili, tenere premuto il tasto CTRL e selezionare le righe da modificare. Dopo aver selezionato le righe, fare clic su Modifica; viene visualizzata la finestra di dialogo Attributi di campo per selezioni multiple. Specificare in questa finestra di dialogo gli attributi da modificare. È possibile specificare un solo valore per ogni attributo. Dopo avere selezionato OK, il valore di tale attributo viene visualizzato in tutti i campi selezionati.

28 Passo 4: Opzioni avanzate
Selezionare qualsiasi opzione avanzata necessaria.

29 Passo 4: Opzioni avanzate
Includi dati nel codice SAS generato. Utilizzare questa opzione se si desidera una versione statica del file da importare o se il progetto verrà condiviso con altri che non hanno accesso al file esterno. Selezionando questa opzione i dati vengono inclusi nel programma SAS memorizzato nel progetto che è stato utilizzato per creare il data set SAS. Se non si seleziona questa opzione, il processo Importa dati accede ai dati del codice SAS generato tramite un collegamento al file esterno. Importa dati utilizzando SAS/ACCESS Interface to PC Files se possibile. Per importare i dati utilizzando SAS/ACCESS Interface to PC File Formats, selezionare la casella di controllo. Questa opzione descrive il codice della PROC IMPORT per importare il file. Il codice può essere salvato ed eseguito in altri ambienti SAS diversi da SAS Enterprise Guide. Rimuovi caratteri che possono causare errori di trasmissione dai file di dati di testo. Selezionare questa opzione per rimuovere i caratteri che potrebbero causare errori di trasmissione. È possibile selezionare questa opzione se si importa un file contenente caratteri con un’impostazione internazionale e il server non supporta questo tipo di carattere. Supponiamo, ad esempio, di importare un file di Microsoft Excel contenente caratteri giapponesi. Poiché l’impostazione internazionale per il server è Francese, alcuni caratteri giapponesi non vengono riconosciuti.

30 Importazione dei risultati
Viene creato il nuovo data set SAS che è accessibile da Struttura del progetto o da Flusso dei processi.

31 Aggiornamento dei risultati
La procedura guidata Importa dati può essere rieseguita o modificata dalla scheda Dati di output. Usare il pulsante per aggiornare il data set di output. Usare Modifica processo per riaprire la procedura guidata Importa dati e apportare le modifiche.

32 Demo L2_A Questa demo illustra come importare un file Microsoft Excel e un file di testo a larghezza fissa per creare data set SAS.

33 Quiz Che cosa si seleziona per apportare una modifica nel processo Importa dati, come cambiare il nome della prima variabile? Type answer here

34 Quiz – Risposta corretta
Che cosa si seleziona per apportare una modifica nel processo Importa dati, come cambiare il nome della prima variabile? Modifica processo Type answer here

35 Esercizio 1 Creazione di un nuovo data set SAS da un foglio di lavoro Excel Aggiungere il foglio di lavoro Addresses dalla cartella di lavoro Excel employee_info. a. Creare un nuovo progetto. Utilizzare la procedura guidata Importa dati per aprire la cartella di lavoro Excel employee_info e creare un nuovo data set SAS denominato employee_addresses. b. Leggere i dati dal foglio di lavoro Addresses e indicare che la prima riga contiene i nomi delle variabili. c. Cambiare il tipo della variabile Postal_Code in Stringa. Analizzare tutti i valori nella colonna per determinare una lunghezza appropriata. d. Modificare ogni etichetta per sostituire i caratteri di sottolineatura con spazi. e. Finire la procedura guidata Importa dati e visualizzare il data set. f. Rinominare il processo Importa dati in Importazione guidata employee_info. g. Salvare il progetto come Lezione_2 nel vostro percorso locale.

36 Esercizio 2 Importazione di un file di testo delimitato in un nuovo data set SAS Il file employee_payroll.csv è un file di testo delimitato da virgole. La prima riga del file di testo contiene nomi per le variabili del nuovo data set SAS. Gli apici sono rimossi automaticamente quando il file viene importato. a. Nel progetto Lezione_2, importare i dati nel file employee_payroll.csv per creare un nuovo data set SAS. b. Chiamare il nuovo data set SAS employee_payroll e indicare che il file è delimitato da virgole. c. Non includere le colonne per Marital_Status e Dependents. d. Cambiare il tipo di Employee_ID in Numero. e. Cambiare il tipo di Salary in Valuta. f. Cambiare il formato di output di Birth_Date in un formato Giorno-Mese-Anno (per esempio, ) con una visualizzazione dell’anno a quattro cifre e, per Salary, con un formato valuta senza posizioni decimali. Suggerimento: utilizzare il formato DDMMYYDw.d con una larghezza totale di 10. g. Modificare ogni etichetta per sostituire i caratteri di sottolineatura con spazi. h. Finire la procedura guidata Importa dati e visualizzare i dati nel nuovo data set. i. Rinominare il processo Importa dati in Importazione guidata employee_payroll. Salvare il progetto Lezione_2.

37 Esercizio 3 Visualizzazione di un data set nella griglia dei dati
Quando si visualizza un’origine dati esistente in SAS Enterprise Guide, si utilizza la griglia dei dati. Nella griglia dei dati è possibile cercare uno specifico valore o nome di variabile e bloccare, nascondere o spostare colonne mentre si visualizzano i dati. a. Nel progetto Lezione_2, aggiungere il data set SAS employee_master. b. Utilizzare l’opzione Trova del menu Modifica per cercare Warehouse Manager nella colonna Job_Title. c. Bloccare la variabile Employee_ID sul lato sinistro della finestra in modo che resti visibile quando si scorre verso destra. Fare clic con il pulsante destro del mouse su specifiche variabili per visualizzare le opzioni. d. Nascondere le variabili Salary e Birth_Date. e. Liberare la variabile Employee_ID (o rimuoverne il blocco) e mostrare le variabili precedentemente nascoste. f. Spostare la variabile Manager_ID in modo che appaia a destra di Employee_Name. Spostare la variabile non cambia l’ordine delle variabili nel data set, cambia soltanto l’ordine di visualizzazione nella griglia dei dati. g. Chiudere la griglia dei dati.

38 Esercizio 4 Modifica del codice del passo di DATA generato per estrarre dati Obiettivo: modificare il codice generato dal processo Importa dati per estrarre il data set e includere soltanto i dipendenti ancora assunti che non hanno una data di cessazione del rapporto di lavoro. b. Fare clic con il pulsante destro del mouse sull’icona Import Employee Payroll nella finestra Struttura del progetto o Flusso dei processi e selezionare Aggiungi come template di codice. c. Modificare il programma SAS in modo che il nome del data set sia Employee_Payroll_Active. d. Aggiungere un’istruzione IF di estrazione al codice per includere soltanto i dipendenti con un valore mancante per Employee_Term_Date. e. Modificare il codice in modo che la variabile Employee_Term_Date non sia inclusa nel data set di output utilizzando il comando DROP. f. Sottomettere il codice per l’esecuzione e visualizzare i dati nel nuovo data set. Quante sono le osservazioni? Quante le variabili? E di che tipo?

39 2.3 Accesso ai dati mediante librerie SAS
2.1 Struttura dei dati SAS 2.2 Importazione di file di dati diversi da file SAS 2.3 Accesso ai dati mediante librerie SAS

40 Accesso trasparenti ai dati remoti
Obiettivi Identificare le origini dati remote. Accedere a un server remoto. Aggiungere dati remoti a un progetto.. Scenario L’azienda Orion Star desidera utilizzare SAS Enterprise Guide per accedere a una tabella DBMS* su un server per visualizzare informazioni sugli ordini dei clienti. *DBMS è l’acronimo di Database Management System

41 Accesso trasparenti ai dati remoti
UNIX Utente locale Mainframe z/OS Server Windows

42 Libreria SAS Librerie SAS
Una libreria SAS è una raccolta di file definiti, riconosciuti e accessibili da SAS. Le librerie possono essere usate per accedere a dati SAS o DBMS. Esempio: la libreria ORION può essere definita per fare riferimento a tutti i data set SAS contenuti nel percorso di rete

43 Apertura di file da un server SAS
La finestra di dialogo Apertura di Dati consente di accedere a file da server su cui è installato e configurato SAS per funzionare con SAS Enterprise Guide. L’icona Librerie consente di accedere a cartelle già definite contenenti origini dati SAS o DBMS. L’icona File consente di accedere alle directory disponibili sul server.

44 Accesso ai dati mediante server SAS
Il riquadro Risorse consente di visualizzare e accedere a tutti i file e origini dati disponibili. Le Cartelle SAS sono usate nella piattaforma per SAS Business Analytics.

45 Quiz Selezionare Visualizza -> Elenco dei server o scegliere l’icona Elenco dei server nel riquadro Risorse sotto la Struttura del progetto. Espandere Server-> nome del server-> Librerie. Quali librerie sono elencate? Type answer here

46 Quiz – Risposta corretta
Selezionare Visualizza -> Elenco dei server o scegliere l’icona Elenco dei server nel riquadro Risorse sotto la Struttura del progetto. Espandere Server-> nome del server-> Librerie. Quali librerie sono elencate? Risposte possibili: Work , Sashelp, Sasuser, EGTASK, MAPS, MAPSSAS, MAPSGFK Type answer here

47 Quiz Nella finestra Elenco dei server, espandere l’icona File.
Che cosa viene elencato? Type answer here

48 Quiz – Risposta corretta
Nella finestra Elenco dei server, espandere l’icona File. Che cosa viene elencato? La struttura dei file del server Type answer here

49 Definizione di librerie SAS
Le librerie SAS sono generalmente definite dall’amministratore SAS. Tuttavia, la procedura guidata Assegna libreria di progetto può essere usata per definire librerie a SAS su cui si ha l’autorizzazione in lettura.

50 Accesso ai dati remoti Dopo avere aggiunto un’origine dati, per impostazione predefinita, il progetto si apre automaticamente nella griglia dei dati. Per impedire che un’origine dati si apra automaticamente quando viene aggiunta a un progetto, disabilitare l’opzione selezionando Strumenti - Opzioni Generali dei dati e deselezionandola casella di controllo Apri automaticamente i dati quando sono aggiunti al progetto.

51 Esercizio 1 Definire una libreria di progetto e aggiungere un data set al progetto mediante la definizione della libreria. Usare il processo Assegna libreria di progetto per creare la libreria ORION e puntare al percorso dei dati del corso. (Scegliere Strumenti  Assegna libreria di progetto….) In Elenco dei server, visualizzare la libreria ORION. Se la libreria o i data set non sono visualizzati, fare clic con il pulsante destro su Server e selezionare Aggiorna. In Elenco dei server, fare clic con il pulsante destro sulla tabella travel_expenses e scegliere Copia. Fare clic con il pulsante destro sulla libreria Work e scegliere Incolla. Nella libreria Work, fare clic con il pulsante destro sulla tabella travel_expenses per aggiungerla al progetto

52 Quiz Fare clic con il pulsante destro su travel_expenses nella finestra Flusso dei processi o Struttura del progetto e selezionare Elimina. La tabella viene eliminata dalla libreria?  Sì  No

53 Quiz Fare clic con il pulsante destro su travel_expenses nella finestra Flusso dei processi o Struttura del progetto e selezionare Elimina. La tabella viene eliminata dalla libreria?  Sì  No Soltanto il collegamento viene rimosso dal progetto, mentre la tabella rimane nella libreria.

54 Quiz Fare clic con il pulsante destro su travel_expenses sotto la libreria Work in Elenco dei server e selezionare Elimina. Si può eliminare la tabella?  Sì  No

55 Quiz Fare clic con il pulsante destro su travel_expenses sotto la libreria Work in Elenco dei server e selezionare Elimina. Si può eliminare la tabella?  Sì No Se si ha accesso in scrittura a una libreria e ai data set in essa contenuti, è possibile spostare, copiare ed eliminare file in Elenco dei server. Prestare attenzione perché tali azioni non possono essere annullate!

56 Quiz Fare clic con il pulsante destro su travel_expenses sotto la libreria ORION in Elenco dei server e selezionare Elimina.Si può eliminare la tabella?  Sì No

57 Quiz Fare clic con il pulsante destro su travel_expenses sotto la libreria ORION in Elenco dei server e selezionare Elimina.Si può eliminare la tabella?  Sì No Poiché è stata usata l’opzione ACCESS=READONLY nella definizione della libreria ORION, non è possibile apportare modifiche al suo contenuto.

58 Ripasso complessivo Quali sono i due tipi di colonne in un data set SAS? Come viene memorizzata una data? Quale elemento SAS viene utilizzato per controllare il modo in cui viene visualizzato un valore in un report?

59 Ripasso complessivo Quali sono i due tipi di colonne in un data set SAS? Come viene memorizzata una data? I due tipi sono alfanumerico e numerico. Una data viene memorizzata come numero intero che rappresenta il numero di giorni intercorsi fra l’1 gennaio, 1960 e una data specifica. Quale elemento SAS viene utilizzato per controllare il modo in cui viene visualizzato un valore in un report?

60 Ripasso complessivo Quali sono i due tipi di colonne in un data set SAS? Come viene memorizzata una data? I due tipi sono alfanumerico e numerico. Una data viene memorizzata come numero intero che rappresenta il numero di giorni intercorsi fra l’1 gennaio, 1960 e una data specifica. Quale elemento SAS viene utilizzato per controllare il modo in cui viene visualizzato un valore in un report? Un formato SAS viene usato per controllare il modo in cui viene visualizzato un valore. Per esempio, il formato DOLLARw.d visualizza un valore numerico con segni di dollaro, virgole e il numero specificato di decimali.

61 Ripasso complessivo Vero o falso: quando si accede ai dati dal processo Importa dati, viene creato un nuovo data set SAS. Vero o falso : quando si aggiunge un’origine dati a un progetto mediante File -> Apri -> Dati, viene creato un nuovo data set SAS. Quale tipo di file di testo è possibile importare con il processo Importa dati?

62 Risposte del ripasso del capitolo
Vero o falso: quando si accede ai dati dal processo Importa dati, viene creato un nuovo data set SAS. Vero Vero o falso : quando si aggiunge un’origine dati a un progetto mediante File -> Apri -> Dati, viene creato un nuovo data set SAS. Quale tipo di file di testo è possibile importare con il processo Importa dati?

63 Risposte del ripasso del capitolo
Vero o falso: quando si accede ai dati dal processo Importa dati, viene creato un nuovo data set SAS. Vero Vero o falso : quando si aggiunge un’origine dati a un progetto mediante File -> Apri -> Dati, viene creato un nuovo data set SAS. Falso: nel progetto viene salvato un puntatore all’origine dati. Quale tipo di file di testo è possibile importare con il processo Importa dati?

64 Risposte del ripasso del capitolo
Vero o falso: quando si accede ai dati dal processo Importa dati, viene creato un nuovo data set SAS. Vero Vero o falso : quando si aggiunge un’origine dati a un progetto mediante File -> Apri -> Dati, viene creato un nuovo data set SAS. Falso: nel progetto viene salvato un puntatore all’origine dati. Quale tipo di file di testo è possibile importare con il processo Importa dati? È possibile importare file di testo delimitati o con colonne a larghezza fissa.

65 Esercitazione finale Creare un nuovo progetto
Usare il processo Assegna libreria di progetto per creare la libreria ORION e puntare al percorso dei dati del corso. In Elenco dei server, visualizzare la libreria ORION. Se la libreria o i data set non sono visualizzati, fare clic con il pulsante destro su Server e selezionare Aggiorna. Utilizzare la procedura guidata Importa dati per importare il foglio Phones del file Excel employee_info e creare un nuovo data set SAS, la prima riga contiene i nomi delle variabili. Cambiare il tipo della variabile Employee_ID in Stringa, analizzando solo le prime 200 righe. Modificare tutte le etichette per sostituire i caratteri di sottolineatura con spazi. Finire la procedura guidata Importa dati e visualizzare il data set. Rinominare il processo Importa dati in Importazione guidata Employee Phones. Salvare il progetto come Esercitazione_finale in locale.


Scaricare ppt "Formati tipici dei dati"

Presentazioni simili


Annunci Google