1 Leggere e scrivere dati da file Giorgio Valentini e –mail: DSI – Dipartimento di Scienze dell Informazione Università degli Studi.

Slides:



Advertisements
Presentazioni simili
ESERCITAZIONE R 12,19 marzo 2012 Mario Mastrangelo
Advertisements

Giorgio Valentini e –mail:
Shell: variabili di sistema PATH HOME USER PWD SHELL HOSTNAME HOSTTYPE Per visualizzare il valore di tutte le variabili dambiente si usa il comando set.
Accesso ai dati su file Lab. Sistemi Informativi Economico-Aziendali Accesso ai dati su file Localizzazione dei dati File system locali e distribuiti Protocolli.
Java Stream e File.
Java Stream e File. La classe File Per operare con lintero file java mette a disposizione la classe File Per utilizzare la classe File è necessario importare.
I File di testo in Pascal
Dipartimento di Matematica
File System Cos’è un File System File e Directory
Algoritmi e Programmazione
PHP e i files Laboratorio di Progettazione Web AA 2009/2010 Chiara Renso ISTI- CNR -
3 a lezione - laboratorio a.a Corso di Laurea Ingegneria MECCANICA.
Interfaccia del file system
INFORMATICA I file.
Programmazione Procedurale in Linguaggio C++
Programmazione Procedurale in Linguaggio C++
Introduzione al software SAS Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°2.
Introduzione al software SAS
Introduzione al software SAS Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°1.
Algoritmi Paralleli e Distribuiti a.a. 2008/09 Lezione del 06/03/2009 Prof. ssa ROSSELLA PETRESCHI a cura del Dott. SAVERIO CAMINITI.
DIPARTIMENTO DI ELETTRONICA E INFORMAZIONE Lab 5 – Info B Marco D. Santambrogio – Riccardo Cattaneo –
1 UNIVERSITA DEGLI STUDI MILANO PRESENTAZIONE NUOVO CATALOGO IN LINEA SERVIZI AL LETTORE Alessandra Carta Biblioteca delle Facoltà di Giurisprudenza Lettere.
File.
Fisica Computazionale I - 51 OPERAZIONI DI INPUT/OUTPUT Le operazioni di input/output sono estremamente complesse perche' implicano una sostanziale interazione.
Introduzione agli stream e alle classi
Importazione di dati Nellambito dellutilizzo di qualsiasi software statistico una necessità è quella di importare dati esterni forniti dallutilizzatore.
Il linguaggio Fortran 90: 5. Formato di I/O e Files
1 Programmi e funzioni in R Giorgio Valentini e –mail: DSI – Dipartimento di Scienze dell Informazione Università degli Studi di.
INFORMATICA I file. © Piero Demichelis 2 File Per rendere più uniforme possibile il comportamento dei programmi in relazione alla grande varietà dei dispositivi.
Unità Didattica 2 I Linguaggi di Programmazione
1 File System ed Input/Output UNIX Implementazione del File System Caratteristiche del File System Unix/Linux System Call relative al File System Linput/output.
Introduzione ai fogli elettronici: EXCEL
I File.
Manipolazione dei dati I comandi SQL che permettono di modificare il contenuto di una base di dati sono insertdeleteupdate insert ha la seguente sintassi:
GESTIONE DEI FILE Per poter mantenere disponibili i dati tra le diverse esecuzioni di un programma (persi-stenza dei dati) è necessario poterli archi-viare.
INTRODUZIONE A MATLAB.
File I record.
Modulo 7 – reti informatiche u.d. 3 (syllabus – )
Ll Questionario Introduzione al software SAS (Parte 2) Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°2.
Usare la posta elettronica con il browser web
Specificare una unità con cui scambiare i dati input da tastiera output a video file esterno variabili di programma unità di I/O Istruzioni di INPUT/OUTPUT.
1 Gestione dei File. 2 Perché i file? Sono strutture dati persistenti Sono solitamente memorizzati sui dischi –Si usano dall'interno dei programmi Realizzano.
Diagrammi 2D e 3D Funzioni di ordine superiore
Creare pagine web Xhtlm. Struttura di una pagina.
DIPARTIMENTO DI ELETTRONICA E INFORMAZIONE Input/output 1 Marco D. Santambrogio – Ver. aggiornata al 2 Dicembre 2013.
Modulo 4 – U.D. 1 – Lez. 6 Ernesto Damiani - Sistemi di elaborazione dell'informazione.
File e Funzioni Si possono distinguere tre tipi di file che vengono utilizzati in MATLAB: M-file: hanno estensione .m e in essi vengono memorizzati i.
Programma di Informatica Classi Prime
Microsoft Access Chiavi, struttura delle tabelle.
Corso di Informatica Corso di Laurea in Conservazione e Restauro dei Beni Culturali Gianluca Torta Dipartimento di Informatica Tel: Mail:
Pagine ASP parte 2 La gestione dei file Stefano Schacherl.
Lezione 2: Simulink Ing. Raffaele Carli (
1 Università della Tuscia - Facoltà di Scienze Politiche.Informatica 2 - a.a Prof. Francesco Donini Accesso a basi di dati con ASP.
A.P. cat. B - 1 Per chi vuole: Libro di testo D.P. Curtis, K. Foley, K. Sen, C. Morin Informatica di base 2° edizione Mc Graw-Hill Companies.
Lettura e analisi statistiche dei dati e computer analysis
Pagine ASP parte 3 I data base Stefano Schacherl.
ORGANIZZAZIONE DI UN SISTEMA DI ELABORAZIONE
Lez. 9 (13/14)Elementi di Programmazione1 Lezione 9 Valutazione di espressioni File di testo sequenziali.
Tecnologie Informatiche ed Elettroniche per le Produzioni Animali (corso TIE) CORSO LAUREA MAGISTRALE IN SCIENZE E TECNOLOGIE DELLE PRODUZIONI ANIMALI.
DIPARTIMENTO DI ELETTRONICA E INFORMAZIONE File Marco D. Santambrogio – Ver. aggiornata al 21 Maggio 2014.
1 File System Concetti e tecniche generali. 2 Il file system Il file system è la parte del SO che si occupa di mantenere i dati/programmi in modo persistente.
1 Fabio Scotti ( ) Laboratorio di programmazione per la sicurezza Valentina Ciriani ( ) Laboratorio di programmazione Lezione 13 e 14 -
1.1 Corso di Sistemi Operativi: Programmazione di Sistema Corso di Laurea in Informatica, Università di Firenze Anno accademico 2010/2011 Prof. Luca Ferrari.
INTRODUZIONE A MATLAB Sara Poltronieri. Avvio del programma Avvio di Matlab (Windows) Start  Programmi  Matlab (o icona) Avvio di Matlab (Linux) terminale.
Metodologia della ricerca e analisi dei dati in (psico)linguistica 25 Giugno 2015 Introduzione ad R
Manuale Utente – i-Sisen Questionario del Gas Naturale
Linguaggio C++ Un esempio: Registrazione e lettura di dati in un file File e Stream.
Lezione 14 Tecniche di I/O Avanzate Obiettivi di apprendimento: A.Come lavorare con stream binari B.Lavorare con I datalog files C.Vantaggi e svantaggi.
Files in C++ Motivazioni Un programma in esecuzione legge (sequenzialmente) una sequenza di caratteri prodotti "al volo" dall'utente (tramite tastiera)
03/06/20161 SPSS Statistics Statistical Package for Social Science.
Transcript della presentazione:

1 Leggere e scrivere dati da file Giorgio Valentini e –mail: DSI – Dipartimento di Scienze dell Informazione Università degli Studi di Milano

2 Lettura e scrittura di dati da file I dati utilizzati in bioinformatica sono usualmente di grandi dimensioni (ad es: file PDB che memorizzano la struttura tridimensionale delle proteine, file per la memorizzazione di dati di espressione genica, etc) Oggetti di grandi dimensioni sono usualmente memorizzati in file esterni su memoria di massa In R esistono diverse funzioni di I/O per la lettura e scrittura di file Esistono anche funzioni e facility per importare/esportare dati verso altri ambienti/linguaggi di programmazione Per maggiori dettagli si consulti il manuale R Data Import/Export disponibile on-line

3 Caricare e salvare oggetti in formato binario Caricare e salvare oggetti arbitrari in formato binario : –Salvare oggetti in formato binario : > x y save(x, y, file = "xy.Rdata"); > rm(x,y) > x Errore: oggetto "x" non trovato –Caricare oggetti in formato binario: > load("xy.Rdata"); > ls() [1] "x" "y Caricare e salvare oggetti relativi ad unintera sessione di lavoro : > save.image(); > load(".RData");

4 Scrittura su file di data frame La funzione write.table memorizza un data frame in un file. Sintassi: write.table (x, file=data) data è il nome del file su cui verrà scritto il data frame x. La funzione write.table possiede molti altri argomenti che permettono di modularne opportunamente la semantica. Esempio: > m1 <-matrix(1:12,nrow=2); v <- c("A","C") > daf3<-data.frame(m1,v); daf3 X1 X2 X3 X4 X5 X6 v A C > write.table(daf3,file="data.df") # memorizza nel file # data.df il data frame daf3

5 Lettura di data frame da file La funzione read.table legge un file memorizzato su disco, inserendo i dati direttamente in un data frame. Il file esterno deve essere memorizzato nel modo seguente: –La prima riga del file deve avere un nome per ciascuna variabile del data frame –Le righe successive del file memorizzano le osservazioni che saranno memorizzate nel data frame –Ciascuna di queste righe può avere come primo valore l etichetta di riga (che sarà memorizzata nel attributo row.names del data frame) –Ciascun valore sulla riga è separato da un blank (spazio, tabulazione, etc) –Possono essere selezionati altri separatori –read.table dispone di molti altri parametri che si possono settare per esigenze particolari (vedi help).

6 Lettura di data frame da file: esempi Il seguente data frame è memorizzato sul file data.df: X1 X2 X3 X4 X5 X6 v A C La lettura viene effettuta tramite la funzione read.table : daf4<-read.table("data.df") > daf4 X1 X2 X3 X4 X5 X6 v A C Il file può naturalmente essere generato da altri programmi (purchè in ASCII), ad es: tramite un qualsiasi text editor, ed essere letto tramite read.table.

7 Lettura e scrittura di data frame : esempi Sia read.table, sia write table possono avere altri argomenti opzionali: > m1 <-matrix(1:12,nrow=2); v <- c("A","C") > daf3<-data.frame(m1,v) > write.table(daf3,file="data.df",col.names=paste("col",1:7,sep="")) > read.table("data.df") col1 col2 col3 col4 col5 col6 col A C > write.table(daf3,file="data.df",sep = ",") # file memorizzato # utilizzando la virgola come separatore: controllare con un editor > read.table("data.df",sep=",") X1 X2 X3 X4 X5 X6 v A C

8 Funzioni generali per lettura/scrittura di file In R sono presenti diverse funzioni generali per lettura e scrittura di file in formato ASCII o binario. Ad es: la funzione file può aprire, creare o chiudere file e più in generale connessioni: ad es: file in scrittura e/o lettura, connessioni di rete tramite socket o descritte da URL. Ci occuperemo solo dell insieme di funzioni per la scrittura/lettura di file.

9 Scrittura di file: esempio > ff <- file("ex.data", "w") # apertura di un file in scrittura > cat("TITLE extra line", " ", "", " ", file = ff, sep = "\n") # scrittura d 4 linee di testo > cat("One more line\n", file = ff) > close(ff) # chiude la connessione al file > readLines("ex.data") # lettura delle righe dal file [1] "TITLE extra line" " " "" " " "One more line" > unlink("ex.data") # cancella il file dal disco Per scrivere dati su file si può usare anche la funzione write (utilizzata usualmente per scrivere matrici) Le funzioni di I/O si possono usare anche per il download/upload di file in rete: x <- readLines(" DATA/Leukemia/Readme.Leukemia");

10 Lettura di file: esempio > ff <- file ("ex.data", "r") # apertura file in lettura > readLines(ff) # lettura di tutto il file [1] "TITLE extra line" " " "" " " "One more line" > seek (ff,0) # rewind del file [1] 54 > readLines (ff,n=1) # lettura d una riga alla volta [1] "TITLE extra line" > readLines(ff,n=1) [1] " " > readLines(ff,n=1) [1] "" > readLines(ff,n=1) [1] " " > readLines(ff,n=1) [1] "One more line" > readLines(ff,n=1) # esaurite le righe del file character(0) > close (ff) # chiusura file

11 La funzione scan Esempi: A. Memorizzazione dati in un vettore > x <- matrix(1:10, nrow=2) > write (x, "data") # scrittura della matrice # su file > xread <- scan ("data",0) Read 10 items > xread [1] La funzione scan legge un file di input e memorizza i dati in un vettore o una lista. B. Memorizzazione dati in una lista Si supponga di avere un file data composto dalle seguenti linee: A Q B M A Q Q P > inp <- scan ("data",list("",0,0,"")) # lettura file e memorizzazione # in una lista: si noti la # lettura per colonne Read 4 records > inp [[1]] "A" "B" "A" "Q" [[2]] [[3]] [[4]] "Q" "M" "Q" "P"

12 Accesso a data set built-in Molti data set sono disponibili con R (data set built- in) ed altri sono contenuti nei package. Per listare i data set built-in si utilizza la funzione data(). Per caricare un data set built-in la sintassi è: > data (nome-data-built-in) Esempio: > data(iris) > iris Sepal.Length Sepal.Width Petal.Length Petal.Width Species setosa setosa setosa.....

13 Editing dei dati E possibile utilizzare la funzione edit per effettuare cambiamenti manuali su matrici e data frame E possibile anche utilizzare la funzione edit per costruire ex novo nuove matrici e data frame La funzione edit fornisce un ambiente di editing simile a quelo di un foglio elettronico Esempi: > edit(iris) # editing di un data frame # esistente > new.data.frame <- edit (data.frame()) # creazione di un nuovo data frame

14 Importare, esportare file in Excel B. Leggere e scrivere direttamente file Excel: il package xlsReadWrite: > library(xlsReadWrite) > data(iris) > write.xls( iris, file="iris.xls", colNames=TRUE); > iris2 <- read.xls("iris.xls") A. Usare write.table e read.table e le funzioni di conversione di Excel: > data(iris) > write.table(iris, file="iris.txt", row.names=F) Aprire iris.txt con Excel ed utilizzare le conversioni formato. Per salvare un file Excel usare Salva formato testo con tabulazioni. Per aprire il file in R: > iris2<- read.table("iris2.txt", header=T)

15 Esercizi 1.Costruire un data frame df1 di 5 righe con 6 variabili di cui 4 numeriche e 2 a caratteri. Memorizzare su file il data frame e quindi leggerlo, assegnandolo alla variabile df2. 2.Costruire una matrice numerica utilizzando la funzione edit. Scriverla su file tramite la funzione write. Ricaricare quindi la matrice in memoria. Si potrebbero utilizzare altre funzioni per memorizzare la matrice? 3. Scrivere su file il data frame df1 dell es. 1 separando però gli elementi con virgole, ed omettendo il nome delle variabili. 4.Effettuare tramite R il download del file colon128.train dal sito Il file e un data set con 31 campioni (righe), ognuno costituito da 129 feature separate da virgole. 5.Carica dal package Biobase il data set aaMap. A cosa si riferisce? Tramite quale struttura dati è rappresentato?