I Microarray: Una nuova tecnologia Sara Loddo 13.10.2008
Background “cariotipo molecolare” XXI secolo “cariotipo molecolare” ~3-10Mb Anni ‘70 ~40-100kb Anni ‘90 The ultimate goal of clinical cytogenetics is the determination of DNA sequence copy number across the entire genome and the co-relation of perturbations in this copy number to genetic maladies and disease states. Prior to the advent of comp genome hybrid techs diagnoses based on chromosome banding afforded a whole genome perspective but were limited to resolutions of approximately 5Mb and higher and necessitated the ability to derive chromosome preparations from the clinical sample. While the introduction of locus-specific FISH technologies dramatically improved the resolution limits associated with banding techniques, the locus specificity of these innovations precluded a whole genome perspective. Visione d’insieme dell’intero genoma, ma bassa risoluzione Elevata risoluzione, ma l’analisi diventa locus-specifica
Tecniche diagnostiche MICROSCOPIA OTTICA: osservazione diretta dei cromosomi bandeggiati con colorazione Giemsa. Limite di risoluzione di 5-10 Mb. FISH (Fluorescence In Situ Hybridization): sonde sito-specifiche, marcate con fluorescenza. Necessarie informazioni a priori sulla localizzazione del riarrangiamento. CGH (Comparative Genomic Hybridization): ibridazione competitiva di DNA genomico di un paziente e di un controllo, frammentati e marcati con un fluorocromo diverso, su metafasi di un soggetto sano.
CGH: Comparative Genomic Hybridization Due DNA (test e controllo) marcati con due fluorocromi diversi vengono messi in competizione per il legame con le metafasi di un soggetto “normale” DNA controllo Metafase individuo normale DNA test
1. Normale: si lega tanto DNA “verde” quanto DNA “rosso” 1. Normale: si lega tanto DNA “verde” quanto DNA “rosso”.Il rapporto dell’intensità della fluorescenza nei 2 colori è pari a 1. 2. Duplicazione: si lega più DNA “verde” del DNA “rosso”.Il rapporto dell’intensità della fluorescenza verde/rosso è > 1. 3. Delezione: si lega meno DNA “verde” del DNA “rosso”. Il rapporto dell’intensità della fluorescenza verde/rosso è < 1.
ARRAY: insieme ordinato di sequenze genomiche , la cui mappatura è nota, fissate ad un substrato solido secondo uno schema ricostruibile. Applicazioni in più campi, quali diagnostica, ricerca, farmacogenomica, etc. Utilizzate differenti tipi di sonde: BAC (80-200 Kb), cloni di cDNA (0.5-2.5 Kb), prodotti di PCR (100 bp- 1.5 Kb), oligonucleotidi (25-80 nt), SNPs (25 nt) La risoluzione dipende dalla lunghezza delle sequenze e dal numero degli spot Vantaggio: analisi di più geni o dell’intero genoma in un singolo esperimento.
DNA microarray: una collezione di microscopiche sonde (probe) Ordinate Miniaturizzate Immobilizzate su una superficie solida I probe possono essere attaccati al substrato mediante: Legame diretto, fisico o chimico Legame indiretto, mediante molecole linker
Due tecniche di produzione di microarray Microarray spottati roboticamente: probe di DNA a singolo filamento pre-sintetizzati sono fissati su vetrini mediante apparecchiature automatizzate (Tecnologia Ink-Jet Printing) Array di oligonucleotidi ad alta densità: set di oligonucleotidi sono sintetizzati in situ su un supporto di vetro mediante un processo di fotolitografia associata alla sintesi chimica degli oligonucleotidi (Tecnologia Affymetrix).
Microarray a DNA spottato Prima dello spottaggio, il vetrino deve essere trattato in modo che esponga sulla superficie molecole con cariche positive (Es. polilisina). Le molecole di DNA che vengono depositate sul vetrino durante lo spottaggio, vengono successivamente UV-crosslinkate alle cariche positive del vetrino.
Microarray di oligonucleotidi ad alta densità Fotolitografia Processo di sintesi di luce-diretta in cui linker sintetici modificati con gruppi protettivi, rimuovibili mediante la luce, sono attaccati alla superficie del vetrino. La luce viene diretta attraverso una maschera per deproteggere e attivare i gruppi selezionati. Nucleotidi protetti possono così accoppiarsi ai siti attivati.
E’ possibile avere 500,000 probe in uno spazio di 1.28 cm2 Ogni singolo probe è costituito da milioni di oligonucleotidi identici Per ogni oligo che presenta un match perfetto (PM) è presente un oligo identico con mismatch per una sola base in posizione centrale (MM) La presenza di un MM consente di stimare legami aspecifici e background locale e di sottrarli dal segnale di PM
Ibridazione basata sul principio di complementarietà delle basi Ibridazione competitiva: il DNA di un campione e di un controllo vengono marcati con due fluorocromi differenti (Cy3 e Cy5) ed uniti in una miscela ibridata poi sull’array. La fluorescenza è rilevata da uno scanner e il rapporto dei due segnali analizzato mediante un software. Ibridazione assoluta: su ogni array è ibridato un singolo campione marcato in maniera indiretta (biotina legata al composto fluorescente streptavidina-ficoeritrina). La fluorescenza è rilevata da uno scanner e un software analizza l’intensità del segnale rosso assoluto.
Principali applicazioni dei microarray cDNA microarray: per misurare i livelli di espressione di determinati geni microarray SNP (“Single Nucleotide Polymorphism”) e array di mutazione: per la genotipizzazione e identificazione di polimorfismi (SNPs) in una popolazione. microarray CGH (“Comparative Genomic Hybridization”): per osservare perdite o guadagni di materiale genomico o un cambiamento nel numero di copie di un gene particolare coinvolto in una malattia.
Microarray Genomici basati su: Sonde BAC (Bacterial Artificial Chromosome)- lunghezza di 80-200 Kb, copertura omogenea del genoma, ma risoluzione bassa con difficoltà di individuazione delle piccole aberrazioni sotto le 50 Kb Cloni di cDNA- utilizzati soprattutto per lo studio dell’espressione genica, offrono una più alta risoluzione ma che risulta ineguale lungo il genoma (i geni non sono distribuiti in maniera omogenea) Prodotti di PCR- offrono una maggiore risoluzione ed una più omogenea copertura, ma il segnale è basso e i costi di produzione molto alti Microarray di nuova generazione
(Tecnologia Affymetrix) ARRAY BASATI SU OLIGONUCLEOTIDI (Tecnologia Ink-Jet) (Tecnologia Affymetrix) Sonde oligonucleotidiche lunghe fino a 60 nt a singolo filamento Risoluzione fino a 10-15 Kb Ibridazione competitiva con un unico DNA di controllo Copertura omogenea dell’intero genoma 20 sonde per ogni SNP, lunghe 25 nt, diverse per la posizione del nucleotide polimorfico Risoluzione fino a 5 Kb Ibridazione del solo DNA da testare e successivo confronto con DNA di riferimento (HapMap Project) Copertura non omogenea dell’intero genoma In campo diagnostico è necessaria una conferma mediante altre tecniche (FISH o Real Time PCR)
International HapMap Project Progetto iniziato nel 2002 Si propone di “catalogare” le varianti comuni del DNA umano in una Mappa degli Aplotipi Analizzati 270 soggetti provenienti da differenti gruppi etnici 1- Sono stati identificati polimorfismi di un singolo nucleotide (SNPs) in diversi individui 2- SNPs vicini lungo il DNA vengono ereditati insieme e formano un APLOTIPO 3- Gli SNPs identificati in un aplotipo sono caratteristici unicamente per quell’aplotipo, perciò mediante genotipizzazione di 3 SNPs si può risalire all’aplotipo del’individuo
Oligonucleotide-Array (Agilent) Gain Loss No change Fino a 244,000 sonde oligonucleotidiche Risoluzione di 10-15 Kb Intensita’ di fluorescenza è rilevata dallo scanner Dati elaborati da un software
SNPs-array (Affymetrix GeneChip 250K) Risoluzione di 5 Kb Intensità di segnale rilevata da uno scanner e i dati elaborati da un software
Maggiore copertura del genoma Affymetrix Genome-Wide Human SNP Array 6.0 Risoluzione di 0.7 Kb 1.8 milioni SNPs e oligonucleotidi che coprono regioni povere di SNPs combinati insieme Maggiore copertura del genoma
Copy Number Variations (CNVs) Segmenti di DNA con estensione maggiore di 1 Kb presenti nel genoma con un numero variabile di copie. Contribuiscono: alle differenze fenotipiche tra gli individui alla patogenesi di malattie, sia mendeliane che multigeniche
La frequenza delle CNVs nella popolazione è di 1/800 bp CNVs polimorfiche La frequenza delle CNVs nella popolazione è di 1/800 bp Contribuiscono: Alle differenze nell’espressione genica coinvolgendo sequenze vicine a geni Alla predisposizione di alcune malattie
CNVs patologiche La complessità del genoma rende difficile stabilire la natura delle CNVs Si devono considerare: Posizione sul cromosoma Evento de novo o ereditato Per CNVs de novo: Dimensione Contenuto genico Tipo di CNV (delezione o duplicazione) Sindromi genomiche mendeliane e da geni contigui associate a CNVs
Elevata sensibilita’ nell’identificare geni-malattia: Vissers et al. (2004) Nat Genet 36: 955-957 Mutations in a new member of the chromodomain gene family cause CHARGE syndrome. Coloboma Heart anomaly Atresia (choanal) Retardation Genital Ear anomalies incidenza: 1/12000
Analisi array-CGH: 1 paziente con delezione di 5 Mb in 8q12 1 paziente con t(6;8): due delezioni non contigue in 8q12 Sequenziamento geni in pazienti non “sbilanciati” → mutazioni in CHD7 (rimodellamento cromatina)
Analisi mediante array-CGH su tutto il genoma Individuazione di una delezione in 8q12 di 5Mb Analisi del contenuto genico e sequenziamento del gene CHD7 nei pazienti che non presentano sbilanciamenti Individuazione di una mutazione nel gene CHD7 nel cromodominio della proteina coinvolta nel rimodellamento della cromatina
BIBLIOGRAFIA Carter NP (2007) Nat Genet 39:16-21 Methods and strategies for analyzing copy number variation using DNA microarrays. International HapMap Consortium (2005) Nature 437:299-320 A haplotype map of the human genome. Vissers et al. (2004) Nat Genet 36: 955-957 Mutations in a new member of the chromodomain gene family cause CHARGE syndrome. Risorse on-line