Genetica Forense Docente: Fulvio Cruciani

Slides:



Advertisements
Presentazioni simili
GENETICA FORENSE Marzio Massimiliano CAPRA
Advertisements

La GENETICA DI POPOLAZIONI
MEIOSI Quelli che seguono sono elementi di base per comprendere la meiosi. Per semplicità non viene preso in considerazione il fenomeno del crossing over.
Marcatori Molecolari Introduzione Marcatori proteici DNA
ERRORI L'errore è presente in ogni metodo analitico e può essere dovuto a cause diverse. L’errore può essere definito come la differenza tra il valore.
L’altro importante equilibrio genetico è un EQUILIBRIO APLOIDE
Per avere una utilità pratica un marcatore deve essere polimorfico
Effetto dell’interazione tra
FORENSE Lezione14 By NA.
Il concetto di aplotipo
Applicazioni: 1- la variabilità genetica nelle scienze forensi
Clonaggio funzionale Clonaggio posizionale
Screening delle sostanze d'abuso: teoria, vantaggi e limiti
Intelligenza Artificiale Algoritmi Genetici
LA DIVERSITA’ DEL GENOMA UMANO
Array di oligonucleotidi
L’ ALU UN VIAGGIO NEL DNA.
Diversità Genetica e Uguaglianza Umana
METODI E CONTROLLI STATISTICI DI PROCESSO
Il sequenziamento genico
Perché Real-Time? Real time PCR Analisi PCR quantitativa
Le distribuzioni campionarie
Clonaggio: vettori plasmidici
Evoluzione di una tecnica che ha rivoluzionato la biologia molecolare
METODI PER LA RICERCA DI MUTAZIONI NEL DNA
Elettroforesi di Acidi Nucleici Southern e Northern Blot
RFLP I primi marcatori molecolari ad essere studiati furono gli RFLP (Restriction Fragment Lenght Polymorphism):particolari tratti di DNA presenti nella.
Caratteristiche e applicazioni
Sequenziamento enzimatico del DNA (Sanger)
Polimorfismi, mutazioni e metodi per evidenziarli
Identificazione e tipizzazione di minisatelliti
Metodi e sistemi in Genetica – modulo II (variabilità genetica nell’uomo) –Fulvio Cruciani Tel /924 stanza.
Accoppiamento non casuale Mutazione
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
Sequenziatore automatico ABI Prism 310®.
BIANCA MARIA CIMINELLI studio 319 (dente B) laboratorio 330 (dente C)
POLIMORFISMO GENETICO
Natura della variabilità genetica
Che cosa offre biotechrabbit ? Prodotti per l’isolamento degli Adici Nucleici (DNA – RNA)
DNA Fingerprinting LLC Bologna
Cosa sono i GENI I geni rappresentano l’unità strutturale e funzionale della genetica Un gene è una successione lineare di unità chimiche semplici (nucleotidi)
Scopi della analisi molecolare
AMPLIFICAZIONE IN VITRO DEL DNA “REAZIONE A CATENA DELLA POLIMERASI
La Genetica di popolazioni studia i fattori che influenzano la trasmissione dei caratteri ereditari a livello di popolazioni e i processi evolutivi che.
Nelle popolazioni naturali la variabilità genetica (ovvero ereditaria) può essere di tipo qualitativo o quantitativo La variabilità qualitativa si riscontra.
Difetti congeniti del metabolismo II
Quantificazione del DNA estratto e determinazione del sesso genetico
L’equilibrio di HW riguarda il modo in cui i gameti si assortiscono due a due a formare gli zigoti, possiamo definirlo quindi un equilibrio diploide L’altro.
Il Principio di Hardy-Weinberg
Test genetici nella investigazione e commercio di specie protette
Corso di formazione all’Esame di Stato Professione Biologo
Corso di preparazione per gli Esami di Stato per Biologi
LA GENETICA… …e le leggi di Mendel Prof.ssa Filomena Mafrica.
TRATTAMENTO STATISTICO DEI DATI ANALITICI
POLIMERASE CHAIN REACTION (PCR)
LABORATORIO 2: ANALISI DI RESTRIZIONE DI DNA GENOMICO In questa esercitazione campioni di DNA (es.: da fago λ e da plasmide pET28) verranno digeriti con.
ESTRAZIONE DNA ANALISI QUANTITATIVA
Genomica strutturale.
fine_structure _repeat
Trasmissione ereditaria di un allele RFLP associato ad un carattere che si trasmette come un carattere AUTOSOMICO DOMINANTE sonda L’esame dell’albero.
Concetti di base. Per biodiversità si intende l'insieme di tutte le forme viventi geneticamente diverse e degli ecosistemi ad esse correlati Il termine.
Soluzione lisante + PK Purificazione del DNA proteine DNA membrane etanolo Sovranatante Contenente DNA.
Diagnostica molecolare Clinica
FINGERPRINTING DI PIANTE E FIORI: UTILE STRUMENTO PER LA CERTIFICAZIONE GENETICA DEL MATERIALE PROPAGATO DAI VIVAISTI.
Clonaggio funzionale Clonaggio posizionale Conoscenza proteina Malattia genetica Determinazione sequenza amminoac.Mappatura genetica con marcatori polimorfici.
L’equilibrio di HW riguarda il modo in cui i gameti si assortiscono due a due a formare gli zigoti, possiamo definirlo quindi un equilibrio diploide L’altro.
MARCATORE genetico  carattere mendeliano che può essere utilizzato per seguire la segregazione di una particolare regione cromosomica lungo un pedigree.
Con la tecnica della PCR si può amplificare in modo specifico e ripetitivo qualsiasi segmento di DNA compreso tra due particolari sequenze nucleotidiche.
Introduzione Abbiamo analizzato un campione di circa 82 soggetti non consanguinei con il kit AmpFlSTR Identifiler®, al fine di valutarne il funzionamento.
Transcript della presentazione:

Genetica Forense Docente: Fulvio Cruciani fulvio.cruciani@uniroma1.it Ricevimento: mercoledì 13:30-15:30 Edificio genetica, stanza 3-09 (2° piano) Telefono (per comunicazioni urgenti): 06 49912826 Parte del corso di «Metodologie genetico-molecolari nell’uomo»

Modulo Genetica Forense Programma AA 2013-2014   Breve storia della genetica forense: dal sistema AB0 ai mini-STR. Repertamento, conservazione e determinazione del tipo cellulare e/o tissutale dei reperti biologici. Estrazione differenziale, quantificazione e determinazione del sesso genetico del DNA dei reperti. Metodi e strumenti per la tipizzazione di marcatori polimorfici in ambito forense. Problematiche relative alla natura del campione biologico: DNA fortemente degradato e/o in tracce minime; determinazione dei genotipi in campioni misti. Problematiche concernenti l’interpretazione del profilo di DNA: stuttering, microvarianti e alleli “off-ladder” nei microsatelliti, alleli nulli, drop-out e drop-in allelico. Utilizzazione dei sistemi ad ereditarietà uniparentale in ambito forense. Identificazione nelle indagini criminali; identificazione delle vittime dei disastri di massa. Test di parentela e paternità. Elementi di calcolo delle probabilità. Potere di esclusione, probabilità di identità, probabilità di match casuale, indice di paternità. Inferenza sull’origine geografica e aspetto fenotipico attraverso l’analisi del DNA. La ricerca scientifica in ambito genetico-forense. 

Docente: Fulvio Cruciani Genetica Forense Docente: Fulvio Cruciani Testo consigliato: Per eventuali approfondimenti:

La genetica nelle scienze forensi La genetica forense è una delle molteplici discipline delle scienze forensi. L’importanza della genetica nelle scienze forensi si è notevolmente accresciuta negli ultimi anni, grazie ai progressi nella conoscenza dei marcatori genetici polimorfici ed all’evoluzione degli strumenti utilizzati per analizzarli. I mass media hanno notevolmente contribuito all’interesse verso le indagini genetico forense….

La genetica come «strumento» in ambito forense e investigativo A cosa serve? Identificare individui che abbiano commesso dei crimini Risolvere casi di paternità incerta Predire la popolazione di origine di un DNA (es. Africano, Asiatico ecc.) Ottenere informazioni fenotipiche su un soggetto (es. colore occhi) Identificare e «ricostruire» cadaveri la cui identità sia ignota (vittime di catastrofi naturali, disastri aerei, guerre, genocidi) Investigazioni su persone scomparse Identificare tracce di sostanze illegali Identificare DNA appartenente a specie a rischio di estinzione in crimini legati al loro contrabbando ………………….

Il fenomeno biologico sul quale si basa la genetica forense: DIVERSITA’ GENETICA

La genetica forense si basa sulla presenza di diversità genetica DIVERSITA’ GENETICA: A QUALE LIVELLO? Diversità genetica tra individui Diversità genetica tra popolazioni Diversità genetica tra specie Applicazione in Ambito forense Nella maggior parte delle applicazioni la genetica forense sfrutta la diversità genetica tra individui (variabilità intra-popolazione). In un minor numero di casi sfrutta la variabilità genetica tra specie. In alcuni casi sfrutta «direttamente» la variabilità genetica tra popolazioni, della quale va tenuto comunque sempre conto (effetti della suddivisione della popolazione, ecc.)

La genetica forense si basa sulla presenza di diversità genetica DIVERSITA’ GENETICA: A QUALE LIVELLO? Diversità genetica tra individui Diversità genetica tra popolazioni Diversità genetica tra specie Applicazione in ambito forense Le basi teoriche della genetica forense vanno ricercate nella genetica mendeliana e nella genetica delle popolazioni

La genetica forense si basa sulla presenza di diversità genetica DIVERSITA’ GENETICA: IN QUALE PORZIONE DEL GENOMA? Autosomi DNA mitocondriale Cromosoma Y Cromosoma X Rilevanza in Ambito forense I marcatori più utilizzati in ambito forense sono localizzati sugli autosomi

La genetica forense si basa sulla presenza di diversità genetica DIVERSITA’ GENETICA: CHE TIPO DI VARIAZIONE? Microsatelliti (short tandem repeats, STRs) Sostituzioni nucleotidiche (~ SNPs) Minisatelliti (~ VNTR) Inserzione/delezione di basi (indels) Presenza/assenza di elementi trasponibili Copy number variants (CNVs) Polimorfismi «citogenetici» Rilevanza in ambito forense I marcatori più utilizzati in ambito forense sono i microsatelliti

Marcatori polimorfici Marcatori polimorfici Sospettato individuato Crimine Trasferimento del materiale biologico May match another (K’) Campione “Q” (Question) Reference (Known) campione “K” Ricerca in database Steps coinvolti Steps coinvolti Raccolta Raccolta Q U A L I T Y S R N C E Conservazione Esclusione (no match) Conservazione Q U A L I T Y S R N C E Serology Caratterizzazione Q ≠ K Estrazione Estrazione Q K Confronto dei profili Biology Quantificaz. Quantificaz. Amplificaz. Amplificaz. Q = K Marcatori polimorfici Marcatori polimorfici Compatibilità (match) Figure 1.1 Steps involved in the Q-K comparison during forensic DNA testing. Separazione/detection Separazione/ Detection Technology Report (con peso statistico) Interpretaz.ne dei dati Interpretaz.ne dei dati Interpretaz.ne statistica Genetics Corte Profilo depositato in database Profilo depositato in database

Esempio di Lab Report relativo ad un indagine sul DNA estratto da 2 reperti (Q1 e Q2) e da due indagati (K1 e K2) Tratto da Butler JM «Fundamentals of forensic DNA typing» 2010.

Breve storia della genetica forense Il primo sistema polimorfico utilizzato in ambito forense: Sistema di gruppo sanguigno ABO (scoperto nel 1900 da Landsteiner) Utilizzato per la prima volta in un processo nel 1915 in Italia (Lattes) e successivamente utilizzato in casi di identificazione e paternità incerta anche in altri paesi europei ed in US Caratteristiche : 4 fenotipi (gruppi sang. A, B, AB, 0) Rapidità di esecuzione Possibilità di esclusione Limitato potere di discriminazione -------------------------------------------------------------------------------------- Successivamente affiancato da altri sistemi di gruppo sanguigno: MN (1927), Rh (1937) fino a circa 30 sistemi di gruppo sanguigno oggi noti

Breve storia della genetica forense L’era dei polimorfismi proteici Differenze nel materiale genetico possono «tradursi» in differenze nelle sequenze aminoacidiche delle proteine. Tali differenze vennero utilizzate negli anni 60-80 per studi di genetica di popolazioni ed in ambito forense. Differenti forme dello stesso enzima (isoenzimi) venivano evidenziate mediante elettroforesi su agar, agarosio o acrilammide, sfruttando la differente carica degli isoenzimi per la separazione e la specificità enzimatica per la colorazione. Caratteristiche rilevanti in ambito genetico-forense: - Numero di alleli ridotto (in genere 2-4) - Tempi di esecuzione relativamente lunghi - Potere di discriminazione maggiore (quando combinati) rispetto ai sistemi di gruppo sanguigno - Livelli di proteine bassi nei reperti, e instabili

Breve storia della genetica forense 1985: MINISATELLITI, inizia l’era del DNA typing Il primo caso criminale risolto mediante DNA typing: il signor Colin Pitchfork 1983: Lynda Mann, 15 anni, viene violentata e uccisa nel Leichestershire (UK) 1986: Dawn Ashworth, 15 anni, viene violentata e uccisa nella stessa zona Il modus operandi nei due delitti era lo stesso ed il gruppo sanguigno (gruppo A), determinato dalle tracce di liquido seminale, era il medesimo. 1986: Richard Buckland, un ragazzo del posto, venne incriminato dei due delitti, ma l’analisi del DNA mediante fingerprinting rivelò che egli era innocente. Circa 5000 individui nel Leichestershire possedevano il gruppo sanguigno A. Si organizzò uno screening di massa ed in nessun caso il DNA fingerprinting dei 5000 individui corrispondeva a quello dell’assassino. 1987: Per un puro caso, si venne a sapere che una persona del posto, un certo Colin Pitchfork, aveva chiesto ad un amico ed ottenuto di partecipare allo screening in sua vece. Il signor Pitchfork venne invitato a donare il sangue ed il profilo del suo DNA risultò identico a quello del DNA raccolto sulla scena dei due delitti.

Breve storia della genetica forense Minisatelliti I minisatelliti sono una classe di DNA ripetuto in tandem, con un motivo ripetuto di 8-100 basi ed un numero di ripetizioni spesso molto elevato (fino a 1000). Sono localizzati in tutto il genoma umano, preferenzialmente nelle regioni subtelomeriche. Il polimorfismo consiste nel diverso numero di ripetizioni in tandem (alleli) presenti nello stesso minisatellite. Il numero degli alleli è spesso nell’ordine delle decine (sempio di sistema multiallelico).

Minisatelliti: la tecnica del «DNA fingerprinting» Breve storia della genetica forense Minisatelliti: la tecnica del «DNA fingerprinting» Il metodo per evidenziare la variabilità dei minisatelliti si basa sulla tecnica «southern blotting». Si utilizza una sonda che riconosce un motivo “core” comune a più minisatelliti, e che permette quindi di evidenziare più minisatelliti contemporaneamente. Alec Jeffreys Il DNA fingerprinting Introdotto da Alec Jeffreys nel 1985. Il DNA viene estratto, digerito con enzimi di restrizione, sottoposto ad elettroforesi, denaturato e trasferito su membrana (southern blotting). Quindi viene utilizzata una sonda multi-locus “core” minisatellite marcata con radioattivo per l’ibridazione. Il segnale radioattivo viene rivelato mediante esposizione di una lastra sensibile ai raggi X DNA fingerprinting

Minisatelliti: esempio di «DNA fingerprinting» Breve storia della genetica forense Minisatelliti: esempio di «DNA fingerprinting» Vantaggi e limitazioni: Potere di discriminazione molto elevato Sensibilità limitata (>50-500 ng) Tecnica time-consuming Non automatizzabile Elevato peso molecolare: non adatto per campioni degradati Differenti alleli difficili da distinguere Problemi per l’interpretazione statistica Note sulla nomenclatura: ambiguità relativa ai termini RFLP, VNTR, DNA fingerprinting Introduzione di sonde che riconoscono un solo locus

Minisatelliti: esempio di «DNA fingerprinting» Breve storia della genetica forense DNA fingerprinting di una famiglia. E’ stata utilizzata una sonda multicolus di tipo (GTG)5

Breve storia della genetica forense 1985: viene descritta la tecnica PCR 1990: la tecnica PCR viene accolta in ambito forense La tecnica della reazione a catena della polimerasi ha rivoluzionato il modo di fare ricerca in diversi settori della genetica e della biologia molecolare. In ambito forense, l’introduzione della PCR ha rappresentato un punto di svolta fondamentale, permettendo di risolvere un problema molto ricorrente nelle indagini criminali: La scarsa quantità di DNA che può essere estratta dalla maggior parte dei reperti. Brevissima descrizione della tecnica, gli studenti dovrebbero già conoscerla

Breve storia della genetica forense 1990: la prima tecnica basata su PCR accolta in ambito forense Il sistema polimorfico Human Leucocite Antigen (HLA) DQA1 La tecnica (reverse dot blot) Amplificazione mediante PCR di una porzione del gene DQA1. I primers sono marcati con biotina. Ibridazione del prodotto PCR con oligo «allele specifici» fissati su una strip di membrana di nylon. Lavaggio ad elevata stringenza: rimangono sulla membrana solo i prodotti PCR con sequenze perfettamente complementari ai relativi oligo. Rivelazione mediante sistema streptavidina/biotina

Breve storia della genetica forense 1990: la prima tecnica basata su PCR accolta in ambito forense Il sistema polimorfico Human Leucocite Antigen (HLA) DQA1 Nel sistema «DQa amplyTaq» erano presenti inizialmente 9 sonde in grado di distinguere 6 alleli, per un totale di 21 differenti genotipi (pannelo “a” in figura) Un kit prodotto successivamente (Amplitype PM + DQA1) permetteva di discriminare un ulteriore allele in DQA (4.1 vs 4.2,4.3) e al tempo stesso permetteva di conoscere il genotipo di altri 5 sistemi polimorfici, due triallelici e tre biallelici (pannello “b” in figura, dove è mostrato il genotipo per una linea cellulare -9948- utilizzata come standard). Vantaggi e svantaggi: - Metodo semplice e rapido - Elevata sensibilità (PCR) - Potere di discriminazione relativamente basso (circa 1/10000)

(un minisatellite amplificabile mediante PCR) Breve storia della genetica forense 1994: Il minisatellite D1S80 (un minisatellite amplificabile mediante PCR) L’introduzione del kit Amplitype D1S80 rispondeva a due esigenze fondamentali in ambito genetico forense: La possibiltà di analizzare quantità minime di DNA mediante PCR La necessità di avere a disposizione marcatori multiallelici e caratterizzati da un elevato grado di eterozigosità (maggiore dei sistemi DQA1). Il minisatellite presenta una unità ripetitiva di 16 basi (corta per essere un minisatellite) con più di venti alleli caratterizzati da un numero di ripetizioni nel range 14-41. L’intero prodotto PCR varia da circa 400 bp (alleli più corti) a circa 800 bp (alleli più lunghi).

(un minisatellite amplificabile mediante PCR) Breve storia della genetica forense Il minisatellite D1S80 (un minisatellite amplificabile mediante PCR) Vantaggi e svantaggi: Metodo relativamente semplice (PCR + elettroforesi) Elevata sensibilità (PCR) Potere di discriminazione elevato (per un singolo locus) La presenza di alleli multipli facilita l’interpretazione delle «misture» Range bp del prodotto PCR troppo grande (problemi con DNA degradato) Difficoltà per l’analisi in multiplex e per l’automazione

1995-present: MICROSATELLITI Breve storia della genetica forense (fine) 1995-present: MICROSATELLITI L’introduzione dei microsatelliti in ambito forense verso la metà degli anni ’90 portò alla rapida «estinzione» dei marcatori utilizzati in precedenza. Dal 1995 ad oggi i microsatelliti autosomici sono rimasti i marcatori di elezione in ambito forense, ed è opinione diffusa (sebbene non da tutti condivisa) che lo rimarranno per sempre. Ciò nonostante, altri tipi di marcatori e sistemi polimorfici vengono oggi utilizzati in casi forensi specifici: Variazione di sequenza del DNA mitocondriale Microsatelliti del cromosoma Y e del cromosoma X SNPs Questi sistemi polimorfici, assieme ai microsatelliti, saranno trattati in dettaglio in lezioni dedicate

Breve storia della genetica forense (fine) Confronto tra sistemi polimorfici utilizzati in ambito genetico forense nel XX secolo (variabilità vs. rapidità analisi) Speed of Analysis (Technology) Power of Discrimination (Genetics) Low High Slow Fast RFLP Single Locus Probes Multi-Locus Probes ABO blood groups Multiplex STRs DQ single STR D1S80 mtDNA PolyMarker Figure 1.1, J.M. Butler (2005) Forensic DNA Typing, 2nd Edition © 2005 Elsevier Academic Press

quale marcatore? localizzazione nel genoma tasso di mutazione In qualsiasi tipo di applicazione (forense, evolutiva, mappatura, diagnostica) che coinvolga dei marcatori genetici polimorfici sono disponibili (o sono stati disponibili) diversi tipi di marcatori. Storicamente, nelle diverse discipline alcuni marcatori sono stati preferiti ad altri, che sono caduti in disuso. La scelta dei marcatori si basa (o si è basata storicamente) su una serie di caratteristiche dei marcatori, che possono essere di tipo biologico o tecnico: localizzazione nel genoma tasso di mutazione grado di eterozigosità numero di alleli ereditarietà mendeliana sensibilità del metodo precisione del metodo possibilità di analisi multiple possibilità di standardizzazione tempi tecnici dell’esperimento costi dell’attrezzatura costi dell’esperimento Caratteristiche biologiche Caratteristiche tecniche

Natura molecolare dei microsatelliti I microsatelliti sono una classe di DNA ripetuto in tandem (VNTR, variable number of tandem repeats) caratterizzato da un piccolo numero di ripetizioni corte in tandem. Sono comuni nel DNA nucleare di tutti gli eucarioti fino ad ora esaminati (circa 1/10 mila basi) Nei primati rappresentano circa 1% del genoma

Esempio di microsatellite utilizzato in ambito genetico forense: D16S539 Figure 5.1 (tratto da Butler) DNA sequence of a D16S539 allele containing 11 GATA repeats (shown in blue font). The STR repeat sequence is included in lowercase font with breaks between each repeat unit for emphasis. Underlined regions in green font indicate PowerPlex 16 primer binding sites (Krenke et al. 2002) with the shaded portion showing the PCR product, which is 288 bp (see Appendix 1). This top strand of the reference sequence is the reverse complement of GenBank entry AC024591 available from http://www.cstl.nist.gov/biotech/strbase/seq_ref.htm. The ‘T’ shown in red font indicates a point mutation that resulted in a null allele with a previous primer (Nelson et al. 2002).

Natura molecolare dei microsatelliti perfetti interrotti composti I microsatelliti possono essere perfetti, interrotti o composti e vengono ulteriormente classificati in base alla lunghezza del motivo ripetuto (dinucleotide repeats, trinucleotide repeats ecc..)

Distribuzione dei microsatelliti I microsatelliti sono distribuiti in modo abbastanza omogeneo nel DNA nucleare dove si ritrovano sia sugli autosomi che nei cromosomi sessuali. Nei primati rappresentano circa 1% del genoma. Non sono invece presenti nel mtDNA umano

Mutazione nei microsatelliti L’elevato tasso di mutazione nei microsatelliti è dovuto a scivolamento della polimerasi in replicazione Tasso di mutazione molto elevato: 10-2 – 10-4 mutazioni/STR/generazione La mutazione avviene generalmente per aumento o diminuzione di una singola unità ripetitiva Mutazioni per aumento più frequenti di mutazioni per diminuzione Il tasso di mutazione per ciascun microsatellite è positivamente correlato con la lunghezza dell’allele

Variabilità genetica dei microsatelliti Il polimorfismo nei microsatelliti consiste nel diverso numero di copie del motivo semplice il numero degli alleli è generalmente compreso tra 4 e 40 il grado di variabilità dei microsatelliti è correlato positivamente con il numero di ripetizioni; microsatelliti corti sono in genere monomorfici A causa dell’elevato tasso di mutazione, gli alleli dei microsatelliti uguali in stato spesso non lo sono per discendenza (CORSO EVOL. MOLECOLARE) Microsatelliti interrotti in genere mostrano un grado minore di variabilità di microsatelliti perfetti di pari lunghezza La mutazione nei microsatelliti generalmente non ha effetti fenotipici, ma in alcuni casi è causa di importanti malattie, in gran parte neuro-degenerative (CORSO GENETICA UMANA)

Tetranucleotide repeats selezionati I microsatelliti in ambito forense «Il microsatellite ideale» (nella genetica forense) Microsatellite con elevata eterozigosità Microsatellite con range allelico contenuto Microsatellite amplificabile in corti prodotti PCR Microsatellite i cui alleli siano ben separabili su gel Microsatellite che presenti un ridotto fenomeno di stuttering Microsatellite con tasso di mutazione contenuto Microsatellite situato su autosomi Molte di queste caratteristiche si escludono vicendevolmente: Qual è un ragionevole compromesso? Tetranucleotide repeats selezionati

I microsatelliti in ambito forense Necessità di identificare un set unico (core) di microsatelliti che sia condiviso da tutta la comunità genetico forense. Pannello di 13 microsatelliti «core» (in giallo) secondo il CODIS, USA CODIS (Combined DNA Index System) Programma dell’FBI in supporto alla giustizia attraverso l’utilizzazione di databases di profili genetici. In UK e alcuni altri stati Europei si utilizza un core di 10 STR, 8 dei quali in comune con il CODIS I 13 microsatelliti furono scelti nel 1997 a partire da 17 loci candidati, in base alla loro variabilità e facilità di interpretazione dei risultati. I 13 loci sono tutti «tetranuceotide repeats», sia semplici che composti. L’analisi dei 13 loci del CODIS porta a profili genetici la cui probabilità di random match media è minore di 1 su un milione di milioni (10-12) .

I microsatelliti in ambito forense Necessità di identificare un set unico (core) di microsatelliti che sia condiviso da tutta la comunità genetico forense. I kit commerciali sviluppati da Applied Biosystems (a sinistra) e Promega (sotto) permettono di amplificare i 13 STR «core» del CODIS più alcuni altri STR. I kit commerciali sono in continua «evoluzione» inseguendo le richieste della comunità forense (>loci, mini STR, Y-STR , STR ipervariabili ecc.) I kit commerciali sono in continua «evoluzione» inseguendo le richieste della comunità forense ( maggior numero di loci coamplificabili, mini STR, Y-STR , STR ipervariabili ecc.)

Nomenclatura dei microsatelliti (e dei loro alleli) Necessità di fare riferimento ad una nomenclatura univoca per permettere il confronto tra laboratori e con i diversi database Nomenclatura degli alleli: (1) Scelta del filamento Se il microsatellite è in un gene, si prende in considerazione il filamento codificante Se il microsatellite non è in un gene, si prende in considerazione il filamento corrispondente alla sequenza originariamente descritta in letteratura e riportata in un database pubblico. La direzione di lettura è sempre, ovviamente, 5’-3’ Figure 5.6 (Butler 2012) Example of the DNA sequence in a STR repeat region. Note that using the top strand versus the bottom strand results in different repeat motifs and starting positions. In this example, the top strand has 6 TCTA repeat units while the bottom strand has 6 TGAA repeat units. Under ISFG recommendations, the top strand from GenBank should be used. Thus, this example would be described as having [TCAT] as the repeat motif. Repeat numbering, indicated above and below the sequence, proceeds in the 5’-to-3’ direction as illustrated by the arrows. 1 2 3 4 5 6 5’-TTTCCC TCAT TCAT TCAT TCAT TCAT TCAT TCACCATGGA-3’ 3’-AAAGGG AGTA AGTA AGTA AGTA AGTA AGTA AGTGGTACCT-5’ 6 5 4 3 2 1

Nomenclatura dei microsatelliti (e dei loro alleli) (2) Nome del motivo ripetuto. Nell’esempio riportato sotto, potremmo parlare di un microsatellite di tipo (TCAT)n oppure (CATT)n oppure (ATTC)n o ancora (TTCA)n (TCAT)n (3) «Microvarianti». Alleli con motivi ripetuti incompleti devono includere il numero di ripetizioni complete e, separate da un punto, il numero di basi nella ripetizione incompleta. Esempio 9.3; 14.2 ecc. 1 2 3 4 5 6 5’-TTTCCC TCAT TCAT TCAT TCAT TCAT TCAT TCACCATGGA-3’ 3’-AAAGGG AGTA AGTA AGTA AGTA AGTA AGTA AGTGGTACCT-5’ 6 5 4 3 2 1 Figure 5.6 (Butler 2012) Example of the DNA sequence in a STR repeat region. Note that using the top strand versus the bottom strand results in different repeat motifs and starting positions. In this example, the top strand has 6 TCTA repeat units while the bottom strand has 6 TGAA repeat units. Under ISFG recommendations, the top strand from GenBank should be used. Thus, this example would be described as having [TCAT] as the repeat motif. Repeat numbering, indicated above and below the sequence, proceeds in the 5’-to-3’ direction as illustrated by the arrows.

Generare un profilo STR 1. Estrazione e quantificazione del DNA (attenzione: questi steps in genetica forense sono di fondamentale importanza e sono successivi ad uno step di caratterizzazione del campione – vedi lezioni Maggiore Iacovacci) Contenuto in DNA nucleare dei campioni biologici: Tipo di campione Quantità di DNA Sangue 30000 ng/mL macchia 1 cm2 200 ng macchia 1 mm2 2 ng Liquido seminale 250000 ng/mL tampone vaginale postcoitale 0 - 3000 ng/tampone Capelli capello strappato capello perso 1 - 750 ng/capello 1 - 12 ng/capello Saliva Urine Cellula umana diploide 10000 ng/mL 1 - 20 ng/mL ~5 pg

Generare un profilo STR: 2. Amplificazione mediante PCR multiplex Amplificare tramite PCR contemporaneamente più microsatelliti (multiplex), utilizzando primers fiancheggianti ciascun locus. Per ottenere buoni risultati i primers devono essere scelti con attenzione: Le temperature di annealing dei vari primers devono essere simili Devono essere valutate e minimizzate le possibili interazioni tra primers, anche appartenenti a coppie diverse (esempio complementarietà al 3’) Una valutazione sperimentale della concentrazione ottimale dei singoli primers è sempre necessaria quando si mette a punto una nuova multiplex, così come una titolazione dei vari componenti della PCR.

Generare un profilo STR: 2 Generare un profilo STR: 2. Amplificazione mediante PCR multiplex Problemi in ambito forense PRESENZA DI INIBITORI: I reperti biologici possono essere mescolati con inibitori della PCR di tipo organico ed inorganico che non sempre vengono eliminati efficacemente negli step di purificazione del DNA. Ulteriore purificazione, BSA, diluzione CONTAMINAZIONE IN LABORATORIO O IN FASE DI REPERTAZIONE: a causa della sua elevata sensibilità, la PCR presenta un forte problema legato alla contaminazione, in misura tanto maggiore quanto più il DNA in esame è scarso e/o degradato. Utilizzazione di guanti monouso e mascherine (in lab e in repertazione) Strumentazione e spazi pre- e post- PCR separati; Utilizzazione di puntali monouso con filtro Irradiazione con UV dell’area dedicata alla preparazione della PCR Creazione di un database di profili genetici del personale del laboratorio

Generare un profilo STR: 3 Generare un profilo STR: 3. sequenziamento mediante elettroforesi capillare

J.M. Butler (2009) Fundamentals of Forensic DNA Typing Printed 4/11/2017 Laser Inlet Buffer Capillary filled with polymer solution 5-20 kV - + Outlet Sample tray Detection window (cathode) (anode) Data Acquisition Sample tray moves automatically beneath the cathode end of the capillary to deliver each sample in succession Figure 9.2 Schematic of capillary electrophoresis instruments used for DNA analysis. The capillary is a narrow glass tube approximately 50 cm long and 50 microns in diameter. It is filled with a viscous polymer solution that acts much like a gel in creating a sieving environment for DNA molecules. Samples are placed into a tray and injected onto the capillary by applying a voltage to each sample sequentially. A high voltage (e.g., 15,000 volts) is applied across the capillary after the injection in order to separate the DNA fragments in a matter of minutes. Fluorescent dye-labeled products are analyzed as they pass by the detection window and are excited by a laser beam. Computerized data acquisition enables rapid analysis and digital storage of separation results. Contribution of the National Institute of Standards and Technology, 2010

Generare un profilo STR: 3 Generare un profilo STR: 3. sequenziamento mediante elettroforesi capillare: Prodotto PCR fluorescente viene denaturato con formammide e posto nel campionatore Si applica voltaggio elettrico Il prodotto PCR viene elettroiniettato nel capillare Il DNA migra nel polimero contenuto nel capillare; tanto più velocemente quanto minore è la grandezza del frammento Detector Window Quando il frammento arriva in corrispondenza di una finestra nel capillare, una sorgente laser eccita il fluorocromo legato al prodotto PCR

Generare un profilo STR: 3 Generare un profilo STR: 3. sequenziamento mediante elettroforesi capillare (segue) CCD Panel (with virtual filters) Argon ion LASER (488 nm) Color Separation Fluorescence ABI Prism spectrograph Processing with GeneScan/Genotyper software Sample Interpretation Sample Detection Capillary (filled with polymer solution) Il fluorocromo eccitato dal laser emette luce nel visibile, in un determinato intervallo di lunghezze d’onda (vedi dia succ.) e con una intensità che è proporzionale alla quantità di molecole di fluorocromo eccitate. La luce emessa viene filtrata per determinati range di lunghezza d’onda e convertita in un segnale elettrico che viene misurato in RFUs (Relative Fluorescence Units). I segnali elettrici vengono tradotti nei tipici picchi colorati degli elettroferogrammi.

J.M. Butler (2009) Fundamentals of Forensic DNA Typing Printed 4/11/2017 Spettri di emissione dei fluorocromi Applied B. in uso nel kit AmpFlSTR. I filtri virtuali sono rappresentati dalle quattro colonne nere centrate sul picco dello spettro di ciascuno dei 4 fluorocromi. A causa della sovrapposizione degli spettri, una matrice di deconvoluzione (4 x 4) deve essere utlizzata per una corretta interpretazione dei dati. (Butler 2010 Figura 9.8) 520 540 560 580 600 620 640 WAVELENGTH (nm) 100 80 60 40 20 310 Filter Set F with color contributions 5-FAM JOE NED ROX Laser excitation (488 nm, 514.5 nm) Normalized Fluorescent Intensity Figure 9.8 Fluorescent emission spectra of ABI dyes used with AmpFlSTR kits. The virtual filters for ABI 310 Filter Set F is represented by the four boxes centered on each of the four dye spectra. Each dye filter contains color contributions from adjacent overlapping dyes that must be removed by a matrix deconvolution. The dyes are excited by an argon ion laser, which emits light at 488 and 514.5nm.

Generare un profilo STR: 4 Generare un profilo STR: 4. interpretazione dei dati del sequenziamento: dati grezzi

RAW DATA PROCESSED DATA D3 vWA FGA D8 D21 D18 D5 D13 D7 Am Il software GENESCAN divide I dati grezzi in un elettroferogramma separato per ciascun colore Blue Green Yellow Red RAW DATA Il software GENOTYPER identifica i differenti loci e per ciascuno di essi riconosce gli alleli facendo riferimento ad uno standard di peso molecolare e ad un ladder allelico (vedi dia successive) D3 vWA FGA D8 D21 D18 D5 D13 D7 Am PROCESSED DATA

Ladder allelico (a) Ladder kit “PowerPlex ESI 17” (b) Ladder kit “Identifiler” Ladder allelico per il locus D16S539 prodotto da Promega (a) e Applied Biosystems (b)

Figure 5.7 (da Butler 2012) Genotyping is performed through a comparison of sized peaks from PCR-amplified samples to allele size bins. These allele bins are defined with the genotyping software using size information from an allelic ladder run with each batch of samples. Any peak falling in a particular dye color and allele bin size range is designated as an allele for that locus. Peaks in both the allelic ladder and the PCR-amplified samples are sized using the same internal size standard so that they may be compared to one another.

J.M. Butler (2009) Fundamentals of Forensic DNA Typing Printed 4/11/2017 Data Collection Peak Identification Data Review by Analyst/Examiner Color Separation Peak Sizing Comparison to Allelic Ladder Confirmation of Results by Second Analyst/Examiner Genotype Assign. to Alleles GeneScan software Genotyper software Internal size standard Matrix file (spectral calibration) Allelic ladder sample GeneMapperID software Expert Systems (e.g., FSS-i3, TrueAllele) Peak Editing to Remove Artifact Calls User-defined thresholds Figure 10.1 Steps involved in the genotyping process for STR profile determination. Software packages for DNA fragment analysis and STR genotyping perform much of the actual analysis, but extensive review of the data by trained analysts/examiners is often required. Contribution of the National Institute of Standards and Technology, 2010

La probabilità di match casuale “la regola del prodotto” Il peso di una corrispondenza (match) tra un profilo di DNA Q ed il profilo di un sospettato K è «quantificato» in termini di probabilità. Ovvero: qual’è la probabilità che un profilo come quello creato a partire dal materiale biologico rinvenuto corrisponda al profilo genetico di un individuo scelto a caso dalla popolazione? Si applica la regola statistica del prodotto per eventi indipendenti. Si assume che la probabilità dei singoli eventi (genotipi) corrisponda alla frequenza attesa del genotipo in questione in una popolazione che sia all’equilibrio di Hardy-Weinberg Prima di vedere come calcolare questa probabilità, è necessario (ri)prendere in con siderazione alcuni concetti base di genetica delle popolazioni

BREVE (MA FONDAMENTALE) INCISO Per la loro rilevanza in ambito genetico forense, nelle 5 slides a seguire si parlerà di: Frequenze alleliche Frequenze genotipiche Equilibrio di Hardy - Weinberg

Un allele è una variazione ad un locus ad esempio Allele 1: CCGCTACGTACGGCGATCGATGGCGGCCACGCTCGCGATCGCTACGCTA Allele 2: CCGCTACGTACGGCGATCGATGGCGGCTACGCTCGCGATCGCTACGCTA La frequenza allelica è la frequenza di un certo allele in una popolazione. Es. Popolazione composta da 20 omozigoti CC 45 eterozigoti CT 35 omozigoti TT Frequenza allele C = (20 x 2 + 45)/ 2x100 = 0.425 Frequenza allele T = (35 x 2 + 45)/ 2x100 = 0.575 Eterozigosità della popolazione per il locus in esame = 1-0.4252-0.5752 = 0.489

Esempio: Frequenze genotipiche e frequenze alleliche del locus STR D13S317 nella popolazione caucasuica americana: Attenzione al conteggio <5 per l’allele 15. Vedi didascalia figura

Equilibrio di Hardy-Weinberg Assunzioni: accoppiamento casuale no mutazione no migrazione no selezione popolazione infinita (no deriva genetica) sia p la frequenza di A , e q la frequenza di a . = p2 = q2 = 2pq AA Aa aa Le frequenze genotipiche raggiungono l’equilibrio in una generazione; Le frequenze alleliche rimangono costanti nel tempo All’equilibrio:

Generazione successiva Le popolazioni raggiungono l’equilibrio di Hardy-Weinberg in una generazione Non in equilibrio A1A1 A1A2 A2A2 0.6 0 0.4 Generazione successiva In equilibrio A1A1 A1A2 A2A2 0.36 0.48 0.16 p2 2pq q2 A1A1 A1A2 A2A2

Hardy-Weinberg equilibrium Nelle popolazioni naturali, le frequenze genotipiche sono quasi sempre in equilibrio di Hardy-Weinberg http://www.micro.utexas.edu/courses/levin/bio304/popgen/popgen.html

Equilibrio di Hardy-Weinberg Frequenza genotipica Frequenza allelica

Probabilità di match casuale 0.222 Locus D3S1358 x 0.222 x 2 = 0.1

Probabilità di match: la regola del prodotto 1 in 10 1 in 22,200 x 1 in 111 1 in 20 1 in 100 1 in 14 1 in 81 1 in 113,400 x 1 in 116 1 in 17 1 in 16 1 in 31,552 x 1 in 79,531,528,960,000,000

La legge di H-W e la misura di variabilità dei sistemi polimorfici La maggior parte delle misure di variabilità dei singoli marcatori genetici si basa sulla legge di Hardy-Weinberg. (1) L’eterozigosità (H) corrisponde (se non diversamente specificato) alla proporzione di genotipi eterozigoti in una popolazione che sia all’equilibrio H-W (eterozigosità attesa) Se p e q sono le frequenze alleliche di un sistema biallelico, allora l’eterozigosità è il ben noto prodotto 2pq Se il sistema è multiallelico con i alleli, indicate con pi le frequenze degli alleli, l’eterozigosità corrisponde a 1-∑pi2

La legge di H-W e la misura di variabilità dei sistemi polimorfici La maggior parte delle misure di variabilità dei singoli marcatori genetici si basa sulla legge di Hardy-Weinberg. (2) Probabilità di identità (matching probability) Considerato un locus, corrisponde alla probabilità che due individui «estratti» a caso dalla popolazione presentino lo stesso genotipo. Questa probabilità è pari alla sommatoria del quadrato delle frequenze dei singoli genotipi (perché?). In una popolazione all’equilibrio H-W, considerando un sistema polimorfico con i alleli, indicate con pi le frequenze degli alleli, e con Xi la frequenza dei genotipi, questa probabilità corrisponde a:

La legge di H-W e la misura di variabilità dei sistemi polimorfici La maggior parte delle misure di variabilità dei singoli marcatori genetici si basa sulla legge di Hardy-Weinberg. (3) Potere di esclusione (probabilità di esclusione) Considerato un locus, misura quanto un locus sia «potente» nel discriminare tra genotipi di una popolazione, e corrisponde alla probabilità di «estrarre» a caso dalla popolazione due individui che presentino genotipi diversi. Questa probabilità corrisponde al complemento ad uno della probabilità di identità :

Indici di diversità al locus D13S317 U.S. Caucasians, STR D13S317 H = 0.7845 PD = 0.8896 PI = 0.1104 Nota: fare attenziona alla differenza tra: (1) probabilità di match casuale tra genotipo Q e genotipo casuale della popolazione (corrisponde alla frequenza nella popolazione del genotipo Q) e (2) probabilità di identità (PI) per l’intero locus (sempre di probabilità di match si tratta).

La legge di H-W e la misura di variabilità dei sistemi polimorfici Esercitasi nel calcolo dei vari indici in uso in genetica forense (più avanti vedremo anche l’indice di paternità) Ipotetico locus multiallelico 10 alleli di uguale frequenza H = 0.90 PD = 0.981 PI = 0.019 Ipotetico locus biallelico p = q = 0.5 H = 0.5 (val. max per locus biallelico) PD = 0.625 (val max per locus biallelico) PI = 0.375 (val min per locus biallelico)

Problemi nell’interpretazione di profili STR Purtroppo, non sempre si ottiene un risultato di facile interpretazione come quello dell’esempio utlizzato per valutare la probabilità di match casuale OK

Problemi nell’interpretazione di profili STR A. Problemi «biologici» A.1: prodotti «stutter». Come conseguenza dello scivolamento della polimerasi nell’amplificare durante la PCR ripetizioni in tandem (fenomeno analogo a quello che porta alla mutabilità in natura dei microsatelliti) si ottengono alcuni prodotti PCR più corti di un’unità rispetto al numero di ripetizioni dell’allele amplificato. In genere, il prodotto dello stuttering ha un’altezza inferiore al 20% del picco «reale» (almeno per i loci validati in ambito forense). Punti da considerare: - differenze tra loci, - differenze per lo stesso locus in esperimenti diversi, - possibili problemi nell’interpretazione di tracce miste.

Problemi nell’interpretazione di profili STR A. Problemi «biologici» A.2: Pattern «multiallelici» Sono generalmente conseguenza della duplicazione (intra- inter- cromosomica) della regione che contiene uno dei microsatelliti della multiplex. Per quanto si tratti di un fenomeno raro (almeno nei microsatelliti forensi standard) sono state riportate in letteratura decine di differenti pattern triallelici. 1 2 3 Type 1 sbilanciata Type 2 bilanciata Punti da considerare: Differenza rispetto alle misture di campioni Problemi per il calcolo delle probabilità

Problemi nell’interpretazione di profili STR A. Problemi «biologici» A.3: Aggiunta di adenina al 3’ incompleta La Taq polimerasi in genere aggiunge al 3’ del filamento PCR neosintetizzato un’adenina. Le multiplex STR sono ottimizzate in modo che questo avvenga regolarmente. Può accedere tuttavia in alcuni casi che si verifichi una adenilazione incompleta dei prodotti PCR, che da luogo, per ciascun allele) a due picchi distanziati di una sola base nell’elettroferogramma. Incomplete adenylation D8S1179 -A +A Punti da considerare: Un picco più corto di una base rispetto al normale potrebbe essere interpretato come una «microvariante»

Problemi nell’interpretazione di profili STR A. Problemi «biologici» A.4: Alleli «off ladder» Sono alleli che presentano un numero minore (alleli “below ladder”) o maggiore (“above ladder”) di ripetizioni di quante ne siano presenti nei ladder commerciali per multiplex STR. Sono considerati “off ladder” anche gli alleli con una lunghezza dell’amplicone PCR tale da ricadere tra due alleli del ladder (microvarianti o alleli “between ladder”), generalmente dovuti a piccole inserzioni delezioni nell’amplicone. below ladder between-ladder (microvariante) Allelic ladder above ladder

Problemi nell’interpretazione di profili STR A. Problemi «biologici» A.5: Alleli nulli In presenza di una mutazione al 3’ del sito di annealing di uno dei due primers utilizzati per amplificare un STR, la Taq polimerasi non è in grado di sintetizzare il prodotto PCR. La conseguenza può essere quella che solo uno dei due alleli STR vengono amplificati. (vedi slide successiva per figura) Punti da considerare: Kit differenti per STR multiplex con diversi set di primers Problemi per il confronto con databases: stringenza della ricerca di match Problemi nei test di paternità

J.M. Butler (2009) Fundamentals of Forensic DNA Typing Printed 4/11/2017 Alleli nulli o sbilanciati dovuti a mutazioni nel sito di annealing di un primer * 8 6 Allele 6 amplicon has ‘dropped out’ Imbalance in allele peak heights Heterozygous alleles are well balanced No mutation Mutation at 3’-end of primer binding site (allele dropout) Mutation in middle of primer binding site (a) (b) (c) (Tratto da Butler 2010) Impact of a sequence polymorphism in the primer binding site illustrated with a hypothetical heterozygous individual possessing a ‘6,8’ genotype. Arrows represent PCR primers in different positions around the STR repeat region. Heterozygous allele peaks may be (a) well-balanced, (b) imbalanced, or (c) exhibit allele dropout. A ‘null allele’, such as shown in (c), can be detected through use of different PCR primers. Contribution of the National Institute of Standards and Technology, 2010

Problemi nell’interpretazione di profili STR B. Problemi «tecnici» B.1: “pull up”: Incapacità del detector nel risolvere appropriatamente i colori emessi dai fluorocromi utilizzati per marcare i primers. B.2: “Dye blobs”: Dovuti al distaccamento dei fluorocromi dai primers con conseguente loro migrazione indipendente B.3: Cristalli di urea e bolle d’aria: Rilevabili come falsi picchi sottili nell’elettroferogramma. B.4: Contaminanti: Sostanze normalmente non presenti nel polimero all’interno del capillare, fluorescenti nella regione visibile dello spettro. 

Situazioni molto comuni nelle indagini forensi di tipo investigativo Reperti difficili: DNA degradato DNA scarso Campioni misti Situazioni molto comuni nelle indagini forensi di tipo investigativo Quali strategie (tecniche e computazionali) possono essere utilizzate per risolvere casi in cui sono coinvolti campioni di questo tipo?

Reperti difficili: DNA degradato L’esposizione all’ambiente (acqua,batteri e funghi, UV, nucleasi) determina la progressiva degradazione del DNA. In presenza di DNA degradato, il vantaggio dell’utilizzazione di marcatori «corti» quali gli STRs è evidente. Se il DNA è fortemente degradato, potrebbero presentarsi dei problemi di amplificazione utilizzando le multiplex STRs, principalmente a carico dei microsatelliti in ampliconi più grandi. Progressiva diminuzione dell’amplificato

Reperti difficili: DNA degradato In situazioni di forte degradazione, si può ricorrere a markers/strategie alternative rispetto agli STR convenzionali In questi casi si possono utilizzare: SNPs (ampliconi < 100 basi) mtDNA (l’elevato numero di copie rispetto al nucleare aumenta la probabilità che i primer si appaino ad un segmento di DNA «intatto») «Mini-STRs» (STR con primer ridisegnati in modo da ottenere ampliconi più piccoli di quelli utilizzati normalmente) Altre possibilità valutate: aree protette da nucleosomi, riparazione del DNA Base pairs Differenti Markers RFLP (minisat multi-locus 50 100 500 1000 D1S80 STRs miniSTRs SNPs

Reperti difficili: DNA degradato Mini STR

(Low Copy Number ~ Low template; «touch» DNA) Reperti difficili: DNA scarso (Low Copy Number ~ Low template; «touch» DNA) Si parla di «low template» DNA (LT-DNA) quando la quantità di DNA disponibile per l’analisi è inferiore a 100-200 pg (il contenuto in DNA di 20-40 cellule diploidi). Sebbene la PCR sia in grado (con qualche difficoltà) di amplificare un bersaglio a partire da una sola cellula, il problema principale del LT-DNA è quello della sensibilità del metodo. Nel tempo sono stati messi a punto vari sistemi per aumentare il prodotto PCR, ad esempio aumentando il numero di cicli. Un’alternativa agli STR, in caso di LT_DNA, è l’analisi di mtDNA Perché? Vantaggi e svantaggi

Reperti difficili: DNA scarso Problemi: I problemi sono tutti relativi al piccolo numero di copie dello stampo. L’entità di amplificazione dei singoli loci (e dei singoli alleli di ciascun locus) è soggetta alle leggi del caso. Interi loci o singoli alleli possono essere non amplificati, oppure può verificarsi uno sbilanciamento tra alleli. Allo stesso modo, può verificarsi un’amplificazione significativa degli stutter. Figura slide successiva

LT-DNA: problemi con STR Reperti difficili: LT-DNA: problemi con STR Replicate #1 High stutter Replicate #2 Modificato da Butler (2012). Figure 11.3 Three replicate PCR amplifications of a 10 pg single source DNA template using the Identifiler kit (only green loci shown) and 31 cycles. The consensus profile, produced by recording all alleles that occurred at least two out of three times, matched the correct profile (note that the consensus wildcard “Z” for D2S1338 appropriately covers the allele 18 that has drop-out twice). The red arrows indicate positions of allele dropout and the blue arrows where severe peak height imbalance was observed. Replicate #3 Consensus Profile: 14,19 7,9.3 12,13 11,13 24,Z Correct Profile: 14,19 7,9.3 12,13 11,13 18,24

Reperti difficili: Reperti misti Quando due o più individui hanno contribuito al campione in esame si parla di campioni misti o «misture». Il profilo STR relativo a questi campioni sarà a sua volta un «profilo misto», nel quale potranno facilmente essere evidenziati loci con un numero di alleli > 2. Importanza dei sistemi multiallelici nell’analisi di misture L’altezza relativa dei picchi dell’elettroferogramma riflette in modo abbastanza preciso la quantità relativa di DNA dei due (o più) individui nella mistura, e permette di valutare se un determinato picco possa risultare dalla sovrapposizione di alleli provenienti da individui diversi. Come conseguenza delle diverse possibili combinazioni di due (o più) genotipi ad un singolo locus, si verificheranno fenomeni di sbilanciamento allelico (es mistura tra un omozigote con ripetizioni 10/10 ed un eterozigote 10/11). La maggior parte delle misture coinvolge solo due individui

Reperti difficili: Reperti misti Steps per l’interpretazione di profili misti 1. Identificare la presenza di una mistura 2. Designare gli alleli nell’elettroferogramma 3. Stabilire il numero di individui coinvolti 4. Stimare il contributo relativo dei diversi individui alla mistura 5. Considerare tutte le possibili combinazioni genotipiche 6. Confrontare con campione di riferimento

Reperti difficili: Reperti misti Dal profilo misto ai singoli profili: i diversi casi, le diverse strategie (cenni)

Le alternative agli STR autosomici

Non solo STR: gli SNPs nelle scienze forensi Sebbene gli STR autosomici siano i marcatori d’elezione della genetica forense, in alcuni casi si fa ricorso a marcatori differenti (SNPs) o situati su porzioni del genoma non autosomiche (mtDNA oppure cromosoma Y). Gli SNPs sono utilizzati principalmente quando il DNA da analizzare è fortemente degradato (prodotti PCR più piccoli, quindi maggiore probabilità di successo tecnico). Trovano tuttavia applicazione anche in: Predizione circa la popolazione di origine di un reperto biologico (AIMs, ancestry informartive markers) – (perché non gli STR?) Predizione di caratteristiche fenotipiche. Ad esempio il fenotipo «capelli rossi» può essere dedotto (in una certa misura) dall’analisi di polimorfismi nel gene «recettore della melanocortina 1» (MC1R).

Non solo STR: gli SNPs nelle scienze forensi

Autosomi Cromosoma Y mtDNA Marcatori autosomici, del mtDNA e del cromosoma Y: vantaggi e svantaggi nelle scienze forensi Autosomi Cromosoma Y mtDNA

Marcatori “uniparentali” nelle scienze forensi Cromosoma Y si utilizzano principalmente Y-STR La variabilità del cromosoma Y viene sfruttata nelle scienze forensi principalmente nei casi di misture maschio-femmina (es. violenza sessuale), per ottenere un profilo STR maschio-specifico non contaminato dal DNA della vittima. Altre applicazioni interessano: test di parentela nei quali non siano disponibili parenti stretti del probando (il profilo STR del cromosoma Y sarà identico in parenti anche molto lontani lungo le linee di discendenza maschile) Misture con un numero elevato di maschi possono essere più facilmente interpretabili se si analizza il cromosoma Y. Maschi deficienti per amelogenina Problemi principali: Essendo un cromosoma non ricombinante ( a parte le PAR) la variabilità si accumula solo per mutazione. Minore informazione e impossibilità di ottenere probabilità di match con la regola del prodotto (si usa la frequenza dell’intero aplotipo nella popolazione)

Marcatori “uniparentali” nelle scienze forensi mtDNA si “utilizza” principalmente la sequenza delle regioni ipervariabili (nel mtDNA umano non ci sono microsatelliti!!) La variabilità del mtDNA viene sfruttata nelle scienze forensi principalmente nei casi di DNA degradato o scarso (lezioni precedenti), a causa dell’elevato numero di copie di mtDNA per cellula. Al pari del cromosoma Y, il mtDNA viene usato anche nei test di parentela nei quali non siano disponibili parenti stretti del probando (la sequenza del mtDNA sarà identica in parenti anche molto lontani lungo le linee di discendenza femminile). Problemi principali: Come il cromosoma Y, mtDNA è un sistema non ricombinante e quindi la variabilità si accumula solo per mutazione. Ne consegue minore informatività («minore» variabilità) e impossibilità di ottenere probabilità di match con la regola del prodotto (si usa la frequenza dell’intero aplotipo nella popolazione per dare un peso alle compatibilità). Il DNA mitocondriale, per il tipo di genotyping cui è sottoposto (sequenziamento) non si presta facilmente nella risoluzione delle misture. La presenza frequente di eteroplasmia rappresenta un problema, soprattutto nel confronto di profili genetici provenienti da DNA estratto da tessuti diversi

Test di parentela e paternità

Test di parentela e paternità L’analisi del DNA può essere usata per studi sulla parentela di individui diversi. La maggior parte di questi studi riguarda: Test di paternità Studi per determinare se determinati individui (viventi o deceduti) siano imparentati. Analisi volte a risolvere casi di persone scomparse. Analisi volte ad identificare cadaveri nei disastri di massa Analisi di supporto ad investigazioni criminali (…il parente dell’assassino…) Predizione dell’origine etnica di un DNA (estendendo il concetto di parentela a quello di «coancestry»)

Sono, in altre parole, più simili geneticamente Test di paternità In tutti i casi, i test di parentela si basano su un concetto semplice: Individui imparentati condividono alleli in una maggiore proporzione (spesso misurabile) rispetto ad individui presi a caso dalla popolazione. Sono, in altre parole, più simili geneticamente Differenze tra autosomi, mtDNA, Cromosoma Y Consanguineità e alleli uguali per discendenza

Due possibili risultati: Test di paternità Due possibili risultati: (1) Compatibilità: Tutti* gli “alleli obbligati paterni” del figlio sono presenti nel padre putativo (2) Esclusione: Più* “alleli obbligati paterni” del figlio non sono presenti nel genotipo del padre putativo * Attenzione ad alleli nulli e mutazioni!!!

Allele obbligato paterno L’allele (i) che il padre DEVE avere Test di paternità Allele obbligato paterno L’allele (i) che il padre DEVE avere In base alle leggi dell’ereditarietà (1° legge Mendel ), considerando un locus autosomico e assumendo che “la madre sia certa”, se si conosce il genotipo di madre e figlio, è possibile dedurre (nella maggior parte dei casi) l’allele di origine paterna. Oppure (nei casi meno fortunati) due alleli di cui uno sia di origine paterna. Questo allele (o alleli) deve essere presente nel padre putativo (allele obbligato) pena esclusione della paternità.

Allele obbligato paterno Test di paternità Allele obbligato paterno

In caso di esclusione, il test può considerarsi concluso Test di paternità In caso di esclusione, il test può considerarsi concluso In caso di compatibilità, è necessario quantificare il “peso” dell’osservazione. P.I. = Indice di paternità (per un locus) C.P.I = Indice di paternità combinato (considerando più loci).

Test di paternità Indice di paternità  L’ indice di paternità si calcola attraverso il rapporto di due probabilità: Numeratore: probabilità che il padre putativo trasmetta l’allele(i) obbligato essendo il vero padre. Il trio in analisi è un vero trio Denominatore: probabilità che un uomo qualsiasi della popolazione trasmetta l’allele(i) obbligato essendo il vero padre. Il trio in analisi è un falso trio Queste due probabilità discendono rispettivamente dalle leggi di Mendel e dalle leggi della genetica di popolazioni, il loro rapporto esprime una verosimiglianza (Likelihood Ratio, LR) 

Esercitarsi nel calcolo! Test di paternità Indice di paternità: Esercitarsi nel calcolo! Esempio (semplice): Madre AB, Figlio AC, Padre AC Individuare l’allele/i paterno obbligato/i (allele C in questo esempio) Numeratore: Probabilità che il padre trasmetta l’allele obbligato = ½ (Mendel!!) Denominatore: Probabilità che un individuo a caso della popolazione trasmetta l’allele obbligato = Frequenza dell’allele nella popolazione (Hardy-Weinberg!!)  necessità di utilizzare database di frequenze alleliche. Se l’allele C ha frequenza nella popolazione (ad esempio) pC = 0,1, allora (in questo esempio): P.I. = 0,5/0,1 = 5

Test di paternità Indice di paternità

Test di paternità Indice di paternità  Un solo locus non è generalmente sufficiente per ottenere una informazione che abbia un peso rilevante circa la compatibilità osservata. Si considerano più loci C.P.I = Indice di paternità combinato Si ottiene come prodotto dei singoli P.I. Un valore di CPI > 100 viene in genere considerato sufficientemente alto da far ritenere il padre putativo il vero padre. CPI = 100 significa: « E’ 100 volte più probabile ottenere i risultati osservati (i profili genetici dei tre soggetti del trio) se il padre putativo (piuttosto che un uomo preso a caso dalla popolazione) è il vero padre Con i loci microsatelliti attualmente in uso in genetica forense, in caso di compatibilità si ottengono valori di CPI >> 100 

Test di paternità Indice di paternità  Un solo locus non è generalmente sufficiente per ottenere una informazione che abbia un peso rilevante circa la compatibilità osservata. Si considerano più loci C.P.I = Indice di paternità combinato Si ottiene come prodotto dei singoli P.I. Un valore di CPI > 100 viene in genere considerato sufficientemente alto da far ritenere il padre putativo il vero padre. CPI = 100 significa: « E’ 100 volte più probabile ottenere i risultati osservati (i profili genetici dei tre soggetti del trio) se il padre putativo (piuttosto che un uomo preso a caso dalla popolazione) è il vero padre Con i loci microsatelliti attualmente in uso in genetica forense, in caso di compatibilità si ottengono valori di CPI >> 100 

Test di paternità in presenza di mutazioni In caso di esclusione si osserva generalmente non compatibilità per più loci. Ma come considerare una situazione in cui solo uno (o “pochi”) dei loci analizzati non sono compatibili? Bisogna tener conto delle possibili mutazioni Tasso di mutazione? Come si tiene conto delle mutazioni? “two exclusion rule” e CPI in presenza di mutazioni

Test di paternità in assenza di madre In caso di assenza della madre è sempre possibile determinare quale/i siano gli alleli obbligati paterni. In caso di non paternità, sarà molto frequente ottenere un giudizio di esclusione In caso di paternità, si avranno meno informazioni per dare un peso alla compatibilità osservata Si può utilizzare anche in questo caso il CPI

quale marcatore? test di paternità distribuzione nel genoma: sufficiente che i geni non siano in LD per una più facile trattazione statistica: OK tutti i marcatori tasso di mutazione: non fondamentale ma da tenere in considerazione OK tutti i marcatori grado di eterozigosità: fondamentale, maggiore l’eterozigosità, maggiore l’informazione: OK minisatelliti, STR ereditarietà mendeliana: importante per una più facile trattazione statistica OK STR, SNPs tempi tecnici dell’esperimento costi dell’attrezzatura costi dell’esperimento precisione del metodo tipizzazione mediante PCR: non rilevante se non in relazione ai costi possibilità di automazione su larga scala: non rilevante Nella pratica forense per i test di paternità si utilizzano quasi solamente STRs

Investigazioni su persone scomparse Test di parentela Investigazioni su persone scomparse Tre categorie di campioni utilizzabili per identificazione di persone scomparse tramite l’analisi di profili genetici: Campioni provenienti dall’individuo scomparso (spazzolino da denti, pettine, vestiti, vecchi reperti medici come biopsie) Campioni di parenti che possono essere utlizzati per “ricostruire” il genotipo dell’individuo scomparso (“reverse parentage testing”) Campioni provenienti da resti umani non identificati Si utilizzano e si confrontano: (1) database di profili di DNA di persone scomparse; (2) database di profili di resti umani non identificati; (3) database di profili di parenti di persone scomparse

Identificazione delle vittime dei disastri di massa (DVI) Test di parentela Identificazione delle vittime dei disastri di massa (DVI) Tre categorie di campioni utilizzabili per identificazione di vittime di disastri: Campioni provenienti dall’individuo scomparso (spazzolino da denti, pettine, vestiti, vecchi reperti medici come biopsie) Campioni di parenti che possono essere utlizzati per “ricostruire” il genotipo dell’individuo scomparso (“reverse parentage testing”) Campioni provenienti dai resti rinvenuti sulla scena del disastro Problemi: Complicazioni dovute al numero di vittime In alcuni casi frammentazione e dispersione dei reperti Spesso DNA fortemente degradato a causa di incendi

Il progetto ha generato Identificazione delle persone disperse nel World trade center in seguito ad attacco terroristico del 9/11 Il progetto ha generato 52,000 profili STR 44,000 profili mtDNA 17,000 profili SNPs 850 delle 1594 vittime identificate grazie all’analisi del DNA