Parte 11 I marcatori uniparentali (Y e mtDNA) e del cromosoma X Genetica Forense (6 CFU) – Fulvio Cruciani Laurea Triennale in Scienze Biologiche Sapienza Università di Roma
Autosomi Cromosoma Y mtDNA Marcatori autosomici, del mtDNA e del cromosoma Y: vantaggi e svantaggi nelle scienze forensi Autosomi Cromosoma Y mtDNA
La variabilità del cromosoma Y nella genetica forense
MSY - Male Specific region of the Y chromosome Cromosoma Y Struttura del cromosoma Y umano MSY - Male Specific region of the Y chromosome
Le palindromi della regione ampliconica della MSY Elevata omologia di sequenza tra i due bracci delle singole palindromi: Conversione genica intracromosomica
Ereditarietà uniparentale paterna Assenza di crossing-over «Aploidia» Variabilità genetica del cromosoma Y umano (MSY) Ereditarietà uniparentale paterna Tasso di mutazione (3.0 × 10-8 mut/base/gen.) più elevato che negli autosomi Assenza di crossing-over Variabilità genetica dovuta solo a mutazione; Alleli a siti polimorfici in forte (o completo) linkage disequilibrium «Aploidia» Ne cromosoma Y = ¼ Ne autosomi Maggiore deriva genetica nelle popolazioni, che comporta: (1) Minore diversità entro popolazioni (2) Maggiore diversità tra popolazioni
VARIABILITA’ GENETICA DEL CROMOSOMA Y VARIABILITA’ INTERSPECIE Grado medio di divergenza tra sequenze umane e di scimpanzé: Cromosoma Y D = 1.9% Loci autosomici D = 1.2% mtDNA D = 35.8% (ND4, ND5) VARIABILITA’ INTRASPECIE Grado medio di divergenza tra differenti sequenze umane: Cromosoma Y = 0.04% Loci autosomici = 0.11% mtDNA = 0.90% Grado di differenziazione tra popolazioni umane per siti polimorfici biallelici: Cromosoma Y Fst = 0.35-0.45 Loci autosomici Fst = 0.08-0.15 mtDNA Fst = 0.18-0.35
Elevata variabilità inter-popolazioni Come conseguenza della ridotta Ne, mutazioni nella MSY definiscono ALOGRUPPI la cui distribuzione geografica è generalmente ristretta a specifiche regioni sub-continentali
VARIABILITA’ GENETICA DEL CROMOSOMA Y a livello molecolare Nella regione MSY sono presenti tutti i tipi di polimorfismi osservati negli altri cromosomi nucleari: Sostituzioni nucleotidiche e piccole ins/del Microsatelliti e Minisatelliti Polimorfismi per presenza/assenza di elementi retrotrasponibili (Alu, LINE1, SVA) Inversioni Copy Number Variants Variazione nel numero di copie di ripetizioni in tandem centromeriche Variazione nella lunghezza della porzione eterocromatica del braccio lungo del cromosoma
Elevato numero di alleli Elevata diversità genetica Identikit del marker perfetto in genetica forense microsatelliti vs. minisatelliti vs. SNPs vs… Elevato numero di alleli Elevata diversità genetica Possibilità di analisi a partire da DNA fortemente degradato Possibilità di analisi a partire da piccole quantità di DNA Possibilità di analisi di più markers in un singolo esperimento multiplex I microsatelliti o short tandem repeats (STR) sono i marcatori di elezione in genetica forense (identificazione personale)
Identikit del marker perfetto in genetica forense microsatelliti autosomici vs. microsatelliti Y-linked Caratteristiche STR autosomico STR Y-linked Numero di alleli simile Ploidia diploide aploide Ereditarietà biparentale uniparentale Ricombinazione/assortimento indipendente si no Genere femmine e maschi solo maschi
Identikit del marker perfetto in genetica forense (identificazione personale) microsatelliti autosomici vs. microsatelliti Y-linked simulazione per due STR, autosomico e Y-linked, con 10 alleli con frequenza 10% STR autosomici STR Y-linked Numero alleli (n) 10 Frequenza allelica (pi) 10% Numero genotipi possibili Totale = n(n+1)/2 = 55 di cui Eterozigoti = 45 Omozigoti = 10 Totale = n = 10 Frequenze genotipiche (Xi) Eterozigoti = 2pipj = 2% Omozigoti = pi2 = 1% Equilibrio Hardy-Weinberg = pi = 10% PI =(∑Xi2) PI = 0,019 PI = 0,1 PI (13 STR uguali) PI = 0,01913 = 4 × 10-23 (0,00000000000000000000004) Linkage equilibrium PI ≈ 0,01-0,001 (non calcolabile) Linkage disequilibrium Database di riferimento Database frequenze alleliche Database fr. aplotipiche
Microsatelliti Y-linked Aploidia Assenza di ricombinazione Minor numero di genotipi Profili condivisi tra individui correlati lungo le linee di discendenza paterna Minore potere di discriminazione rispetto a marcatori autosomici Nella routine genetico forense vengono utilizzati STR autosomici
Perché utilizzare i microsatelliti Y? Test di paternità/parentela nei quali non siano disponibili per l’analisi parenti stretti del probando Interpretazione di misture in cui siano coinvolti molti maschi Tracce miste di DNA maschio–femmina ad esempio nei crimini sessuali, nelle quali la componente biologica maschile di interesse sia minoritaria.
AUMENTARE IL POTERE DI DISCRIMINAZIONE DEI Y-STR Y-STR sono insostituibili nella risoluzione di misture maschio-femmina, ma il loro potere di discriminazione è basso a causa dell’aploidia e del linkage disequilibrium tra loci Tasso di mutazione di Y-STR «standard» ≈10-3 Esistono Y-STR che presentino un tasso di mutazione molto più elevato, tale, ad esempio, da permettere la discriminazione tra individui imparentati per via paterna? Rapidly mutating Y-STR (RM Y-STR)
AUMENTARE IL POTERE DI DISCRIMINAZIONE DEI Y-STR: Rapidly mutating Y-STR (RM Y-STR) Screening di 186 Y-STR in 1966 coppie padre-figlio Osservate 924 mutazioni in 120 Y-STR Tasso di mutazione globale 3.35 × 10-3 462/924 mutazioni (50%) osservate in soli 13 Y-STR 13 Y-STR con tasso > 10-2 Rapidly mutating Y-STR (RM Y-STR)
AUMENTARE IL POTERE DI DISCRIMINAZIONE DEI Y-STR: Rapidly mutating Y-STR 13 marcatori RM Y-STR (tasso mutazione > 10-2 mut/STR/gen), caratterizzati da un numero elevato di alleli Il tasso di mutazione elevato è correlato a due fattori: (1) Numero elevato di repeats e/o (2) coaplificazione di loci STR multipli
AUMENTARE IL POTERE DI DISCRIMINAZIONE DEI Y-STR: Rapidly mutating Y-STR (RM Y-STR) L’utilizzazione di soli 13 marcatori RM Y-STR permette di distinguere circa ¼ delle coppie padre-figlio e più della metà dei fratelli Numero di coppie analizzate Father - son Brothers % Coppie differenziate Numero di meiosi tra membri della coppia 17 Y-STR «standard» (Yfiler) 13 Rapidly Mutating RM Y-STR
Condivisione aplotipica entro popolazioni AUMENTARE IL POTERE DI DISCRIMINAZIONE DEI Y-STR: Rapidly mutating Y-STR (RM Y-STR) Condivisione aplotipica entro popolazioni Condivisione aplotipica tra popolazioni 17 Y-STR «standard» (Yfiler) 13 Rapidly Mutating RM Y-STR
Fine 2014: Introdotta una nuova multiplex ad uso genetico forense che permette di amplificare contemporaneamente 25 STR: 19 loci «standard» YSTR + 6 rapidly mutating Y-STR Y FILER PLUS Sensibilità: Profili completi con quantità minime di DNA (60 pg) Inibitori: Profili completi in presenza di inibitori a concentrazioni elevate (200 mM ematina; 100 ng/ml acido umico) Misture: Profilo maschile completo in misture maschio/femmina in rapporto 1:4000 m = 1.4% m = 1.2% m = 1.8% m = 1.2% m = 1.2% m = 1.6%
Y-STR Haplotype Reference Database (YHRD, www.yhrd.org) A causa del linkage disequilibrium tra loci, per dare un «peso» ad un match relativo ad un profilo Y-STR, è necessario fare riferimento a database di aplotipi piuttosto che di alleli
SNP del cromosoma Y come AIMs (Ancestry informative markers) Abbiamo visto in precedenza che per il loro basso tasso di mutazione (10-8/gener./base), gli SNP possono essere utilizzati per stabilire l’origine geografica di un donatore a partire dal suo DNA Con gli attuali AIMs autosomici è possibile ottenere informazioni sull’origine geografica del donatore a livello principalmente continentale (es. Africa vs Europa)
«Aploidia» Ne cromosoma Y = ¼ Ne autosomi Maggiore deriva genetica nelle popolazioni, che comporta: (1) Minore diversità entro popolazioni (2) Maggiore diversità tra popolazioni SNP della MSY da utilizzare come AIMs a livello sub-continentale
Distribuzione geografica dei principali aplotipi del cromosoma Y umano. La maggior parte degli aplotipi del cromosoma Y presenta una distribuzione limitata ad una singola area geografica (a livello continentale o sub-continentale) permettendo l’utilizzazione del cromosoma Y come AIM. L’elevato grado di differenziazione (rispetto alla maggior parte dei marcatori autosomici) è dovuto principalmente alla deriva genetica (minore dimensione efficace della popolazione)
La variabilità genetica del mtDNA nella genetica forense
Marcatori “uniparentali” nelle scienze forensi DNA mitocondriale (mtDNA)
mtDNA numero di copie L’interesse del mtDNA nella genetica forense è legato principalmente al numero molto elevato di copie per cellula. Tessuti diversi presentano diversi quantitativi di mtDNA. In alcuni casi estremi, in cui il DNA nucleare sia scarso o fortemente degradato, il mtDNA può rappresentare l’unica risorsa disponibile per ottenere informazioni sul genotipo.
DNA mitocondriale Variabilità genetica: Nel DNA mitocondriale umano la variabilità genetica è dovuta esclusivamente alla presenza di SNPs e piccole ins/del. Non sono presenti microsatelliti! - se si eccettua un piccolo (AC)5 che mostra poca variabilità osservati rari alleli nel range (AC)3 – (AC)7 Il tasso di mutazione per sostituzione di base è almeno 10 volte più elevato di quello osservabile negli autosomi ed ancora più elevato nelle regioni iper-variabili. C’è un elevato grado di diversità sia entro-popolazioni (a causa del tasso di mutazione elevato), sia inter-popolazioni (a causa della deriva genetica casuale)
DNA mitocondriale Variabilità genetica: regioni ipervariabili HV1, HV2, HV3 Si analizzano principalmente le regioni ipervariabili HV1 e HV2. I prodotti PCR possono essere più lunghi o più corti di quelli mostrati in figura, a seconda della qualità del DNA
mtDNA nella genetica forense La variabilità del mtDNA viene sfruttata nelle scienze forensi principalmente nei casi di DNA degradato o scarso, a causa dell’elevato numero di copie per cellula. Altri due fattori potrebbero contribuire al successo dell’analisi dell’mtDNA in presenza di DNA degradato: (1) essendo il mtDNA racchiuso in un organello delimitato una doppia parete, sembrerebbe più protetto rispetto al DNA nucleare; (2) essendo una molecola di DNA circolare è protetto dall’azione delle esonucleasi Al pari del cromosoma Y, il mtDNA viene usato anche (raramente) nei test di parentela nei quali non siano disponibili parenti stretti del probando (la sequenza del mtDNA sarà identica in parenti anche molto lontani lungo le linee di discendenza femminile). A causa dell’elevato grado di differenziazione inter-popolazioni, il mtDNA può essere utilizzato come AIM «ancestry informative marker»
Marcatori “uniparentali” nelle scienze forensi mtDNA come ancestry informative marker Gli aplotipi del mtDNA presentano un elevato grado di specificità continentale, che è conseguenza principalmente di deriva genetica (confronta con gli AIMs autosomici, dove il più importante fattore evolutivo alla base della differenziazione tra popolazioni è la selezione direzionale regione specifica). Possono quindi essere utilizzati in ambito investigativo per inferenze circa la provenienza biogeografica dei campioni.
Marcatori “uniparentali” nelle scienze forensi mtDNA nella genetica forense animale La variabilità del mtDNA viene sfruttata nella genetica forense animale per definire a quale specie appartengano determinati reperti. In questo caso, invece delle regioni ipervariabili usate nella genetica forense umana per discriminare tra individui diversi, si utilizzano regioni conservate codificanti della molecola. Da un punto di vista sperimentale, si utilizzano coppie di primers in grado di amplificare regioni ortologhe (ma non identiche) di più specie, e si riconosce la specie mediante sequenziamento.
mtDNA nella genetica forense Problemi principali: Come il cromosoma Y, mtDNA è un sistema non ricombinante e quindi la variabilità si accumula solo per mutazione. Ne consegue minore informatività («minore» variabilità) e impossibilità di ottenere probabilità di match con la regola del prodotto (come per il cromosoma Y, si usano database di frequenze aplotipiche per dare un peso alle compatibilità, vedi slide successiva). Il DNA mitocondriale, per il tipo di genotyping cui è sottoposto (sequenziamento di tipo Sanger) non si presta facilmente alla risoluzione delle misture. La presenza frequente di eteroplasmia rappresenta un problema, soprattutto nel confronto di profili genetici derivati da tessuti diversi
mtDNA nella genetica forense Dare un peso statistico ad un match basato su mtDNA (o cromosoma Y) Come per la RMP basata su STR autosomici, si valuta quanto sia frequente un determinato «profilo» nella popolazione. Non essendo però i siti variabili (SNP) della sequenza di mtDNA in linkage equilibrium, non sarà possibile estrapolare la frequenza del genotipo come prodotto delle frequenze alleliche dei singoli marcatori. Si ricava quindi la frequenza dell’intero APLOTIPO (combinazione di alleli a siti polimorfici differenti) semplicemente valutando quanto è rappresentato all’interno di un database di frequenze aplotipiche. Se il database ha dimensione N, ed il profilo è osservato X volte nel database, la frequenza p del profilo sarà 𝑝= 𝑋 𝑁 Per trovare l’intervallo di confidenza al 95% di questa stima: 𝑝±1.96×𝑆𝐸=𝑝±1.96 𝑝×(1−𝑝) 𝑁 Si utilizza poi, in modo conservativo, il limite fiduciario superiore della stima. Se il profilo non è presente nel database, si usa come limite fiduciale superiore il seguente valore: 1− (∝) 1 𝑁 = 1− 0.05 1 𝑁 ≅ 3 𝑁
DNA MITOCONDRIALE: eteroplasmia Eteroplasmia: presenza di molecole di mtDNA differenti in un individuo. L’eteroplasmia può essere limitata ed essere osservata a livello di singolo mitocondrio, cellula, tessuto. Il livello di eteroplasmia (proporzione di DNA mutato rispetto al DNA totale) può variare in tessuti/cellule differenti dello stesso individuo. La variabilità nel grado di eteroplasmia che si osserva in un individuo (e/o in momenti diversi della vita di un individuo) è conseguenza di (1) segregazione casuale del mtDNA nelle cellule figlie (vegetative segregation in figura), (2) replicazione / degradazione diseguale di molecole di mtDNA, anche in cellule che non sono in divisione. Inoltre (3) la selezione può favorire/sfavorire determinate mutazioni Omoplasmia: quando tutte le molecole di mtDNA (ad un dato livello di osservazione) sono uguali. Mutazione omoplasmica: mutazione che è presente in tutte le cellule di un individuo (oppure, se specificato, di un certo tessuto…).
La variabilità genetica del cromosoma X nella genetica forense
La variabilità genetica del cromosoma X nella genetica forense Da un punto di vista molecolare, sul cromosoma X si trovano gli stessi tipi di marcatori polimorfici presenti sugli autosomi e sul cromosoma Y. Il grado di variabilità genetica intra ed inter-popolazioni è modellato in gran parte dalla deriva genetica ed è intermedio tra quello del cromosoma Y e quello degli autosomi (N autosomi : X : Y = 4 : 3 : 1) L’interesse forense per il cromosoma X risiede nelle sue peculiari modalità di trasmissione genetica e viene utilizzato soprattutto per test di parentela o paternità complessi e/o deficitari. Può essere utile anche nel DVI e identificazione di persone scomparse X X X Y X X X Y
La variabilità genetica del cromosoma X nella genetica forense Caso 1: test di paternità deficitario (padre putativo non disponibile) Si ricorre alla nonna paterna. Analisi di un set di X-STR in figlia, madre, nonna paterna Identificazione degli alleli obbligati X-linked paterni. Per le modalità di trasmissione del cromosoma X, questi alleli saranno obbligati anche nella nonna paterna. Se c’è compatibilità, si può calcolare una probabilità di paternità, ma bisogna tener conto del fatto che gli STR «forensi» del cromosoma X sono organizzati in gruppi di linkage (vedi dopo)
La variabilità genetica del cromosoma X nella genetica forense Caso 2: Risoluzione di un caso di incesto non consenziente, nel quale il padre biologico del frutto dell’incesto può essere o il padre della vittima (ipotesi H1) oppure il fratello della vittima (ipotesi H2). In questa situazione, l’analisi classica basata sugli autosomi potrebbe rivelarsi inconclusiva, in quanto padre e fratello della vittima condivideranno molti alleli autosomici per discesa. Il cromosoma X del padre e del fratello della vittima non hanno invece nulla in comune, permettendo con maggiore probabilità di distinguere tra le due ipotesi
Cromosoma X: gruppi di linkage Gruppo di linkage 4 di linkage 3 di linkage 1 di linkage 2 Cromosoma X: gruppi di linkage Poiché presenti su un solo cromosoma, gli alleli dei microsatelliti del cromosoma X possono essere in linkage disequilibrium, ovvero gli alleli dei diversi STR potrebbero non essere associati in modo casuale nelle popolazioni. La maggior parte dei microsatelliti utilizzati in genetica forense ricade all’interno di 4 gruppi di linkage (in figura) ovvero 4 gruppi all’interno dei quali c’è linkage disequilibrium tra STR. Gli alleli dei microsatelliti all’interno di ciascun gruppo devono essere trattati in termini di aplotipi, come se si trattasse del cromosoma Y o del mtDNA. Ad aplotipi di gruppi di linkage differenti può poi essere applicata la regola del prodotto per il calcolo della rarità di un determinato profilo X. Esempio di multiplex di X-STR (investigator Argus X-12)
Identificazione del genere maschile/femminile in genetica forense L’dentificazione del sesso viene effettuata sfruttando le differenze nella composizione genetica tra femmine e maschi, ovvero la presenza in questi ultimi del cromosoma Y. Sono stati esplorati molti sistemi genetici diversi (indicati nella figura a lato) tutti caratterizzati dal presentare una copia sul cromosoma Y ed una copia omologa (ma non identica) sul cromosoma X. Il sistema più ovvio a questi fini è rappresentato dal gene SRY, implicato direttamente nella determinazione del sesso maschile. Il gene SRY tuttavia ha un omologo sull’X (SOX3) troppo differenziato per poter essere coamplificato con SRY ed utilizzato come controllo positivo dell’aplificazione (in quanto presente sul cromosoma X che si trova sia nei maschi che nelle femmine).
Identificazione del genere maschile/femminile in genetica forense Al gene SRY si preferisce la coppia genica AMELX/AMELY, codificante per una proteina coinvolta nella formazione dello smalto dei denti, l’amelogenina. Entrambi i geni sono attivi, sebbene nei maschi siano trascritti in diversa proporzione (AMELX 90%, AMELY 10%).
Identificazione del genere maschile/femminile in genetica forense Sono stati messi a punto numerosi saggi differenti per AMELX/AMELY. In tutti i casi una coppia di primer unica si appaia in corrispondenza di regioni di completa identità di sequenza in AMELX ed AMELY. La differente lunghezza del tratto amplificato nei due geni paraloghi permetterà di rilevare la presenza del cromosoma Y e/o X e determinare il sesso NGM select Fusion 6C
Identificazione del genere maschile/femminile in genetica forense Sono stati messi a punto numerosi saggi differenti per AMELX/AMELY. In tutti i casi una coppia di primer unica si appaia in corrispondenza di regioni di completa identità di sequenza in AMELX ed AMELY. La differente lunghezza del tratto amplificato nei due geni paraloghi permetterà di rilevare la presenza del cromosoma Y e/o X e determinare il sesso NGM select Fusion 6C
Identificazione del genere maschile/femminile in genetica forense AMELY nullo Sono stati osservati numerosi alleli AMELY nulli, con una frequenza molto diversa in paesi diversi. La frequenza degli alleli nulli può essere superiore al 1% in paesi del sud-est Asiatico, dove sono frequentemente associati ad uno specifico aplogruppo del cromosoma Y (J2e). L’allele AMELY nullo è quasi sempre conseguenza della delezione di estese porzioni del cromosoma Y (0.5-4 Mb), dovute frequentemente a ricombinazione omologa ineguale tra sequenze ripetute TSPY Individui di sesso maschile con AMELY nullo risulteranno di sesso femminile in base al test AMELY/AMELX. Per risolvere questo problema, nelle nuove multiplex è stato introdotto un STR dell’Y (es. DYS391)
Identificazione del genere maschile/femminile in genetica forense AMELX nullo Gli alleli AMELX nulli sono molto più rari rispetto agli alleli nulli AMELY e sono in genere dovuti a mutazioni puntiformi nel sito di annealing di un primer piuttosto che a delezioni estese che coinvolgono l’intero gene. La frequenza più alta finora riportata è 10/503 nell’isola di Sao Tomé (Africa occidentale) ed è comunque più comune in Africa che altrove Individui di sesso maschile con AMELX nullo risulteranno comunque di sesso maschile. Potrebbero tuttavia esserci dei problemi nell’interpretazione dei misti. Ad esempio un misto maschio (X-null) : femmina = 2:1 risulterebbe in due picchi AMELX e AMELY della stessa altezza, e potrebbe quindi essere interpretato come un misto maschio:maschio 1:1