Le alternative ai microsatelliti autosomici: Parte 10 Le alternative ai microsatelliti autosomici: SNPs
Non solo STR: gli SNPs nelle scienze forensi 200 bp
SNPs (Single Nucleotide Polymorphisms) Sebbene gli STR autosomici siano i marcatori d’elezione della genetica forense, in alcuni casi si fa ricorso a marcatori differenti (SNPs) o situati su porzioni del genoma non autosomiche (mtDNA oppure cromosoma Y). Gli SNPs sono utilizzati principalmente nelle seguenti 4 situazioni: Identity SNP. Utilizzati a fini identificativi, in modo analogo a quanto visto per i microsatelliti. Quando il DNA da analizzare è fortemente degradato (prodotti PCR più piccoli, quindi maggiore probabilità di successo tecnico). Si scelgono quegli SNPs che presentano un elevato grado di eterozigosità (il più possibile vicino a 0,50 - massimo possibile per loci biallelici). Ancestry informative markers (AIMs) Predizione circa la popolazione di origine di un individuo ignoto a partire dal DNA estratto da un reperto biologico. Marcatori “fenotipici”. Predizione del fenotipo di un individuo ignoto a partire dal DNA estratto da un reperto biologico Lineage markers: Marcatori che identificano linee di discendenza materna e paterna grazie all’analisi della variabilità di cromosomi non ricombinanti (mtDNA e cromosoma Y)
SNPs – Identity SNPs SNPs utilizzati a fini identificativi, in modo analogo a quanto visto per i microsatelliti. In genere vengono utilizzati quando il DNA da analizzare è fortemente degradato (prodotti PCR più piccoli, quindi maggiore probabilità di successo tecnico). Si scelgono quegli SNPs che presentano un elevato grado di eterozigosità (il più possibile vicino a 0,50 - massimo possibile per loci biallelici). Si veda il case study relativo alla identificazione dei resti umani in seguito alll’attentato del 11 settembre
SNPs – Identity SNPs Quanti SNPs sono necessari per ottenere un livello di informazione paragonabile a quello ottenuto con le multiplex di microsatelliti? Possiamo considerare come misura di informazione la probabilità di identità vista in precedenza: PI Probabilità di identità per multiplex di microsatelliti: Fusion (23 microsatelliti autosomici) PI: 2.3 ×10-27 Per avere una simile PI con SNPs il cui MAF* sia 0.4 dovremmo usare 65 SNPs Multiplex SNPs (65 SNPs con MAF = 0.4) PI: 1.2 ×10-27 *MAF = Minor Allele Frequency
Identity SNPs vs STR, la diatriba SNPs – Identity SNPs Identity SNPs vs STR, la diatriba Uno dei grandi interrogativi d’attualità nella genetica forense riguarda la possibilità che gli SNPs possano sostituire i microsatelliti come identity markers PRO SNPs: un numero molto maggiore di SNPs rispetto ai microsatelliti può essere coamplificato in un singolo esperimento, ottenendo potenzialmente più informazione PRO STRs: esistono già database di profili STR, ma non database (se non molto limitati) di SNPs. Il passaggio agli SNPs comporterebbe la perdita di una grande quantità di informazione già disponibile La soluzione? Massive parallel sequencing of STRs and SNPs??
SNPs – AIM: ancestry informative markers Il tipo di variabilità di interesse non è più quello intra-popolazione, ma quello inter-popolazioni. Lo SNP ideale come AIM sarà quello in cui ci sono differenti alleli fissati in differenti popolazioni (quasi inesistente)
La diversità inter-popolazioni può essere misurata utilizzando l’indice di fissazione. In questo contesto, può essere considerato equivalente ad una distanza genetica 𝐹𝑆𝑇= 𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 (𝑝) 𝑝 𝑞
FST = (varianza di p) / ( p q ) Alcuni esempi pop1 p1 = 0.3; q1 = 0.7 pop2 p2 = 0.3; q2 = 0.7 FST = [(0.3-0.3)2 + (0.3-0.3)2] / 2 / (0.3 x 0.7) = 0.000 pop1 p1 = 0.6; q1 = 0.4 pop2 p2 = 0.3; q2 = 0.7 FST = [(0.6-0.45)2 + (0.3-0.45)2] / 2 / (0.45 x 0.55) = 0.091 pop1 p1 = 0.9; q1 = 0.1 pop2 p2 = 0.1; q2 = 0.9 FST = [(0.9-0.5)2 + (0.1-0.5)2] / 2 / (0.5 x 0.5) = 0.640 pop1 p1 = 1.0; q1 = 0.0 pop2 p2 = 0.0; q2 = 1.0 FST = [(1.0-0.5)2 + (1.0-0.5)2] / 2 / (0.5 x 0.5) = 1.000
FST = 0 le popolazioni hanno le medesime freq. alleliche FST varia tra 0 ed 1 FST = 0 le popolazioni hanno le medesime freq. alleliche FST = 1 le popolazioni hanno fissato alleli diversi 0 < FST < 1 le popolazioni hanno diverse freq. alleliche
SNPs – AIM: ancestry informative markers Per il loro basso tasso di mutazione (10-8/gener./base), gli SNP possono essere utilizzati per stabilire l’origine geografica di un individuo a partire dal suo DNA (negli SNPs, alleli derivati identici in stato sono generalmente identici anche per discendenza, IBS = IBD). Tra milioni di SNP conosciuti, vengono scelti quelli che presentano le maggiori differenze nelle frequenze alleliche tra popolazioni diverse, ovvero quelli che presentano i valori di FST più elevati Se si tratta di SNP autosomici, gli SNP con elevate differenze di frequenze tra popolazioni spesso sono (o sono stati) sotto selezione direzionale in alcune popolazioni ma non in altre. Con gli attuali marcatori autosomici AIMs è possibile ottenere info abbastanza precise a livello continentale (esempio Africa vs Europa), ma meno precise a livello sub-continentale (ad esempio Italia vs. Albania)
Distribuizione delle frequenze alleliche per quattro SNPs utilizzati come AIMs molto differenziati in popolazioni appartenenti a continenti/gruppi geografici diversi Kenneth K. Kidd , William C. Speed , Andrew J. Pakstis , Manohar R. Furtado , Rixun Fang , Abeer Madbouly , Martin... Progress toward an efficient panel of SNPs for ancestry inference Forensic Science International: Genetics, Volume 10, 2014, 23 - 32
SNPs – AIM: ancestry informative markers Utilizzando uno degli approcci possibili, l’inferenza sull’origine geografica del campione in esame avviene confrontando il profilo genetico ottenuto dall’analisi di 40-100 SNPs “AIM” con un database di frequenze alleliche per gli stessi SNPs, relativo a popolazioni differenti. Per ciascuna popolazione nel database, si calcola una probabilità di osservare quel profilo (usando le stesse regole viste per la probabilità di match casuale). L’origine geografica più probabile è quella relativa alla popolazione con la più elevata frequenza “stimata” del profilo. Si può calcolare un LR mettendo a rapporto la frequenza di un profilo in due diverse popolazioni
SNPs – AIM: ancestry informative markers Esempio: Genotipo individuo unknown (Q): AIM1 =T/T AIM2 = C/C DATABASE FREQUENZE ALLELICHE AIM1 in Europa: Allele T = 0.8, allele C = 0.2 AIM1 in Africa: Allele T = 0.1, allele C = 0.9 AIM2 in Europa: Allele C = 0.7, allele G = 0.3 AIM2 in Africa: Allele C = 0.2, allele G = 0.8 Frequenza profilo Q (basata sull’assunzione equilibrio Hardy-Weinberg) In Europa: 0.8×0.8 ×0.7×0.7 = 0.3136 In Africa: 0.1×0.1 ×0.2×0.2 = 0.0004 LIKELIHOOD RATIO LR = 0.3136 0.0004 =784 E’ 784 volte più probabile che Q sia di origine europea piuttosto che africana SNPs – AIM: ancestry informative markers
SNPs – AIM: ancestry informative markers
Ancestry informative markers per tutti (il business dell’ancestry) https://homedna.com/category/ancestry https://www.familytreedna.com/ https://www.ancestry.com/dna/ https://www.23andme.com/en-int/dna-ancestry/ e molti altri…. Forse anche uno show tutto italiano… http://www.bicformats.com/dna-adventure/
SNPs – Marcatori informativi sul fenotipo In genetica forense, i marcatori informativi sul fenotipo sono quelle varianti genetiche la cui analisi permette di ottenere informazioni rilevanti sul fenotipo «visibile» di un individuo (EVCs, Externally Visible Characteristics). Al pari degli AIMs, vengono utilizzati con scopo NON IDENTIFICATIVO MA INVESTIGATIVO Le informazioni ottenute mediante i marcatori di questo tipo permettono di riconstruire un IDENTIKIT che può essere utilizzato alla stessa stregua degli identikit «classici» basati sulle testimonianze oculari, ma con due vantaggi: Minore soggettività rispetto alle testimonianze oculari Possibilità di trattare la presenza di un certo EVC in modo probabilistico
SNPs – Marcatori informativi sul fenotipo I tratti umani attualmente utilizzati o studiati per fiinalità investigative sono A) Caratteri legati alla pigmentazione: Colore degli occhi Colore dei capelli Colore della pelle B) Altri caratteri: Altezza Morfologia cranio-facciale Età Calvizie Struttura dei capelli
SNPs informativi sul fenotipo EVCs: Si tratta (con l’eccezione dell’età) di caratteri ad ereditarietà complessa, in alcuni casi di tipo quantitativo (esempio altezza) spesso multifattoriali e multigenici caratteri quantitativi (vs. caratteri dicotomici) sono misurabili caratteri multifattoriali (vs. caratteri monofattoriali) intervengono geni ed ambiente caratteri poligenici (vs. caratteri monogenici) intervengono più geni caratteri complessi (vs. caratteri semplici) ereditarietà più complessa della Mendeliana monogenica Queste quattro categorie di “fenotipi” sono sovrapposte ma non coincidenti e sono accomunate dal fatto di presentare un tipo di ereditarietà non immediatamente interpretabile mediante la genetica Mendeliana.
SNPs informativi sul fenotipo EREDITABILITA’ Ai fini di una corretta predizione del fenotipo a partire dal genotipo, è essenziale che la componente ereditaria del fenotipo sia >> di quella ambientale. Per i caratteri quantitativi, la varianza fenotipica totale (VP) può essere scomposta in una varianza genetica (VG ) ed una varianza ambientale (VE) VP = VG + VE La proporzione di varianza fenotipica determinata geneticamente viene detta EREDITABILITA’ e viene indicata con h2 h2 = VG / VP Tutti i caratteri considerati per le investigazioni forensi hanno una ereditabilità molto elevata, in genere > 80%
Identificare i geni coinvolti in un ECVs: Gli studi di associazione Negli studi di associazione si valuta a livello di popolazione se esista una associazione statisticamente significativa tra un determinato fenotipo ed un particolare allele (oppure genotipo) al fine di individuare i geni coinvolti nella determinazione fenotipica A questo fine si confrontano gruppi di individui della stessa popolazione che presentino caratteristiche fenotipiche differenti (esempio capelli chiari vs capelli scuri) che vengono analizzati per una batteria di marcatori genetici (su tutto il genoma nei recenti studi genome-wide) Differenze statisticamente significative nella frequenza di alleli (o genotipi) tra i gruppi potrebbero indicare che quel marcatore si trova in corrispondenza di un gene rilevante per il fenotipo indagato
SNPs – marcatori informativi sul fenotipo Colore degli occhi Il colore dell’occhio dipende principalmente dalla quantità totale di melanina negli strati più superficiale dell’iride e dal rapporto quantitativo tra due diversi tipi di melanina (eumelanina e feomelanina). Individui con occhi marroni hanno un elevato rapporto eumelanina : feomelanina, mentre individui con occhi chiari hanno più feomelanina Nevi Cripte di Fuchs Noduli di Wolfflin Solchi contrattili
SNPs – marcatori informativi sul fenotipo Genetica del colore degli occhi Sembrerebbe un carattere Mendeliano classico ma….
SNPs – marcatori informativi sul fenotipo Genetica del colore degli occhi E’ un carattere poligenico con elevata ereditabilità in cui uno dei geni coinvolti (OCA2) da un contributo preponderante al fenotipo rispetto ad altri geni
Relazione tra genotipo e fenotipo SNPs – marcatori informativi sul fenotipo Genetica del colore degli occhi SNP rs12913832, Relazione tra genotipo e fenotipo Il gene OCA2 (ocular albinism 2) codifica per una piccola proteina di membrana implicata nel trasporto della tirosina all’interno dell’eumelanosoma (organulo cellulare deputato alla sintesi di eumelanina). L’allele G dello SNP rs12913832, localizzato in un enhancer del gene OCA2 (che si trova all’interno di un introne del gene adiacente HERC2), determina una diminuzione dell’espressione del gene OCA2 con conseguente diminuzione della sintesi di eumelanina e comparsa del fenotipo occhi azzurri. Distribuzione del colore degli occhi in Europa La mutazione rs12913832 è sorta una sola volta in Europa 6-10 kya
SNPs – marcatori informativi sul fenotipo Colore degli occhi Il sistema IRISPLEX Nel 2011 viene sviluppata la prima multiplex commerciale per la previsione del colore degli occhi basato sull’analisi dei polimorfismi del DNA, il sistema IrisPlex, basato sull’analisi di 6 SNPs in altrettanti geni: HERC2 (SNP rs12193832); OCA2 (rs1800407); SLC24A4 (rs12896399); SLC45A2 (rs16891982); TYR (rs1393350) e IRF4 (rs12203592), in grado di individuare, con un buon grado di confidenza, il colore degli occhi di un individuo a partire dal suo DNA.
SNPs – marcatori informativi sul fenotipo Colore dei capelli Il colore dei capelli dipende principalmente dalla distribuzione della melanina nei melanociti. Nei soggetti biondi, i pigmenti di melanina sono presenti nella sola cuticola, mentre in quelli castani o mori sono presenti anche nello strato midollare. Negli individui con capelli rossi i pigmenti di melanina sono sostituiti da pigmenti solubili diffusi.
SNPs – marcatori informativi sul fenotipo Genetica del colore dei capelli Anche il colore dei capelli è un carattere poligenico con elevata ereditabilità. Il primo gene identificato coinvolto nell’espressione di questo EVC è stato il recettore della melanocortina 1 (MC1R). Mutazioni in omozigosi (o doppi eterozigoti) per perdita di funzione in questo gene determinano la comparsa del fenotipo capelli rossi nel 96% dei casi. Successivamente sono stati identificati almeno altri 10 geni coinvolti nella determinazione del colore dei capelli oltre a MC1R: OCA2, HERC2, SLC45A2, KITLG, EXOC2, IRF4, TYR, SLC24A4, ASIP e TYRP1 , alcuni dei quali responsabili anche di variazioni di pigmentazione nell’occhio (come OCA2) e nella pelle (come MC1R)
SNPs – marcatori informativi sul fenotipo Colore dei capelli Il sistema HIRISPLEX: colore di occhi e capelli Il sistema HIrisPlex è un saggio di previsione del fenotipo basato su 24 SNPs relativi al colore di occhi e capelli, tra i quali ritroviamo i 6 SNPs del sistema IrisPlex sviluppato in precedenza e altri polimorfismi utili per l’inferenza del colore dei capelli.
SNPs – marcatori informativi sul fenotipo Colore della pelle Il colore della pelle non dipende tanto da una concentrazione più o meno elevata di melanina, quanto dalla sua disposizione nelle cellule che la contengono. Le cellule di individui con pelle scura hanno la melanina dispersa nel citosol; negli individui con la pelle chiara, invece, la melanina è racchiusa in vacuoli. La melanina è presente prevalentemente nello strato dell’epidermide e quasi assente nel derma.
SNPs – marcatori informativi sul fenotipo Genetica del colore della pelle Anche il colore della pelle è un carattere poligenico. Ma in questo caso i fattori ambientali sono piuttosto importanti nel determinare variazioni fenotipiche, anche temporali, per uno stesso soggetto, rendendo la previsione del fenotipo meno certa. Inoltre la variazione intra-popolazione del colore della pelle è molto più limitata rispetto a quella di altri tratti (occhi e capelli) , rendendo meno efficaci gli studi di associazione genome-wide effettuati per l’identificazione dei geni coinvolti. Nonostante queste limitazioni, è stato possibile identificare numerose mutazioni che nel loro insieme permettono di attenere una buona predizione del colore della pelle
SNPs – marcatori informativi sul fenotipo Colore della pelle Nel 2017, Welsh e collaboratori sono riusciti ad identificare un set di 36 SNPs da 16 geni in grado di prevedere, con stime statisticamente significative ed un elevato livello di accuratezza, il colore della pelle su scala globale (figura a destra). Nonostante al momento non esistano multiplex commerciali per la previsione del colore della pelle, è verosimile che i risultati ottenuti da Welsh e collaboratori possano essere utilizzati per sviluppare un nuovo saggio per questo fenotipo
SNPs – marcatori informativi sul fenotipo Morfologia cranio facciale La morfologia cranio facciale è di ovvia rilevanza a fini investigativi per la ricostruzione dell’identikit di un ignoto, ma è anche uno degli EVCs più complessi da analizzare, a causa dell’elevato numero di geni coinvolti ma anche del fatto che si tratta di un fenotipo molto più complesso di quelli relativi alla pigmentazione. L’importanza della componente genetica nella variazione fenotipica della forma del cranio è evidente se si considerano i seguenti fattori: I gemelli monozigoti presentano dei lineamenti molto simili, al punto da essere in alcuni casi indistinguibili, soprattutto in età giovanile Mutazioni a livello genetico, patologiche o meno, si esprimono spesso in cambiamenti fenotipici riproducibili dell’aspetto cranio-facciale; A livello continentale o sub-continentale, individui di differenti popolazioni sono caratterizzate da caratteristiche cranio-facciali differenti.
SNPs – marcatori informativi sul fenotipo Morfologia cranio facciale Da diversi anni, il professor M. Shriver del Dipartimento di Antropologia della Penn State University, sta conducendo ricerche volte a ricreare tridimensionalmente il cranio di soggetti, basandosi esclusivamente sulle informazioni ricavabili da un’analisi del loro DNA. Sono stati individuati 24 siti polimorfici che, secondo uno studio di Shriver et al. (2014) influenzano direttamente la morfologia cranio-facciale, e che si distribuiscono in 20 geni differenti: POLR1D, CTNND2, SEMA3E, SLC35D1, FGFR1, WNT3, LRP6, SATB2, EVC2, RAI1, ADAMTS2, ASPH, DNMT3B, RELN, UFD1L, ROR2, FGFR2, FBN1, GDF5 e COL11A1. Al momento, la ricostruzione della morfologia cranio facciale da risultati di limitata utilità ai fini investigativi
SNPs – marcatori informativi sul fenotipo Morfologia cranio facciale Al momento, la ricostruzione della morfologia cranio facciale da risultati di limitata utilità ai fini investigativi
SNPs – marcatori informativi sul fenotipo Inferenza sull’età E’ chiaro che l’età è un carattere che non può essere analizzato in modo analogo ad altri visti in precedenza, essendo determinata esclusivamente dal trascorrere del tempo. Ciò non toglie che l’età possa essere inferita a partire da un reperto biologico in base ad alcune modificazioni che si verificano nel corso della vita: Accumulo progressivo di delezioni nel mtDNA Accorciamento progressivo dei telomeri Variazione della metilazione delle isole CpG di alcuni geni. Quest’ultimo fenomeno in particolare si è rivelato molto utile per la predizione dell’età, permettendo di ottenere delle stime dell’età molto accurate, con un errore di pochi anni.
SNPs – marcatori informativi sul fenotipo Inferenza sull’età Il test predittivo sull’età si basa su un piccolo numero di isole CpG per le quali è stata dimostrata una elevata correlazione con l’età (3 nella figura a sinistra). In questi test bisogna tener conto che i pattern di metilazione possono cambiare a seconda del tessuto (e quindi del tipo di reperto: sangue, saliva ecc).
CASE STUDY (9): Lo snapshot della Parabon Nanolabs Una company americana ha messo recentemente a punto un kit che permette di mettere assieme informazioni sull’ancestry e sul fenotipo (colore di capelli, occhi e pelle, lentiggini, e forma della faccia) per fornire un identikit «molecolare» ad uso delle forze di polizia. Nel luglio di quest’anno, grazie anche all’identikit mostrato a destra, è stato possibile identificare l’autore di un aggressione avvenuta 10 anni prima ad Albuquerque (New Mexico), analizzando il DNA estratto dal materiale biologico rinvenuto sulla scena del crimine.