Scarica Biologia molecolare applicata (Vai Martegani) e più Dispense in PDF di Biologia Molecolare solo su Docsity! Analisi dell’espressione di singoli geni - Northern blot o Sull’RNA totale o sui messaggeri purificati o Assoluta o relativa - RT-PCR o Totale o messaggeri, assoluta o relativa o Più sensibile e veloce della northern o PCR quantitativa o competitiva o Numero esatto di molecole di templato iniziale - Real time PCR o Assoluta o relativa o Segue la cinetica di reazione - Microarray o Spot dispensing o Gene chip I saggi di northern, southern… e gli array sono tutti basati sull’ibridazione, possono essere - Diretti: target freddi sul supporto e sonde marcate in soluzione (northern, southern…) - Inversi: sonde fredde sul supporto e target marcati in soluzione (array) Northern blot Partenza: RNA totale estratto o mRNA purificato con matrici/resine con oligo-dT Dosaggio allo spettrofotometro a 260nm sfruttando l’assorbanza delle basi azotate; si analizza la qualità dell’estratto leggendo a 280nm (aromatici delle proteine) e 240nm (fenoli) Corsa su gel denaturante di agarosio con formammide/formaldeide e separazione sulla base del peso molecolare; la migrazione è inversamente proporzionale al logaritmo del peso molecolare Visualizzati con intercalanti stechiometrici come l’etidio bromuro; con l’RNA totale si vedono i due segnali delle subunità ribosomiali in rapporto 1:1, a parità di quantità alla subunità maggiore si intercala più etidio e la banda più alta è più intensa Con i messaggeri purificati non si devono vedere bande definite per via delle piccole quantità Trasferiti su un filtro di nylon/nitrocellulosa (carichi +) mettendo il gel sopra a un foglio di carta che pesca da una vasca contenente un tampone, sopra al gel viene posto il filtro e carta asciutta che per capillarità fa salire l’acqua e gli acidi nucleici che rimangono bloccati sul filtro Il filtro viene fissato agli UV per formare legami covalenti con l’RNA (cross-linking); nella southern qui c’è un passaggio di denaturazione per separare il DNA Sonde e ibridazione Ibridazione con sonde che soprattutto nel caso di messaggeri rari devono essere molto sensibili; la marcatura può essere radioattiva o indiretta, quella radioattiva di solito è più sensibile Di una sonda radioattiva si misura l’attività specifica, come rapporto tra marcato e non marcato Il metodo più comune per sintetizzare sonde a DNA marcate radioattivamente è il random priming che sfrutta il frammento di Klenow privo dell’attività esonucleasica 5’-3’ (nick translation), nucleotidi marcati con 32P in posizione alfa e una miscela di esanucleotidi in tutte le possibili combinazioni come primer per la polimerasi (46 possibili oligo) Gli oligo si annealano a caso sul templato e vengono allungati fino all’oligo successivo, non avendo attività di nick translation e senza fare ligazioni si ottiene una miscela si frammenti radioattivi rappresentativi del templato Un’alternativa è sintetizzare sonde a RNA usando nucleotidi marcati e una RNA polimerasi fagica (T3, T7 o SP6), usando plasmidi pGEM che hanno i promotori delle polimerasi ai lati del polylinker e che non avendo terminatori di trascrizione vengono linearizzati dall’altro lato, in funzione della polimerasi scelta Il vantaggio è l’efficienza delle polimerasi fagiche che porta ad un’amplificazione e quindi ad una maggiore sensibilità rispetto al random priming ed inoltre in questo caso si può anche eliminare in modo specifico il templato usando la DNAsi 1 specifica per il DNA Le sonde a RNA si possono usare nella southern che contiene entrambi i filamenti, per usarle nella northern è necessario conoscere il senso di trascrizione dei messaggeri target Il metodo a minore attività specifica prevede la marcatura delle due estremità con 32P usando fosfatasi alcalina per rimuovere il fosfato terminale e poi la polinucleotide chinasi T4 e ATP marcato in gamma per fosforilare e marcare l’estremità L’ibridazione è l’appaiamento di due filamenti di RNA o DNA che formano un ibrido a doppia elica mediante formazione di legami idrogeno tra basi complementari; l’ibrido può essere DNA/DNA, DNA/RNA o RNA/RNA e la sua stabilità dipende dalla complementarietà e dalle condizioni sperimentali, aumentando le condizioni di stringenza la percentuale di omologia deve essere più elevata. La stringenza dipende da temperatura, concentrazione di sali (stabilizzano le ibridazioni non perfette) e di denaturanti Prima di ibridare il filtro si fa un passaggio di blocking per saturare i siti di legame aspecifici, usando BSA/latte nella western e DNA di sperma di salmone in northern e southern Poi si ibrida aggiungendo le sonde overnight, poi si fanno lavaggi successivi aumentando la stringenza e alla fine il filtro viene esposto ad una lastra autoradiografica per rilevare il segnale Marcature non radioattive possono essere - Dirette : nucleotidi marcati con un fluoroforo - Indirette : nucleotidi marcati con un gruppo che possa essere riconosciuto in modo specifico (es. digossigenina-anticorpi o biotina-streptavidina) e al secondo elemento è coniugato un fluoroforo o un enzima che emetta luce Le marcature non devono interferire con la formazione dei legami fosfodiesterici e di quelli a idrogeno, se necessario vengono distanziate con uno spacer dal nucleotide o Taqman: una sola sonda (meno specificità) che porta un fluoroforo e un quencher alle due estremità e che viene idrolizzata dall’attività di nick translation della polimerasi o Molecular beacons: stesso principio della Taqman ma quando non è annealata assume una struttura a stem-loop e non viene idrolizzata o Scorpions: struttura a stem-loop con reporter e quencher, legata direttamente al primer della PCR SYBR green È un aromatico policiclico che si intercala in modo stechiometrico nel solco minore, viene eccitato a 488nm nel blu ed emette a 522nm nel verde; è preferito all’etidio perché ha un background di fondo molto minore e a parità di quantità ha intensità di emissione 200 volte superiore, quindi la sensibilità è molto maggiore Usando il SYBR l’eccitazione e il rilevamento vengono fatti ad ogni ciclo dopo la polimerizzazione, quando si è formato il double strand e il SYBR è intercalato È un sistema semplice ed economico ma non avendo sonde poco specifico, i primer devono essere studiati bene per non annealarsi off-target ed inoltre è impossibile analizzare più target in contemporanea La presenza di amplificazioni non specifiche viene rilevata con le curve di melting: la Tm viene misurata alzando la temperatura e seguendo la denaturazione guardando l’aumento dell’assorbanza a 260nm Aumentando la temperatura la denaturazione fa tornare in soluzione il SYBR e porta anche ad una diminuzione della fluorescenza, che avrà lo stesso andamento delle curve di melting La Tm quindi è anche il punto in cui la fluorescenza è diminuita del 50% ed è il punto di flesso della funzione, facendo la derivata negativa il flesso si trasforma in un picco che è specifico per ogni molecola di DNA, l’area sottesa corrisponde alla quantità di prodotto Contaminanti o varianti alleliche quindi appariranno come picchi secondari, lontani o vicini al picco del target in funzione della differenza in lunghezza e composizione Sonde di ibridazione Sono one labelled se contengono solo il fluoroforo reporter e dual labelled se contengono anche un quencher, ma tutte si basano sull’effetto FRET (fluorescent resonance energy transfer) L’effetto FRET è basato sul trasferimento di energia da un fluoroforo donatore ad uno accettore, eccitando il donatore è possibile quindi rilevare il segnale dell’accettore Perché avvenga lo spettro di emissione del donatore deve essere parzialmente sovrapposto a quello di eccitazione dell’accettore e i due devono trovarsi ad una distanza di 10-100Å (distanza di Foster) Un elettrone del donatore viene eccitato e si ritrova molto vicino alle nuvole elettroniche dell’accettore, collide con uno degli elettroni dell’accettore e gli trasferisce energia eccitandolo ad un livello però comunque inferiore di quello del donatore Per avere FRET è fondamentale che i due spettri siano solo parzialmente sovrapposti, per poter avere trasferimento netto di energia tra donatore e accettore; l’accettore si trova comunque ad un livello energetico minore e quindi anche collidendo nuovamente con il donatore non riesce a trasferirgli indietro energia, quindi si rilassa emettendo fluorescenza che viene rilevata Sonde di ibridazione Sono due sonde one labelled interne al target, una marcata con il donatore e una con l’accettore in modo che dopo l’annealing i due fluorofori si trovino alla distanza di Foster Il rilevamento della fluorescenza viene fatto dopo l’annealing ma prima della polimerizzazione eccitando il donatore e rilevando il segnale dell’accettore che sarà proporzionale alla quantità di templato presente Avendo le due sonde il sistema è più specifico ed inoltre è possibile analizzare più target usando sempre lo stesso donatore e accettori diversi specifici per i target, la difficoltà sta nello studiare bene le condizioni di annealing di tutte le sonde Taqman I due fluorofori sono un reporter donatore e un quencher accettore quindi quando i due si trovano a distanza di Foster il segnale è quenchato, se vengono allontanati il donatore può emettere fluorescenza La sonda ha in 5’ il reporter e in 3’ in quencher ed è fatta il modo che quando si anneala e linearizza il segnale sia quenchato, poi la polimerasi Taqman idrolizza la sonda avendo attività di nick translation e il reporter va in soluzione emettendo fluorescenza Il rilevamento avviene subito dopo l’inizio della polimerizzazione, la sonda è studiata per annelarsi vicino al primer ed è anche modificata in 3’ con un blocker per non essere usata come primer Le sonde vengono degradate, quindi non si possono studiare le curve di melting Il sistema può essere usato anche per studiare più target, usando sonde Taqman che abbiano diversi reporter con stessa eccitazione ma emissione diversa Molecular beacons In soluzione assume una struttura a stem-loop in cui reporter e quencher sono vicini, quando si anneala e linearizza vengono allontanati e il reporter emette fluorescenza Il loop è complementare al target mentre le due regioni stem no, la sonda si ibrida ad una temperatura più alta rispetto ai primer e quindi il rilevamento va fatto dopo aver alzato la temperatura, prima di raggiungere quella ottimale per la polimerizzazione a cui la sonda si stacca La sonda non viene degradata, può essere usato per lo studio delle curve di melting Il rilevamento a temperature elevate però aumenta il rumore di fondo, parte della sonda in soluzione si linearizza ed emette fluorescenza anche se viene ridotto dal software che è in grado di discriminare tra la fluorescenza emessa dalla sonda ibridata e quella della sonda in soluzione parzialmente linearizzata Scorpions Lo stem-loop ha il reporter in 5’ e il quencher in 3’ ed è collegato al primer di PCR, separato mediante un blocker che blocca la polimerizzazione in senso opposto evitando che venga copiata anche la sonda La regione loop è complementare al filamento neosintetizzato, subito dopo il primer Il primo ciclo è normale, poi dopo la denaturazione del secondo ciclo il loop si anneala intramolecolarmente al filamento neosintetizzato linearizzando la sonda che quindi emette fluorescenza È un metodo più complesso, le sonde sono più difficili da studiare e costose ma essendo l’interazione intramolecolare il sistema è più sensibile Generalmente per costi/benefici si usa la Taqman, solo in alcuni casi ha senso usare gli scorpions Quantizzazione Può essere relativa o assoluta che permette di determinare il numero di molecole di templato iniziale, confrontando il campione con una curva standard di fluorescenza ottenuta da DNA in quantità note Il valore di fluorescenza espresso nel grafico finale è normalizzato con una serie di controlli: si fa una reazione senza templato per ottenere il rumore di fondo della metodica e per ogni punto del grafico la fluorescenza è normalizzata su un fluoroforo che non partecipa alla reazione, il cui segnale quindi non dovrebbe variare nel corso della PCR ed elimina la variabilità del sistema di eccitazione e rilevamento Il segnale (Rn+) è calcolato come segnale del reporter / segnale del fluoroforo di controllo passivo Il rumore di fondo (Rn-) è calcolato allo stesso modo con una PCR senza templato La fluorescenza è poi espressa come Rn (Rn+ - Rn-) Sul grafico viene deciso arbitrariamente un valore soglia definito threshold e sulla base di questo valore si calcola il Ct, il ciclo a cui il segnale di fluorescenza raggiunge la threshold che dipende dalla quantità inziale di templato Gene chip Per effettuare la fotolitografia si parte da un chip di silice dotato di gruppi -OH da cui possa partire la sintesi delle probe che vengono bloccati con dei gruppi fotolabili Con un laser si degradano selettivamente i bloccanti nelle posizioni scelte e ai gruppi -OH liberi viene aggiunto il nucleotide desiderato, anch’esso bloccato con un gruppo fotolabile; con una serie di sblocchi selettivi nelle diverse posizioni vengono sintetizzate le sonde a sequenza nota Il chip è un cristallo di silicati SiO44- con struttura regolarissima e con numerosi gruppi -OH esposti in superficie Le sonde così sintetizzate sono al massimo di 25pb per essere statisticamente sicuri che la sequenza sia corretta, andando oltre anche avendo efficienza di reazione del 99% la sequenza non sarebbe considerata affidabile È quindi una tecnica costosa e difficile, ed inoltre richiede che il genoma sia sequenziato almeno con i metodi di NGS per avere frammenti di 25nt noti con certezza Per identificare univocamente un gene non bastano 25nt, generalmente per ogni gene sono presenti 20 probe da 25nt ciascuna La specificità quindi è data dall’avere 20*25= 500nt per identificare ciascun gene La sensibilità dall’avere 10 milioni di copie identiche di ciascuna probe Sono presenti anche dei controlli per essere sicuri che le ibridazioni siano tutte perfette al 100%, per ogni probe del chip c’è un controllo identico ma con un mismatch in posizione 13; il target si deve annealare solo alla probe e non al mismatch e i segnali rilevati garantiscono di avere un perfect match Gli mRNA vengono purificati dal trascrittoma usando oligo-dT ancorati come primer per la retrotrascrizione, poi l’RNA viene degradato e viene sintetizzato il complementare aggiungendo in 3’ una coda di poliC con la terminal transferasi e usando oligo-dG come primer I primer ancorati hanno come ala in 5’ il promotore della RNA polimerasi T7 che viene usata per trascrivere in vitro il cDNA a cRNA marcati con UTP modificati con biotina (molto più piccola dei fluorofori), questo è un passaggio di amplificazione necessario per poter rilevare mRNA molto rari I cRNA vengono frammentati casualmente con un tampone basico a pH11 e temperature controllate per ottenere frammenti di 50-100nt al massimo, dimensioni compatibili con l’ibridazione e inoltre la frammentazione aumenta ulteriormente la sensibilità Dopo l’ibridazione si usa streptavidina marcata con un fluoroforo per avere sufficiente risoluzione ed eccitando la fluorescenza viene rilevata con uno scanner confocale per poter analizzare un solo piano, usando un microscopio a fluorescenza analizzando tutti i piani la fluorescenza diffonderebbe; l’immagine di fluorescenza finale viene convertita in numeri che verranno usati dal software per le analisi DNA micro-dispensing Come probe vengono usati dei cDNA e come supporto un vetrino rivestito di polilisina per usare il gruppo ammidico per formare legami fosfoammidici stabili con il 5’-P La densità di sonde sul chip è molto inferiore ma il sistema è più semplice e più economico ed inoltre usando cDNA di 500pb non è necessario conoscere la sequenza del genoma Per indicizzare il supporto i cDNA vengono inseriti in un vettore e clonati a formare una libreria in coli, poi ciascun clone viene fatto crescere individualmente in una provetta e i cloni vengono deposti uno alla volta in modo ordinato sul supporto, in modo da sapere che clone c’è in ogni posizione; trattando a 70° le cellule si rompono e il cDNA viene rilasciato e denaturato, si lega ai gruppi amminici del filtro I target sono gli mRNA purificati che vengono retrotrascritti a cDNA marcati con Cy3 o Cy5-dCTP; i due campioni hanno due marcature diverse e vengono usati in quantità equimolari per ibridare lo stesso vetrino, i target dei due campioni competeranno per le stesse sonde e alla fine la gradazione di colore di ogni segnale dipenderà dalla quantità relativa di target nei due campioni Le cianine hanno elevata efficienza di emissione e sono poco soggette a foto bleaching, sono policicli molto ingombranti ma avendo dimensioni di 500-1000pb sono comunque compatibili con l’ibridazione mentre non lo erano nei gene chip; sono molto simili agli intercalanti e distorcono la struttura a doppia elica, avendo solo 25pb di ibridazione questo altererebbe troppo la stabilità Si potrebbe usare anche la biotina ma la marcatura non sarebbe differenziale tra i due campioni, per questi motivi nel gene chip si usa la biotina e nel dispensing le cianine Analisi dei dati degli array La densità di sonde nel dispensing è minore rispetto al gene chip, le differenze trascrizionali si possono valutare solo nell’intervallo 1-300000 contro 1-10mln nel gene chip Le due cianine devono avere spettri non sovrapposti per non dare minimamente effetto FRET, i due segnali devono essere indipendenti; le due cianine vengono eccitate contemporaneamente con una lampada alogena ad ampia lunghezza d’onda e i due segnali vengono rilevati indipendentemente e analizzati dal computer Il fold change viene calcolato come log2 Cy3/Cy5, è uguale a 0 quando le due fluorescenze sono uguali e il rapporto è quindi uguale a 1, tende ad infinito se il rapporto tende ad infinito e tende a - infinito se il rapporto tende a 0 Nel gene chip il profilo che si ottiene è dato dal cRNA testato senza competizione con altri campioni, si ottengono dati assoluti che devono poi essere confrontati È necessario validare i segnali, se ogni gene è rappresentato da 20 probe il segnale deve essere rilevato in tutte e 20 e per essere specifico deve essere assente nei controlli mismatch Ogni gene quindi è rappresentato da una “probe set” formata da 20 probe e 20 controlli; si lavora a coppie (probe pair) che sono positive se il segnale della probe è significativamente superiore a quello del mismatch e il software analizza le 20 probe pair per capire se il segnale è specifico o no I due dati dei campioni sono assoluti, per poterli confrontare devono essere normalizzati, provengono da esperimenti diversi di retrotrascrizione… La normalizzazione è fatta sulla fluorescenza totale del chip che dipende dalla quantità di cRNA caricata, in questo modo si normalizza la quantità di cRNA Dopo aver definito le probe pair positive e aver normalizzato si fa il controllo tra i due campioni usando solo le caselle di perfect match (PM) positive; il software calcola le variazioni tra i due campioni ed ottiene il fold change con calcoli complessi Il trascritto può essere increased, marginally increased, no change, marginally decreased o decreased Rispetto alla real time gli array possono analizzare più geni ma meno campioni contemporaneamente e sono un po’ meno precisi nello stimare le differenze di espressione, tipicamente di un profilo ottenuto dagli array si possono scegliere alcuni geni da validare con la real time (rose e cellule tumorali) Le metilazioni sono riconosciute dalle MeCP (metil-CpG binding protein) che generalmente reclutano deacetilasi istoniche che inattivano la trascrizione oppure agiscono direttamente come repressori trascrizionali Esistono due categorie di metilasi: - Di mantenimento : servono per ereditare gli schemi di metilazione durante la replicazione del DNA, riconoscono la sequenza emimetilata e metilano il filamento di neosintesi - De novo : responsabili delle metilazioni successive e a loro volta regolate a monte Il pattern di metilazione può cambiare con l’invecchiamento o con il cancro, generalmente si trova una globale ipometilazione che porta ad instabilità genetica e ipermetilazioni sito specifiche che inattivano i geni apoptotici, gli oncosoppressori… Esempi di patologie legate a difetti della metilazione: - Sindrome di Rett: legata all’X, soprattutto nelle bambine dopo i 18 mesi insorgono disturbi mentali, motori… dovuta a mutazioni nel gene della MeCP2 che funziona da repressore particolarmente nel cervello, queste mutazioni portano al mancato legame della proteina e all’espressione di geni che dovrebbero essere inattivati e alla patologia Può essere studiata con la ChIP, per verificare il legame della proteina al DNA - Sindrome dell’X fragile: dovuta a mutazioni nell’esone 1 del gene FMR1 in cui una tripletta CGG viene espansa per slittamenti della DNA polimerasi; il CpG viene metilato e il gene silenziato, l’assenza del prodotto che è importante nelle sinapsi determina la patologia Si pensa che la metilazione sia una conseguenza dell’espansione: le metilasi de novo riconoscono le ripetizioni come se fossero elementi trasponibili e li metilano per silenziarli Per analizzare le metilazioni esistono diverse tecniche: - Enzimi di restrizione suscettibili alla metilazione, con analisi di southern/PCR - Bisolfito di sodio che converte la citosina non metilata in uracile, accoppiandola ad una PCR quelle non metilate verranno convertite in adenina - PCR specifiche per la metilazione (MSP) - COBRA (combined bisulfite restriction analysis) associando il trattamento con bisolfito a quello con enzimi di restrizione - Methylated DNA immunoprecipitation (MeDIP) Gli enzimi di restrizione hanno metilasi corrispondenti, se la sequenza è metilata non tagliano Gli isoschizomeri sono enzimi che hanno lo stesso sito ma tagliano in modo diverso, e quindi sono diversamente sensibili alla metilazione; usando coppie di isoschizomeri il cui sito di taglio contenga dei CpG essi taglieranno diversamente se il sito è metilato o no, il prodotto viene poi analizzato sul gel dove compaiono bande tagliate o intere Il problema principale dell’approccio con southern gel è che non avendo amplificazione serve molto campione ed inoltre servono sonde radioattive Un’alternativa è fare PCR con due oligo ai lati del sito di taglio, una PCR viene fatta senza trattare con l’enzima e una dopo il trattamento, se ottengo la stessa banda del non trattato il sito era metilato, altrimenti se il sito non era metilato viene tagliato e non c’è amplificazione Trattando con bisolfito di sodio, facendo una PCR e sequenziando il DNA, comparandolo ad un DNA non trattato si identificano le citosine non metilate che sono state trasformate in timidine dalla PCR PCR specifiche per la metilazione vengono fatte dopo il trattamento con bisolfito usando oligo che riconoscono la sequenza di metilazione; usando due oligo diversi in modo che uno riconosca la sequenza con la C e uno la sequenza con la U si ottengono prodotti diversi a seconda dello stato di metilazione Le MSP possono anche essere real time, usando due sonde Taqman CG e TG marcate con due reporter diversi che daranno segnale a seconda del templato; questa tecnica permette anche di quantificare l’amplificato e studiare le varianti alleliche allo stesso tempo Per aumentare ulteriormente la specificità si possono usare contemporaneamente sia sonde che primer che discriminano metilato e non metilato Il COBRA associa un trattamento con bisolfito e PCR ad un’analisi di restrizione, il sito di taglio dell’enzima viene mantenuto solo se la C è metilata, altrimenti essa viene trasformata in T e il sito viene perso; oppure si può anche usare un enzima il cui sito compare solo se la C diventa T Nella MeDIP il genoma viene frammentato senza bisogno di cross- linkare e dopo aver prelevato l’input si immunoprecipita con un anticorpo specifico per le citosine metilate; input e precipitato vengono marcati con le cianine 3 e 5 e messi su un chip rappresentativo dei promotori Per marcare i target si fa una T-PCR con nucleotidi marcati, usando un pool di oligo che abbiano in 3’ 9-15nt in tutte le combinazioni e in 5’ un’ala costante di 17nt I primi cicli si fanno a bassa stringenza, facendo annealare le regioni casuali in modo da ottenere templati che hanno tutti le estremità uguali dovute all’ala costante; poi si fanno cicli ad alta stringenza usando oligo specifici per l’ala e fornendo i nucleotidi marcati con le cianine si ottengono amplificati rappresentativi dell’input e dell’immunoprecipitato Modificazioni agli istoni Responsabili della formazione della cromatina che compatta il DNA e influenza la trascrizione Il primo livello di compattazione è la catena di perle formata da nucleosomi, composti dagli istoni H2A, H2B, H3 e H4, tutti presenti in due copie per nucleosoma Per ogni nucleosoma ci sono 136 basi che formano poco meno di due avvolgimenti, la massa relativa tra proteine istoniche e DNA è circa equivalente, 100kDa ciascuno Il nucleosoma è composto da un core centrale formato da 2 H3 e 2 H4 compatte, mentre due omodimeri H2A e H2B si appoggiano sul core Le modificazioni su H3 e H4 sono prevalentemente a livello dell’N-terminale, tranne una centrale in H3 che però si trova comunque sulla superficie del nucleosoma; H2A e H2B invece hanno siti di modificazione sia in N che in C-terminale Le modificazioni superficiali sono molto importanti nelle interazioni con proteine che avvengono in quella regione del nucleosoma Le modificazioni istoniche sono di due tipi: - Covalenti : introducono un gruppo chimico con un legame stabile o lo rimuovono, acetilazione, metilazione, fosforilazione e ubiquitinazione - Non covalenti : modificano la posizione del nucleosoma che può essere rimosso, spostato o riassemblato La fosforilazione avviene su Ser/Thr, aggiunge una carica negativa e fa principalmente da signalling Metilazione e acetilazione sono mutualmente esclusive e avvengono sulle Lys, fanno da interruttore per accendere o spegnere l’espressione genica L’ubiquitina è un gruppo molto ingombrante che blocca l’ulteriore compattazione della cromatina Le estremità N-terminali di H3 e H4 sono ricche di lisine, in condizioni fisiologiche espongono la carica positiva per favorire l’interazione con il DNA e la compattazione L’acetilazione maschera la carica positiva ed espone gruppi idrofobici, rendendo più facile lo svolgimento del DNA La metilazione può essere mono-, di- o tri-; aggiungendo uno o due gruppi l’ammina della Lys che è primaria mantiene comunque la carica positiva, solo con la tri-metilazione la carica viene nascosta completamente La regolazione dipende da un’altra modificazione, una di-/tri-metilazione fatta dalla metilasi Dot1 sulla K79 di H3 che è presente sul 90% del genoma; visto che il 10% del genoma è silenziato l’ipotesi è che la metilazione sia anti-silenziamento Il sito della metilazione è molto vicino a quello di Sir3, la presenza del metile quindi ne blocca l’accesso e blocca il silenziamento della regione Un mutante che overesprime Dot1 ha il 100% del genoma metilato e lo 0% silenziato Un mutante dot1 però ha lo 0% metilato ma comunque lo 0% silenziato; questo avviene perché non avendo la metilazione Sir3 si lega a tutti i nucleosomi senza l’aiuto del dimero Sir2-Sir4 e si forma una struttura disordinata che impedisce il silenziamento K79 si trova sulla faccia superiore, vicino al sito di ubiquitinazione di H2B e la presenza dell’ubiquitina è fondamentale perché Dot1 possa di-/tri-metilare H3 Dot1 da solo riesce a monometilare il substrato ma dopo la prima reazione il substrato è meno reattivo e all’enzima serve più tempo, l’ubiquitina fa da scaffold e permette a Dot1 di rimanere più tempo a contatto con H3 e di di-/tri-metilarlo Quindi a monte della metilazione necessaria per il silenziamento c’è l’ubiquitinazione che viene fatta da Rad6 sulla K123 di H2B La de-ubiquitinazione invece viene fatta da Ubp10, che ha la stessa azione di Ubp8 ma in contesto diverso (8 agiva sui promotori, 10 sui telomeri) Il silenziamento avviene perché Sir2 deacetila K16 di H4, l’antagonista che acetila è Sas2 Ortologhi di Sir2 sono le sirtuine umane che richiedono NAD+ per funzionare, agenti come il resveratrolo stimolano il legame sirtuine-NAD+ anche in condizioni di stress ossidativo favorendone la funzionalità Super riassunto epigentica: Promotori inducibili attivatore trascrizionale recluta SAGA e Rad6 Rad6 ubiquitina H2B K123 TBP e Pol2 arrivano sul DNA Set1 metila H3K4 Gcn5 riconosce la metilazione e acetila l’intorno Ubp8 toglie l’ubiquitina Set2 metila H3K36, la pol procede repressore trascrizionale o metil-binding protein reclutano/fanno parte di complessi deacetilasici che spengono la trascrizione Interruttore molecolare H3K9 metilato o acetilato H3K9 metilato lega Hp1 che recluta metilasi del DNA; viceversa se il DNA è metilato viene legato dalle MeCP che reclutano deacetilasi istoniche che deacetilano K9, che viene poi metilato da metilasi istoniche reclutate dalle MeCP o da repressori trascrizionali Silenziamento dei telomeri Sir2-4 lega il dimero Ku70-80, cambia conformazione e lega Rap1 il telomero si avvolge intorno a Sir2-4 Sir2 deacetila H4K16 del primo nucleosoma reclutato Sir3 che recluta un altro Sir2-4… Max 20kb per la metilazione H3K79 fatta da Dot1 che impedisce il legame di Sir3, antisilenziamento Dot1 richiede l’ubiquitinazione di H2B K123 la de-ub fatta da Ubp10 impedisce la metilazione Antagonista di Sir2 è Sas2 che acetila H4K16 Martegani Colture cellulari Condizioni opportune per la crescita: - Nutrienti e metaboliti essenziali - Temperatura - pH - Aderenza o sospensione a seconda del tipo cellulare - Fattori di crescita - Indicatori di pH Cellule di mammifero hanno td di 20-24 ore, dopo 3-4 giorni si fermano per inibizione da contatto e perché finiscono i fattori di crescita; al tempo t il numero di cellule sarà uguale al numero iniziale moltiplicato per 2 t/Td Al tempo t la massa è uguale alla massa iniziale moltiplicata per e Kt , K è la costante di crescita e la pendenza della retta costruita mettendo su grafico la massa in scala logaritmica Nella fase di crescita esponenziale bilanciata il rapporto numero di cellule/massa è costante, e Kt =2 t/ Td e si può ricavare K=ln2/Td, si passa da costante di crescita a tempo di duplicazione Dopo 40/50 generazioni le cellule vanno in senescenza e smettono di replicare, compaiono però dei cloni immortalizzati che si replicano all’infinito; sono tendenti alla trasformazione tumorale ma hanno comunque inibizione da contatto e sono dipendenti dai fattori di crescita e dall’ancoraggio Le cellule possono essere trasfettate per inserire DNA esogeno, il primo modo è stato l’uso di CaCl2 in tampone fosfato, si forma fosfato di calcio che precipita e induce la pinocitosi, se è presente DNA questo è affine al fosfato di calcio e viene internalizzato insieme ad esso Per trasfettare sono fondamentali i marcatori di selezione: - Complementazione : tk o dhfr, richiedono l’uso di mutanti Per tk si fa selezione con terreno HAT: l’aminopterina inibisce DHFR e blocca la sintesi delle basi, l’ipoxantina permette di superare il blocco per AMP e GMP mentre solo in presenza di tk la timidina può essere convertita in TMP Per dhfr si fa selezione su terreno senza ipoxantina e timidina; usando metotrexato che inibisce DHFR a concentrazioni crescenti si possono anche selezionare le cellule che esprimono a livelli più alti il DNA esogeno - Dominanti : il ceppo non deve essere mutante, tipicamente resistenze ad antibiotici come neo per il G418 o HPH per l’igromicina I geni da esprimere devono avere promotore, terminazione e sito di poliadenilazione riconosciuti dalla cellula ospite per poter esprimere; i vettori di trasfezione hanno un polylinker che contiene siti unici di restrizione in cui clonare il gene target e ai lati del polylinker ci sono anche promotori riconosciuti dalle RNApol fagiche per fare trascrizione in vitro Tramite PCR o southern si analizzano i trasformanti per verificare l’avvenuta integrazione, l’espressione però varia a seconda dell’effetto posizione e l’inserzione può anche essere mutagenica; si possono usare gli insulator per ridurre l’effetto posizione, possono reclutare delle acetilasi istoniche per bloccare la progressione dell’eterocromatina e il silenziamento, oppure bloccare l’azione di enhancer a valle legando proteine che blocchino il legame di fattori trascrizionali… Esistono due classi di metodi per la trasfezione: - Chimici con agenti che permeabilizzano la membrana - Fisici creando pori sulla membrana I metodi chimici più usati sono quello del calcio fosfato che però funziona male con alcuni tipi cellulari, l’uso di DEAE-destrano modificato con dietilenamminoetili per essere carico contiene il promotore forte ed R il sito di poliadenilazione, quindi il trascritto non ha l’U3 iniziale e l’U5 terminale La replicazione del genoma parte da un tRNA cellulare per la tirosina complementare a una regione dell’RNA virale, esso fa da primer per la sintesi di un frammento di DNA Il tRNA viene digerito, il frammento si appaia alla regione R terminale e viene sintetizzato un filamento di DNA intero, poi la RNAsi H digerisce l’RNA virale L’RNA virale però contiene un tratto di polipurine più resistente, che non viene degradato dalla RNAsi H e fa da primer per la sintesi di una parte del filamento complementare, che poi si stacca e si appaia all’estremità consentendo di ottenere il genoma completo di DNA doppio filamento che comprende anche le due LTR alle estremità che può integrarsi nel genoma Dal genoma vengono rimossi i geni virali, sostituiti con un marcatore di selezione, un promotore forte e un polylinker e il vettore viene usato in cellule definite impacchettatrici, che contengono i geni gag, pol ed env necessari per la replicazione del vettore In alternativa si possono usare plasmidi helper che contengano i geni virali, per avere un sistema più sicuro possibile ed evitare che una ricombinazione possa formare un retrovirus ricombinante si usa un sistema a 4 plasmidi, 1 con il gene di interesse e 3 helper con i geni virali Animali transgenici La cosa fondamentale è che il transgene sia presente in tutte le cellule, soprattutto in quelle della linea germinale; i metodi principali sono tre: - Microiniezione nella cellula uovo fecondata, la probabilità di integrazione è alta iniettando molte molecole di DNA ma è una tecnica molto invasiva, viene fatta su tante cellule in contemporanea per averne qualcuna che sopravviva - Modificare e reinoculare nell’embrione cellule staminali embrionali - Infettare l’embrione con retrovirus Con PCR/southern si verifica la presenza del transgene ma a seconda di quando si è integrato spesso si genera un organismo mosaico, in cui il transgene è presente solo in alcune cellule Per verificare che sia presente nella linea germinale l’animale transgenico viene incrociato con un wt, ipotizzando che il transgene sia presente in eterozigosi il 50% circa della progenie deve essere transgenica Si può studiare la localizzazione di alcune proteine, è stato fatto un topo in cui a valle del promotore dell’acrosina, una proteina presente nell’acrosoma degli spermatozoi, è stata messa la GFP con le sequenze di localizzazione dell’acrosina e si è visualizzata la localizzazione Oppure animali transgenici possono essere usati per produrre una proteina, per esempio facendola esprimere nella pecora con il promotore della lattoglobulina che è espressa solo nelle ghiandole mammarie, la proteina ricombinante si troverà solo nel latte e sarà facilmente isolabile L’Alzheimer è determinato da un processamento alterato di APP con cui si forma un peptide - amiloide che si accumula in membrana e determina la morte del neurone Il processamento alterato può dipendere da mutazioni in APP oppure dall’età, probabilmente per un problema delle secretasi o nella clearence L’obiettivo è creare topi modello dell’Alzheimer, il gene di APP umano è molto grande, circa 500kb, e per inserirlo intero e non come cDNA come vettore è necessario usare uno YAC Uno YAC contiene marcatori di selezione, ars, centromero e telomeri; dopo aver inserito il gene umano e trasfettato le cellule si preleva il DNA e si frammenta con un enzima di restrizione che taglia raramente (che riconosca 6-8 basi), conoscendo il pattern di frammentazione sia dello YAC che del gene umano è possibile capire quali cellule hanno ricevuto uno YAC contenente il gene umano, definite cellule ES+ (embrionali staminali) È possibile anche ottenere topi in cui il transgene è stato inserito in una posizione specifica: nei mammiferi la ricombinazione omologa è poco efficiente, solitamente l’integrazione è casuale ma è stato sviluppato un sistema per selezionare positivamente i rari eventi di ricombinazione omologa usando un doppio marcatore Il costrutto deve avere regioni di omologia di 2-4kb vista la bassa efficienza, in mezzo a queste c’è il gene neo e all’esterno il gene tk Se avviene ricombinazione omologa entra solo il gene neo, con integrazione casuale invece probabilmente entra tutto il costrutto, compreso il gene tk; la selezione viene fatta con G418 e ganciclovir, in questo modo sopravvivono solo le cellule che hanno neo ma che non hanno tk che attiverebbe il ganciclovir a trifosfato, che blocca la DNA polimerasi Il saggio però dà molti falsi positivi e i cloni devono essere controllati con southern/PCR, non è una vera selezione ma almeno arricchisce i cloni in cui è avvenuta la ricombinazione Vengono così selezionate cellule embrionali staminali (ES) agoute in cui è avvenuta ricombinazione omologa, queste vengono iniettate in una blastocisti di topi neri e trasferita in una femmina albina pseudo gravida; la progenie deve essere a chiazze nere/agoute e se il transgene entra nella linea germinale incrociandola con topi neri deve dare una seconda progenie agouta, non più chimerica Della seconda progenie il 50% prende l’allele mutato e il 50% l’allele sano dalla chimera, mentre entrambi ricevono un allele sano dal wt; la progenie quindi è agouta ma è al 50% eterozigote wt/mutato e al 50% omozigote wt/wt Quindi si cercano gli individui eterozigoti e questi possono anche essere incrociati tra loro per ottenere omozigoti mutati/deleti nel gene di interesse, però solo se il gene non è essenziale Questo approccio è stato usato per studiare il ruolo di v-Abl una variante oncogenica del gene C- ABL che codifica per una tirosina-chinasi espressa in particolare in timo e milza, e di cui esiste una variante a funzione ignota espressa solo nel testicolo Topi knockout per ABL sono normali in eterozigosi e in omozigosi hanno problemi nello sviluppo del sistema immunitario, ABL deve avere un ruolo in questo; la funzione della variante nel testicolo non è chiara, probabilmente perché la sua assenza viene compensata da altre tirosina chinasi ridondanti Si può anche ottenere un knock-out condizionale usando la recombinasi Cre che riconosce e taglia le sequenze LoxP; se due LoxP sono nella stessa direzione la regione in mezzo viene eliminata insieme a una LoxP, se sono in direzioni opposte la regione in mezzo viene invertita Facendo esprimere in un certo momento la Cre si può eliminare un gene solo in una fase dello sviluppo e/o solo in uno o alcuni tessuti, per esempio mettendo Cre sotto controllo del sistema Tet-on o di promotori/enhancer tessuto specifici Piante La cellula vegetale non ha i lisosomi ma ha i vacuoli, con funzione di degradazione ed anche di riserva di sali, fosfato, amminoacidi…, ha tutti gli altri organelli e in più i cloroplasti che fanno la fotosintesi per produrre energia dalla luce Hanno anche una parete composta da cellulosa, pectine, glicani e proteine, dinamica grazie ad enzimi che la modificano continuamente; è anche presente lignina formata da alcoli aromatici che da alla cellula una resistenza meccanica I cloroplasti come i mitocondri derivano probabilmente da un processo di endosimbiosi, hanno un loro genoma circolare di 100-200kb e un apparato di trascrizione e traduzione con ribosomi 70S La membrana interna ha strutture lamellari sovrapposte definite tilacoidi, su cui è assemblato l’apparato fotosintetico che genera un gradiente di pH usato per la sintesi di ATP e NADPH, a loro volta usati nel ciclo di Calvin per fissare la CO2 e produrre zuccheri Le cellule sono totipotenti, trattando con fitormoni formano una massa non differenziata definita callo che può essere coltivata e con auxine o citochine (ormoni vegetali) in diversi rapporti si induce la formazione di germogli o radici Nei terreni servono macro e micronutrienti e fitoormoni, uno importante è l’etilene fondamentale per la produzione di frutti Le cellule differenziate sono molto difficili da trasformare per via della parete cellulare, i primi tentativi sono stati fatti con i protoplasti, a cui la parete è stata tolta con cellulasi e pectinasi, Sono anche state usate per la produzione di vaccini, con l’idea di far consumare il frutto per sviluppare l’immunità; sono stati modificati pomodori con la componente B del colera (non tossica, serve solo per l’ingresso nella cellula) e il loro consumo nei topi induce l’immunità al colera Per produrre alte quantità di proteina ricombinante l’ideale è modificare i cloroplasti, si arriva ad avere anche livelli del 20% delle proteine totali, facendo crescere le piante in serre ed estraendo poi le proteine, le rese sono molto elevate visti gli alti livelli di espressione Oppure si può usare l’agroinfezione, usando l’intero genoma del virus del mosaico del tabacco portante il gene della proteina ricombinante che si diffonde in tutta la pianta e viene prodotta Sono un sistema ottimale per la produzione di farmaci per questione di costi, qualità del prodotto, probabilità di contaminazione e sicurezza; è molto importante però controllare la glicosilazione delle proteine, il pattern è leggermente diverso da quello dei mammiferi Recentemente è stato proposto come sistema la physcomitrella, un muschio che ha un sistema molto efficiente di ricombinazione omologa molto simile a quello del lievito e può essere usato per fare knock-in/knock-out allo stesso modo Biologia molecolare dei mitocondri Mitocondri e cloroplasti hanno un loro sistema batterico di trascrizione e traduzione e derivano da un processo di endosimbiosi, i batteri sono gli unici organismi ad aver sviluppato una catena di trasporto degli elettroni e i fotosistemi, che infatti sono identici tra cloroplasti e cianobatteri I ribosomi dei mitocondri sono più piccoli di quelli batterici, 50S con meno proteine ed RNA più corti (16S e 12S) La RNA polimerasi batterica ha 5 subunità: due , , ’ e e riconosce promotori bipartiti; i mitocondri hanno una polimerasi più semplice simile a quelle fagiche composta da una sola catena peptidica, visto il basso numero di geni da trascrivere è inutile averne una più complessa Il genoma mitocondriale umano è piccolo e circolare, circa 16-20kb contiene gli rRNA, 22 tRNA e geni che codificano per 13 proteine che fanno parte dei complessi della catena degli elettroni La maggior parte dei componenti della catena vengono dal genoma cellulare, non tutti forse perché il trasferimento genico non è ancora stato completato o forse è importante che parte dei geni rimangano nel genoma mitocondriale per rispondere velocemente a stimoli È quasi tutto codificante, i geni sono tutti senza introni e quasi tutti sullo stesso filamento, l’altro ha solo un gene e alcuni tRNA; i due filamenti sono anche molto diversi in composizione e densità, possono essere denaturati e separati e distinti tra Heavy e Light L’unica regione non codificante sono 500-600pb che contengono il promotore e un D-loop formato da uno strand displacement che fa da origine di replicazione Nel lievito il genoma mitocondriale è più grande, 78kb ma contiene comunque solo una decina di proteine, 24tRNA e gli rRNA; i geni però hanno tutti introni di gruppo 1 o 2 che fanno autosplicing e ci sono diversi promotori Quello del mais è di 500kb ma contiene solo una trentina di proteine oltre a t e rRNA; contiene anche due o tre regioni ripetute e per ricombinazione omologa si possono formare diverse strutture all’equilibrio Nei protozoi il genoma mitocondriale è molto variabile, può essere composto da un cromosoma circolare, uno lineare, uno grande e tanti piccoli… In un protozoo è stato trovato un genoma mitocondriale simile a quello cellulare degli eubatteri, con un gran numero di promotori e geni e forse per questo motivo è l’unico ad avere una RNA polimerasi più complessa Ci sono anche esempi di processi di endosimbiosi ancora in corso, un esempio sono gli afidi, insetti che succhiano zuccheri dalle piante ma non sono in grado di sintetizzare amminoacidi e li ottengono da batteri endosimbiontici che vivono nel loro apparato digerente Questi batteri (es. carsonella) hanno un genoma troppo piccolo per formare una cellula vivente, una parte dei geni sono passati al genoma dell’ospite anche se la maggior parte è per ora mantenuta, probabilmente il processo è ancora in atto Funghi e lieviti contengono introni di gruppo 1 che richiedo un cofattore guanosidico, alcuni introni contengono una ORF che codifica per una maturasi, chaperonina che si associa all’introne e facilita lo splicing aiutando l’introne nel folding Le piante invece hanno introni di gruppo 2 che non richiedono cofattori e prevedono un intermedio a laccio come lo spliceosoma; l’introne è formato da 6 domini di cui il 5 e il 6 sono i più importanti per il meccanismo, il 4 spesso contiene una ORF per una maturasi oppure per una trascrittasi inversa, è probabile che questi introni derivino da retrotrasposoni Il mitocondrio usa un codice genetico leggermente alterato in modo da aver bisogno solo di 22tRNA, principalmente perdendo significato nella terza base che viene distinta solo come purina/ pirimidina; traducendo in vitro gli mRNA mitocondriali i prodotti sono completamente diversi da quelli che si ottengono nel mitocondrio, soprattutto perché UGA non è un codone di stop ma codifica per triptofano Nel D-loop del genoma mitocondriale umano sono presenti un promotore Heavy e uno Light, la trascrizione spesso si ferma al primo terminatore trascrivendo solo gli rRNA che sono quindi in quantità maggiore, se non si ferma trascrive tutto il genoma formando un mRNA policistronico che contiene le regioni codificanti e quelle dei tRNA I tRNA assumono una struttura 3D e vengono tagliati dalla ribonucleasi P che libera gli mRNA codificanti per le proteine; i tRNA vengono maturati e gli mRNA vengono tradotti, terminano tutti con una U e il codone di stop UAA si forma dopo la poliadenilazione La trascrizione che parte dal promotore L può generare un frammento lungo fino all’origine di replicazione del filamento H, il frammento verrà usato come primer dalla DNApol che genera il nuovo filamento H spiazzando quello vecchio; quando la replicazione arriva circa al 75% si attiva un’altra origine di replicazione da cui parte la sintesi del nuovo filamento L, la ligasi unisce i nick al termine della replicazione e il DNA viene superavvolto Il filamento H che viene spiazzato viene ricoperto di SSBP, in un determinato punto circa al 75% della replicazione il singolo filamento forma una struttura ad hairpin che non viene coperta da SSBP e viene riconosciuta dalla RNApol che genera il primer da cui parte la replicazione del filamento L usando l’H come stampo Nel lievito ci sono diverse origini di replicazione e sono stati identificati intermedi lineari di replicazione, il meccanismo non è chiaro ma l’ipotesi è che sia un meccanismo di rolling circle, probabilmente regolato in modo coordinato alla proliferazione cellulare Mutazioni nel genoma mitocondriale sono frequenti e spesso silenti nel D-loop, che è una regione ipervariabile, ma possono anche avere fenotipo e causare problemi alla catena respiratoria se insorgono nelle regioni codificanti e soprattutto nei tRNA; le patologie associate possono essere di diversa entità, sono a trasmissione non Mendeliana ma puramente materna e riguardano principalmente i muscoli e il sistema nervoso, i due sistemi che usano più energia metabolica La patologia può essere presente solo in una parte dei mitocondri della cellula, si parla di eteroplasmia e l’intensità della patologia dipende dal rapporto sani/mutati, che a sua volta dipende da come si divisi i mitocondri della madre nella formazione degli oociti Se una madre è malata si può prelevare il nucleo dall’oocita fecondato ed inserirlo in un oocita anucleato ottenuto da una donatrice sana Gli mRNA mitocondriali vanno spesso incontro ad un fenomeno di RNA editing che porta alla modificazione di una base; il fenomeno avviene anche sui messaggeri cellulari ma nell’uomo solo in 2, uno dei quali è l’apolipoproteina che normalmente è formata da 4563 residui, un codone codificante Gln CAA viene convertito in codone di stop UAA da una citosina deaminasi molto specifica per quella posizione a formare una proteina di 2152 residui nei villi intestinali L’RNA editing è molto frequente nel genoma mitocondriale delle piante e di una classe di protozoi patogeni, i trypanosomi, che hanno un solo mitocondrio vicino al flagello contenente un genoma definito DNA kinetoplasto (kDNA), un maxicircolo di 50kb e migliaia di piccoli anelli di 500-1000pb Il maxicircolo contiene i geni che però vengono pesantemente modificati, con l’aggiunta di più di 3000 e la rimozione di circa 300 uracili; l’RNA editing è controllato da RNA guida codificati dai minianelli che si appaiano agli mRNA e guidano l’editing L’inserzione avviene perché dopo l’appaiamento tra pre-mRNA e gRNA c’è una regione spaiata che viene riconosciuta e tagliata da una endonucleasi, poi una terminal-uracil transferasi (TUT) aggiunge uracili e una ligasi chiude il nick Un dsDNA nel citoplasma viene processato dal complesso Dicer e tagliato in frammenti di 21-22pb definiti siRNA, uno dei due viene scelto come guida, lega il complesso RISC ed è pronto ad appaiarsi ad un mRNA complementare, se l’appaiamento è perfetto l’mRNA viene degradato Nei mammiferi sono presenti geni codificanti per pre-miRNA che vengono prima processati dal complesso Drosha, escono dal nucleo con il sistema dell’esportina 5 e poi interagiscono con Dicer e RISC in modo analogo ai siRNA Possono essere usati in terapia genica somministrando un DNA a doppio filamento che venga processato da Dicer oppure direttamente frammenti di 21-22pb che interagiscono con RISC; in alternativa si può usare un plasmide che esprima uno short hairpin RNA che viene processato come un pre-miRNA da Drosha, Dicer e RISC Dopo 24/48 ore si guardano i livelli di proteina usando come controllo un RNA con composizione uguale ma che non si appai al mRNA target Modifica mirata del genoma Usando un sistema che riconosca una posizione precisa del genoma si possono introdurre DSB che vengono riparate con NHEJ introducendo mutazioni che possono inattivare il gene o, fornendo una sequenza omologa, con HR con cui si può modificare un gene target oppure inserire un marcatore, un reporter, un sito LoxP… Sono stati sviluppati tre sistemi basati su nucleasi sito-specifiche: Nucleasi zinc-fingers (ZFNs) Lo ZF è un dominio globulare - - presente nei fattori trascrizionali che coordina un atomo di Zn e interagisce con il solco maggiore riconoscendo basi specifiche; ad esso viene associato il dominio nucleasico FokI che taglia uno dei due filamenti, per ottenere una DSB sono necessari due ZFN; le nucleasi devono anche contenere una sequenza di localizzazione nucleare Lo ZF contiene due cisteine separate da 3-4aa nelle regioni e dopo 13aa due istidine separate anch’esse da 3-4aa nella regione , che è anche la regione che riconosce le basi e si lega al DNA I residui importanti per l’interazione specifica sono quelli in posizione -1, 3 e 6 rispetto all’ elica che riconoscono una tripletta di basi adiacenti e quello in posizione 2 che riconosce una base adiacente alla tripletta ma sull’altro filamento; modificando questi residui si cambia la tripletta Per avere un sistema specifico servono due ZFN che abbiano almeno 3 domini ciascuno, per un totale di 18 basi riconosciute: 9 su un filamento e 9 sull’altro ad una distanza di circa 10 basi, in modo da tagliare nello stesso punto e generare una DSB Per analizzare la frequenza di NHEJ si fa una PCR con due oligo ai lati del sito target e poi si analizzano i prodotti denaturandoli e trattandoli con la nucleasi CEL1 Denaturando e rinaturando c’è una buona probabilità che filamenti che hanno subito delezioni/inserzioni a causa del NHEJ si associno a filamenti wt formando una struttura a forcina che viene riconosciuta e tagliata da CEL1; sul gel quindi si vedrà una banda di dimensioni normali e altre due dovute al taglio la cui intensità dipende dalla frequenza di NHEJ TALENs I TALE (transcription activator-like effector) sono fattori di trascrizione, usati da batteri Xanthomonas che infettano le piante, che contengono una sequenza di 34aa ripetuta una decina di volte, in funzione delle posizioni 12 e 13 ciascun dominio riconosce una base specifica Al dominio TALE viene associato il dominio nucleasico FokI e vengono usati come le ZFNs per generare due tagli sui due filamenti e ottenere una DSB Sono più semplici da fare, bisogna solo fare i 10 domini con i residui specifici e metterli in fila, ma la proteina è molto più grande di una ZFN; l’efficienza è inferiore rispetto alle ZFN, probabilmente perché a causa delle dimensioni viene prodotta meno proteina CRISPR-CAS9 Sistema batterico basato su una proteina con due domini nucleasici e un RNA che fa da guida e porta la nucleasi sulla sequenza specifica da tagliare Il locus è formato da regioni spacer derivate da genomi virali, regioni repeats e dalle proteine CAS (CRISPR-associated); trascrivendo il locus si genera un RNA che viene processato a dare piccoli crRNA che contengono uno spacer fiancheggiato da due repeats che reclutano la nucleasi se incontrano un filamento complementare Il sistema più semplice è quello della Cas9, basato su una sola proteina e due RNA: il crRNA complementare al target e il tracrRNA che si associa al crRNA; il sistema però è stato ingegnerizzato e migliorato per avere un solo RNA, definito gRNA (guida) La sequenza target per essere tagliata deve avere adiacente una sequenza PAM, questo ha funzione di protezione per evitare di tagliare il locus CRISPR del genoma che non ha le sequenze PAM e quindi non viene riconosciuto; se il gRNA incontra un complementare e c’è la sequenza PAM viene reclutata Cas9 che ha due domini nucleasici con cui taglia i due filamenti Sono stati usati in linee cellulari e piante, per esempio per tagliare e correggere una sequenza mutata della GFP tramite HR usando un donatore con la sequenza wt, cellule che non la esprimevano diventano fluorescenti con efficienza dello 0.4% con i TALEN e dell’8% con CRISPR Per essere usato nell’uomo però non è abbastanza specifico, è basato su un riconoscimento di sole 20 basi che nel genoma potrebbe non essere univoco al 100%; per migliorarlo sono state isolate varianti della Cas9 in cui funziona uno solo dei domini nucleasici e vengono usate due proteine Cas9 ciascuna con il suo gRNA in modo da avere una specificità di 40 basi che arriva al 100% Genoma umano La prima metodica per sequenziare un genoma era basata sull’uso di YAC o BAC per costruire una libreria ordinata di frammenti che venissero poi sequenziati Gli YAC possono ospitare inserti di 1-2 milioni di pb ma sono difficili da isolare, serve un’elettroforesi su gel pulsante, non sono stabili e gli inserti essendo così grandi possono ricombinare; i BAC sono più semplici da usare ma possono clonare al massimo 350kb Dal cromosoma si ottiene una libreria di cloni che vengono ordinati guardando le mappe di restrizione, poi ciascun inserto viene sequenziato con una tecnica shotgun: frammentandolo in piccoli pezzi da poche kb clonati in un plasmide adatto al sequenziamento I frammenti della sotto-libreria vengono sequenziati dal primer universale del plasmide e avendo sequenze sovrapposte viene ricostruita la sequenza dell’inserto iniziale e quella del cromosoma È una metodica molto lunga, complessa e poco precisa, gli errori sono molto frequenti per la difficoltà nel distinguere le bande radioattive (il sequenziamento è fatto con Sanger) e anche per l’errore umano Nell’uomo prima del genoma intero sono stati sequenziati i cDNA completi o solo le EST, corte sequenze di 200-300 basi sul singolo filamento all’estremità del cDNA che fanno da etichetta I geni umani sono al 90% introni, allineando le sequenze genomiche a quelle delle EST o dei cDNA è anche possibile identificare gli esoni e quindi i punti di splicing Oggi i sequenziamenti vengono fatti con le metodiche di NGS, la più popolare è Illumina in cui il genoma viene frammentato, alle estremità dei frammenti vengono legati due adattatori e i frammenti vengono ancorati su un chip che ha oligo complementari agli adattatori Tramite bridge-PCR si formano cluster di frammenti uguali che vengono sequenziati con dNTP fluorescenti bloccati in modo da poter leggere per ogni ciclo che dNTP entra poi sbloccare e staccare il fluoroforo e passare al ciclo successivo Si ottengono reads corte, di 50-300pb precise al 98%, analizzando miliardi di reads contemporaneamente ed è una metodica molto economica Si può anche partire dall’RNA, sequenziando i cDNA retrotrascritti (RNA-seq) È stato cercato il numero minimo di geni per avere una cellula, il batterio Mycoplasma genitalium ha un genoma di 580kb contenente 515 proteine delle quali 150 ignote e circa 40 RNA, cresce solo su piastre con terreni molto arricchiti Nanoarcheum equitans ha 536 proteine e 17 RNA che codificano per metà tRNA ciascuno e vengono poi combinati per avere i tRNA necessari In modo sintetico la cellula creata con il numero minore di geni in grado di fare colonie ne contiene 473 dei quali 149 ignoti ma essenziali, il genoma è di 531kb Il genoma umano contiene meno di 25mila geni, ciascuno con in media 9 esoni da circa 150pb ciascuno e introni di 3.4kb ciascuno Solo il 2% del genoma codifica per proteine, ma il 60% viene trascritto anche se non tradotto È pieno di sequenze ripetute, il 21% del genoma è formato da LINEs lunghe 6-8kb e presenti in 850k copie, il 13% da SINEs di 100-300pb in 1.5 milioni di copie, l’8% è di origine virale e il 3% è formato da trasposoni Nel genoma sono anche presenti pseudogeni che non vengono trascritti e che probabilmente derivano da trasposizioni di cDNA