Scarica Biologia Molecolare I - Martegani UNIMIB e più Appunti in PDF di Biologia Molecolare solo su Docsity! 1 BIOLOGIA MOLECOLARE Ha lo scopo di capire il funzionamento dei sistemi viventi tramite lo studio delle macromolecole. DNA, RNA e proteine sono i polimeri principali, essenziali per l’attività della cellula. Gli RNA non solo trasportano il materiale ma hanno anche ruoli attivi (RNA ribosomiale). Lo scopo è di comprendere i processi complessi che avvengono all’interno della cellula (unità elementare vitale; il virus non lo è ma è un messaggero di informazione biologica perché può vivere solo con una cellula) e le interazioni tra le molecole per capire come si è originata la vita. La vita è proprietà unica dei sistemi viventi. È difficile definirla in modo rigoroso. Dal punto di vista chimico, la vita è una proprietà di un sistema che riesce a mantenersi in uno stato di non equilibrio termodinamico. Un sistema in equilibrio termodinamico va verso il disordine mentre il sistema mantiene un ordine. Il sistema vivente non contraddice le regole della termodinamica perché anche se l’entropia al suo interno diminuisce, esso scambia materia con l’ambiente perché è un sistema aperto. Dunque l’entropia globalmente aumenta anche se all’interno del sistema diminuisce. Il concetto è della struttura dissipativa ovvero un sistema che è lontano dall’equilibrio ma che genera comunque ordine. (Ilya Prigogine) Nel tempo, in una struttura dissipativa, si stabiliscono spontaneamente delle strutture ordinate nel tempo e nello spazio. La definizione migliore è stata stabilita nel 1992 dalla NASA in necessità di definire in modo inequivocabile cosa si intende per “vita” per evidenziare la presenza di vita extraterrestre nelle missioni. La vita è un sistema chimico autoreplicante capace di evoluzione darwiniana. Il concetto di evoluzione implica una caratteristica fondamentale dei sistemi viventi: l’informazione biologica ovvero la presenza di sistemi molecolari capaci di immagazzinare, di replicare, trasmettere e modificare l’informazione biologica. Senza questa capacità, i sistemi rimarrebbero congelati in uno stato iniziale. Le 3 macromolecole principali sono: il DNA (genoma), che è capace di replicare se stesso; RNA (trascrittoma), che riceve l’informazione genetica; proteine (proteoma) che utilizzano l’informazione. È un ciclo che si ripete. L’interazione tra acidi nucleici e proteine presuppone l’esistenza di un codice genetico perché essi sono strutture diverse ma che interagiscono. Uno degli aspetti più importanti della biologia molecolare è di capire in cosa consiste l’informazione biologica, come viene usata e possa essere replicata e modificata nel tempo e come venga usata per costruire le proteine. Il gene è una molecola. Il fatto che l’informazione sia contenuta in una molecola implica che il gene deve potersi modificare nel tempo. La molecola può rompersi ma i sistemi di riparo possono ripristinarla. Shrodinger (fisico) in “What is Life?” è stato il primo a suggerire che la base del gene sia un cristallo aperiodico, ovvero che non ha periodicità. Cenni storici: . 1939 Bernal: struttura del virus del mosaico del tabacco; . 1944 Avery: il DNA è un gene; . 1945 Astbury: impilamento delle basi di DNA; . 1950-60: struttura del DNA; . 1960-70: trascrizione e traduzione. Cibernetica molecolare; 2 . 1970-80: DNA ricombinante. Sequenziamento DNA e RNA; . 1980-90: Ribozimi; differenziamento e sviluppo in termini molecolare. Aspetti biotecnologici; . 1990: rivoluzione genomica; biologia strutturale e bioinformatica. Sequenziamento genoma umano. Esperimento di Griffith sullo Streptococco: Le colonie formate dal ceppo virulento sono lisce (S). Quelle formate dal non virulento sono rugose (R). Il topo moriva con il ceppo S e non con R. Il ceppo virulento aveva una capsula di polisaccaridi che consentiva ai batteri di sfuggire ai macrofagi. Se il ceppo virulento veniva scaldato a 45°, esso non infettava. Se venivano iniettate cellule morte (erano state scaldate) e cellule del ceppo non virulento, il topo moriva. Griffith ipotizzò che l’informazione delle cellule virulente morte fosse passata a quelle non virulente. Intuì un principio trasformante. Avery è stato il primo ad aver isolato il principio trasformante, il DNA. Per isolarlo: 1. Le cellule virulente erano state coltivate e recuperate per centrifugazione. 2. Vengono sospese in una soluzione salina (NaCl) e scaldate a 65° provocandone la morte. Gli enzimi si denaturavano. 3. Le cellule venivano raccolte per centrifugazione e disperse in un detergente che solubilizza i lipidi e consente al contenuto della cellula di fuoriuscire (lisi cellulare) 4. Si centrifuga e si ha un resto di sedimenti e si si aggiunge alcol etilico. In questo modo precipitano in modo selettivo gli acidi nucleici che non sono solubili in alcol. 5. Alla soluzione si aggiunge fenolo. Nella fase organica rimangono le proteine mentre dell’acquosa gli acidi nucleici. La fase acquosa viene separata. Si può ripetere la separazione. 6. Per eliminare i polisaccaridi aggiunge degli enzimi (glicosidasi). 7. Estrae con cloroformio per eliminare gli enzimi e aggiunge alcol etilico. Si forma un precipitato biancastro ma c’è del materiale fibroso che rimane attaccato alla bacchetta, ovvero DNA. Mycroplasma genitalium ha 580mila basi e 470 geni codificano. Si può replicare solo dentro le cellule di un mammifero e, per questo, ha un genoma molto piccolo (sfrutta la cellula). Domini: • Eubatteri • Archeobatteri • Eucaria Gli eucarioti sono più grandi dei procarioti e ci sono compartimenti interni (es. nucleo). Hanno un RER. I ribosomi liberi creano proteine che vengono riversate nel citoplasma mentre quelli sul RER entrano nel RER e vengono poi destinate ad altri compartimenti. I mitocondri sono di origine batterica. Nella procariote il DNA (unico filamento circolare) è addensato ma non vi è un nucleo. Procariote: il citoplasma è composto dal 75% di acqua. Contiene pochi ribosomi quindi la sua crescita è più lenta (fa poche proteine) 5 La temperatura di transizione è la temperatura alla quale metà delle molecole sono denaturate Tm (melting). Quando la temperatura aumenta, alcuni legami si rompono a causa dei maggiori urti. Tuttavia rimangono altri legami. Se si supera la temperatura critica, allora tutti i legami si rompono e la proteina si denatura. È la transizione cooperativa: tanto più è alta la cooperatività (ci sono tanti legami deboli nella proteina), più veloce è il crollo. ∆G0 = -RTlnK K = e-∆G°/RT Se aumenta il numero di legami deboli coinvolti, più grandi diventano i due valori (∆H e ∆S) e più veloce è la denaturazione. La proteina scaldata non torna allo stato iniziale perché, di tutte le conformazioni che può assumere, solo una è quella nativa quindi è quasi impossibile poter tornare a quella. La transizione cooperativa riguarda anche acidi nucleici e film proteici. CATALIZZATORI L’attività di catalizzatore è tipica delle proteine ma anche gli acidi nucleici possono fare da catalizzatori. Per far avvenire la reazione, è necessario superare l’energia di attivazione. Il catalizzatore abbassa l’energia di attivazione. - inorganici: acidi / basi forti (es. soda che catalizza l’idrolisi di un estere; platino: accelera le reazioni di riduzione).Hanno una bassa specificità, catalizzano quindi centinaia di reazioni diverse
- organici: è tipica delle macromolecole. Es. acidi nucleici: RNA catalitici chiamati ribozimi dove l’RNA, essendo un acido nucleico a singolo filamento, può assumere conformazioni molto complesse, generando cavità per legare un substrato e DNA: è richiesto un filamento di DNA perché si possa sintetizzare l’altro.
Equazione di Arrenhius k = Ae Eatt RT L’ureasi è una proteina che fa da catalizzatore. Converte l’urea e l’acqua in anidride e ammoniaca. Abbassa l’energia da 30 kcal/mole a 11 kcal/mole. H2O + NH2 - CO - NH2 ⇋ CO2 + NH3. La velocità aumenta di 1,5*1014. Ha all’interno del Nichel (è polarizzato +) che lega l’ossigeno (-) e l’azoto (-) e questo favorisce l’attacco dell’ossidrile al carbonio. L’idrolisi dell’estere è mediata da catalizzatore. L’ossigeno dell’acqua attacca il C carbonilico. Lo stato di transizione ha l’ossigeno dell’acqua positivo e quello del carbossile negativo e, quindi, richiede una separazione di carica. Questo aumenta molto l’energia di attivazione. L’esterasi ha due modi per farlo: - catalisi da base: molto vicino alla molecola d’acqua che deve attaccare il carbonio ci deve essere un composto con un ossigeno con carica negativa (es. carbossilato) che neutralizza, quindi, la carica + dell’O dell’acqua; - da metallo: si neutralizza la carica negativa dell’ossigeno del carbossile grazie ad uno ione metallico I ribozimi sono RNA con attività catalitica. RNA ribosomiale 23S crea le proteine. 6 ESPERIMENTO DI HERSHEY E CHASE È un esperimento sui fagi, virus che infettano cellule batteriche. La testa è costituita da proteine e contiene un acido nucleico (DNA o RNA). Per l’esperimento hanno usato quelli a DNA. C’è un riconoscimento del batterio da attaccare. Il fago inietta il suo DNA all’interno del batterio e induce la cellula batterica a replicare il DNA del fago provocandone l’esplosione. Per capire che entra solo il DNA e non anche la capsula hanno utilizzato isotopi radioattivi: hanno usato l’isotopo S35 dello zolfo, ritrovabile nelle proteine, per una coltura; per un’altra coltura hanno usato il fosforo marcato, che non era ritrovabile nelle proteine ma nel DNA. Hanno infettato cellule di E. Coli con questi fagi. Hanno visto che le cellule infettate non avevano radioattività ma lo zolfo era stato ritrovato nel supernatante (che veniva scartato), mentre il fosforo non era ritrovabile nel supernatante, dunque era rimasto solo il DNA all’interno della cellula infettata. DNA e RNA Contengono: fosfato, deossiribosio o ribosio e basi azotate. Pirimidine: citosina, timina, uracile. Purine: Adenina, Guanina. RNA ha l’uracile al posto della timina. Il legame tra fosfato e zucchero è un legame estere. Il legame tra base e zucchero è N-glicosidico. C’è un legame diretto tra C e N, invece nel glicosidico è tra O e C. Il nucleoside è base (es. adenina) + zucchero. Il nucleotide (es. acido adenilico) comprende il nucleoside (es. adenosina) e il fosfato. Il fosfato si lega agli ossidrili disponibili (mono fosfato, di fosfato o tre fosfato). I nucleotidi usati per il DNA sono a tre gruppi fosfati perché viene liberato il pirofosfato nella polimerizzazione. Anche se a livello termodinamico si potrebbe avere una condensazione anche con nucelosidi monofosfati, nella cellula non avviene. ATP è utile, anche, per reazioni di fosforilazione in modo da fornire energia al sistema. cAMP è AMP ciclico ma il fosfato fa due legami esteri con 5’ e 3’. Qualunque filamento di DNA inizia con 5’ fosfato e finisce con 3’ OH, è polarizzato. Il DNA non esiste come filamento singolo. Ci sono state più proposte riguardo alla struttura del DNA. Regola di Chargaff: Fece un’analisi quantitativa sui filamenti di DNA di diverse specie. Ha idrolizzato in ambiente acido (così si disfa la molecola) il DNA. Fece una cromatografia su carta e quantizzò le basi. Diversi DNA avevano quantità diverse di basi. Il rapporto A:T e C:G, in qualunque DNA, tendeva ad 1. Wilkins e Franklin dedussero la struttura secondaria del DNA tramite studi di diffrazione sulle fibre di DNA. Watson e Crick, utilizzando il loro studio, cercarono di capire come appaiare le basi per conferire la struttura più regolare. Proposero un’elica destrorsa con filamenti antiparalleli di diametro regolare di 2 nm. Capirono che l’adenina si legava solo con la timina e che la citosina si legava solo con la guanina. La distanza tra le basi è di 3,4 A quindi 10 paia di basi per giro. Secondo il loro modello, l’asse che unisce gli zuccheri non è parallelo al legame N-glicosidico ma ci sono circa 51° tra essi. Questo implica che le basi non sono simmetriche rispetto all’elica ma c’è una regione dove le basi sporgono di più verso l’esterno (solco maggiore) e una dove sporgono meno (solco minore). Le interazioni tra DNA e proteine avvengono principalmente nel solco minore. 7 Esistono diversi tipi di fibre di DNA in base all’umidità presente quando il DNA è in soluzione. • Il tipo A è al 75% di umidità. (condizioni di bassa idratazione) È una forma più compatta in quanto ogni giro d’elica è formato da 11 bp. Il suo solco maggiore è più stretto rispetto alla forma B mentre il solco minore è più largo ma poco profondo. In condizioni fisiologiche, questa conformazione caratterizza gli eteroduplex (caratterizzati a due filamenti diversi,1 DNA e 1 RNA), le doppie eliche di RNA (RNA va solo in forma A) e i complessi formati dalle associazioni DNA-proteina. L’RNA non va in forma B perché ha un ossidrile che impedisce l’avvicinamento mentre il DNA può. Le basi sono molto inclinate rispetto all’asse. Guardando da sopra l’elica, si vede una cavità centrale perché le basi sono verso l’esterno; • il B a 92% cioè a condizione fisiologiche. È quello proposto da Watson e Crick. Le basi sono quasi perpendicolari all’asse; • il tipo C a 66%. Si forma in condizioni di relativa bassa umidità per una fibra di DNA ed è molto simile alla forma B della macromolecola, avente però 9.3 residui per giro dell’elica • il tipo Z è un’elica che ruota in senso opposto (levogira), molto sottile. È tipica delle sequenze che presentano modificazioni chimiche come la metilazione e dei tratti di DNA ricchi di basi C e G. Ha un passo di 45,6 A°. L’analisi cristallografica può essere fatta solo su cristalli di DNA. I cristalli di DNA sono sintetici. Alexander Rich usò un oligonucleotide con solo basi C e G. 5’ GCGCGCGCGCGC 3’. Questa sequenza è auto-complementare quindi, appena sintetizzata, avrebbe formato una struttura ad elica. Ottenne dei cristalli. Dopo l’analisi con raggi X ottenne una struttura completamente diversa da quella che si aspettava. I fosfati sono più vicini e l’andamento zucchero-fosfato è meno lineare (zig-zag). Questa forma è dovuta da una posizione anomala dell’adenina. La purina, nei DNA A e B, è rivolta verso l’esterno. È la conformazione Anti. Nel DNA Z, la purina è rivolta vero l’interno in conformazione Sin. L’asse dell’elica, inoltre, non passa attraverso la coppia di basi ma a livello del solco minore. Nel DNA B passa nel piano contenente le basi; nel DNA A passa a livello del solco maggiore. La distanza tra le basi è maggiore del B e l’angolo di rotazione è -30° mentre nel B è +36°. Il passo è maggiore, ci sono 12 basi per giro di elica. Le basi sono rivolte verso l’esterno, non rientrano nell’elica. Il DNA Z è antigenico, ovvero si possono ottenere degli anticorpi specifici contro il DNA Z. Il DNA può assumere delle strutture di ordine superiore dette topoisomeri. La transizione da B a Z favorisce la trascrizione. Ci sono delle interazioni specifiche tra proteine virali e DNA Z. Se le proteine fossero modificate, l’interazione non avverrebbe e quindi l’effetto infiammatorio sarebbe inibito. Gradi di libertà L’anello del ribosio non è planare ma può parzialmente ruotare. Gli altri legami possono ruotare liberamente e quindi i gradi di libertà sono molti. Questo implica che il piano tra le basi può ruotare parzialmente. Il piano delle basi può ruotare rispetto diversi assi. • L’angolo di Twist è quello che genera l’elica (+36° DNA B); • L’angolo di Tilt è quando i due piani ruotano rispetto all’asse dell’elica; • L’angolo di Roll è quando ruotano rispetto allo scheletro fosfato; • Il propeller Twist è la distorsione a pala d'elica. 10 • capire la frammentazione del DNA: essendo la viscosità legata al peso molecolare, quando il peso diminuisce, la viscosità diminuisce. Il DNA è fragile perché è una molecola molto lunga e sottile. Essendo la viscosità legata al peso molecolare, quando il peso diminuisce, la viscosità diminuisce. • vedere l'interazione fra DNA e intercalanti. Intercalanti Sono molecole che rendono il DNA più rigido infilandosi all'interno della doppia elica. Ad esempio il Bromuro di Etidio. È una molecola con 3 anelli aromatici condensati. Ha una struttura aromatica planare. L’ingombro sterico è simile ad una coppia di basi. Ha una carica positiva perché ha un azoto quaternario. Una molecola di questo tipo può interagire con il DNA. L'intercalazione avviene in due fasi: 1. Il fosfato del DNA è negativo a pH fisiologico dunque l’azoto positivo instaura un’interazione elettrostatica con lo scheletro esterno; 2. Quando il bromuro di etidio si è legato al DNA, la porzione fatta dai tre anelli si intercala tra le coppie di basi. Per farlo, deforma la struttura secondaria. Srotola localmente l'elica, in quanto diminuendo l'helical twist le basi si allontanano. L’angolo di rotazione tra le basi diminuisce molto dove si inserisce l’etidio perché si massimalizzano le forze di Van der Waals e perché diminuire la rotazione è l’unico modo per allontanare le basi e consentire l’ingresso dell’intercalante senza rompere la struttura. Più molecole si intercalano, più il passo aumenta perché diminuisce la rotazione quindi c’è bisogno di più basi per fare la rotazione. Il legame tra intercalante e DNA è reversibile e dipende dalla concentrazione di intercalante presente: se ho DNA intercalato con bromuro di etidio e lo sospendo in una soluzione in cui non c'è, spontaneamente fuoriesce dalla doppia elica. Il numero massimo di molecole di intercalante che può inserirsi nel DNA è quello che lo rende saturo: vi è al massimo una molecola di intercalante ogni due paia di basi Alcuni intercalanti sono molecole permeabili, ovvero possono entrare nelle cellule. Cisplatino e daunomicina sono usati come anti tumorali. Modificando il DNA, impediscono che le proteine (polimerasi, …) si leghino ad esso ed inibiscono, quindi, la replicazione del DNA. Essi colpiscono prevalentemente le cellule con proliferazione più rapida, dunque soprattutto le cellule tumorali. Sono comunque sostanze tossiche perché intercalano DNA anche di cellule normali e l'effetto sarà tanto più dannoso tanto più questi tessuti sono in proliferazione: epiteli e tessuti adibiti alla produzione di cellule del sangue sono inibiti da queste sostanze non selettive. L’etidio non è permeabile e viene usato come colorante come l’ammino acridina. Il vantaggio dell’etidio è che è poco costoso ma viene usato meno a causa della potenzialità mutagenica. Il Bromuro di etidio ha effetti sulla densità del DNA. Fa diminuire la densità perché ha una densità minore quindi rende minore la densità della molecola. Questa proprietà è stata usata per dividere DNA circolare dal lineare, che satura e diventa meno denso. Il circolare è più pesante. L’actinomicina blocca la RNA polimerasi, sia nei batteri che eucarioti. Non si può usare perché è tossica. Il Propidio non è permeabile e si lega solo alle cellule fissate. HOECHST 33342 è un intercalante colorante e colora anche le cellule vive mentre il DAPI colora solo le cellule morte perché non è permeabile. Per permettere l’ingresso dell’intercalante nell’elica (lineare), si deve aumentare il passo quindi l’elica si svolge e ruota alle estremità. Man mano che l’intercalante entra, l’elica si 11 svolge. La saturazione si raggiunge quando si trova 1 molecola di intercalante ogni paia di basi. Se il DNA è lineare, si può intercalare fino a saturazione. L’intercalazione dipende dalla concentrazione: maggiore sono le basi, maggiore è l’intercalazione. Il processo è reversibile. Se la molecola di DNA è circolare e covalentemente chiusa (genomi virali o plasmidi batterici, usati per generare DNA ricombinante) e la si tratta con intercalante, il passo dell'elica si allenta. Il DNA dovrebbe srotolarsi, ma non può svolgersi perché è chiuso. Si crea una tensione, che genera dei riavvolgimenti. Si crea un superavvolgimento positivo del DNA, che si attorciglia su sé stesso. È un processo più limitato perché man mano che entrano molecole di intercalante, il DNA si superavvolge. L’intercalazione è minore di quello lineare perché altrimenti si romperebbe. Questo metodo consente di dividere DNA circolare da DNA lineare. Aminoacridina, arancio d'acridina e bromuro di etidio non sono permeabili e non entrano nella cellula. Per farli entrare nella cellula bisogna danneggiare la membrana, permeabilizzarla. Sono, però, molecole fluorescenti: assorbono la luce a una certa lunghezza d'onda e si diseccitano emettendo luce a lunghezza d'onda maggiore. Si usano per rendere fluorescente il DNA in cui si intercalano e per riconoscere il DNA in preparati microscopici. Il microscopio a fluorescenza sfrutta la fluorescenza del campione. Es. cromosomi che appaiono rossi tramite EB. Il DAPI consente di vedere i nuclei. L'intensità di fluorescenza è caratterizzata dalla resa quantica, cioè il rapporto tra fotoni emessi ed assorbiti. Un composto non fluorescente ha resa quantica 0. Alcune molecole si diseccitano emettendo luce, altre si diseccitano per urti con il solvente ovvero dissipano l’energia in calore. Il Bromuro di etidio assorbe la luce blu-verde. Su 100 molecole in soluzione, circa 2 si diseccitano per emissione. La resa quantica, però, raggiunge il 100% quando il bromuro di etidio è dentro il DNA perché non può diseccitarsi scaldano il solvente (non può interagire con esso) ma si deve diseccitare con fluorescenza. La resa quantica è proporzionale alla quantità di DNA presente. L'etidio è un colorante aspecifico, si intercala indipendentemente dalla base. Il DAPI, invece, intercala prevalentemente le coppie A-T e solo il DNA; la mitramicina C-G. Tutti i coloranti non sono permeabili. Quando il Bromuro di etidio è illuminato dall’ultra violetto si emette un po’ di fluorescenze che poi scompare e ricompare quando è illuminato nello spettro blu-verde. Se aggiungo il DNA, la fluorescenza aumenta molto sia quella nell’ultra violetto che nel blu- verde. L’aumento è proporzionale alla quantità di DNA. È un modo per sapere quanto DNA è presente. Se aggiungo del RNA, avviene la stessa cosa. L’utilizzo principale di questo processo è l’elettroforesi su gel di agarosio. Per vedere i frammenti di DNA, si illumina con luce ultra violetta. Se coloro con il DAPI, il DNA si colora di azzurro (emette nell’azzurro). Con il bromuro di etidio diventa rosso. L’intercalante è capace di evidenziare piccole quantità di DNA in un gel e di intercalarsi in funzione della composizione. DAPI e EB intercalano in modo diverso. Ora si usa, in laboratorio, il Syber Green. Si eccita nell’ultravioletto ma il massimo di eccitazione è nel blu. Appare verde. È impermeabile, quindi non è tossico. A parità di quantità di DNA, il Syber Green è più sensibile del EB. È più costoso. Elettroforesi su gel Si usa per separare frammenti di DNA e determinarne la dimensione grazie allo standard di riferimento. Nell'elettroforesi, a parità di carica, le molecole con massa maggiore si muovono più lentamente. Il DNA ha rapporto massa/carica che non varia mai: all’aumentare delle dimensioni, aumentano le cariche. Per DNA e proteine si usa una fase solida con maglie 12 abbastanza larghe per farle passare. La fase funge da setaccio molecolare, permettendo di separare le molecole di dimensioni diverse, che attraversano i pori del gel con una data velocità in base alla propria dimensione. I frammenti possono derivare dai plasmidi, molecole circolari di DNA capaci di riprodursi. I frammenti netti sono ottenuti trattando una molecola di DNA con enzimi di restrizione. Il limite di questo tipo di elettroforesi sono le dimensioni dei segmenti: a volte può servire separare frammenti di DNA molto più grandi (es. genomi di eucarioti superiori che hanno migliaia di milioni di basi). Usando agarosio a bassa concentrazione si possono dissolvere frammenti fino a massimo 30.000 basi. Se si hanno frammenti molto piccoli (fino a 300 paia di basi) si usa la poliacrilammide. Il tipo di gel da usare dipende dal tipo di frammenti che si studia. Molecole lunghe come il DNA potrebbero rimanere incastrate nel gel e non riuscire a passare. Il problema è ovviato invertendo il campo elettrico periodicamente, la tecnica è la FIGE. Il DNA, essendo carico negativamente, va verso il polo positivo. Il campo elettrico, in questa tecnica, è periodicamente invertito: il DNA procede a scatti, va avanti e indietro e il risultato è di consentire la migrazione di molecole anche grandi. Gli svantaggi di questa elettroforesi sono: il tempo (molto lungo) e che bisogna raffreddare il gel scaldato dalla corrente che lo attraversa per tutte quelle ore. Per raffreddarlo si pone in una camera fredda o si fa passare sotto una serpentina con acqua a T costante minore. Un cromosoma umano non si riesce comunque a separare, perché troppo grande, ma dei suoi frammenti grandi si. 3) Spettrofotometria Il DNA può assorbire la luce UV che, tuttavia, può danneggiarlo. L’assorbimento è misurato con spettrofotometri che misurano l’intensità della luce in entrata e quella in uscita. Misura, grazie al monocromatore, il tipo di lunghezza d’onda da misurare (da qui il nome “spettro”). Lo spessore dell’oggetto influenza l’assorbimento: tanto più l’oggetto è spesso, più questo assorbe. La transmittanza è il rapporto tra l’intensità uscente e quella entrante. I=I0 e(-bx), in cui b è il coefficiente di estinzione. Passando ai logaritmi, si ottiene l'assorbanza, A, il valore ottenuto dallo spettrofotometro. log10 I I0 = bx = A. b è usato per un oggetto solido. Per le soluzioni si usa a, il coefficiente di estinzione molare. log10 I I0 = ax = acL dove c è la concentrazione molare. Conoscendo il coefficiente di estinzione ad una certa lunghezza d’onda, si può ottenere la concentrazione. Se la luce assorbita è nel visibile, la molecola assume un colore (assorbe il giallo-arancio, si colora di blu-verde). Si può usare lo spettrofotometro anche per capire lo spettro di assorbimento. Esso misura l'assorbanza di una soluzione al variare della lunghezza d'onda. Si passa man mano a lunghezza d’onda maggiori. Il DNA assorbe al massimo a 260 nm grazie alle sue basi. Per sapere quanto DNA è presente in soluzione si misura l’assorbanza a 260 nm da cui poi si ricava la concentrazione. L’assorbanza può dare idea anche della purezza del DNA. Se esso fosse contaminato da proteine, vi sarebbe un’assorbanza significativa anche a 280 nm perché le proteine assorbano a quella lunghezza. Effetto ipercromico, detto così perché aumenta la capacità della molecola di assorbire radiazione e quindi diventa più "colorata" negli UV. Aumenterebbe l’intensità di colore se la lunghezza d’onda della luce assorbita fosse del visibile (UV non sono visibili). Quando il DNA viene denaturato, i due filamenti si separano e lo spettro di assorbimento cambia: si sposta verso valori più alti e anche il suo picco massimo d'assorbimento si innalza del 30/40%. L’assorbanza aumenta a DNA denaturato rispetto a quello nativo. L’aumento è dovuto al fatto che nel DNA nativo le basi sono impilate una sull’altra quindi ogni base 15 Le sequenze molto ripetute, essendo più corte, hanno complessità minore e si riassociano più velocemente. Ci sono zone mediamente ripetute, più grandi e con complessità maggiore, in cui la ripetizione varia da migliaia a centinaia di volte. Infine ci sono le sequenze uniche, che sono quelle caratteristiche di un organismo. Da questa curva si possono ricavare 3 parametri importanti: 1) La frazione genomica di ogni componente di sequenze ripetute o uniche; 2) Il valore di Co t(1/2) per ogni componente. 3) La complessità di ogni componente. Con questi numeri si può risalire alle dimensioni del genoma dell'organismo e stimare la frequenza delle ripetizioni. N è la complessità. La complessità delle sequenze uniche è Nnr = α * G. G è la grandezza del genoma. quella delle sequenze ripetute è Nr = β * G/F dove F è la frequenza di ripetizione. Nnr è anche α * Co t(1/2) di tutto il genoma * 4.2∗106 Cot1 2 E.Coli . dalle due si ricava G. Nr = β * Co t(1/2) di tutto il genoma * 4.2∗106 Cot1 2 E.Coli . Si ricava la F. Es. 1 GB = 109 paia di basi. La frequenza α è 0,7 quindi 7*108 pb (uniche) La frequenza β è 0,3 quindi quindi 3*108 pb (ripetute) Se analizzo 500 pb n = 109/5*102 = 2*106 p=(1/(2*106))*0,7 devono avvenire milioni di urti affinché i frammenti si possano riassociare quindi la probabilità è molto basa. Il Co t(1/2) è così lungo perché ci vuole tanto tempo per queste sequenze. P è la probabilità di trovare il complementare a quella sequenza. Nel caso di quelle ripetute, p=(106/(2*106))*0,3 essendo corte e ripetute, si incontrano molto più rapidamente e quindi il Co t(1/2) è più piccolo. Ipotizzo che tutte siano complementari. Si ricava la dimensione del genoma o dosando chimicamente il DNA e dividendo il DNA ottenuto per il numero di cellule da cui è stato estratto oppure usare il metodo della riassociazione dei frammenti (delle cinetiche). Si misura il Co t(1/2) delle sequenze uniche e si ricava G. G = Co t(1/2) di tutto il genoma * 4.2∗106 Cot1 2 E.Coli Le sequenze a bassa complessità e molto ripetute sono dette DNA satellite. Il gradiente di densità consente di separare il DNA in base alla densità e di misurarlo. Il DNA dei procarioti mostra un solo picco di densità. Quello degli eucarioti è diverso: c’è un picco principale con densità 1,7 e un picco secondario con densità 1,69. Questa bassa densità corrisponde alle regioni particolarmente ricche di A-T. queste regioni sono dette DNA satellite. Se la frazione è recuperata dal gradiente lo si studia cineticamente, si misura un Co t(1/2) molto basso. Sequenziando questo DNA si vede che una prima metà della sequenza ripetuta è praticamente uguale alla seconda metà, ma con basi diverse in qualche posizione. È come se avesse subito qualche variazione. È di 234 pb ovvero due da 117. È una sequenza formata dalla ripetizione di sequenze di 9 paia di basi. Il DNA satellite non è codificante. Per vedere la posizione di queste sequenze sui cromosomi si è fatta un'ibridazione in situ. Si prende un frammento di DNA satellite clonato in grande quantità. Questo viene usato per fare una probe radioattiva. Si fa avvenire in vitro una sintesi 16 di DNA usando questo satellite come stampo e vengono aggiunti nucleotidi marcati radioattivamente con C14 o trizio. Poi si prendono cellule in metafase, stato in cui i cromosomi sono ben visibili, e vengono permeabilizzate. Si lascia il tempo per fare riassociare i segmenti e si lava per eliminare l’eccesso di radioattività. Il preparato viene coperto con un'emulsione fotografica a base di sali d'argento e si lascia al buio per un tempo sufficiente (2 settimane). Poi si sviluppa con un fissativo. Dove c'era il materiale radioattivo si sono formati dei grani d'argento che al microscopio appaiono neri. In questo modo si può localizzare sui cromosomi il DNA satellite, che è in posizione soprattutto centromerica oppure telomerica. Il cromosoma Y contiene più del 50% di DNA satellite. Alcuni cromosomi (sempre umani) hanno dei bracci di DNA satellite. Bisogna vedere se questi DNA satelliti sono codificanti. Si fa un esperimento su cellule con nucleo interfasico. I segnali dati dal radioattivo corrispondono a regioni di eterocromatina, ricche di DNA particolarmente condensato (si colora meno perché più condensata). Il DNA satellite, quindi, si trova nell'eterocromatina, zona del DNA mai trascritta. Sequenziando porzioni di genoma umano c'è una componente principale, il DNA satellite, e poi si notano regioni più piccole, i minisatelliti dei telomeri e i microsatelliti. Nel DNA satellite si trovano sequenze più corte (25 pb) dette minisatelliti. Ad esempio nei telomeri. I microsatelliti sono sequenze di 2 o 4 basi ripetute 10-20 volte. Per identificare queste sequenze si usano più metodi: densità; cinetiche di riassociazione ed enzimi di restrizione. Enzimi di restrizione Gli enzimi di restrizione sono gli strumenti moderni per studiare sequenze di DNA. Sono enzimi che tagliano il DNA e che esistono solo nei batteri (gli eucarioti non li hanno). Le endonucleasi sono tutti enzimi di origine batterica. Sono capaci di legare un filamento di DNA a livello di una sequenza specifica e tagliano il doppio filamento. Sono enzimi dei batteri responsabili della resistenza ai fagi. Sono sistemi di difesa contro l'infezione da fagi. Sono stati scoperti negli anni 70; riconoscono il DNA estraneo e lo tagliano, eliminandolo. Il DNA nel batterio viene modificato per non essere aggredito dall'enzima. Sono le metilasi che metilano il DNA batterico. Ci sono tre tipi di endonucleasi: • quelli di tipo I e di tipo III non hanno un rigido controllo sulla posizione del taglio perché esso avviene in un punto casuale e distante dalla sequenza segnale; • quelli di tipo II tagliano esattamente in corrispondenza di una sequenza definita. L’endonucleasi di tipo II riconosce una sequenza palidnromica. Il nome dell'enzima dipende dal batterio da cui è stato estratto. Ad es. in EcoRI, Eco deriva dal batterio Escherichia coli, mentre Ri indica il ceppo da cui è stato estratto (EcoRI è un dimero). Riconosce la sequenza GAATTC quindi di 6 basi; BamHi deriva dal batterio Bacillus amyloliquefaciens H e I perché esistono più tipi di questo enzima e I è il primo. Ci sono 2 tipi di taglio: alcuni enzimi tagliano in mezzo alla sequenza e il DNA tagliato viene detto a estremità piatte (non sporge nulla ed è tagliato di netto); altri enzimi, come EcoRI, tagliano a zigzag generando una porzione che si estende, detta appiccicosa. L'estensione è sul 5', il 3' recede. 17 Se ho due frammenti tagliati dallo stesso enzima si possono facilmente associare fra loro, perché hanno estremità coesive e fra loro compatibili perché sono autocomplementari. Con questo meccanismo si possono unire DNA di frammenti di origine diversa: questa è la base del DNA ricombinante. Fare DNA ricombinante significa fare molecole di DNA unendo dei frammenti che hanno origini diverse. La frequenza di taglio dell’enzima dipende dal sito di restrizione. Se il sito di restrizione è di 4 basi, la probabilità è (1/4)4 ovvero 1 ogni 256 pb. Se è di 6 basi, la probabilità è (1/4)6 ovvero 1 ogni 4096 pb. Si può vedere se il DNA è separato su gel d'agarosio. Digerendo il genoma di un eucariote superiore ottengo moltissimi frammenti distribuiti a formare un continuo; non si distinguono i singoli frammenti, su gel ho una strisciata continua, detta smare. Sul genoma umano non si nota nulla, ma su quello di topo o di mucca compaiono delle bande brillanti, separate e relativamente piccole. Queste bande brillanti implicano che ci sono frammenti tutti uguali ripetuti tante volte. Derivano da sequenze genomiche che hanno sequenze ripetute in tandem (una dopo l’altra). Se ho un sito di restrizione all'interno di queste sequenze (non nell'uomo) avvengono dei tagli e si ottengono milioni di frammenti uguali e di uguali dimensioni che vanno a finire nella stessa posizione su gel e che generano una banda brillante. Le bande mi dicono che in quel genoma c'è DNA altamente ripetuto che contiene un sito di taglio per quell'enzima. Si possono avere anche bande multiple se una mutazione ha inattivato un sito di taglio; anziché avere una banda di lunghezza X avrò una banda pari a 2X o 3X. Questo è un modo per vedere rapidamente la presenza di sequenze altamente ripetute e quindi il DNA satellite. A questo punto si può recuperare la banda dal gel, estrarre il DNA e studiarlo. Nel genoma eucariotico le sequenze ripetute a volte sono disperse (non in tandem), non una dopo l'altra, ma separate da altre regioni quindi il taglio con enzimi di restrizione non dà informazioni. Nel genoma umano circa solo l'1,5% codifica per proteine: la porzione codificante è molto piccola. Di questi circa 25.000 geni, il 40% ha splicing alternativo, quindi dallo stesso gene si ottengono due o tre mRNA diversi che daranno proteine parzialmente diverse. Il 50% del genoma è composto da sequenze ripetute. Il DNA satellite è però circa il 10% di cui 48% è dato da sequenze altamente ripetute e disperse. Queste sequenze disperse fanno parte di diverse famiglie: • Le sequenze LINE sono composte da circa 5000 bp ripetute in molte copie; costituiscono il 20% del genoma umano. Sono trasponibili (segmenti di DNA capaci di spostarsi e inserirsi in diverse regioni del genoma tramite un meccanismo detto trasposizione. Hanno la capacità di creare mutazioni geniche a causa dei loro spostamenti casuali, ma che non funzionano più); • Le sequenze SINE sono formate da 500/600 basi e sono più piccole, presenti in molte copie e si possono spostare attraverso un meccanismo di retrotrasposizione. Sono responsabili della maggior parte delle mutazioni ex novo della linea germinale. Se una SINE si inserisce in una sequenza codificante può generare una mutazione per interruzione; • Le sequenze derivate da RETROVIRUS ENDOGENI si evidenziano perché hanno 2 regioni, una all'inizio e una alla fine, dette long terminal repeat (LTR), ovvero sequenze identiche ripetute di un retrovirus che sono state integrate nel genoma. Sono il 5% del 20 • T, o twisting number, è il numero di volte in cui un filamento di DNA si avvolge sull'altro a formare la doppia elica. Se ho un frammento di DNA di 1000 bp, so che ci sono 10 basi per giro, quindi T varrà 1000/10=100; T=numero nucleotidi DNA/passo dell'elica; • W è il numero di supereliche e dice quante volte un filamento si avvolge sull'altro a formare un superavvolgimento; • L, o linking number (numero di legami), è la somma di questi due. È una invariante topologica. L per un frammento non può cambiare: possono cambiare T e W ma non la loro somma. Per cambiare L si deve rompere la molecola. Un concetto importante è il topoisomero: sono topoisomeri molecole di DNA identiche, ma che hanno un numero di legami (L) diverso. Esempio: ho una molecola di DNA circolare a doppia elica rilassata di 500 bp. E' rilassata, non ha superavvolgimenti e W=0. Per T, T=500/10=50. Quindi L=50+0=50 Se aggiungo EtBr si intercala e fa diminuire l'angolo di rotazione fra le basi; il passo dell'elica anziché di 10 diventa di 12, quindi T diventa T=500/12=41. Poiché L non può cambiare deve cambiare W, che diventa 9, infatti 41+9=50. Un intercalante genera sempre un superavvolgimento positivo cioè W > 0. La molecola di DNA è la stessa, in quanto non è cambiato il numero di legami (L), anche se la molecola è un po' modificata. Se L > T, W è positivo e il numero di bp dell'elica per giro è maggiore di 10. Si genera un superavvolgimento positivo. Se L < T, W è negativo e il numero di bp dell'elica per giro è minore di 10. Si genera un superavvolgimento negativo. Se L=T, W è uguale a 0 e il numero di bp dell'elica per giro è 10, il DNA è rilassato e non si genera nessun superavvolgimento. Se il DNA rilassato viene avvolto su un supporto e si rimuove il supporto, il DNA rimane superavvolto. La superelicità si calcola come W/T e i DNA nativi circolari hanno un valore di circa -0,05. Questo valore negativo corrisponde a un giro di superelica negativa ogni 200 basi. Anche il DNA dei cromosomi è superavvolto negativamente. Il superavvolgimento è realizzato compiendo lavoro quindi, quando il DNA si rilassa, si libera (1) energia. Questa quantità di energia immagazzinata è importante perché, se il superavvolgimento è negativo, aiuta l’apertura locale del DNA (es. x trascrizione). Per capire il motivo considero un DNA circolare rilassato di 360 pb. I suoi parametri topologici sono T=360/10=36, W=0 e L=36. Provochiamo dei superavvolgimenti tramite l’enzima DNA girasi (topoisomerasi di tipo II) che, in presenza di ATP, introduce un numero pari di superavvolgimenti negativi. Consideriamo 4 superavvolgimenti. W da 0 diventa -4 e quindi L da 36 è passato a 32. T rimane uguale. Immaginiamo ora di denaturare una regione di 40 basi. il DNA si rilassa e togliamo 4 giri d'elica. T diventa 32, L non cambia (non avendo rotto alcun legame fosfodiestere non varia il numero di legami) e quindi varia W, che torna ad essere zero. Queste due molecole sono lo stesso topoisomero perché non abbiamo rotto legami covalenti. Un superavvolgimento negativo è topologicamente equivalente ad un DNA rilassato con una regione denaturata, purché L sia lo stesso. Se avessi introdotti superavvolgimenti positivi, W sarebbe aumentato e quindi avrebbe ostacolato l’apertura. (2) Il superavvolgimento negativo consente anche transizioni del DNA, come da forma B a Z. (3) Un altro tipo di struttura introdotta da forte superavvolgimento negativo sono le strutture cruciformi, ottenute da sequenze palindromiche che possono trovarsi nel DNA. 21 Queste strutture sono termodinamicamente sfavorite ma con un superavvolgimento negativo si riesce. I topoisomeri si possono separare su gel di agarosio. Più è rilassato, più si trova in alto sul gel. Si usano degli enzimi, le topoisomerasi. Le topoisomerasi funzionano per grado ovvero fanno cambiare il numero di legame un passo alla volta. Sul gel vedo se la topoisomerasi sta lavorando. In questo caso da superavvolto, rilassa. In generale, le topoisomeriasi sono gli enzimi che fanno cambiare il numero di legami del DNA. • di tipo I: sono sia batteriche che eucariotiche e tagliano 1 filamento. Fanno cambiare il numero di legame di 1; • di tipo II: tagliano il doppio filamento e fanno cambiare il numero di legame di 2. La topo 2 di E. Coli è la DNA-girasi. Topoisomerasi I - Sono enzimi abbastanza semplici fatti da una sola subunità. - Non usano ATP. Consentono di rilassare il DNA, fanno diminuire il numero di supereliche perché, non usando ATP, la reazione va nel verso spontaneo (di rilassamento perché si libera energia). Quella batterica rilassa solo il DNA superavvolto negativamente. Quella eucariotica sia negativo che positivo. Entrambi gli enzimi creano intermedi metabolici. - Nick-closing: non avviene un’idrolisi del legame fosfoestere ma un ossidrile di un residuo di tirosina forma un legame fosfoestere con 5’ fosfato nella batterica e 3’ fosfato nell’eucariotica. È reversibile perché si può tornare indietro staccando la tirosina. Se ci fosse stata un’idrolisi, non sarebbe reversibile. La topoisomersi di tipo I può risolvere dei nodi topologici ed è coinvolta nella generazione di un’elica a doppio filamento partendo da una a singolo. È coinvolta anche nel processo contrario. Con la topoisomerasi I si può generare in laboratorio del DNA superavvolto negativamente. Si tratta un DNA rilassato con bromuro d’etilio. Il DNA si superavvolge positivamente a causa dell’etilio. Usando la topoisomerasi I eucariotica, si ottiene DNA rilassato contenente bromuro d’etilio. Togliamo il bromuro d’etilio e quindi il passo dell’elica diminuisce superavvolgendosi negativamente. Topoisomerasi II - Sono enzimi complessi. - Formati da 4 subunità (multimerici). L'enzima si lega ad uno dei due filamenti e li rompe entrambi, generando una rottura della doppia elica. L'enzima rimane in quella posizione, legato covalentemente da una parte e dall'altra. Fa passare una doppia elica completa attraverso il taglio e lo richiude. Il passaggio di un filamento di DNA dentro l’altro è forzato quindi si usa ATP. - Usano ATP. La girasi è una topoisomerasi, presente solo nei batteri, che aggiunge superavvolgimenti negativi al DNA. Questo processo richiede che funzionino tutte e 4 le subunità (2A e 2B). La subunità A ha funzione di nick-closing (si comporta come una topoisomerasi I). Le subunità B sono trasduttori di energia ovvero idrolizzano ATP per generare energia meccanica. Le subunità possono essere inibite selettivamente da alcune sostanze: le subunità A sono inibite da acido nalidixico o oxolonico; le subunità B da antibiotici come la novobiocina o coumermicina A1. Nel tempo, i batteri hanno sviluppato resistenza a questi 22 antibiotici, quindi ora si usano ciprofoxacina e norfloxacina (struttura di base simile ad acido nalixidico e oxolonico). Se la girasi è inibita, il batterio muore perché essa è coinvolta nella replicazione e trascrizione per eliminare i superavvolgimenti che si formano quando il DNA viene aperto. Se prendessimo un DNA rilassato e lo avvolgessimo creando un nodo positivo ed uno negativo e lo trattassimo con girasi, essa convertirebbe il nodo positivo in negativo facendo passare un filamento sull’altro. Si ottengono due nodi negativi. SDS (detergente) rompe le interazioni tra le subunità. ORGANIZZAZIONE DEI CROMOSOMI Il DNA deve essere impacchettato. Il cromosoma è impacchettato in modo ordinato. Subisce dei ripiegamenti che formano circa 50 anse che vengono bloccate da una matrice fatta sia da proteine (condensine) che RNA. Le anse sono superavvolte negativamente. Ogni ansa è un dominio topologico indipendente. Se trattassi il cromosoma con la DNAsi I, che è un enzima che rompe i legami, si creerebbero delle anse rilassate. Poiché essa non è una topoisomerasi, il nick non viene richiuso quindi il DNA dell'ansa si rilassa completamente. Se lo trattassi con la RNAsi, le anse si uniscono ma rimangono superavvolte. Il DNA a pH fisiologico è ricoperto di cariche negative, una per ogni nucleotide. Se si cerca di avvicinare 2 filamenti, questi si respingono. Per impacchettare il DNA bisogna neutralizzare le cariche negative. Per questo motivo si usano proteine con cariche positive. In E. Coli si usa la proteina HU fatta da circa 80 aa che è ricca di lisina e arginina. Se si togliessero le proteine basiche, il DNA fuoriuscirebbe a causa della repulsione elettrostatica. Nei batteri non c’è un nucleo ma il DNA è condensato formando una struttura compatta, quindi, una volta digerita la parete cellulare, il nucleoide rimane come un organello compatto e viene recuperato con centrifugazione. Il coefficiente di sedimentazione è alto e, quindi, sedimenta anche in centrifugazione a velocità bassa. Se fosse trattato con DNAsi, questa causerebbe un graduale rilassamento delle anse e si potrebbe arrivare ad una situazione in cui il DNA non è più superavvolto, ma ha ancora le anse bloccate al centro. In questo caso, ha coefficiente di sedimentazione minore, perché le anse non sono più superavvolte e occupano più spazio. Negli eucarioti, il problema dell’impacchettamento è maggiore perché il genoma è più grande. Si usano gli istoni. Il cromosoma eucariotico è molto condensato. La matrice o scaffold del cromosoma tiene insieme le anse. Per impacchettare il DNA bisogna: - Neutralizzare le cariche negative (istoni x eucarioti); - Ottenere la condensazione risolvendo problemi topologici. Le proteine positive si legano al DNA con interazioni elettrostatiche. Aumentando la forza ionica (essa neutralizza le cariche), gli istoni si staccano in un preciso ordine. L’istone H1, ricco di lisina, si stacca dalla cromatina quando la concentrazione di cloruro di sodio è 0,5 M. La concentrazione fisiologica è circa 0,1 M. Si staccano poi H2A e H2B. H3 e H4 richiedono una concentrazione 3 M per staccarsi; sono più ricchi di arginina. Gli istoni hanno anche residui acidi in proporzione minore in modo che la carica totale sia positiva. Questo provoca la formazione di sali interni agli istoni che li rende molto solubili. Il più grosso è l’istone H1, di circa 20 kDa. Sono proteine molto conservate evolutivamente perché hanno sia la funzione di regolare l’impacchettamento e sono importanti anche nel ruolo 25 H1 è coinvolto nei processi di condensazione che consentono di ottenere dei cromosomi alla mitosi. Subisce infatti delle modifiche. Le più importanti sono legate alle serine e treonine, che vengono fosforilate. La fosforilazione ne regola l'attività ed è regolata dal ciclo cellulare. Nella fase S si replica il DNA e, quindi, questo processo avviene in questa fase. Lo stato di maggior condensazione è nella fase S per poter separare gli istoni. La sintesi degli istoni è periodica: sono sintetizzati quando servono ovvero nella fase S. Gli istoni H3 e H4 vengono acetilati nella fase S e deacetilati in fase G2. Le chinasi ciclina dipendenti sono proteine che regolano il ciclo cellulare capaci di modificare la coda di H1. Durante il ciclo cellulare gli istoni vengono modificati. All'inizio del ciclo abbiamo cellule con un contenuto presintetico di DNA e sono in fase G1. Il DNA, poi, viene replicato nella fase S; nella fase G2 le cellule hanno contenuto doppio di DNA: in questa fase abbiamo una progressiva condensazione della cromatina, fino a raggiungere il massimo durante la mitosi. Dopo la mitosi il DNA si decondensa e diventa di nuovo accessibile in G1. Gli istoni vengono sintetizzati periodicamente perché non servono in G1, ma solo nella fase S. Il ciclo cellulare è accompagnato dal ciclo di condensazione e decondensazione della cromatina dovuto agli istoni. È un processo abbastanza complesso e molto efficiente; questo fa capire il motivo della sua conservazione per più di un miliardo di anni. Replicazione del DNA Meselson e Stahl dimostrarono la replicazione semiconservativa. È stato usato come modello E. Coli, facendo crescere una sua colonia su un terreno con DNA isotopo N14. Se al posto del terreno con N14 si usa un terreno con N15 (isotopo stabile e non radioattivo, ha reattività e proprietà uguali a N14), il DNA del Coli avrà questo isotopo, che ha densità maggiore (su cloruro di cesio si nota un picco distinguibile). Dopo averle fatte cresce in terreno con N15, le fanno crescere su un terreno ricco di N14. Da questo momento tutto il DNA sintetizzato avrà N14. Il DNA si duplica e può essere estratto dalle cellule. Si osserva un picco di densità intermedia tra quello che contiene sono N14 e quello che contiene solo N15. La densità è intermedia perché le due eliche pesanti sono identiche: quando si aprono 26 fanno da stampo per una nuova elica fatta con gli N più leggeri. Si ottengono, quindi, due DNA, ciascuno con un'elica pesante e una leggera; questo spiega la densità intermedia. Dopo due generazioni sul terreno N14, entrambe le eliche dei due DNA ottenuti fungeranno da stampo e si otterranno 2 DNA fatti da catene completamente leggere e 2 DNA fatti da catene intermedie. Man mano che si va avanti il picco di densità di N15 diminuirà sempre più fino a non essere più visibile, ma non si annullerà mai. Questo è compatibile con un modello di replicazione semiconservativa. Per fare un controllo sul fatto che l'elica della prima replicazione sia davvero ibrida, si può fare un gradiente a pH 12 anziché 7. Il DNA si denatura e i due filamenti si separano. Si avranno due picchi di densità, uno dovuto al filamento pesante e l'altro dovuto al filamento leggero, in uguale quantità. Il sistema più veloce per confermare che sia avvenuta una sintesi è usare dei precursori radioattivi che vengono inclusi nel DNA sintetizzato e si potrà osservarne la radioattività per avere conferma della sintesi. Il nucleotide non è il precursore radioattivo perfetto perché la cellula non ha un sistema di trasporto per esso. I nucleotidi sono impermeabili, non entrano nella cellula perché sono polari e perché non ci sono trasportatori che li facciano entrare. I nucloesidi e le basi azotate sono trasportati all’interno. Siccome una cellula contiene molto più RNA che DNA, se si usassero certe basi la radioattività finirebbe nell'RNA. Per marcare selettivamente il DNA si deve usare la timina, contenuta unicamente nel DNA. Se dò alla cellula timina/timidina radioattiva questa si ritroverà unicamente nel DNA. Sintetizzazione del dTMP (tutte le cellule, dai batteri all'uomo, usano questa via ex novo per la sua sintesi): • Si parte dall'UMP, che per ragioni di equilibrio diventa UDP • Un enzima converte l'UDP in dUDP • Sempre per equilibrio, da dUDP si passa a dUTP e poi a dUMP (questi tre nucleotidi sono in equilibrio tra loro) • A questo punto un enzima usa il dUMP come substrato della sua reazione: la metilazione dell'uracile per fornire dTMP, che può entrare nel DNA. 27 Esiste un'altra via per ottenere la timina, detta via di recupero o salvataggio, che non è presente in tutti gli organismi, ma che hanno mammiferi ed E. Coli. Questa consente di recuperare T dalla degradazione del DNA. Degradando il DNA si ottengono le basi e i vari componenti, tra cui la T. Attraverso un enzima, la timina non viene sprecata ma è riciclata. La timidilato chinasi converte la desossiuridina in dTMP. Le cellule che hanno questa via di recupero consentono di marcare selettivamente il DNA, dando timina o timidina dall'esterno, che viene poi integrata nel DNA. Metodi per verificare che stia avvenendo una sintesi del DNA: 1. Timidina triziata Pongo in una beuta una coltura di batteri (E. Coli) e timidina triziata (H3-Thy). Se c'è una sintesi del DNA, il precursore radioattivo verrà integrato nel DNA. Estraendo il DNA e facendo un gradiente con cloruro di cesio ci vuole troppo tempo. Un metodo più veloce è prendere a vari intervalli un'aliquota della coltura e aggiungere un acido forte come l'acido tricloroacetico in soluzione al 20% in una provetta immersa nel ghiaccio. Dopo circa mezz’ora, le cellule muoiono a causa dell'acido, che ha anche permeabilizzato le membrane. Il materiale solubile contenuto nelle membrane fuoriesce. Le molecole piccole e i metaboliti vanno in soluzione mentre le macromolecole (DNA, RNA e proteine) precipitano perché l'acido è denaturante e le rende insolubili. Il trattamento con questo acido a 0° viene detto trattamento a freddo. Si separano le macromolecole dalle molecole piccole per filtrazione con un filtro di fibra di vetro (o di microcellulosa), inerte e che non viene attaccato dall'acido. L'unica radioattività che rimane sul filtro è quella incorporata dal DNA perché la timidina triziata non entra nelle proteine o nel RNA. Basterà misurare la radioattività sul filtro per avere un'indicazione della sintesi di DNA. Si possono prendere dei campioni a diversi tempi e metterli in ghiaccio con TCA e così si può ottenere la dinamica di sintesi del DNA. La precipitazione con l'acido tricloroacetico a freddo consente di separare rapidamente le macrocomponenti molecolari da quelle a basso peso molecolare e di vedere la sintesi di macromolecole in vivo (per RNA e proteine si cambia il precursore radioattivo). Inizialmente la radioattività sarà nulla ma, man mano che la T viene incorporata nel DNA, si avrà un aumento di radioattività. In un certo momento si può aggiungere una sostanza che inibisca la sintesi del DNA, come l'idrossiurea (che inibisce l'enzima che crea il desossiribosio). L'incorporazione si blocca, ma la timidina triziata già incorporata rimane. Questo metodo serve a verificare che stia avvenendo una sintesi del DNA, ma anche per studiare il ciclo cellulare su cellule di mammifero: si possono vedere quante cellule di una popolazione sono in fase S e per quanto tempo rimangono in quella fase. Tecnica per studiare il ciclo cellulare di una cellula con la timidina triziata: Appena isolate, le cellule entrano in mitosi; man mano che le cellule crescono, perdono la sincronia. Questo accade perché c’è una variabilità naturale. Nel primo ciclo sono sincrone. Se al primo ciclo aggiungiamo la timidina triziata, possiamo vedere quando la cellula entra in fase S. Per molto tempo non si misura quantità di timidina triziata ma ad un certo punto aumenta molto. Si deduce, quindi, che la prima fase è la G1; poi la S; poi G2 quando vediamo che non aumenta più la quantità di timidina e dopo la G2 c’è la fase M. per capire che è avvenuta la fase M, misuriamo il contenuto delle cellule finali rispetto alle iniziali. 30 Negli eucarioti, il cromosoma è molto più grande. Per questo motivo, sono presenti molte origini di replicazione e da ognuna parte una replicazione bidirezionale. Le origini non si aprono contemporaneamente, gli occhielli più grandi si sono aperti prima. Avere molte origini consente una replicazione del DNA molto più veloce. Sono stati fatti degli esperimenti di marcatura per dimostrare che all'interno delle regioni a occhiello ci sia davvero la replicazione. Sono stati usati dei derivati dall'ovaio di criceto. Queste cellule sono state sincronizzate per entrare tutte insieme in fase S: per sincronizzarle si usano degli inibitori della sintesi proteica che bloccano le cellule prima di entrare in S. Si cambia, poi, il terreno per rimuovere l'inibitore e tutte le cellule entrano in S insieme. Si aggiunge della timidina triziata per un tempo molto breve per evitare la sintesi completa, poi si estrae la cromatina. Il materiale viene stratificato per avere dei singoli filamenti. In un singolo filamento di DNA diverse regioni si stanno replicando e sono le uniche che si vedono in quanto radioattive. Ci sono più repliconi in un unico filamento e non sono sincroni, alcuni si sono aperti prima e hanno replicato un tratto più lungo. Per verificare che il meccanismo di replicazione fosse bidirezionale si è usata la tecnica pulse and chase. Si usa prima della timidina triziata ad alta attività specifica e a bassa concentrazione per qualche minuto. Dopo si aggiunge, allo stesso terreno, della timidina non radioattiva (il vantaggio di questa tecnica è che non si deve cambiare il terreno) a concentrazione molto più alta (1000 volte superiore). In questo modo viene diminuita la radioattività (viene diluita), la radioattività diminuisce gradualmente fino all’estremità. C’è molta radioattività all'interno e diminuisce sia da un'estremità che dall'altra. Man mano che si va avanti si vede sempre meno radioattività, fino ad annullarsi completamente alle due estremità. Questo dimostra che la sintesi è bidirezionale. Pulse and chase è un metodo dinamico per seguire un fenomeno. Ci sono più origini di replicazione, ognuna delle quali si apre e inizia una replicazione bidirezionale con un meccanismo detto replicone. Duplicazione del DNA • I substrati usati sono i desossiribonucleotidi trifosfato. Dal punto di vista energetico, si potrebbero usare anche difosfati o monofosfati. Le pirofosfatasi idrolizzano il pirofosfato che viene liberato dopo la formazione del legame tra i due nucleotidi. In questo modo, la reazione di sintesi è irreversibile (non essendoci più il fosfato). Questo implica che la reazione non dipenda dalle concentrazioni dei reagenti ma solo dall’attività dell’enzima. • L’enzima, la DNA polimerasi, lega il 3’OH all’α fosfato del nucleotide entrante. La replicazione è processiva perché l’enzima non si stacca dal filamento ma scorre su di esso. La processività consente una reazione di sintesi più veloce (l’enzima non deve ritrovare sempre il templato ma rimane su di esso). • La duplicazione richiede un templato, ovvero uno stampo su cui l’enzima opera (è un DNA a singolo filamento) e un primer (o a RNA o a DNA), un piccolo tratto già a doppia elica a cui l’enzima si lega. Questo implica che l’enzima abbia una determinata polarità: polimerizza solo in direzione 5’-3’. Il nucleotide aggiunto è complementare al nucleotide del templato. 31 DNA polimerasi I La DNA polimerasi I di E. Coli è stata la prima ad essere stata isolata. Da una coltura batterica sono state isolate le proteine e si è cercato se, nelle frazioni, fossero presenti attività polimerasiche. Si fornivano nucleotidi radioattivi. Se si trova della radioattività, significa che i nucleotidi sono stati polimerizzati. È un enzima fatto da un’unica catena polipeptidica di circa 109 kDa (quindi circa 1000 amminoacidi). In vitro, se si aggiunge molto pirofosfato, l’enzima degrada il DNA. Ha due attività esonucleasiche, ovvero degrada il DNA: - 3’-5’: correzione di bozze - 5’-3’ digerisce DNA che si trova più avanti e lo sostituisce con un altro. Ha due domini che possono essere separati tra loro tramite la tripsina, una proteasi, che rompe i legami peptidi in corrispondenza di sequenze particolari. Si ottengono due frammenti: 1) di Klenow, più grande e contiene l’attività di polimerasi e attività esonucleasica 3'-5' 2) piccolo, contiene l’attività esonucleasica 5’-3’. Nick translation Se si fornisce all’enzima del DNA a doppia elica, non succede nulla. Se si fornisce DNA a doppia elica con un nick, il nick lascia un'estremità 3'-OH e una 5'-P libere. Questo nick può essere indotto da delle DNA-si. La DNA polimerasi si lega e degrada il filamento a monte, poi polimerizza in direzione 5'-3'. Il risultato è la sintesi di un filamento nuovo complementare allo stampo nella zona di nick e il nick viene spostato. Non è in grado di legare il nick e chiuderlo. È stato uno dei primi metodi in vitro per generare DNA radioattivo. La DNA polimerasi I è presente in tutti i batteri. Le polimerasi eucariotiche non hanno attività esonucleasica, perché viene fatta da un altro enzima. Se si considera un DNA lineare single strand, la DNA polimerasi I può appaiare le parti complementari del filamento perché digerisce con attività 3’-5’ le parti vicine al tratto da appaiare. Le regioni possono appaiarsi e formare strutture deformate con anse seguite da regioni di appaiamento. La pirofosforolisi è una reazione che avviene solo in vitro, dove il pirofosfato non viene eliminato e la reazione può tornare indietro. L’equilibrio si posta verso la reazione inversa. Mettendo del pirofosfato marcato libero in vitro, questo verrà usato dal DNA nella sintesi dei nucleotidi, portando ad avere dei nucleotidi marcati radioattivamente. Lo scambio di pirofosfati è dato da due reazioni che, essendo in equilibrio dinamico, portano allo scambio di pirofosfati nella formazione di nucleotidi. Sono reazioni che non hanno senso in vivo. 32 Il sito attivo della polimerasi è una cavità con: • una regione in cui è contenuto lo stampo; • una regione che riconosce i fosfati del nucleotide entrante; • una regione che riconosce i desossiribosi per la sintesi (in modo da non usare ribosi); • una regione che riconosce il corretto appaiamento delle basi. C’è un controllo perché due purine sarebbero troppo grosse per entrate ma due pirimidine potrebbero entrare. Si è visto che, nel E. Coli, il sistema di replicazione è molto fedele. C’è un errore ogni 1000- 10000 replicazioni. L'enzima è molto fedele perché riesce a distinguere tra nucleotidi coretti e sbagliati, è molto selettivo. In vitro, si è visto che sbaglia ogni 10000-50000 basi. Questo può essere dovuto alle forme tautomeriche delle basi: una forma particolarmente sfavorita può essere letta come sbagliata. Tuttavia, grazie all'attività esonucleasica 3'-5' la maggioranza degli errori vengono corretti. Se viene incorporato il nucleotide sbagliato, si crea una distorsione che viene riconosciuta dall'enzima, che lo elimina. È l’attività di correzione di bozze. L'attività esonucleasica si manifesta sempre quando manca il substrato per la sintesi. In condizioni normali i substrati sono sempre presenti, in vitro si possono non mettere. In condizioni normali, se le basi di un filamento non sono appaiate, vengono degradate dalla polimerasi I con l'attività esonucleasica 3'→5'. Se sono invece appaiate, vengono mantenute. Quando è presente un nucleotide sbagliato, questo non sarà appaiato correttamente e verrà riconosciuto ed eliminato dall'enzima, che continuerà poi a polimerizzare. Si usa un templato fatto da adenine con le ultime timine radioattive. Si fornisce la polimerasi e si vede se viene persa della radioattività. Si perde la radioattività perché l’enzima elimina i nucleotidi anche se le basi sono perfettamente appaiate. Questo accade perché non c’è un substrato quindi l’enzima non può polimerizzare. Le basi scorrette appaiate, vengono degradate comunque a prescindere che la polimerasi possa polimerizzare o meno (esperimento con C14 e Timine triziate). La DNA polimerasi I è l’unica a fare nick translation perché ha l’attività esonucleasica 5’-3’. È presente solo nei batteri. La prima struttura tridimensionale della polimerasi I è stata determinata a partire dal frammento Klenow. Ha una struttura simile a una mano, in cui è presente il templato e nel sito attivo entra il nucleotide che poi verrà polimerizzato. Le regioni delle tre dita e del pollice sono costituite da α eliche, mentre il palmo ha anche β foglietti. Le dita e il pollice si avvolgono intorno al DNA e lo tengono in posizione, mentre il sito attivo è sul palmo. 35 risultato è la formazione di un legame fosfodiestere. Il nick viene chiuso, l'enzima liberato e l'AMP rilasciato. L'enzima ora è libero di ricircolare. Frammenti di Okazaki I frammenti sono molto piccoli e il processo è molto veloce. Il primo a voler dimostrare la reale esistenza dei frammenti fu Okazaki negli anni 50/60. La sua idea era che i frammenti avessero vita breve e che per vederli bisognava rallentare i processi e aumentarne la produzione. 1) Per rallentare le reazioni, abbassò la temperatura (circa 8°). Usò un mutante PolA- ovvero dove la DNA polimerasi I non funzionava perché così diminuiva la velocità di formazione del legame. 2) Usò una marcatura con timidina triziata per tempi brevi con alta attività specifica. 3) Per aumentare il numero di frammenti usò un Coli infettato da un fago, perché nell'infezione si ha una grande replicazione del DNA del fago. 4) Uccise, poi, le cellule e fece un'estrazione del DNA. Per vedere i frammenti bisogna denaturare il DNA, altrimenti rimangono attaccati allo stampo. Per farlo, aumentò il pH a 9 (non poteva aumentare la T; in condizioni alcaline il DNA si denatura). 5) Separò il DNA su un gradiente a saccarosio (separa in base alle dimensioni) e misurò l'assorbanza a 260 nm. Facendo la marcatura, la radioattività entra metà nei frammenti e metà nel DNA ad alto peso molecolare (leading strand). In realtà, osservò un eccesso di frammenti: la radioattività del DNA ad alto peso molecolare era molto inferiore a quella dei frammenti. I frammenti esistono, ma erano troppi. Si è scoperto in seguito che una porzione dei frammenti era quella di Okazaki, ma il resto era dovuto ad un processo di un sistema di riparo. È, infatti, possibile che nella sintesi del DNA venga incorporato dell'U al posto di una T, perché la polimerasi non sa distinguerli (comunque nella cellula l'UTP è presente in quantità molto minori del TTP). L'uracile è visto come un danno al DNA, perché può derivare dalla deamminazione della citosina. La cellula lo vede come un danno e questo viene rimosso da un sistema di riparo basato sull'uracil-N- glicosidasi, un enzima immutato dai batteri all'uomo. Quando entra un U, l’enzima stacca la base e un altro enzima taglia il DNA, generando un frammento simile a quelli di Okazaki, che verrà poi riparato. Esperimento che dimostra che l’eccesso di frammenti di Okazaki sia dovuto al sistema di riparo: Isolando dei mutanti senza U (hanno dei problemi di riparo, ma riescono comunque a crescere), si nota che in essi ci sono meno frammenti. Metà della radioattività va nei frammenti e metà nel DNA ad alto peso molecolare. Non c'è un eccesso di frammenti. Ci si aspetta che i frammenti di Okazaki derivino da un pezzo di RNA. Per creare un frammento occorre un primer, sintetizzato da una RNA polimerasi, capace di partire da zero. Prima si credeva che l'RNA polimerasi batterica (enzima che trascrive tutti i tipi di RNA) fosse coinvolta anche nella sintesi del primer. La RNA polimerasi batterica è inibita da un antibiotico, la rifampicina. Se si fornisce la rifampicina ad un batterio, c'è un'inibizione della sintesi del DNA, ma a scoppio ritardato. Questo è dovuto al fatto che la RNA polimerasi controlla l'apertura delle origini di replicazione mentre la replicazione già in atto continua ma non si aprono nuove origini. 36 Si è, quindi, escluso che l'RNA polimerasi sintetizzasse il primer e si è scoperta l'esistenza di una RNA polimerasi specializzata nei primer, la DNA primasi. È un enzima molto più piccolo della normale polimerasi e non richiede la presenza di sequenze particolari per attaccarsi al DNA (la RNA polimerasi invece necessita la presenza del promotore). Può legarsi a qualunque posizione del DNA. I frammenti Okazaki contengono, quindi, porzioni di RNA. La presenza di questo piccolo tratto di RNA non è facile da dimostrare, perché il primer è lungo una decina di basi mentre il resto del frammento è di 1500 basi. La presenza dell'RNA è talmente piccola che non influenza il comportamento del DNA. È stata dimostrata per la prima volta in Coli, osservando se un frammento Okazaki separato grazie al gradiente a saccarosio potesse essere degradato dall'enzima esonucleasi di milza. Questa è una esonucleasi particolare: digerisce gli acidi nucleici in direzione 5'->3', ma solo se sul 5' c'è un 5'-OH. Gli acidi nucleici nativi hanno sempre 5'-P, quindi in genere sono resistenti all’enzima. I frammenti Okazaki sono resistenti a questo enzima, ma se vengono trattati con NaOH diventano sensibili, perché NaOH idrolizza l'RNA, ma non il DNA, rompendo il legame fosfodiestere tra zucchero e P. Si rompe il legame del primo nucleotide a RNA, che si stacca come nucleotide monofosfato in 3' e rimane un 5'-OH. I vari nucleotidi si staccano fino ad arrivare all'ultimo ribonucleotide legato al DNA. Il fosfato rimane attaccato all'ultimo ribonucleotide uscente e rimane un frammento di DNA con 5'-OH, degradato dall'esonucleasi di milza. Questo risultato si può spiegare solamente se si assume che all'inizio la molecola avesse dell'RNA degradabile dall'NaOH. Replisoma La sintesi avviene in una forca replicativa in cui vengono sintetizzati contemporaneamente i due filamenti di DNA. In un caso, la sintesi è continua, nell'altro è ritardata. L'attività della sola DNA polimerasi non basta: ci vuole un complesso di fattori proteici che aiuta la polimerasi; questo complesso è il replisoma e ha tutti i fattori proteici necessari al funzionamento della forca replicativa. Per capire quali sono questi complessi proteici, si individuano i geni coinvolti in un processo di replicazione. Questo sistema prevede l'isolamento di mutanti TS (sensibili alla temperatura), per i quali la funzione di sintesi di DNA viene persa solo ad una certa temperatura. 1° tecnica: Suicidio delle cellule. Si trattano delle cellule con mutageni, poi si riscaldano a 42° per un tempo brevissimo, in modo che non muoiano. Si aggiunge timidina triziata ad attività specifica elevata. A questo punto: le cellule che a 42° possono sintetizzare DNA non sono mutate (non ci interessano) e incorporano timidina triziata; le cellule che a 42° non riescono a sintetizzare DNA sono mutanti TS. Si riporta T ad un livello normale: le cellule non mutate fanno suicidio, perché la timidina entrata nel DNA, a seguito del decadimento del trizio, porta a una frammentazione del loro genoma. I mutanti invece non hanno subito nessun problema. 2° tecnica: uccisione selettiva delle cellule con bromo-desossi-uridina Si fa incorporare al posto della T triziata della bromo-desossi-uridina. Queste cellule a T normali non fanno suicidio ma irradiate a una lunghezza d'onda di 310 nm il loro DNA si frammenta a causa della presenza del bromo. 37 Il risultato in entrambi i casi è di isolare i mutanti. Bisogna fare una seconda selezione per eliminare i mutanti lesi nella crescita ovvero nella sintesi proteica o di RNA. Vengono isolati i mutanti DNA-, specifici per la sintesi del DNA. Si può studiare la cinetica di questi mutanti in vitro. Si suddividono in 2 categorie in base al tipo di arresto: I. I mutanti con arresto immediato sono quick stop (es mutanti per le SSB o per le subunità della polimerasi) ed intervengono direttamente nel meccanismo di replicazione. Una loro modifica porta ad un arresto immediato della sintesi. II. Se la sintesi non si blocca immediatamente sono mutanti slow stop. Non intervengono immediatamente nella forca replicativa, ma funzionano in un altro momento, come l'apertura delle origini (le parti che già si stanno replicando non subiscono problemi, ma poi non si formano più altre origini di replicazione, perché manca l'enzima che ne catalizza l'apertura) Ci sono diverse proteine che fanno parte del replisoma: • DNA PRIMASI: è una quick stop. È una piccola proteina monomerica presente in piccole quantità che sintetizza il primer di 5/60 nucleotidi. Per funzionare ha bisogno di DNA a singolo filamento, proteine SSB e proteina DNA B. • PROTEINA DNA B: è un enzima che idrolizza ATP unicamente in presenza di DNA (è ATP-asica); è un'elicasi, in presenza di DNA e ATP apre il DNA. È un quick stop ed è poco rappresentata; nel suo sito attivo ci sono 6 subunità. • PROTEINA DNA C: sono stati isolati mutanti sia slow stop che quick stop. È una proteina monomerica piccola, non ha attività enzimatica, forma dei complessi attivi a esamero con la DNA B. I complessi sono importanti: sono un richiamo per la primasi per farla funzionare. • SSB: sono quick stop. Erano già state identificate quando si studiavano cellule infettate dal fago T4. Le cellule infettate producono moltissime SSB, prodotti del gene 32 del fago. Le SSB sono facilmente purificabili con cromatografia per affinità e sono fondamentali nella replicazione del fago. È presente anche in Coli ed è una piccola proteina tetramerica in quantità abbondanti. Le SSB sono capaci di legarsi al DNA single strand in modo cooperativo. In vitro, il DNA single strand viene ricoperto in alcune parti da SSB mentre in altre no. Questo è dovuto al fatto che il monomero che si lega aumenta la probabilità che se ne leghi un altro. È una cooperatività positiva. Questo processo porterà alla copertura totale del filamento. Lo scopo delle SSB è legarsi al DNA single strand per prevenire l'appaiamento con un altro filamento (stabilizzano e favoriscono l'apertura dell'elica nella replicazione). La presenza di queste proteine stimola l'attività della polimerasi III. Se non ci sono le SSB questa non funziona. Le SSB hanno diverse funzioni in vitro: - Sono necessarie per la replicazione del DNA dei fagi; - Stimolano l'attività della polimerasi II e III, ma non hanno alcun effetto sulla I; - Aumentano la velocità di denaturazione e rinaturazione del DNA. Le SSB causano una denaturazione lenta di DNA e una rinaturazione rapida quando viene aggiunto magnesio: 40 Quando la forca replicativa arriva qui, si ferma e attende che arrivi l'altra forca. Quando la replicazione è finita, i due cromosomi circolari sono incastrati uno sull'altro. Per separarli c'è una topoisomerasi di tipo II, la topoisomerasi 4, simile alla girasi, che rompe il doppio filamento e libera i due cromosomi indipendenti. Eucarioti Gli eucarioti hanno più DNA polimerasi. Esperimento: estrazione da diversi tessuti di ratto delle DNA polimerasi per capire la capacità di sintesi. La velocità di sintesi del DNA è correlata al contenuto delle DNA polimerasi. Cuore e cervello ne hanno poche. (i neuroni non si replicano più e vengono bloccati in G1 o G2). Nei tessuti proliferanti come la milza, viene sintetizzata una grande quantità di DNA. Esperimento: neuroni di ratto estratti poco prima della nascita e neuroni di un organismo adulto. Nel primo caso, c'è ancora una fase di crescita, i neuroni si stanno ancora replicando; si riscontra ancora la presenza di DNA polimerasi. Nel tessuto embrionale si osservano DNA polimerasi α, β e γ. In cellule proliferanti si vedono 3 attività, di 3 polimerasi diverse. Nei neuroni adulti rimangono l'attività di β e γ ma non α. Questo dimostra che la polimerasi più coinvolta nella replicazione è α. L'attività di β è stimolata da danni al DNA: è coinvolta nelle attività di riparo; γ è la DNA polimerasi dei mitocondri. DNA polimerasi α La sua attività è l'80% dell'attività totale delle polimerasi eucariotiche. È inibita da afidilcolina (sesquiterpene) e dal NEM (N-etilmaleimide). Funziona bene con la primasi, con cui si associa. Nel lievito, forma un complesso di tre subunità con la primasi e la DNA polimerasi β. DNA polimerasi β La sua attività aumenta dopo l'esposizione a raggi UV, indicativo del fatto che abbia attività di riparo. Ha un cofattore associato con attività esonucleasica 3'->5' (come tutte le polimerasi, necessaria per la correzione). Ce ne sono una decina per cellula. Non ha attività polimerasica. DNA polimerasi γ È stata trovata nei mitocondri, quindi consente la replicazione del DNA mitocondriale. DNA polimerasi δ È formata da più subunità ed è inibita da afidiolina. In vitro una DNA con gap. È stata isolata una subunità proteica (una proteina) detta PCNA (antigene nucleare presente nelle cellule proliferanti) che permette alla polimerasi δ di usare DNA a singolo filamento per sintetizzare. PCNA è un fattore di processività, come la subunità β nella DNA polimerasi III batterica, di cui è un omologo anche strutturale. La differenza è che la subunità β crea una pinza come dimero, mentre PCNA crea una pinza come trimero. Nella replicazione sono coinvolte α, β, δ e ε, che ha proprietà biochimiche simili a δ e che è un fattore di processività (sono interscambiabili per funzione). Ci sono, quindi, due enzimi coinvolti nella replicazione: la polimerasi α e la polimerasi δ o ε Replicazione negli eucarioti 41 Come per i batteri, la replicazione è semiconservativa: due filamenti stampo danno origine a una replicazione con un filamento leading e uno lagging. La polimerasi δ è quella che sintetizza DNA, è un analogo della DNA polimerasi III di Coli, e funziona sia sul filamento veloce che su quello ritardato. Sul filamento ritardato si lega il complesso polimerasi α-primasi: la primasi sintetizza il primer a RNA, la polimerasi α inizia a replicare il filamento e viene poi sostituita dalla polimerasi δ che si lega al DNA e che è quella che di fatto sintetizza nuovo DNA Delle proteine legano il DNA a singolo filamento (è il filamento ritardato) con la stessa funzione delle SSB e sono dette RPA. Interviene il complesso polimerasi α- primasi, che sintetizza il primer e un primo frammento di DNA. Interviene un fattore detto RFC che stacca la primasi e la polimerasi δ inizia a replicare. L'RNA del primer viene tolto dalla ribonucleasi H e interviene un fattore specifico MFI capace di togliere l'ultimo nucleotide, che la ribonucleasi H non riusciva a rimuovere. I gap fra gli okazaki vengono saldati dalla ligasi. C'è somiglianza fra il processo batterico e quello eucariotico, con la differenza che negli eucarioti non c'è la DNA polimerasi I con attività esonucleasica in entrambe le direzioni. Viene usata la ribonucleasi H. Origini di replicazione negli eucarioti Sono più origini, dovuto al fatto che il genoma è più grande. Il lievito, che ha un genoma piccolo, ne ha 150 dette ARS. Il complesso ORC (origin recognition complex) permette l’apertura delle origini. ORC è regolato da varie proteine coinvolte nel controllo del ciclo cellulare eucariotico. Il genoma di Coli è poco più di 4 milioni di basi. Il lievito ha un genoma a 20 cromosomi, è piccolo, 12/14 milioni di bp. Contiene però 500 repliconi. La grandezza media di ogni replicone è 40 000 bp. Negli eucarioti superiori le dimensioni aumentano nettamente. A causa delle dimensioni occorrono alcune ore per replicare l'intero genoma eucariotico. È complicato isolare le origini di replicazione degli organismi superiori. Primi esperimenti: si volevano ottenere sistemi che potessero replicarsi nel lievito autonomamente come i plasmidi nei batteri. Si volevano costruire vettori adeguati. Il marcatore usato per i vettori batterici era la resistenza all'antibiotico ma il lievito è resistente per sua natura. Si usarono dei marcatori per il plasmide non dominanti, ma auxotrofici. 42 Una mutazione auxotrofica può essere una mutazione che provoca l’impossibilità di sintetizzare leucina. Affinché la cellula possa crescere bisogna mettere della leucina nel suo terreno. Il mutante è detto Leu2 e la cellula è auxotrofa per la leucina. La mutazione più usata è URA 3, che fa in modo che la cellula per crescere richieda uracile nel terreno. Si è scoperto che alcuni geni di lievito potevano complementare con mutazioni di Coli. Ad esempio il gene Leu B di Coli codifica per la stessa proteina modificata dal gene Leu2 del lievito. Questo enzima serve per la sintesi della leucina. Per fare l'esperimento, si prende un plasmide batterico in cui vengono incorporati dei frammenti del genoma di lievito. Si ottiene una serie di plasmidi, di cui ognuno ha incorporato un diverso frammento di DNA di lievito. Questa collezione è detta libreria o banca genomica. Si selezionano i plasmidi che hanno complementato la mutazione con Coli. Questo sistema funziona solo con il lievito: quasi tutti gli altri organismi non presentano mutazioni auxotrofe capaci di complementare con Coli. Si prende un plasmide e si inserisce al suo interno il gene Ura3 funzionante. È stato poi preso un ceppo di lievito Ura3, che richiede uracile per crescere; se il plasmide entra e funziona, i trasformanti crescono anche senza U. Per selezionare i trasformanti, si piastra la colonia di lievito in un terreno senza uracile: cresceranno solo le cellule che hanno il plasmide. C'è un problema: le cellule trasformanti, anche se funzionano, hanno un'efficienza molto bassa. Osservandole, si scopre che al loro interno non c'è il plasmide libero ma esso viene integrato dall'ospite con una trasformazione integrativa. Questo spiega le basse efficienze. Affinché venga incorporato, infatti, avviene una ricombinazione omologa (crossing over) tra DNA inserito e un pezzo di cromosoma. Avviene una ricombinazione omologa tra il gene selvatico e quello mutato. La trasformazione integrativa è rara, per questo l’efficienza è bassa. Tutto il DNA del plasmide risulta integrato nel cromosoma. Questo accade solo nel lievito, che ha una ricombinazione omologa molto efficiente. Questi vettori sono detti anche YIP. Se uso come marcatori Ura3 o Leu3 o le cose vanno così, ma usando come marcatori ad es TRP1 o ARG4, la cellula ha efficienza molto più alta. Andando a verificare, si vede che il plasmide non viene incorporato ma rimane com’è nella cellula. Era inoltre capace di replicazione autonoma. Si è visto che vicino a TRP1 c'era un'altra regione che funziona come origine di replicazione. Si aveva un plasmide contenente un'origine di replicazione del lievito. Sono i vettori YRP e questa regione è stata chiamata ARS. Quando il plasmide rimane intatto, funziona solo nella fase S perché il DNA viene replicato quando viene attivato il ciclo cellulare. Il sistema è instabile, ci sono cellule con pochi plasmidi e cellule con un centinaio (di media 1-10). Accanto al gene c'è la regione ARS che dà capacità replicative. Il cromosoma normalmente usa un centromero che si lega alle fibre del fuso mitotico e separa le due copie del cromosoma nella cellula madre e nella figlia. Nella replicazione dei plasmidi però non c'è il centromero e quasi sempre le copie del cromosoma rimangono alla madre. Ad ogni fase S il numero di cromosomi aumenterà e, quando sarà elevato, ci saranno buone probabilità che qualche copia passi alla figlia. Quindi il plasmide viene replicato correttamente ma è instabile perché non c'è un sistema di segregazione. È comunque funzionante. Se si aggiunge una sequenza per il centromero al plasmide, si ottiene un cromosoma circolare stabile, in cui non c’è il problema. Si è quindi cercato di sequenziare le ARS: sono regioni molto piccole, più ancora di quelle di Coli, di 120 bp, formate da 4 sequenze ripetute ricche di AT. 45 Il vantaggio è che il vettore può essere anche molto grande mentre nei plasmidi si possono inserire molecole di DNA molto più corte. Se si usassero plasmidi per ricoprire l'intero cromosoma umano servirebbero troppi plasmidi mentre 300/400 YAC per tutto il cromosoma. Questa tecnica viene usata per clonare pezzi del cromosoma mammifero molto grandi. Lo svantaggio è che per modificare un genoma bisogna selezionare i cloni che contengono il cromosoma. Per farlo, l'unico metodo è separare i cromosomi di lievito con elettroforesi. Il lievito ha 16 cromosomi, quindi con elettroforesi si otterranno 16 bande. Il cromosoma artificiale si troverà in una 17-esima banda. In questo modo, si possono anche conoscere le dimensioni del cromosoma artificiale e quindi la porzione di DNA incorporata. PCR La PCR è una tecnica per amplificare pezzi di DNA che sfrutta le caratteristiche della DNA polimerasi. È un metodo rapido. Quando il metodo è stato scoperto, l'unica polimerasi a disposizione era quella di Coli. Per denaturare il DNA serve alzare la temperatura a 95°C. Il problema è che la DNA polimerasi di Coli funziona a 37°. Era, quindi, necessario aggiungere la polimerasi ad ogni ciclo. Per evitare questo meccanismo scomodo, si usano DNA polimerasi resistenti al calore, estratte da batteri termofili. La prima polimerasi scoperta con queste caratteristiche è la Taq. La temperatura di annealing dipende dagli oligonucleotidi da replicare. Ci sono tre fasi con tre passaggi ciclici di T: - Fase di denaturazione: si scalda il DNA a 95°C. La temperatura di fusione dipende dalla composizione in basi del DNA. - Fase di annealing: bisogna raffreddare il sistema perché gli oligonucleotidi possano appaiarsi. È necessario abbassare la temperatura fino alla temperatura di annealing degli oligonucleotidi considerati. - Fase di estensione: La polimerasi termostabile aggiunta comincia a sintetizzare il frammento. La temperatura è di circa 70°. Il tempo per il processo dipende dalla lunghezza del campione. Se il DNA in questione è grande, la sua T di fusione si può calcolare con la formula Tm=[4(G+C)+2(A+T)] 46 Siccome questi oligonucleotidi sono sintetizzati artificialmente devono avere una T di annealing molto vicina e non devono essere autocomplementari. I vantaggi sono: • La velocità di riproduzione; • È un sistema sensibile: basta una sola copia della molecola iniziale; • È possibile utilizzare DNA di partenza anche non molto puro (cadaveri). Gli svantaggi sono: • Si deve essere già a conoscenza della sequenza del campione per poter aggiungere i nucleotidi corretti per duplicarlo; • Le dimensioni sono un limite (è difficile avere replicazioni di sequenze oltre le 5000 basi) • La resa teorica è 2n ma è inferiore perché i primi due cicli di replicazione sono più lenti. • La Taq polimerasi potrebbe non lavorare più bene dopo i vari cicli. • I frammenti possono legarsi tra loro. • Una bassa concentrazione di oligonucleotidi implica velocità minore. L'amplificazione che si ottiene è di molteplici copie, una quantità sufficiente da essere osservata su gel con elettroforesi. Si calcola la dimensione del segmento e si estrapolano i dati d'interesse confrontandoli con gli standard. RNA L'RNA è un polinucleotide, primo prodotto della trascrizione. Ha il ribosio e ha un OH in 2' che determina una grossa differenza di reattività. Gli RNA sono abbastanza stabili a basse T. Sono facilmente idrolizzati anche a T basse in ambiente acido a caldo e in ambiente basico (con NaOH) a freddo, generando come prodotti dei monofosfati in 2' o 3'. Nel meccanismo dell'idrolisi basica interviene l'OH in 2' e questo spiega perché il DNA è più stabile: non ha questo gruppo. Con NaOH viene attaccato l'OH, che viene sostituito con un P; si forma un P ciclico e si rompe la catena. Il fosfato ciclico è instabile perché il suo legame con l'altro P può essere idrolizzato da una molecola di H2O, portando a un P singolo sul 2' o sul 3'. L'RNA può poi subire tutti gli attacchi che subisce il DNA, come l'attacco di agenti alchilanti o la modifica di basi. Proprietà: 1. Codice genetico ad RNA (es. retrovirus); 2. Strutturali (rRNA); 3. Informazionali (mRNA, tRNA) 4. Enzimatiche (ribozimi) L'RNA ha una capacità codificante limitata perché le RNA polimerasi non hanno sistemi di riparazioni. La non esistenza di metodi di riparazione aumenta le mutazioni. Per i virus, 47 questo è un vantaggio: l’elevata variabilità dei virus è dovuta alla maggior velocità di mutazione. L’RNA informazionale ha una vita limitata. L'RNA ha proprietà molto simili al DNA: • Assorbe nell'ultravioletto con un massimo di assorbanza a 260 nm; sono infatti le basi che assorbono. Anche gli RNA possono avere strutture secondarie; inoltre se si hanno due filamenti di RNA complementari formeranno una doppia elica A (cosa che non succede quasi mai tranne che nei genomi virali a doppia elica). • Un filamento singolo di RNA in genere è molto lungo e al suo interno ci sono regioni di complementarietà; si formano appaiamenti e la molecola non rimane lineare, forma strutture secondarie. RNA piccoli, come tRNA, formato da 75 nucleotidi, hanno regioni particolari, che formano una struttura secondaria distorta, con regioni appaiate e regioni a singolo filamento che formano anse. Se il filamento viene scaldato, si denatura come il DNA. Anche qui si ha un effetto ipercromico, in cui l'assorbanza massima a 260 nm aumenta, se viene riscaldato. Tutti gli RNA formano strutture secondarie ma rispetto al DNA la variazione di assorbanza sarà minore perché non tutte le regioni formano struttura secondaria. Le regioni con struttura secondaria nell'RNA si possono denaturare indipendentemente l'una dall'altra e, quindi, la curva di denaturazione non sarà mai una sigmoide. Se un RNA è abbastanza grande, si possono ottenere decine di strutture secondarie. Questo rende l'RNA più disponibile del DNA per generare strutture come i ribozimi, RNA a capacità catalitica con strutture secondarie complicate in grado di interagire con substrati. Tecniche di purificazione dell'RNA La procedura è la stessa della purificazione del DNA. 1) Lisi delle cellule 2) Estrazioni con solventi tipo fenolo o cloroformio che eliminano le proteine. 3) Si fanno precipitare gli acidi nucleici con etanolo. La procedura viene ripetuta più volte 4) Purificazione su gradiente di cloruro di cesio. Sul fondo la concentrazione di cloruro di cesio è maggiore (è detta cuscinetto) e in alto una soluzione più diluita. Essendo l’RNA più denso, si troverà sul fondo. Si ottengono DNA e RNA. Se si tratta di microrganismi non sono necessarie altre procedure, perché nei microrganismi il rapporto RNA/DNA è 30/1, quindi ottengo quasi solo RNA. Per fare una purificazione più distinta, si può usare una DNA-si Il DNA è una molecola molto stabile; si frammenta, ma non si degrada. L'RNA invece è molto labile, naturalmente è associato a proteine che gli offrono stabilità e impediscono che vada incontro a degradazione. Se gli RNA a singolo filamento vengono separati dalle loro proteine diventano facilmente attaccabili dalle ribonucleasi, uno degli enzimi più abbondanti 50 ad incorporare quella non radioattiva. Di conseguenza anche la sua velocità di incorporazione diminuisce di 1000 volte. Si possono immaginare tre situazioni: a) Se tutto l'RNA sintetizzato con l'uridina triziata era stabile e non degradabile, dopo il chase la radioattività rimane costante; b) Se tutto l'RNA sintetizzato con l'uridina triziata era labile, dopo un certo tempo la radioattività andrà a 0 perché si degrada tutto; c) Se, realisticamente, ci saranno percentuali di RNA stabile e di RNA labile, si avrà un andamento intermedio. La radioattività scenderà fino a un plateau, una quota rappresentata dall'RNA stabile. Si può calcolare: • un rapporto quantitativo tra gli RNA stabili e i messaggeri; • i tempi di dimezzamento (quanto tempo è necessario perché gli RNA labili siano la metà). La cinetica che si ottiene è esponenziale negativa, cioè del primo ordine. Negli eucarioti queste tecniche non funzionano perché sono molto più grossi dei procarioti (la velocità di riduzione del pool è molto lenta) e perché i compartimenti rallentano l'equilibrio necessario per la procedura (cioè affinché venga incorporata un'uridina triziata o una normale). Se si vogliono studiare i messaggeri negli eucarioti ci sono due metodi: • Uso di inibitori della RNA polimerasi: si usa una sostanza specifica che inibisce l'enzima che sintetizza l'mRNA. Si usa la α amantina, una tossina derivata da un fungo che entra nell'RNA polimerasi II eucariotica e crea un legame irreversibile. Il problema è che la cellula in questione sta morendo e i dati raccolti non sono attendibili. • Uso di marcatura continua (migliore): si dà un marcatore radioattivo e si guarda la quota di radioattività che entra nell'mRNA in brevi tempi. È un meccanismo facile negli eucarioti perché si può poi separare l'mRNA con la tecnica poliA-. Si osserva la quantità di radioattività dopo 10 minuti e dopo un'ora e da questi valori ottengo la quantità di RNA messaggero. I messaggeri sono labili e la cellula non ha sviluppato un sistema per conservarli per poter rispondere rapidamente ai cambiamenti. In caso di necessità la cellula può cambiare rapidamente il suo pattern d'espressione. I tempi dipendono dalle condizioni e dal tipo di 0 0.2 0.4 0.6 0.8 1 1.2 0 2 4 6 [u ri d in a tr iz ia ta ] T(°C) stabile prima di Chase labile realistica 51 organismo: i mammiferi ad esempio, a differenza dei batteri, devono codificare per proteine critiche TRASCRIZIONE Il processo di sintesi dell'RNA che avviene nelle cellule è la trascrizione. È un processo sequenziale che usa come stampo una sequenza di DNA. Le RNA polimerasi sono enzimi che fanno RNA e funzionano solo se è presente un templato. Affinché avvenga la trascrizione, il DNA deve essere denaturato localmente con una bolla. Gli enzimi provocano una denaturazione locale di 14-15 nucleotidi e si utilizza uno dei due filamenti come stampo. La trascrizione è una sintesi polarizzata perché la RNA polimerasi funziona solo in direzione 5'->3'. La RNA polimerasi assomiglia molto alla DNA polimerasi, con la differenza che sintetizza ribonucleotidi anziché desossiribonucleotidi. Data la direzione 5'->3', il filamento di RNA che nasce avrà un 5'-P e un 3'-OH. Lo stampo viene usato in direzione 3'->5'. La scelta di quale filamento e di che direzione seguire per la lettura del filamento dipende da una particolare sequenza sul DNA, il promotore. Il promotore costituisce il sito di aggancio della RNA polimerasi. Solo un filamento quindi porterà l'informazione corretta per la sintesi dell'RNA e quindi delle proteine. Il promotore è formato da più parti: una è il core promoter, sequenze vicine al sito di inizio della trascrizione. A monte del promotore si trovano gli elementi distali di promotore, che si legano ad altre proteine che agiscono con la RNA polimerasi ed influenzano l’efficienza con cui la RNA polimerasi si lega. La trascrizione termina quando la RNA polimerasi arriva ai terminatori. Dopo il promotore c'è una regione la cui sequenza corrisponde a un gene che codifica per una proteina. È la open reading frame (ORF) e permette che venga sintetizzata la proteina quando l'mRNA è riconosciuto da un ribosoma. Non tutti i geni in un organismo sono trascritti in contemporanea; si possono riconoscere due tipi di geni: i geni sempre espressi (geni housekeeping, piccolo pacchetto che codifica per componenti fondamentali) e i geni espressi in modo regolato, espressi solo se necessario. È possibile fare misure qualitative e quantitative: 1. Qualitative: permettono di capire se un gene è espresso o meno o da dove parte la trascrizione. Se un gene è attivo, nella cellula si può trovare il suo mRNA. La tecnica principale usata è la northern blots, che implica un tipo di ibridazione (si identifica l'RNA specifico in una cellula usando una probe a DNA marcato che si lega all'RNA di interesse in modo specifico). Si usa anche la dot/slot blot; 2. Quantitative: permettono di capire quanto mRNA ci sia; l’attività trascrizionale; la stabilità di un mRNA e l’attività di un promotore. Sono più difficili. Northern blot (qualitativa) • Si estrae RNA da una cellula e si separa mediante elettroforesi. Si usa un gel denaturante (formaldeide). Gli RNA vengono caricati, si applica un campo elettrico e gli RNA si separano; • Si fa un'ibridazione per verificare la presenza di uno specifico RNA (se il messaggero non è abbondante conviene usare un poliadenilato separato, anziché fare l'elettroforesi); 52 • Il gel viene posto su una vaschetta di plastica (Blotting) in cui si pone tampone, carta da filtro, gel e nitrocellulosa. Queste operazioni serviranno a trasferire l'RNA dal gel alla nitrocellulosa, capace di trattenere gli acidi nucleici a singolo filamento; • C'è un passaggio di liquido dal tampone alla carta da filtro, al gel e infine ai fazzoletti. Il passaggio di liquido trasferisce RNA verso l'alto e si blocca quando entra in contatto con la nitrocellulosa. È una tecnica lenta ma efficace. Si rimuovono i fazzoletti e l'RNA viene ritrovato sulla nitrocellulosa, ma non è fissato. • Si fanno dei trattamenti fissativi, per assicurarsi che l'RNA rimanga bloccato sul filtro. Un metodo è mettere il filtro sottovuoto a 80/90° (sottovuoto perché la nitrocellulosa è infiammabile). Questo permette la formazione di legami che fissano il campione. Un'altra tecnica è l'uso di UV, che creano dei radicali nelle basi, permettendo dei crosslink fra nitrocellulosa e basi dell'RNA. • La nitrocellulosa viene messa in un sacchetto di plastica, che deve essere sigillato. In questo sacchetto si pone un tampone con forza ionica nota, necessaria perché si formi il doppio filamento. Si aggiunge ad una probe radioattiva di DNA un filamento radioattivo che vada a complementare con uno dei filamenti di RNA presenti. Si sceglie una probe specifica per il gene interessato. Bisognerà conoscere prima la sequenza per poterla cercare fra l'RNA. • La probe viene immessa, si chiude il sacchetto e si incuba a 45/50°. Questa temperatura permette la formazione di ibridi DNA/RNA perché è al di sotto della T di fusione dei nucleotidi ed è abbastanza alta per evitare che si formino strutture secondarie intermolecolari. • Il filtro dopo qualche ora viene rimosso dal sacchetto e lavato per eliminare la probe radioattiva legata in modo aspecifico e non all'RNA cercato. Si mette il foglio di nitrocellulosa su una lastra fotografica e si fa una autoradiografia. Se all'interno del campione c'era un tot di RNA ibridati in modo specifico con la probe, sulla lastra si troveranno delle bande radioattive che daranno origine a una banda che impressionerà la lastra. Se succede, le cellule prese come campione stavano trascrivendo quel dato gene. Questo metodo offre informazioni sulla presenza di un messaggero e sulle sue dimensioni. La banda ha infatti una dimensione specifica in base a cui è possibile risalire al numero di basi di cui è composta. Se si vede una banda sola vuol dire che esiste una forma sola del messaggero analizzato. Questa tecnica è qualitativa, ma dà anche informazioni quantitative, come le dimensioni del messaggero e se ne esistono diverse forme. Si può anche sfruttare in maniera diversa: se si ripete l'esperimento mantenendo la quantità di RNA costante e si ottengono segnali di diverse intensità, la trascrizione del gene sta procedendo. Ad es: nel caso in cui si è estratto RNA da cellule trattate con sostanze come l'interferone, in grado di modulare l'espressione dei geni, si può fare una probe per uno specifico messaggero per verificare se l'espressione del suo gene è stata cambiata. L'RNA estratto dallo stesso tipo di cellule trattate diversamente dà un segnale diverso. Come si può dare un numero che corrisponda a questo effetto? Si potrebbe misurare la radioattività su filtro, ma non è pratico. Un buon metodo può essere misurare l'intensità dell'annerimento dovuto alla probe radioattiva. Si fa una scansione su lastra fotografica e si ottiene un'immagine digitale. Questa è formata da vari pixel e se lavoriamo a 8 bit i pixel saranno 256; 0 starà per il più bianco, 256 per il più nero. L'intensità del nero è 55 • Per verificare l'attività di un promotore e sapere se un gene è espresso o no si misura l'attività dell’enzima (es. β-galattosidasi). Questa è la tecnica dei geni reporter: la β- galattosidasi è un reporter. Il reporter è una sequenza che genera qualcosa facilmente visualizzabile, quantificabile e non presente naturalmente nelle cellule che si stanno studiando. • Se si stanno studiando cellule di piante o mammiferi il gene della β-galattosidasi non va bene, perché questa viene già prodotta spontaneamente da questi organismi; andrà bene nel lievito. Nei mammiferi si usano altri reporter: - Gene CAT: è un enzima batterico che permette la resistenza all'antibiotico cloramfenicolo, lo acetila e lo inattiva. Quindi si utilizza CAT, si uccidono le cellule e si misura l'attività di CAT. Se c'era attività CAT, funzionava, altrimenti no. È possibile quantizzare questa attività, ma non è semplice. - Gene LUC: codifica per l'enzima luciferasi delle lucciole. Se si immette questo gene e avviene trascrizione, le cellule producono luciferasi e l'enzima si può misurare mettendo il substrato luciferina con ATP. Si misura la quantità di luce così prodotta. - GFP: proteina prodotta dalla medusa Victoria, è fluorescente. Per vedere se questa proteina è espressa dal promotore basta illuminare le cellule di blu e osservare se ci sono emissioni o meno. Dosando la fluorescenza si può quindi capire la quantità di gene espresso. RNA polimerasi I batteri ne hanno 1; gli eucarioti 3 (più specializzate). - Le RNA polimerasi catalizzano la stessa reazione catalizzata dalla DNA polimerasi: la creazione di un legame fosfodiestere fra un 3'OH e un 5'P. I substrati usati sono nucleotidi trifosfati. Una volta formato il legame, viene liberato il pirofosfato. Anche questa reazione è resa irreversibile perché il pirofosfato è immediatamente idrolizzato. Anche qui la velocità di reazione non dipende dalle concentrazioni dell'enzima. - La catena cresce in direzione polarizzata 5'-3' come il DNA. - Ci sono delle differenze: l'RNA polimerasi usa un templato, ma non ha bisogno del primer, è capace di sintetizzare ex novo. L'enzima opera in presenza di opportuni segnali. - Sono enzimi multimerici. - L'enzima scorre sul filamento di DNA, genera una bolla di denaturazione (funziona anche da elicasi denaturando regioni di 15/20 nucleotidi), tiene separati i 2 filamenti (una porzione di RNA polimerasi si comporta come le SSB). Uno dei due filamenti è usato come templato. C'è un sito catalitico da cui entrano i nucleotidi e c'è un canale d'uscita, da cui esce l'RNA sintetizzato. - Ha attività elicasica e dopo il suo passaggio il DNA si riassocia spontaneamente. La chela scorre, apre il DNA, lo copia, scorre e quello copiato si richiude. C'è un problema: per compiere questo meccanismo, o tutto il complesso ruota per aprire l'elica o si genereranno dei superavvolgimenti positivi a monte e dei superavvolgimenti negativi dal lato opposto. La trascrizione si bloccherebbe, perché i superavvolgimenti positivi inibiscono l'apertura dell'elica. Per la trascrizione è necessaria la topoisomerasi, sia per i batteri (vedi girasi) che per gli eucarioti, che deve eliminare i superavvolgimenti positivi. Da una sequenza di DNA si possono ottenere due diversi mRNA, in base a quale filamento sia stato scelto come stampo. La scelta dipende dalla posizione del promotore. 56 La RNA polimerasi legge il filamento prescelto in direzione 5'-3' e sintetizza il nuovo filamento dall'estremità 5'. L'unica differenza fra lo stampo e l'RNA saranno uracili al posto di timine. La RNA pol di Coli è stato il primo enzima purificato. Negli anni '60 si è deciso di prendere Coli come modello, nonostante sia un batterio molto complicato. Anche la prima DNA pol è stata estratta da Coli. Il processo è semplice: si fa un lisato cellulare, si separano le proteine su colonna e si vede quali frazioni sono capaci di sintetizzare RNA in vitro, dando DNA come templato. La RNA polimerasi di Coli è un enzima complicato composto da più subunità con un peso molecolare di 480 kDa. È un sistema molto grosso. Ha una porzione centrale, il core, che è la polimerasi vera e propria. Il core è un tetramero costituito da: • 2 subunità α identiche ciascuna di 40 kDa sintetizzate dal gene rpoA. • Una subunità β, sintetizzata dal gene rpoB. • Una subunità β’, sintetizzata dal gene rpoC. Il core contiene i siti di legame per i nucleotidi, ovvero il sito catalitico e lega il DNA. In vitro come templato si fornisce del genoma di fago, che contiene un piccolo numero di geni riconosciuti dalla polimerasi di Coli (quando il DNA del fago entra in Coli, i primi geni saranno letti e trascritti dalla polimerasi di Coli, poi il fago sintetizza una sua polimerasi). Se faccio un sistema in vitro con core e DNA non succede nulla, perché il core per interagire con i promotori sul DNA richiede altre subunità dette fattori di inizio: le subunità σ. Coli ha diverse subunità σ, ma la più usata è la σ 70 (che in realtà ha peso molecolare 85 kDa, è detta 70 perché in elettroforesi a SDS migra come se fosse 70 kDa). In Coli il 90% dei geni e quindi dei promotori funzionano con la σ 70. L'insieme di core e σ 70 viene detto oloenzima, che riconosce il promotore e inizia la trascrizione. L'RNA polimerasi si può quindi purificare come core o come oloenzima. Il fattore σ riconosce le sequenze in modo specifico. σ 70 riconosce le regioni -10 e -35 sul promotore, 10 e 35 nucleotidi prima del sito di inizio della trascrizione. Le altre σ riconoscono altre sequenze sul promotore: σ32 lega i promotori dei geni per le heat shock proteins, molecole che aiutano le altre proteine a resistere al calore. σ32 ha una struttura, infatti, che permette di resistere alle alte temperature; σ28 è usato in risposta alla mancanza di nutrienti: serve quindi per la chemotassi; σ54 lega i promotori, con sequenza molto diversa rispetto alla canonica, dei geni codificanti per proteine necessarie all’organicazione dell’azoto inorganico. σ54, anche se legato al promotore, rimane inattivo finché, in mancanza di azoto organico, viene prodotto il fattore NTRC che lega, in forma di tetramero, due regioni a monte del promotore permettendo al DNA di formare un’ansa che porta il fattore a legarsi alla polimerasi, così attivata. All'inizio, enzima e DNA si legano nel promotore e formano un sistema detto complesso chiuso (chiuso perché la situazione è ancora reversibile, il DNA è chiuso). Se c'è un'interazione specifica forte avviene un processo detto isomerizzazione del promotore, irreversibile, e quindi si passa a un complesso aperto. Dopo che la polimerasi si è legata e ha formato il complesso chiuso, il DNA si denatura e si crea la bolla di denaturazione. Se mancano nucleotidi il sistema si congela in questa situazione, con il DNA pronto e aperto, ma non succede nulla. Questo complesso è estremamente stabile. 57 In presenza di nucleotidi, i primi due entrano e si crea il primo legame fosfodiestere. Iniziano a entrare uno dopo l'altro e si passa dallo stato chiuso a una fase di allungamento, in cui la RNA polimerasi lascia il promotore e scorre sul filamento. Il meccanismo è processivo: l'enzima non si stacca, scorre sul DNA; σ si stacca e il core continua. Si crea un ciclo di allungamento seguito da riunione fra core e σ per riconoscere una nuova sequenza e ricominciare il processo. Struttura della RNA polimerasi i Coli: CTD e NTD hanno due domini separati, uno ammino terminale e l'altro carbossiterminale, con funzioni diverse. Sono regioni strutturate separate fra loro da una regione flessibile. I due domini N terminale sono le regioni in cui le subunità α si uniscono e formano il supporto che permette l'aggancio alla β e alla β'. La regione C terminale si può legare a particolari regioni vicine al promotore, che non ci sono sempre ma se ci sono favoriscono l'interazione fra DNA e RNA polimerasi. Le CTD possono legarsi a proteine che legano sequenze specifiche di DNA, le proteine attivatrici. Le due porzioni CTD legano la proteina attivatrice e creano un ulteriore ancoraggio che facilita l'interazione. Esperimenti sull'interazione fra DNA e RNA polimerasi vengono fatti in vitro Si prende l'RNA polimerasi e si immette del DNA radioattivo. C'è un'interazione specifica e si formano dei complessi DNA-proteina. Un metodo semplice che dà informazioni sia termodinamiche che cinetiche è il filter binding, o legame a filtro. Si mescolano i due componenti in una provetta e a diversi intervalli di tempo un'aliquota viene filtrata su un filtro di nitrocellulosa. Il DNA a doppia elica passa attraverso i pori di questo materiale, le proteine rimangono intrappolate. Se il DNA è denaturato a singolo filamento rimane intrappolato, come l'RNA. Se prendo un'aliquota della miscela e la passo su nitrocellulosa, sia DNA che RNA polimerasi rimangono attaccati al filtro (il DNA è trattenuto dal legame con l'enzima). Poiché il DNA è radioattivo, basterà misurare la radioattività su filtro per misurare la quantità di complesso formato. Si può misurare la quantità di radioattività in funzione del tempo, filtrando aliquote a tempi diversi. All'inizio la quantità di complessi è zero, poi comincia a salire fino a un livello di saturazione. Si raggiunge l'equilibrio e la quantità di complessi resta costante. Il core ha affinità per DNA generico molto alta; l'RNA polimerasi è una proteina basica e, essendo il DNA un acido, grazie alla carica negativa di esso, si legano bene. L'enzima si muove, ma non si ferma in una regione distinta. In presenza di σ, l'enzima si lega e scorre su DNA, ma quando incontra il promotore l'affinità aumenta molto; non si creano solo legami elettrostatici ma anche legami a idrogeno. L'RNA polimerasi si blocca in quella regione, aumenta moltissimo l'affinità e il DNA si apre. Inizia la trascrizione. Il sistema è quasi irreversibile, l'enzima non si riesce più a sbloccare e rimane congelato in quella posizione. Possiamo studiare con un esperimento la dissociazione di questo complesso grazie al filter binding. Si prende il DNA radioattivo e la RNA polimerasi batterica. Si fanno formare complessi all'equilibrio, si filtra e si ottiene il complesso DNA-proteina isolato. 60 DNA-asi. Le regioni non protette dall’enzima vengono digerite dalla DNA-asi. Si recupera un p-DNA (p di promtore) che è lungo circa 40 pb. Questo significa che la RNA polimerasi protegge il DNA. Se al complesso si aggiungo i nucleotidi trifosfati, si osserva se il complesso riesce a fare un pezzo di RNA e dove si ritrova rispetto alla posizione iniziale. Si ottengono degli RNA di circa 20 basi. (la sequenza proteica, dato un DNA di 40 pb, è a -20 e +20). Se aggiungo la RNA polimerasi al pezzo di DNA p40, mi aspetto che si riformi il complesso. Non succede perché quel DNA non contiene delle sequenze essenziali, che sono state perse con la digestione. Queste sequenze vengono identificate tramite digestione con la DNA-asi ma in condizioni più blande. (La prima digestione era energica per poter digerire tutto il DNA). Questa tecnica è il footprinting, che studia l'impronta di una proteina sul DNA e consente di vedere le interazioni più deboli. Bisogna avere: - Un pezzo di DNA con una regione di interazione (un promotore); - Il frammento di DNA non deve essere troppo grande (max 400 pb); - Il frammento di DNA deve essere marcato radioattivamente ad una sola estremità. Se fossero entrambe marcate, non si capirebbe da che posizioni arriverebbero i frammenti. Si marca l’estremità 5’, che ha un fosfato. L’enzima usato è la polinucleotide chinasi che usa ATP ɣ(P)32 ovvero con il fosfato 32 marcato. Questo enzima aggiunge, però, ad un’estremità che ha OH. Si aggiunge, quindi, un enzima, la fosfatasi alcalina, che defosforila l'estremità 5’. In questo modo, però, entrambe le estremità sono marcate. Per averne solo una, si digerisce con l’enzima EcoR1 e si ottengono 2 frammenti marcati da una parte sola. • I due frammenti avranno dimensioni diverse e saranno separabili su gel. Il DNA si vede bene perché è radioattivo e su lastra fotografica si vedrà una banda corrispondente al frammento marcato. Se si aggiunge DNA-si I, essa inizierà a tagliare in diversi punti e si otterranno molti frammenti che saranno marcati. • Dopo la digestione, il DNA viene separato su gel di poliacrilammide, in modo che il gel separi pezzi più piccoli, in condizioni denaturanti (temperatura elevata) per separare i due filamenti. A livello teorico se il frammento è di 200 bp, l'enzima può tagliare in 200 posizioni. • Dopo l'elettroforesi si mette il campione su lastra fotografica e si vedono solo i frammenti radioattivi. I frammenti radioattivi iniziano tutti dallo stesso punto e finiscono al punto di taglio. Ci si aspettano tante bande quanti sono i nucleotidi, se si opera in condizioni ideali. È necessario calibrare tempo e quantità di enzima per avere una distribuzione uniforme. • A questo punto si rifà l'esperimento aggiungendo la proteina. Si vedranno molti frammenti tagliati, ma ci saranno anche gruppi di regioni in cui non potranno avvenire tagli, che non avranno radioattività. La regione senza bande sarà testimonianza del fatto che la proteina ha coperto questa regione dalla DNA-si. La proteina causerà una distorsione nelle regioni vicine, rendendole più accessibili e meglio digerite dalla DNA-si. Queste bande saranno più intense. L'intensità è indice dell'interazione. L'interazione sarà suggerita sia da mancanza di bande che dalla presenza di bande intensificate. 61 Si può vedere dove inizia e finisce la zona protetta e si può conoscere la sequenza della zona di footprinting. La regione di footprinting è più estesa di 40 nucleotidi: va da -40 a +20, coprendo 60 bp, che compongono la regione di interazione. Si riconoscono due regioni principali: una da -20 a +20, che dà inizio alla trascrizione, e una da -40 a -25. Il frammento -40/+20 isolato è capace di interagire con la polimerasi e formare un complesso aperto. Lì dentro c'è tutta l'informazione necessaria per funzionare come promotore. Per capire quali sono le regioni importanti bisogna esaminare diversi promotori. Queste sequenze saranno conservate entro certi livelli. Sono state trovate due regioni conservate, una è la regione -10, centrata dieci nucleotidi a monte del sito di inizio; è anche detta primum box. L'altra è la regione -35, centrata 35 nucleotidi a monte del sito di inizio (è in genere una purina, spesso una A). Le singole regioni si assomigliano, ma non sono identiche. Principalmente si trovano A e T. Le posizioni non sono conservate nello stesso modo: alcune porzioni sono molto conservate, altre meno. Il promotore di Coli è dipartito e l'informazione è suddivisa in due esanucleotidi circa da -10 a -35. In mezzo non ci sono regioni conservate, ma è conservata la distanza, che non può essere <16 o >19 basi; fa parte dell'informazione. Questo implica che, affinché l'oloenzima interagisca con le due regioni contemporaneamente, queste devono essere a una data distanza l'una dall'altra, o il promotore non funziona. Tutte le mutazioni che capitano nelle 2 regioni conservate del promotore e che lo allontanano dalla sequenza canonica ne diminuiscono l'efficienza. Se, invece, avvengono delle sostituzioni che riavvicinano la sequenza canonica, queste sono mutazioni up, che permettono un migliore funzionamento. Le mutazioni down diminuiscono l'attività del promotore, le mutazioni up ne aumentano l'efficienza. La sequenza canonica corrisponde alla sequenza ideale che Coli dovrebbe avere ma nessun promotore è davvero così. La disponibilità di alcune proteine in un organismo sarà diversa da quella di altre (es. le proteine ribosomiali sono espresse in grande quantità, la vitamina B12 max 2 a cellula). Il fatto che i promotori siano diversi garantisce un sistema automatico di regolazione. Gli operoni che devono funzionare meglio avranno promotori efficienti. Questo è un meccanismo basale di regolazione. A volte si ha un promotore praticamente irriconoscibile (se manca ad esempio la -35), ma grazie al legame di una proteina attivatrice a monte, la polimerasi riesce a interagire col promotore e inizia la trascrizione oppure riesce tramite interazione diretta con il DNA. La presenza del promotore indica quale filamento sarà usato come stampo e quindi la direzione di trascrizione. Metà dell'RNA fatto è RNA ribosomiale. (Coli ha 7 operoni per 62 l'rRNA, sono pochi). Tutti i geni per l'RNA ribosomiale hanno i promotori uno di seguito all'altro. A monte del primo promotore c'è una lunga regione ricca di AT, detta TATA, che interagisce con il dominio carbossiterminale delle subunità α e stimola la trascrizione. Questo promotore in Coli è molto forte perché la sequenza è vicina alla sequenza canonica, c'è una forte affinità per la subunità α e poi c'è un promotore dopo l'altro. C'è un sistema di riciclo rapido delle polimerasi sul promotore. Questi sono in assoluto i promotori più efficienti in Coli (Coli ha un'unica RNA polimerasi che sintetizza messaggero, RNA ribosomiale e tRNA) REGOLAZIONE PER INDUZIONE O REPRESSIONE In Coli ci sono dei sistemi di regolazione per cui alcuni operoni sono accesi o spenti in risposta a specifici segnali. Se l'operone si attiva quando arriva il segnale è un'induzione, se l'operone si spegne all'arrivo del segnale è una repressione. La prima induzione studiata è stata sull'operone LAC (uso di altre fonti di C, in questo caso lattosio). Prima c'è un'induzione attraverso un controllo negativo e poi uno positivo. Una repressione riguarda gli operoni per la sintesi di aa: Coli sintetizza tutti gli aa necessari, ma se si trovano già nel terreno è inutile sintetizzarli; l'aa reprime l'espressione dei geni. Induzione e repressione sono fondamentali per i batteri, la loro regolazione dell'espressione genica è quasi esclusivamente a livello trascrizionale. Le regolazioni post trascrizionali per i batteri sono pochissime, mentre negli eucarioti sono abbondanti la regolazione trascrizionale, post trascrizionale e a livello di sintesi proteica (il messaggero c'è, ma viene tradotto o no in base al segnale) Induzione e repressione si possono ottenere con controllo negativo e controllo positivo. Nei batteri, il sistema di repressione è molto più efficiente. Il controllo positivo invece ha un’efficienza minore. Per questo nei batteri ci sono più controlli negativi. Controllo negativo: un fattore (proteina o RNA) si lega in una posizione specifica vicino al promotore e blocca la trascrizione. L'operone LAC ha un gene che codifica per una piccola proteina, il repressore, che ha alta affinità per una sequenza vicina o sovrapposta al promotore, detta operatore. Se il repressore è legato all'operatore, la polimerasi non può leggere il promotore e la trascrizione è bloccata. Questo è un controllo negativo, la cellula sintetizza un fattore inibitore che blocca la trascrizione. La sequenza del promotore lega un repressore che crea un ingombro per cui la polimerasi non riesce a riconoscere la sequenza. Controllo positivo: un gene regolatore codifica per una proteina detta apoinduttore, che si lega al DNA solo in risposta a un segnale e una volta legata attiva la trascrizione facilitando l'interazione fra promotore e polimerasi. 65 In Coli ci sono tre livelli principali di regolazione: un livello basale (di tipi quantitativo, dipende dalla struttura del promotore), un livello di switch (usa fattori σ alternati), un livello specifico per siti e operoni (che può usare controllo positivo o negativo, induzione o repressione) Terminazione La polimerasi deve potersi fermare. Servono dei segnali specifici di terminazione. In Coli, oltre ai segnali, c'è anche una proteina specifica per la terminazione, rho, scoperta in un esperimento di trascrizione in vitro con DNA di fago lambda. Il DNA di fago lambda contiene solo due promotori riconosciuti dalla polimerasi. Questi prodotti in vivo genereranno proteine che consentono di attivare altri promotori in una cascata di attivazione. Si è messo il DNA in vitro, aggiungendo ribonucleotidi marcati con P32 (è marcato il fosfato α perché gli altri due vengono tagliati e liberati come pirofosfato) e polimerasi di Coli con σ 70. I prodotti specifici che genereranno le proteine necessarie non ci sono. Sono stati sintetizzati, invece, RNA ad alto peso molecolare di molte migliaia di basi. La differenza tra quello che succede in vivo e quello che succede in vitro è che in vitro si sono ottenuti solo questi due messaggeri ad alto peso molecolare. In vitro l'RNA polimerasi si è legata al DNA e ha iniziato a trascrivere. Se non si ferma, trascrive l'intero genoma. Se si aggiunge una proteina rho purificata, si ottengono i prodotti che si ottenevano in vivo. La quantità di RNA ad alto peso molecolare diminuisce drasticamente. Rho è un fattore necessario per la terminazione. La proteina rho è un esamero di 46 kDa per unità e funge da RNA elicasi. Scorre sul filamento di RNA utilizzando ATP (motore molecolare) e, se ci sono strutture secondarie, le apre. Quando raggiunge la polimerasi sul filamento, che ha una struttura secondaria tra RNA e DNA stampo, causa il suo rilascio. Affinché la polimerasi si arresti, deve esistere un segnale specifico presente sul gene: il terminatore. Si è cercato di identificare il terminatore con tecniche particolari come la mappatura con nucleasi. Ci si aspettava che il terminatore avesse una sequenza consenso come i promotori ma non è così. Verso la fine, in corrispondenza di tutte le regioni terminali, tutte le sequenze presenti sono palindromiche. Si è pensato che il terminatore fosse dato da queste sequenze. Per dimostrarlo, si fece un'operazione di delezione di queste sequenze e si vide che senza la sequenza palindromica la trascrizione continuava. Il terminatore è dato da sequenza palindromiche. Idee sul funzionamento del terminatore: 1) Una sequenza palindromica di DNA può formare una struttura a croce sul DNA. Quest'idea è poco probabile, perché le strutture a croce richiedono un'energia molto maggiore del superavvolgimento. In condizioni fisiologiche le strutture a croce non si creano. 2) La struttura palindromica è trascritta e la polimerasi si ferma dopo la sua trascrizione. Si è quindi pensato che il segnale non sia dal DNA ma dalla struttura secondaria del RNA: quando si trascrive questa regione di RNA, in corrispondenza della sequenza palindromica, si forma una struttura molto stabile ricca di CG detta forcina. 66 La terminazione causa una modifica della struttura dell'RNA appena trascritto e genera un segnale per l'enzima, che viene fermato in questa posizione. La forcina è seguita da una sequenza non stabile di U e in questa zona RNA e DNA si separano. La formazione della forcina causa un blocco del movimento della polimerasi: l'enzima rimane legato in corrispondenza della corta sequenza di U e qui viene spontaneamente rilasciato. Per confermare questa ipotesi è stato fatto un test che mutava le basi nella forcina. Si vedeva che la trascrizione non terminava. Questo dimostra che il terminatore è causato dalla struttura secondaria a forcina formata sull'RNA. Due classi di terminatori: - Rho dipendenti: se la coda poliU non è presente, rho è necessaria per terminare la trascrizione. Quando l'RNA viene trascritto, rho si lega all'mRNA e si muove lungo il filamento di RNA, cercando di raggiungere la polimerasi. Quando c’è un terminatore, si forma la forcina ma il messaggero non si stacca spontaneamente perché l’interazione è più stabile (non c’è regione A e regione U). La proteina rho manda in pausa per circa un minuto la polimerasi e con l’attività elicasica stacca la polimerasi. Non è detto che la proteina rho arrivi in tempo e quindi dopo la pausa la polimerasi può riprendere la trascrizione. - Rho indipendenti: se la coda poliU è presente, la terminazione avviene senza l’uso di rho. C’è un’interazione tra A e la coda di poliU del terminatore. Questa interazione non è forte quindi il messaggero si può staccare. In vivo la proteina rho è sempre presente. In vitro, si può vedere come avviene senza rho. Nei casi importanti in cui la terminazione corretta è necessaria (come la sintesi di rRNA, che richiedono una forma molto precisa), si hanno più terminatori consecutivi. In questo modo è certo che il sistema si fermi. RNA polimerasi eucariotiche Sono 3 diverse RNA polimerasi: l'RNA polimerasi I, la II e la III. Il nucleolo è il luogo in cui viene sintetizzato rRNA. In esso si trova la RNA pol I. Le altre due sono nel nucleoplasma. La RNA pol II trascrive la maggior parte dei geni che danno poi origine a mRNA. Il vero prodotto della RNA pol II è una moelcola più grande dell’mRNA ed è detta RNA eterogeneo nucleare. La RNA pol III è specifica per piccoli RNA, come il tRNA o l'RNA 5S, un rRNA a basso peso molecolare. Le tre polimerasi hanno una biochimica differente e sono inibite da sostante diverse. Questo consente di vedere quale polimerasi si sta usando. • L'actinomicina è un potente inibitore per la polimerasi batterica, ma in bassa concentrazione è selettiva per la polimerasi I e blocca la sintesi di rRNA. • La polimerasi II è inibita da dosi basse di α amantina, tossina presente in un fungo mortale, se ingerito, perché distrugge tutti i messaggeri epatici. • La pol III non è inibita da α amantina ed è molto poco inibita da actinomicina. Dopo aver estratto i tre enzimi, gli scienziati fecero un'elettroforesi SDS in poliacrilammide. Videro così che gli enzimi sono composti da una decina di subunità diverse, a peso molecolare diverso, che può essere alto, basso o intermedio. Molte subunità sono comuni a tutte e tre le polimerasi. La differenza sta nelle subunità ad alto peso molecolare e in alcune a peso molecolare intermedio. 67 Tra RNA pol II umana e quella di lievito non ci sono grandi differenze: entrambe hanno 12 subunità anche se le dimensioni sono diverse. Nel lievito la maggior parte delle subunità è necessaria per la crescita della cellula: se muta il gene della subunità 1, il lievito non riuscirà più a sintetizzare mRNA e morirà. Ci sono due subunità però, come la 4 e la 9, che non sono essenziali. Hanno un fenotipo condizionale (es. temperatura sensibile) e possono essere presenti o meno ma non sono essenziali per la crescita. La RNA pol III umana ha: due subunità molto grandi (160 kDa); delle subunità a peso intermedio e un gruppo di subunità a basso peso molecolare (40 kDa). Stessa cosa anche per pol III di piante e funghi e per pol II e pol I. RNA polimerasi di Coli è simile: ha due subunità β e β’ molto grandi, di 160 kDa, dei fattori σ di intermedio peso molecolare e le subunità α intorno ai 40 kDa. C'è un core di due grandi subunità in tutti gli organismi. Il core batterico è più semplice dell'eucariotico: ha α, β', σ e le due α). L'eucariotico ha una serie di proteine accessorie a basso peso molecolare di cui la struttura è sconosciuta, probabilmente correlate con l'esistenza della cromatina negli eucarioti. La subunità più grande della pol II è molto grande e c'è una regione tipica di questa polimerasi. Usando anticorpi contro subunità β di Coli, essi cross reagivano anche con le subunità più grandi delle pol eucariotiche, le β like. Lo stesso è successo con le β' like. Si è isolato il gene per derivarne la sequenza e confrontarla con quella delle subunità β e β' di Coli. Si è vista una notevole somiglianza. Le subunità più grandi della pol II e III del lievito hanno 6 loci in comune con le subunità β' del Coli. Queste regioni sono conservate con una notevole analogia. Si può pensare che l'analogia sia anche funzionale: La subunità β' like ha una regione carbossi-terminale che però non è presente nella β' di Coli o nelle altre subunità (vale per tutte le β' like della pol II). Questa regione ha una struttura particolare fatta da sequenze ripetute. È una regione flessibile e intrinsecamente disordinata, ricca di aa idrofilici che possono essere fosforilati. Questa struttura non esiste solo nel lievito, ma anche nell'uomo, con una struttura ripetuta 50 volte. È stato fatto un esperimento su questa subunità: le proteine sono state fatte crescere con S35 che marca gli aa. Se facciamo lo stesso esperimento con P32, esso marca solo le proteine che vengono fosforilate, quelle della regione C-terminale della β' like della pol II. L'idea è che le polimerasi eucariotiche abbiano una struttura generale con le subunità β e β’ like simili a quelle di Coli. Le subunità β’ like della pol II hanno, però, una subunità C- terminale molto importante per la funzione della proteina. Sono state identificate nelle pol eucariotiche anche le subunità α like, poi molte subunità a 70 Per il fattore 5S, è diverso: TF3A riconosce la sequenza BOX C e si lega. Può, ora, reclutare il fattore TF3C, che a sua volta recluta TF3B, che richiama la polimerasi. TF3C è un grosso complesso di 6 subunità diverse. TF3B è fatto da 3 componenti, di cui la principale è la TBP, TATA binding protein. La TBP è presente anche nel fattore principale per far funzionare la polimerasi II. TF3A è stato il primo fattore di cui si è determinata la sequenza. - È una piccola proteina di 40 kDa che interagisce con 50 nucleotidi. È una metallo- proteina: contiene 7/10 ioni di zinco per catena polipeptidica. Se tratto la proteina con agenti chelanti
(che sequestrano i metalli es. EDTA per calcio e magnesio, la proteina non funziona più e non riesce a legarsi al 5S formando i complessi 7S. Lo zinco, quindi, è importante per fare in modo che la struttura interagisca in modo specifico con il promotore e l’RNA 5S. - è presente solo in proteine eucariotiche, non nei batteri. - Si lega al suo promotore come monomero. Lega il gene e riconosce il promotore. - Lega anche il prodotto RNA 5S. È, quindi, capace di legarsi al prodotto, formando dei complessi detti 7S. I 7S danno una componente ribosomiale pronta per essere usata. - Resta legata al 5S perché è un caso di regolazione autogena: feedback negativo, ovvero il prodotto del gene controlla la sua sintesi. L'RNA 5S viene fatto e, se la biogenesi dei ribosomi funziona, entra nei ribosomi. Se però la sintesi dei ribosomi rallenta o si blocca, l'RNA 5S fabbricato si associa a TF3A e la sintesi del 5S si ferma. Questo impedisce che si continui inutilmente a produrre 5S quando non serve. - Ha 9 sequenze ripetute, che hanno delle zone molto conservate. Ci sono 2 cisteine separate da 4 aa, un loop di 13 aa, 2 istidine separate da 4 aa e un amminoacido aromatico, che può essere tirosina o fenilalanina. La posizione delle 2 cisteine e istidine fa pensare che possano ancorare un atomo di Zn. Dato che ho 9 sequenze ripetute, avrò 9 atomi di Zn. La coordinazione avviene attraverso gli S delle cisteine e l'N delle istidine. Ognuno dei 9 motivi coordina un atomo di Zn e la regione di 13 aa presente fra cisteine e istidine forma un picco detto zinc-finger. Si forma una struttura che interagisce con il DNA. Ogni zinc-finger interagisce con 4,5 basi del solco maggiore del DNA. Una regione C-terminale flessibile interagisce con il fattore TF3C. Con cristallografia, si è scoperto che lo zinc-finger non è proprio come è stato appena descritto: andando dall'ammino al carbossi-terminale, ci sono 2 regioni β, un ripiegamento e un'α elica. Lo zinc-finger non assomiglia a un dito, ma ad un dominio globulare compatto, che stabilizza la struttura. Le 2 cisteine sono sul foglietto β antiparallelo, le 2 istidine sull'α elica. L'interazione con il DNA è mediata dall'α elica che si infila nel solco maggiore del DNA con un riconoscimento di 4 basi
(3 su un filamento e 1 sull’altro). Lo zinc-finger è stato il primo motivo di interazione riconosciuto fra DNA e proteine, ma ci sono molti altre proteine che interagiscono col DNA. 71 Varianti: - C2-H2: 2 istidine e 2 cisteine
- C2 -C2: 2 cisteine e 2 cisteine: recettori per gli steroidi (dimeri). Stabilizzano le α eliche, che poi si infilano nel solco maggiore del DNA.
- GAL4, una proteina che riconosce una specifica sequenza sul DNA. Anche GAL4 ha due atomi di zinco, ma non forma due zinc-finger. Ha una regione di 6 cisteine che coordinano i 2 Zn. Questa struttura è detta zinc-cluster e genera due α eliche, di cui una si infila nel solco maggiore e riconosce una specifica sequenza palindromica di 17 bp. Il recettore dimerizza, così che due metà di recettore riconoscano le due regioni uguali e opposte affiancate sul DNA. Lo zinc-finger è un motivo importante di interazione DNA-proteina. Gli aa presenti in questa regione sono importanti per l'interazione specifica col DNA. INTERAZIONI DNA-PROTEINE Ci sono diversi motivi di interazione fra DNA e proteine: • Elica-giro-elica: è presente nei repressori batterici. Sono due eliche separate da un β turn. Una delle eliche si infila nel solco maggiore e legge le basi. Nei batteri tutte le proteine che legano DNA hanno motivo elica-giro-elica. Ci sono due eliche principali e una terza elica che stabilizza la struttura. La elica terza stabilisce i contatti col DNA. Si formano legami ad H direzionali con le basi nel solco maggiore. • Zinc-finger (negli eucarioti) • Homeodomains (domini omeotici, eucarioti): sono proteine che interagiscono col DNA, ma non contengono zinco. Hanno tre eliche e le eliche 2 e 3 sono nella stessa condizione delle eliche dei repressori batterici. Il dominio omeotico è una variante del motivo elica-giro-elica. I geni omeotici codificano per le proteine omeotiche, che legano sequenze specifiche di DNA e contengono il dominio omeotico. Una mutazione di questi geni altera il processo di sviluppo dell'organismo e genera mutazioni macroscopiche, perché controllano l'attivazione a cascata di molti altri geni. Es. mutanti senza ali. • Leucine zipper: cerniera di leucine. È stata scoperta per la prima volta in una proteina, GCN4, del lievito. Questa proteina ha una struttura particolare come sito di legame al DNA. Ha una sequenza di aa basici (suggerisce un legame elettrostatico col DNA) strutturata ad α elica. La regione che segue questa non è nè acida né basica, ha una peculiarità: contiene aa idrofobici, in particolare leucine, regolarmente spaziate (L, 6 aa, L, 6 aa,...). Se si trasforma questa regione in un'α elica, tutte le L vanno dalla stessa parte. È un'α elica anfipatica: da una parte ha una regione con aa acidi e basici, idrofilica, dall'altra ha le L idrofobiche. Eliche anfipatiche di questo tipo si vedono in interazioni proteina-proteina, in un modello detto coils-coils. Le regioni con leucine possono interagire con una corrispondente α elica con leucine spaziate allo stesso modo con legami idrofobici. Questa struttura è una cerniera con le L incastrate fra loro. La struttura viene stabilizzata da forze di van der Waals. Questa regione è detta cerniera di leucine, o leucine-zipper, e contiene una regione basica seguita dalla cerniera di L. Il leucine zipper ha un dominio di dimerizzazione importante per un'interazione specifica col DNA. La cerniera di leucine forma una pinza con cui la regione basica lega il DNA. La regione di interazione con il DNA è piccola, circa di 5/6 nucleotidi, e non è palindromica. 72 Queste proteine funzionano come dimeri (Jun-Jun), in genere omodimeri, nei mammiferi anche eterodimeri (Jun-Fos). Il dominio basico è conservato, infatti, riconosce sul DNA la stessa sequenza sia in GCN4 che in altre proteine, come Jun e Fos nel mammifero. La proteina OPAC del mais si comporta come una di lievito o di mammifero e riconosce la stessa sequenza di sei nucleotidi. Si può anche far esprimere OPAC in lievito e questa va a riconoscere gli stessi siti riconosciuti normalmente da GCN4. Una proteina interessante è Jun: è stata estratta in origine come oncogene di alcuni retrovirus e in realtà si è scoperto che l'oncogene è una variante mutata di un gene endogeno dei mammiferi, Jun, che ha un'attività regolata. La mutazione gli conferisce una crescita esponenziale tipica dei tumori Queste proteine possono essere ben studiate in lievito. Per vedere se c'è un'interazione specifica proteina-DNA possono essere usati dei metodi già visti. Metodi di studio per studiare le interazioni DNA-proteine: 1) Il filter binding, o legame a un filtro di nitrocellulosa. La nitrocellulosa trattiene le proteine, ma non gli acidi a doppia elica. Se si filtra una miscela DNA-proteine, il DNA passa a meno che non si leghi in modo specifico con la proteina. Questo metodo è quantitativo: si può misurare la quantità di complessi DNA-proteina che si formano, e consente anche di ricavare parametri cinetici e termodinamici dell'interazione. Questo metodo tuttavia non dà informazioni sulla sequenza della regione che si sta studiando. Offre informazioni solo sulla presenza o meno di interazione. 2) Footprinting, dà informazioni specifiche sulla sequenza: se è presente o meno l’interazione e la sequenza di DNA che riconosce. Tramite questo metodo si può conoscere la precisa posizione della proteina sul filamento ma è un processo lungo e laborioso. 3) Gel retardation, dà informazioni qualitative e mostra la regione di interazione. È veloce e poco costoso. Funziona anche usando una miscela di tante proteine: se ce n'è una che si lega in modo specifico al DNA, si vede. - Si ha un pezzo di DNA abbastanza lungo (500-1000 basi) a cui si deve legare una proteina ma non si sa in che punto. - Si taglia il DNA a pezzi con un enzima di restrizione. Tanto più i frammenti sono piccoli, meglio si riesce a definire dove si trova il sito di legame. - Il DNA viene marcato con isotopi radioattivi grazie alla polinucleotide chinasi. Si otterranno frammenti con entrambe le estremità 5' radioattive. - Si mettono i frammenti su gel in elettroforesi. A sinistra andrà il DNA radioattivo da solo, a destra si aggiungerà la miscela proteica. - Il DNA dopo elettroforesi arriverà in una data posizione in base al proprio peso e creerà delle bande. Se la proteina si lega solo al frammento x, a destra si vedranno i frammenti nella stessa posizione che a sinistra, tranne il frammento x, che sarà rallentato perché insieme alla proteina peserà di più. Questo metodo dimostra se esiste un'interazione specifica (forte) tra DNA e una proteina. Bisogna comunque fare un ulteriore controllo perché può essere che la proteina che si è legata al DNA sia fagica e che si leghi al DNA in maniera aspecifica. Per verificarlo, si mette un eccesso di DNA non radioattivo aspecifico e se la proteina era fagica, la banda scompare. Se il legame era specifico, la banda continua a vedersi. Quando viene individuato il frammento giusto specifico di DNA, si applica footprinting su di esso. Il 75 100 basi dalla TATA box. Se è presente la TATA box, queste regioni stimolano la trascrizione, se la TATA box non c'è, queste agiranno da TATA box. Sono sempre elementi prossimali. A monte si hanno delle sequenze attivatrici più grandi, complesse e a distanza maggiore di quelle del lievito: gli enhancer. Hanno la stessa funzione degli UAS, ma si chiamano diversamente perché isolati indipendentemente da ricercatori che lavoravano su sistemi diversi. Sono più complesse perché coordinano più segnali. Nelle regioni prossimali ci possono essere sequenze che migliorano l'attività del promotore come la BRE, ricca di CG, o i DPE, a valle dopo il punto di trascrizione, che possono fungere anche loro da promotori. I TATA box sono i più importanti e sono riconosciuti dalla proteina TATA binding protein, che non esiste mai da sola ma come complesso con associate altre proteine, il TFIID. TATA box è più importante perché riesce a legare il TFIID. Questo complesso si lega alla TATA box attraverso la TBP, ma le proteine associate possono anche associarsi al DPE o ad altre sequenze delle regioni prossimali. TFIID è un complesso molto grosso, 700 kDA. I fattori di trascrizione richiesti per far funzionare la polimerasi si chiamano TFII. • Il TFIID permette al DNA di ripiegarsi: è un complesso di 700 kDa, composto dalla TBP, che lega la TATA box insieme ad una dozzina di altre proteine di peso molecolare variabile, chiamate TAFs, fattori associati alla TBP. Alcune TAFs riconoscono i DPE, Nella maggior parte dei casi c'è la TATA box e anche BRE e DPE. Se non c'è il promotore, esso può essere composto da BRE, DPE, GC box e CAAT box. Si ha quindi un'azione modulare e combinatoriale: tanti elementi possono fungere da promotore, non ce n'è uno specifico. In base a cosa c'è il promotore funzionerà più o meno bene. 76 quindi permettono il legame anche in assenza di TATA box, altre TAFs riconoscono gli enhancer, la cui azione è mediata da queste proteine. Quando un promotore ha TATA, TFIID si lega a TATA box e richiama TFIIA. Si stabilizza il legame tra TFIID e DNA. Si lega poi il TFIIB, richiamato dalla TFIIA o perché riconosce BRE. Dopo che le 3 (D-A-B) si sono legate, si può legare la polimerasi, che porta TFIIF, fattore ausiliario che facilita il legame tra polimerasi e promotore. • TFIIE stimola TFIIH, che è un'elicasi che apre il DNA. È un legame a cascata di fattori diversi. TBP È la proteina più importante, lega la TATA box ed è molto conservata. Ha una struttura a sella, fatta da una regione di foglietti β bloccata da α eliche all'esterno. Interagisce con il DNA causandone una curvatura: è una delle poche proteine a interagire unicamente con il solco minore del DNA. Questo è il motivo per cui bisogna piegare il DNA, altrimenti il solco minore non sarebbe accessibile. Il risultato è una forte interazione con le basi del solco minore. TAFs Fattori associati alla TBP e sono eterogenei: si hanno proteine da 30 a 250 kDa. Questo complesso è abbastanza conservato evolutivamente e ha una composizione molto simile in lievito e uomo. Ci sono differenze specie-specifiche. - La coda viene fosforilata e la pol si stacca dal promotore. Anche gli altri fattori si staccano, tranne la TFIID, che rimane per reclutare altre pol. Nell'allungamento, la pol si muove con la coda fosforilata. La coda recluta i fattori che saranno importanti per la maturazione dell'RNA. L'RNA uscente verrà modificato da questi fattori legati alla coda. Un footprinting permette di vedere cosa succede quando si legano i diversi fattori. - Se si mette direttamente la pol II, non succede nulla. Quello che si deve legare inizialmente sono i complessi TFIID, A e B. A questo punto si può legare la polimerasi. TFIID è indispensabile per il legame polimerasi-DNA. - La pol II ha una struttura che termina con una coda di sequenze flessibili all'estremità C terminale. La coda interagisce con i fattori. Alla fine del processo, quando il DNA si apre, la coda viene defosforilata per consentire il distacco della pol II dal promotore. Finché la coda non è fosforilata, la pol II rimane legata e non si può muovere. Si passa dalla fase di inizio a quella di allungamento. Nella fase di inizio la coda non è fosforilata, nell'allungamento si. - Si legano TFIIF, E e H e si crea il complesso di pre- inizio; ora la TFIIH con attività elicasica apre il DNA e si ha il complesso aperto. 77 - Dopo la terminazione, l'enzima si stacca dopo essere stato defosforilato da fosfatasi. Es promotori con TATA box: - il promotore del gene della pirrolinato chinasi, che ha una TATA box, un CAAT box e 2 GC box. - il promotore del virus SV 40, che ha un TATA box e 6 GC box. Questi due sono promotori forti e hanno un unico punto di partenza della trascrizione. Es promotori che non contengono TATA box: - il promotore di un gene di mammifero che codifica per l'enzima idrossimetilglutaril-CoA sintasi, importante per il primo step della sintesi di steroidi. Le cellule di mammifero, oltre al colesterolo, non sintetizzano molti steroidi. Basta quindi una piccola quantità dell'enzima. Il suo promotore è poco efficiente, contiene solo 3 regioni GC box. Inoltre il punto di partenza è un po' incerto: i punti di partenza sono distribuiti in una regione di 50/60 basi. - Il promotore di un gene che codifica per un recettore detto epidermal grow factor, che stimola la crescita delle cellule epiteliali. Questo fattore di crescita è importante, ma essendo una proteina di membrana non ne è richiesta una grande quantità. Il promotore avrà quindi 5 GC box e il punto di partenza sarà incerto. Se c'è un TATA box la trascrizione parte da un unico punto e si ha una trascrizione robusta anche in assenza di enhancer. Se non c'è il TATA box, la trascrizione funziona meno bene. GC box È una sequenza ripetuta di GC, di 9/10 nucleotidi. È stata trovata nel virus SV40. Questa regione è coperta da una proteina detta SP1. La proteina SP1 ha due regioni: una C terminale contiene 3 zinc fingers, che legano GC; una N terminale che contiene amminoacidi come glutammina, importanti per l’attività trascrizionale. Quando si lega al GC box può interagire con altri componenti e attivare la trascrizione. Anche qui la sequenza consenso ha delle varianti in base all'organismo che si sta studiando. A seconda delle varianti, il GC box può essere più o meno efficiente; l'attività della proteina è modulata dalla sequenza GC box. CAAT box Influisce anche questa sull'attività trascrizionale. La regione contiene come core la sequenza specifica CAAT. In realtà, la regione riconosciuta dal fattore proteico CTF è più grande e in genere è palindromica. Questa sequenza, quando c'è, è a monte dei geni. La CAAT box, quando c'è, è riconosciuta dal fattore CAAT box transcription factor. Ci sono dunque tre casi nei vari promotori: 1) C'è TATA box, che lega TFIID, TFIIA, ecc. Il promotore è molto efficiente. 2) Non c'è TATA box ma solo DPE davanti al gene. DPE non è riconosciuto dalla TBP, ma è riconosciuto dalle TAFs. Il reclutamento del TFIID avviene da parte del DPE. Quando il complesso sarà legato, partirà tutto il processo. 3) Non c'è TATA box né DPE. C'è solo il GC box. Il GC box da solo non fa quasi nulla ma servono tanti perché si riesca a reclutare un buon numero di SP1, che interagiscono con una TAFs, portando il meccanismo in funzione attraverso l'interazione proteina- 80 - Per misurare l'attività di CAT bisogna usare un metodo complesso, la trasfezione transiente, ovvero l'introduzione di materiale biologico esogeno all'interno di una cellula di mammifero. È stato inserito il plasmide reporter in cellule HeLa. Per far entrare il DNA batterico si tratta la cellula con CaCl. - Dopo 48 h di transfezione si uccidono le cellule per lisi e si fa un estratto, per vedere se nel citoplasma c'è attività CAT. Se c'è il promotore, è funzionante e l’enzima è stato sintetizzato. A questo estratto contenente l'enzima, si aggiunge cloramfenicolo radioattivo e acetil CoA. L'enzima usa l'acetil CoA e attacca il gruppo acetilico al cloramfenicolo. - Né l'antibiotico né il prodotto acetilato sono colorati. Per misurarli, bisogna fare una cromatografia su strato sottile (TLC). Si usa una lastrina di vetro ricoperta di gel di silice, su cui si mette un tot di materiale. Si pone poi la lastrina in una vaschetta con diversi solventi, in questo caso idrofobici. Il cloramfenicolo è idrofilico e, quindi, si muove poco. I prodotti acetilati, invece, sono idrofobici e si muovono di più. La presenza dei prodotti viene vista mettendo una lastra fotografica, perché le sostanze usate sono radioattive. L'attività dell'enzima si misura contando la radioattività negli spot acetilati: più enzima c'è, più cloramfenicolo acetilato radioattivo c'è. - Se si fa un costrutto uguale senza enhancer, l'attività è molto minore, gli spot si vedono meno. A questa attività si assegna il valore 1 e viene detta attività basale; con l’enhancer è 40 volte superiore. Questo mostra che l'enhancer agisce amplificando la trascrizione. Se al posto dell'intero enhancer, si mette un oligonucleotide con il sito di legame per AP1, non succede nulla; se si mettono due o tre copie, invece, c'è un aumento di trascrizione di 10 volte rispetto al livello basale. Già la sequenza a cui si lega AP1 ha caratteristiche di un piccolo enhancer. Se metto una singola copia della sequenza, la quantità di proteina che si lega è bassa. Se metto più copie, la concentrazione della proteina sale. Lo stesso esperimento è stato rifatto usando la sequenza target di AP2 e ha generato lo stesso risultato. L'enhancer è fatto da più motivi e ognuno lega una proteina attivatrice. L'effetto è sinergico: più proteine si legano maggiore sarà la capacità di trascrizione. Molti geni di mammifero hanno a monte delle regioni che legano queste proteine. SV40 si è impossessato delle regioni e ha sfruttato le proteine che si legano. Dimostrazione della presenza di siti AP1 in un gene endogeno, hMTnIIA. SV 40 usa le proteine che si legano ai geni ma l’organismo stesso usa le proteine per i suoi geni. È il gene (umano) che codifica per la metallotioneina, una proteina che protegge da avvelenamento da metalli pesanti tossici. Questa lega i metalli grazie ai gruppi sulfidrilici nel suo sito attivo. È prodotta a livello basale ma la sua quantità nel sangue aumenta in situazioni di stress o di avvelenamento da metalli pesanti. Il promotore di questo gene ha un TATA box, un GC box (che legano SP1) e una regione di 200 nucleotidi, che comprende due regioni: a. BLE region: è un elemento che consente di avere una trascrizione basale significativa, aumenta di molto l'efficienza della trascrizione. Ha dei siti per AP1 b. GRE: elemento che risponde ai glucocorticoidi (come il cortisone) prodotti in risposta allo stress. In presenza di cortisone, il recettore specifico lo lega e questo entra nel nucleo, dive si lega a siti specifici per attivare la trascrizione Anche i geni endogeni usano le stesse proteine per la trascrizione. I promotori endogeni, quindi, assomigliano a quelli virali. Hanno elementi in comune come TATA box e 81 GC box, che danno una trascrizione basale. Hanno poi degli amplificatori che usano gli stessi motivi di SV40. Molti geni umani hanno i siti per AP 1,2,3. Come fa la proteina, che si lega lontana dal promotore, ad attivarlo? Le regioni enhancer sono a una certa distanza e ad esse si legano proteine attivatrici, come AP1, AP2, ecc. Le proteine interagiscono con le componenti basali di trascrizione (TATA, GC box) attraverso un ripiegamento del DNA. Con questo meccanismo, attivano la trascrizione. Questo spiega il motivo per cui, invertendo l'enhancer, non ho un effetto significativo: la sequenza, girata in ogni senso, deve legare la proteina, che si lega in ogni caso. La proprietà è dovuta alla proteina stessa, che attiva la trascrizione quando viene posta vicino al promotore Le proprietà delle proteine che si legano all’enhancer sono state studiate con il lievito. SISTEMA GAL È un sistema di induzione. Il lievito, per crescere, ha bisogno di zuccheri. Usa il glucosio ma può usare anche altri zuccheri come galattosio e arabinosio. Non può usare lattosio perché non ha l'enzima β galattosidasi. Il galattosio, per entrare nelle cellule, ha bisogno di un trasportatore specifico, la galattosio permeasi, un enzima codificato dal gene GAL2. Il galattosio, per entrare nella glicolisi, deve essere metabolizzato: 1) fosforilato dalla galattochinasi (codificata da GAL 1) a formare galattosio P1. 2) Il galattosio P1 viene metabolizzato in glucosio P1 da una coppia di enzimi codificati da GAL 7 e GAL 10. 3) Il glucosio 1P viene convertito in glucosio 6P dalla glucomutasi ed entra in glicolisi. Il gene per la glucomutasi in lievito è GAL 5, che non è specifico per il sistema GAL: glucosio 1P si ottiene, infatti, anche dalla degradazione di glicogeno. I geni specifici per il galattosio sono, quindi, GAL 2,1,7,10. MEL I codifica per un’α galattosidasi e trasforma il melibiosio in galattosio e glucosio. Questi geni sono espressi in bassissima concentrazione in assenza di galattosio. Con galattosio, l'attività di questi enzimi sale molto rapidamente. In GAL i geni sono separati: non c'è un operone e ciascuno ha il suo promotore. Il sistema è represso da glucosio perché, se sono presenti sia il glucosio che il galattosio, il lievito usa prima tutto il glucosio, che gli consente di crescere più rapidamente. 82 L'induzione avviene a livello di trascrizione, è un controllo trascrizionale. Il GAL 2 è distante dagli altri geni GAL. GAL 7,10,1, che consentono di trasformare il galattosio in glucosio 1P, sono tutti vicini fra loro sullo stesso cromosoma. Formano un cluster di geni, ovvero geni diversi raggruppati e ciascun gene è regolato in maniera indipendente dagli altri. GAL 1 e 10 hanno una trascrizione divergente. Ogni gene ha una regolazione a sé, ma ci deve essere un fattore comune di regolazione, altrimenti non si spiega che tutti rispondono al galattosio. I geni che codificano per la permeasi sono indotti da galattosio. Una piccola quantità di permeasi c'è anche prima altrimenti il galattosio non potrebbe entrare e il sistema non verrebbe attivato. Quando entra il galattosio, viene sintetizzata altra permeasi e questo aumenta la velocità di entrata dello zucchero. Sono stati introdotti dei geni regolatori, mutazioni in loci che alteravano il meccanismo di regolazione. I geni regolatori principali sono 3: GAL 4, GAL 80 e GAL 3. In più c'è un altro gene, MIG 1, che non è specifico per la regolazione del galattosio, ma è responsabile della repressione da glucosio. Questi geni influenzano direttamente il meccanismo. Sono stati studiati mutanti: • recessivi di GAL 4: hanno un fenotipo non inducibile, cioè la proteina non funziona e quindi il sistema non si induce. Questi mutanti sono incapaci di crescere su galattosio, perché non possono indurre il sistema GAL. • dominanti di GAL 4: codificano per una proteina mutata, che fa sì che il sistema sia sempre attivo. Questo si spiega pensando che GAL 4 codifichi per un attivatore, ovvero un regolatore positivo. Se esso non c'è, il sistema non si induce mentre se è mutato, non sente nessun altro segnale e dà un fenotipo costitutivo, in cui i geni GAL vengono espressi indipendentemente dalla presenza di galattosio (sistema sempre indotto). Il gene GAL 80 ha comportamento opposto. I mutanti GAL 80 sono: • recessivi: inducono continuamente l'attività indipendentemente dalla presenza di galattosio. • dominanti: hanno un fenotipo detto super represso, ovvero anche a concentrazioni alte di galattosio non riescono a sbloccare il sistema. Il prodotto di GAL 80 sarà un regolatore negativo. Se esso non c'è, si ha un fenomeno costitutivo (attività costante anche senza galattosio). Si ipotizzò l’esistenza di un doppio sistema di regolazione con controllo positivo, attivatori e controllo negativo, inibitore. Modelli per spiegare il doppio sistema di regolazione: - Modello di Douglas and Hawthorne, secondo cui GAL 4 e GAL 80 possono interagire. In assenza di galattosio, l'interazione viene eliminata perché GAL 4, legata a GAL 80, Se non c’è galattosio: bassa concentrazione di enzimi Se c’è galattosio: alta attività Se si rimuove il galattasio, l'enzima non viene inattivato e continua a funzionare, ma non viene più sintetizzato e non si accumula più nella cellula 85 GAL 4 è sempre legata a UAS, sia che il sistema sia indotto che meno. L'unica situazione in cui GAL 4 è legata meno fortemente è in presenza di glucosio, per la presenza di inibitori specifici mediati dalla presenza di glucosio Ci sono tre stati possibili: 1. Non indotto. Non è presente né galattosio né glucosio. Il lievito sta crescendo su una fonte di C alternativa. I geni GAL sono espressi molto poco. Gal 4 è legata a UAS, ma il dominio attivatore è inibito dalla presenza di GAL 80. L’attività trascrizionale è molto ridotta. 2. Indotto. C'è galattosio. GAL 80 si dissocia da GAL 4 e il dominio attivatore di GAL 4 è libero: può interagire fisicamente con i componenti dell'apparato basale di trascrizione. L'interazione fisica è permessa dalla flessibilità del DNA. La trascrizione avviene in modo efficiente. 3. Represso. Quando c'è glucosio. Questa è l'unica situazione in cui GAL 4 non si lega all'UAS, perché nella zona adiacente a UAS ci sono dei siti riconosciuti dalla proteina inibitrice. Il suo posizionamento impedisce l'interazione di GAL 4 con UAS. Anche il dominio attivatore è bloccato perché non c'è galattosio e il sistema risulta praticamente spento. Esperimento per capire come fa il dominio ad attivare la trascrizione Questa regione di GAL 4 non ha sequenze particolari, è una zona flessibile e non strutturata, che però contiene un certo numero di aa acidi. L'unica caratteristica conservata di questi domini non è una sequenza, ma è l'acidità, cioè l'alta presenza di aa come acido aspartico e acido glutammico. 86 Per dare attività trascrizionale è sufficiente il sito di legame per il DNA alla sequenza UAS e un dominio acido attivatore. Per verificare se questo fosse vero, hanno creato una sequenza inesistente in natura. Si cambia il dominio di legame al DNA e si mette una regione presa da un repressore batterico che si lega all'operatore, la sequenza che causa il legame del repressore batterico con il DNA. Il repressore è stato modificato e si è fatta una fusione fra sequenze codificanti per il repressore e le sequenze di GAL 4 codificanti per il dominio attivatore. Si è costruito un dominio trascrizionale nuovo che è composto da una porzione di quello di GAL 4 e da un dominio di legame a DNA batterico che, quando viene espresso in un lievito con questo costrutto, ne attiva la trascrizione. Si possono quindi costruire attivatori trascrizionali ex novo unendo un sito di legame al DNA a un dominio attivatore. Si ottiene una libreria di plasmidi diversi contenenti attivatori diversi. Questo fa capire che il sito di legame al DNA non ha caratteristiche particolari, è un enhancer, ma deve avere aa acidi conservati. Per creare un dominio trascrizionale di GAL basta legare una regione di legame per UASgal e un dominio acidico. Se al posto dei primi 147 aa di GAL 4 si fa esprimere un repressore e lo si fonde con un attivatore, mi aspetto che questa proteina ottenuta funzioni come attivatore trascrizionale se essa si può legare al promotore. Cambio il reporter, uso un reporter in grado di legare il repressore che sto usando. Se il repressore è fuso con un attivatore, ho un’attivazione della trascrizione. Si possono, quindi, creare attivatori trascrizionali che non esistono in natura. Questo implica che per avere attivazione trascrizionale, basta avere una proteina che si leghi al promotore (al DNA) e abbia un dominio acidico. Opac 2 del mais ha una regione di legame al DNA diversa, è leucin zipper, quindi basica, e una regione acida ricca di residui di acido glutammico in tandem. GCN4 ha una regione leucine zipper e una porzione centrale estremamente acida. Anche con altri attivatori trascrizionali, c’è un sito di legame al DNA e un dominio acidico. Il fatto che troviamo una struttura attivazionale simile implica che c’è una conservazione evolutiva. Una proteina presente in lievito può attivare la trascrizione in piante o animali. La proteina GAL 4 può funzionare in altri organismi. Generalmente un attivatore trascrizionale è fatto da due domini, uno basico di legame con il DNA e uno acido attivatore della trascrizione. In realtà l'attivazione può essere ottenuta con diversi domini di attivazione, ma quello più presente è il dominio acidico. Nel modello originale, per avere l’induzione, si pensava che il galattosio si legasse direttamente a GAL 80 e il legame avrebbe dovuto indurre la dissociazione fra GAL 4 e GAL 80. In realtà GAL 80 non lega galattosio ma c’è il prodotto del gene GAL 3. Se viene aggiunto galattosio a un ceppo di lievito che sta crescendo su altra fonte di C, l'induzione è rapidissima; se il gene per GAL 3 manca o è mutato l'induzione è molto più lenta, ma viene 87 indotta lo stesso (fenotipo di induzione lento). GAL 80 e GAL 3 si associano. GAL 3 lega il galattosio e, legandolo, stacca GAL 4 da GAL 80. L'associazione GAL 3 e GAL 80 è debolissima in assenza di galattosio, ed è molto forte se invece questo è presente. GAL 3 è una proteina citoplasmatica ed è un omologo della galattochinasi. Ha lo stesso sito della galattochinasi per galattosio e ATP, solo che perde l'attività chinasica: non fosforila il galattosio ma lega galattosio e ATP e, in queste condizioni, lega GAL 80. Il modello è questo: GAL 3 è libera e nel sistema non indotto GAL 80 è legata a GAL 4, inibendo la trascrizione. In presenza di galattosio, GAL 3 si lega al galattosio e così lega GAL 80, causando il distacco fra GAL 80 e GAL 4. GAL 3 è il mediatore, l'induttore è il galattosio. GAL 4 è prodotto poco in lievito: bastano poche molecole per attivare l’espressione. Se si aumenta la produzione di GAL4, si altera il sistema di regolazione a causa del cambiamento delle concentrazioni relative. È stato fatto un esperimento di aumento di GAL 4 con northern blot. Nelle cellule di lievito è stato inserito un plasmide che porta GAL 4 con il suo promotore, in dieci copie; anziché un gene GAL 4 ne abbiamo 10 per cellula. Si è osservato un certo aumento di espressione del gene. Se si inserisce anche UAS GAL, essa attiva la trascrizione di GAL 4 e il risultato è che la cellula produce una grandissima quantità di questa proteina. Questa situazione è negativa perché tanto attivatore trascrizionale è fastidioso per la cellula, interagisce con altri meccanismi. Questi sono esperimenti di manipolazione dei sistemi di regolazione e dimostrano che sono fondamentali anche le quantità relative delle sostanze. L’espressione dipende dalla quantità relativa di GAL4 e GAL 80 (se aumento una, deve aumentare anche l’altra) e anche dalla quantità relativa di UAS GAL e dell’inibitore MIG1 (se c’è tanto inibitore, esso si lega al posto di UAS GAL). Esperimento per dimostrare che GAL 4 è in grado di attivare la trascrizione anche nei mammiferi e nelle piante - Si usano plasmidi inseriti dentro cellule di mammifero. Si inseriscono contemporaneamente diversi DNA, è la cotrascrizione. Si devono inserire nelle cellule due diversi plasmidi: uno è un vettore batterico con un promotore forte (SV40) seguito dalla sequenza che codifica per GAL 4, seguito da un terminatore (un sito poliadenilato); l’altro è un plasmide reporter che contiene UAS GAL dove il gene reporter è CAT. - Gal 4 viene fatta esprimere e, se il sistema è conservato, questa si legherà a UAS GAL e attiverà la trascrizione anche in cellule di mammifero. - L'attività CAT viene vista con cromatografia dopo la lisi delle cellule. Si va a dosare nell'estratto proteico l'attività di CAT con cloramfenicolo radioattivo e si fa la cromatografia per vedere la formazione dei prodotti acetilati. - Si è scoperto che GAL 4, intera o con i soli domini funzionali, attiva la trascrizione anche nei mammiferi. In tutti gli eucarioti, quindi, ci sono dei fattori comuni che possono interagire con i domini acidici per attivare la trascrizione. Modelli di transattivazione Il primo modello è di interazione proteina-proteina: le sequenze enhancer (UAS) legano le proteine attivatrici. La proteina attivatrice ha un dominio attivatore che lega componenti del TF2D. Questa interazione stabilizza a sua volta l'interazione fra TFIID e TATA box. In questo modo, quindi, si aumenterebbe l’efficienza di trascrizione. Questo modello, però, non può spiegare un’attivazione così forte. 90 GAL 4 recluta con il suo dominio attivatore il SAGA, un complesso ad alto peso molecolare capace di acetilare gli istoni dei nucleosomi adiacenti. In questo modo, il promotore è accessibile. Se questo non succede, il TATA box non è accessibile perché è bloccato da un nucleosoma. A questo punto si può legare TFIID e arriva la polimerasi. Le proteine attivatrici che si legano agli enhancer attirano complessi capaci di regolare la cromatina, rendendo accessibile la cromatina a valle e quindi il promotore. I co-attivatori (TAF) stabilizzano le interazioni di TFIID con il promotore e stabilizzano l'interazione della polimerasi. C'è un'interazione a tre livelli sequenziali: il primo livello è fondamentale, altrimenti il promotore non è accessibile e il sistema non può partire. È un rimodellamento della cromatina Il modello attuale è che ci sono dei siti di legame dell'enhancer in una posizione inizialmente non occupata dai nucleosomi. L'attivatore si lega al DNA all'enhancer e il suo dominio acidico recluta il complesso SAGA, che acetila gli istoni dei nucleosomi adiacenti. A questo punto i nucleosomi scivolano via e TATA box è disponibile e può reclutare TFIID, che lega pol e così parte la trascrizione. I promotori eucariotici hanno 3 elementi: • il core promoter, a cui si legano TFIID e il macchinario basale di trascrizione; • una regione prossimale, in cui si trovano sequenze che aiutano l'interazione fra TFIID e il promotore, come le GC box; • le regioni enhancer o UAS che legano i transattivatori (TAFs, mediatori, attivatrici) capaci di interagire fisicamente con le componenti basali e di sbloccare il sistema, spostando i nucleosomi Il genoma eucariotico è represso, perché la cromatina è un repressore. Negli eucarioti, quindi, gli istoni, nucleosomi e cromatina sono conservati per questo motivo. Per farlo funzionare, bisogna spostare i nucleosomi con un meccanismo che elimini la repressione. Questo spiega perché la regolazione degli eucarioti è positiva: il fattore si lega rendendo la cromatina accessibile. Ci sono anche dei regolatori negativi, come b1, che, legandosi, regolano la deacetilasi: se ci sono istoni attivi, li deacetila e la cromatina si compatta, rendendoli non più accessibili. Questo controllo negativo è poco usato e può servire per spegnere un promotore. Il controllo basale è positivo e dereprime il DNA per poterlo utilizzare. TIPI DI RNA Gli RNA vengono sintetizzati dalla RNA polimerasi. Gli RNA sono: - poco stabili: degradati, es. mRNA. - stabili: non vengono degradati e più abbondanti. Sono rRNA (70% dell'RNA nelle cellule) Negli eucarioti ci sono anche altri RNA stabili ma in minima quantità. Non si possono vedere su gradiente di saccarosio, bisogna farli crescere su P radioattivo per marcarli e poi separarli con elettroforesi su poliacrilammide (permette di separare molecole di RNA piccole). Gli small RNA si possono trovare ovunque nella cellula e sono stabili: nel nucleo (nuclear small RNA), nel nucleolo (nucleolar small RNA) o nel citoplasma. Nel nucleo si trovano anche i microRNA, capaci di regolare la sintesi delle proteine a livello di traduzione del messaggero. Gli U RNA sono piccoli RNA stabili, ricchi di uracile. U 1, 2, 4, 5 e 6 sono nucleari e hanno un ruolo importante nello splicing e nella maturazione dell'mRNA. U3 è nucleolare e aiuta a far maturare gli rRNA; è sintetizzato dalla polimerasi III. Anche U6 è sintetizzato dalla 91 polimerasi III, come gli RNA 5S. U 1, 2, 4, 5 sono sintetizzati dalla polimerasi II: nascono come se fossero dei messaggeri poi vengono tagliati e formano questi piccoli RNA. Tutti questi RNA non sono mai nudi, sono sempre accompagnati da proteine con cui formano complessi detti ribonucleoproteine. RNA 7S è citoplasmatico, è sul RE e forma una struttura, SRP, che permette di trasportare le proteine sintetizzate dal RE. tRNA Sono piccole molecole di 73/80 bp (si possono aggiungere sequenze funzionali). I tRNA hanno struttura estremamente conservata, invariata in tutti i viventi. La struttura di base ha una tipica forma a trifoglio, al cui interno si evidenziano strutture secondarie, tra cui α eliche. Partendo dal 5' ci sono diverse regioni particolari: - Braccio della di-idro-uridina: formato da 4 nucleotidi appaiati più un'ansa caratteristica che ha come base particolare il di-idro-uracile. (braccio D); - Braccio dell'anticodone: ansa con 3 nucleotidi centrali che costituiscono l'anticodone, che deve appaiarsi alla tripletta complementare sul messaggero. Quest'ansa è fatta di 7 nucleotidi: i 3 centrali sono l'anticodone, preceduto da due pirimidine e seguito da due purine; - Braccio extra: può essere corto o lungo e determina la differenza tra i diversi tRNA, fra cui anche le dimensioni. Non è presente in tutti i tRNA; - Ansa della pseudo-uridina: contiene basi appaiate e altre disposte in modo da costruire un'ansa. Contiene delle basi modificate con timina, pseudo-uracile e pseudo-uridina. (braccio T); - Gambo accettore: il tRNA termina con una sequenza a singolo filamento di 3 nucleotidi, CCA. Il 3°nucleotide, A, termina con un OH libero, usato per legare l'amminoacido. Di-uridina e pseudo-uridina sono due anse estremamente conservate, quasi identiche in tutti i tRNA. La struttura a trifoglio è la struttura secondaria. Visto tridimensionalmente, il tRNA ha una conformazione a L rovesciata. Si forma un angolo di 90° tra l'anticodone e l’amminoacido. Questa struttura deriva da legami a H fra l'ansa della di-idro-uridina e l'ansa della pseudo- uridina. Le modifiche in queste zone sono indispensabili perché si formi la conformazione a L e senza questa il tRNA non può essere riconosciuto dal ribosoma e non può quindi svolgere la sua funzione. 92 Le modifiche principali sono: • Un metile che trasforma U in T, formando ribo-nucleotimina; • La saturazione di un doppio legame dell'U: la struttura aromatica diventa una struttura ciclica alifatica, formando idro-uridina; • Formazione di un legame C=C fra U e zucchero anziché N-glicosidico, perché la base viene girata (si ha comunque U, ma è detto pseudouridina). Queste modifiche ci sono in tutti i tRNA e sono necessarie affinché il tRNA assuma la struttura tridimensionale corretta. Ci possono poi essere modificazioni occasionali: ad esempio è il ti-uracile, generato da un atomo di S al posto di O2 (si trova a volte nell'anticodone). Le modifiche più importanti sono sulle purine. Ci possono essere: . metilazioni a formare metiladenina o metilguanosina; . deaminazione ossidativa dell'adenina a formare ipoxantina (nell'anticodone consente di leggere più codoni); . aggiunta di un gruppo isopentilico al gruppo amminico dell'adenina, generando isopentiladenina, che è un potente ormone vegetale, responsabile della crescita delle cellule vegetali. Non ha effetto in quelle animali. La guanina può essere pesantemente modificata generando base Q, base Y, o aerosina. Queste basi modificate sono solo nelle regioni adiacenti all'anticodone e sono importanti per modulare l'attività del tRNA. Queste modifiche fondamentali devono avvenire in modo corretto, o il tRNA non interagisce bene con la sintetasi, enzima che carica l'aa. SINTESI DEI tRNA Le vie di sintesi sono diverse fra eucarioti e procarioti. Ci sono due tipi di gene: 1. il gene di tipo 1: contiene anche la sequenza per codificare la tripletta finale ACC dell'estremità 3'; 2. il gene di tipo 2 non ha ACC nell'RNA nascente ma ACC verrà aggiunta in un secondo momento. I batteri hanno geni di tipo 1, gli eucarioti geni di tipo 2. Nel Coli, la maggior parte delle sequenze codificanti per i t-RNA sono nei 7 operoni per rRNA. Gli operoni rrn, hanno due promotori in tandem; la regione codificante e due terminatori, che permettono un'efficienza di terminazione del 100% in questa posizione. RNA pol si lega ai promotori e genera un RNA precursore detto 30S, che contiene sequenze diverse. Si distinguono sequenze di rRNA 16S, rRNA 23S, rRNA 5S e delle sequenze per tRNA. Gli operoni differiscono fra loro solo per le sequenze per i tRNA. L'operone rrnC è l'unico a contenere (oltre a sequenze per tRNA per acido glutammico e acido aspartico) tRNA per triptofano. Coli non può disattivare questo operone perché altrimenti non potrebbe più produrre proteine con triptofano e la cellula sarebbe danneggiata perché è l’unico operone che ha il gene che codifica per il triptofano. Ci sono operoni che contengono sia geni che codificano per tRNA che proteine. Es. operone Tyr-U che genera un mRNA che codifica per la proteina EFTU (immagine di operone rrn) 95 In 3' ci sono pochi nucleotidi che verranno tagliati dalla ribonucleasi D, un'esonucleasi che rimuove i vari nucleotidi fino a lasciare un 3'-OH libero. La trasferasi aggiungerà la sequenza ACC in 3’. La differenza maggiore con i tRNA batterici è la presenza di un introne piccolo. Questo introne non viene rimosso con lo spliceosoma. L'introne non è una sequenza conservata ma contiene sempre una regione complementare all’anticodone e si trova sempre subito dopo l’anticodone. Si forma un appaiamento fra anticodone e introne (l'introne è complementare all'anticodone). Per eliminare gli introni, in genere, si usa una transesterificazione: si rompono 2 legami fosfodiesterici in corrispondenza delle estremità dell'introne e se ne formano altri due che generano un tRNA maturo e un introne circolare. Questo meccanismo, però, è usato dallo spliceosoma, quindi in questo caso non viene usato. La rimozione dell’introne, quindi, avviene tramite una endonucleasi specifica, che taglia in corrispondenza delle estremità dell'introne. Essa non riconosce una sequenza ma una struttura secondaria. Genera un introne lineare e le due estremità del tRNA verranno unite dalla RNA ligasi. L'endonucleasi che toglie l'introne, in realtà, lascia un'estremità 5'- OH e una 3'-fosfato ciclico. Queste non possono essere unite dalla ligasi, che richiede estremità 3'-OH e 5'-P. Intervengono altri due enzimi per modificare le estremità. Una chinasi, usando ATP, attacca un gruppo fosfato in 5' e una fosfodiesterasi rompe il fosfato ciclico dall'estremità 3', lasciando un OH libero. Le estremità ora possono essere legate. La ligasi usa una molecola di ATP, libera pirofosfato e forma l'intermedio chinasi-AMP. La ligasi lega al 5' il residuo di AMP e catalizza l'attacco nucleofilo del 3' OH sul legame pirofosfato appena formato tra 5' e AMP. Si libera AMP e la molecola è unita. Interviene la fosfatasi che stacca il P in 3', non presente nel tRNA maturo. Il tRNA non è ancora maturo: deve andare incontro alla modifica delle basi presenti nelle anse dei bracci. Normalmente lo splicing avviene nel nucleo, in questo caso invece nel citoplasma. Vengono usate 2 molecole di ATP per ogni tRNA che viene maturato. 96 RNA ribosomiale Gli RNA ribosomiali sono molecole grandi con strutture complicate. Sono fatti da diversi domini: hanno una regione in 5', un dominio centrale e una regione in 3'. Gli rRNA hanno moltissime regioni appaiate, almeno il 70% è a strutture secondarie. Hanno una porzione centrale detta corpo, una porzione detta testa e una porzione laterale detta piattaforma. Gli rRNA sono estremamente conservati, le mutazioni riguardano solo certe regioni. Altre sono conservate al 100% in tutte le specie: le variazioni sono tali da mantenere inalterata la struttura secondaria. Gli eucarioti hanno rRNA 18S; i procarioti hanno il 23S (ha 6 domini). La subunità maggiore contiene sempre rRNA 5S, il ribozima più importante. Sintesi degli rRNA Nei batteri gli rRNA sono sintetizzati dagli operoni. La trascrizione genera un rRNA primario di 30S. Il 30S è difficile da vedere perché appena prodotto viene tagliato dalla ribonucleasi terza. Se il taglio non avviene, come nei mutanti temperatura sensibili, quando il mutante è portato a 42°C, esso smette di crescere perché rRNA non viene più tagliato. Il taglio crea un rRNA più lungo del 16 S. Essa taglia, inoltre, anche nell'estremità adiacente a 23S. I precursori ottenuti da questi tagli interagiscono con le proteine ribosomiali e la maturazione finisce durante l'assemblaggio dei ribosomi. RNA ribosomiale negli eucarioti Negli eucarioti non si ha un gene specifico per l'RNA 18S, 28S ecc: si ha un'unica unità di trascrizione che assomiglia ad un operone. È abbastanza grande e genera un precursore che contiene le sequenze che matureranno nei vari rRNA. Il precursore contiene anche delle sequenze che saranno trascritte e che verranno poi eliminate, gli spaziatori trascritti. Tra 97 una regione trascritta e l’altra ci sono delle regioni non trascritte, gli spaziatori non trascritti che contengono dei promotori. Le unità di trascrizione per l'rRNA eucariotiche vengono anche dette rDNA. Sono presenti in molte copie, perché gli eucarioti necessitano di molti ribosomi. Le unità di trascrizione sono nel nucleolo, così anche la pol I. Questo è il sito di sintesi e maturazione dell'rRNA e di assemblaggio dei ribosomi. La dimensione del trascritto primario (precursore) varia nei diversi organismi. Per Coli è di 30S, nel lievito è di 37S e nei mammiferi 45S. Cambia anche la percentuale di RNA conservata nell'RNA maturo: Coli conserva il 75%, i mammiferi il 51%. Unità di trascrizione eucariotiche La pol I lega il promotore e genera il trascritto primario, che va incontro a modifiche. Il trascritto primario comprende sempre una regione che diventerà il 28 S, una che diventerà la 5.8 S e una che sarà la 18 S. La maturazione avviene tramite tagli specifici grazie alle endonucleasi. Non uno splicing perché lo splicing taglia e poi unisce le giunzioni. In questo caso avvengono solo dei tagli. Esperimento per studiare la maturazione: - Le cellule di lievito sono state marcate con metionina con C14 ed è stato estratto l'RNA, separato poi su gradiente. Per marcare rRNA, è stata usata della metionina marcata perché è stato scopeto che gli rRNA sono metilati e la metilazione riguarda sia le basi azotate che gli zuccheri. Ci sono circa un centinaio di metilazioni in un rRNA. La metilazione avviene già nel precursore. La metionina marcherà anche le proteine ma non è un problema perché RNA e proteine vengono separati tramite centrifugazione. - rRNA è separato su gradiente di saccarosio. - Misurando l'assorbanza a 260 nm, si possono vedere le quantità di rRNA maturi; si notano due picchi, a 25S e a 18S. In rosa si vede la radioattività dovuta alla metionina. Molta della radioattività sarà nel materiale pesante (il precursore) a 35S. - Dopo il Chase, si vede il destino di queste molecole radioattive seguendole nel tempo. - Dopo 5 minuti, il picco di radioattività 35S diminuisce e aumentano i picchi 25S e 18S. Si è visto che a partire da un precursore iniziale (35 S) si ottengono due frammenti di rRNA: il 20S, che genera il 18S e il 28S, che genera il 25S e il 5,8S. Ora si conosce esattamente dove le endonucleasi tagliano. Il punto di taglio è selezionato grazie a piccoli RNA nucleolari. Questi RNA nucleolari controllano la maturazione del rRNA,