Scarica Biologia molecolare di base e più Dispense in PDF di Biologia Molecolare solo su Docsity! 29 CAPITOLO 5 5.1. Lo studio della replicazione del DNA richiede un accostamento multidisciplinare. Con l’esperimento di Meselson e Stahl iniziò lo studio della replicazione del DNA nei Procarioti ed è in Escherichia coli che sono principalmente progredite le conoscenze su tale processo, anche se in anni recenti sono stati chiariti diversi elementi di rilievo di come esso avvenga negli Eucarioti e negli Archei. Il modello di replicazione delineato in E. coli è pressoché completo nei suoi vari aspetti e si è inoltre rivelato di aiuto per la comprensione dei meccanismi replicativi in altri sistemi. Notevole interesse hanno anche attirato le modalità di replicazione dei genomi virali e fagici, di una varietà impressionante, anche se tutte riconducibili allo stesso schema molecolare di base. Il conseguimento di questi obbiettivi di conoscenza è stato reso possibile dal confluire di diverse competenze disciplinari e tecniche sperimentali. Esse includono esperienze di fisiologia batterica e genetica batterica, studi autoradiografici al microscopio elettronico per osservare il decorso del processo replicativo, studi biochimici in vitro sugli enzimi associati alla replicazione (DNA polimerasi, ecc.), esperimenti biochimici in vivo per marcare con radioisotopi gli stadi intermedi della replicazione e infine l’analisi teorica e sperimentale dei problemi creati dall’apertura della doppia elica parentale al momento della sintesi dei nuovi filamenti. Partiremo proprio da quest’ultimo punto, che è possibile studiare anche su modelli sperimentali in vitro, non senza aver prima riassunto alcuni dati di fatto che serviranno a chiarire la natura del problema. Quando i due filamenti di una molecola di DNA a doppia elica devono fungere da stampo per sintetizzare due nuovi filamenti a loro stessi complementari, sono necessari due eventi: a) la rottura dei legami tra le basi che uniscono localmente i due filamenti; b) la separazione fisica dei due filamenti, perché ciascuno divenga parte di una nuova doppia elica. Ogni regione del DNA che presenta questo fenomeno di apertura e divaricazione dei filamenti, su ciascuno dei quali avviene la sintesi di nuovo DNA, costituisce una forcella replicativa; affinché la replicazione proceda, la forcella replicativa deve avanzare, ossia il tratto di doppia elica ancora avvolto si deve separare in due filamenti. Perciò, la doppia elica a valle deve girare come una vite o un filamento deve ruotare sull’altro: essi non sono accostati uno all’altro (struttura paranemica), ma avvolti uno sull’altro come i capi di una treccia (struttura plectonemica). Per procedere in questo discorso, abbiamo però bisogno maggiori dettagli sulla velocità e sul tempo richiesto per il processo replicativo nei Batteri. 5.2. Il DNA genomico nei batteri: tempo globale di replicazione e velocità di replicazione. Iniziamo col considerare quale sia la velocità globale del processo di replicazione in un batterio come E. coli, misurata come numero di nuove coppie di basi sintetizzate al minuto. Il DNA genomico di E. coli è lungo circa 4,6x106 paia di basi ossia 4,6 Mpb1. Esso è costituito da un’unica molecola a doppia elica circolare covalentemente chiusa (cccDNA); questa proprietà geometrica è stata dedotta sia da osservazioni al microscopio elettronico, sia da esperimenti di genetica per localizzare i loci in una mappa genica. La posizione di un gene nel genoma batterico viene indicata in minuti, in quanto essa è stata ottenuta mediante esperimenti di coniugazione batterica, che comportavano il trasferimento e la ricombinazione di materiale genomico da una cellula hfr+ (high frequency of recombination = alta frequenza di ricombinazione) a una cellula ricevente: il tempo richiesto per trasferire un certo gene (misurato in minuti) rappresenta quindi la sua distanza dal sito che ha iniziato il trasferimento (in cui è presente il fattore di fertilità F come episoma o plasmide integrato). Tramite altri tipi di esperimenti è stato possibile verificare che loci assai distanti in una direzione (da 80 a 100 minuti) sono invece molto più vicini nell’altra direzione della mappa. 1 In inglese l’unità di lunghezza del DNA a doppia elica è detta base pair = bp; in italiano si può dire paiabasi = pb; 103 pb = 1 kpb (chilopaiabasi); 106 pb = 1 Mpb (megapaiabasi). 30 Il tempo richiesto per la replicazione completa del DNA genomico di E. coli a 37°C è circa 42 min (tale tempo non va confuso con la durata del trasferimento durante la coniugazione, né col tempo tra due divisioni cellulari). Come dimostreremo, la replicazione è un processo bidirezionale che inizia in un preciso locus genico (replicatore). Vedremo anche che il genoma batterico possiede un solo replicatore, il che si esprime dicendo che l’intera molecola di DNA batterico consiste di un unico replicon. Quindi, si formano in un punto unico due forcelle replicative che progrediscono in direzioni opposte, ognuna provvedendo a replicare metà del cccDNA (circa 2,3 Mpb). Poiché la replicazione di 10 pb richiede di svolgere un giro completo di doppia elica, ogni forcella replicativa richiede quindi il disavvolgimento totale di circa 230.000 giri di doppia elica in 42 minuti. Se ne ricava che la velocità media di rotazione del cccDNA alla forcella replicativa è di circa 5.500 giri/min. Se la reazione che replica il cccDNA avviene sempre alla stessa velocità, questo risultato permette di prevedere due proprietà necessarie dell’apparato replicativo: 1) l’enzima che replica il DNA deve essere in grado di polimerizzare il DNA alla velocità di ~55.000 nucleotidi/min ossia ~920 nucleotidi/s, agendo continuatamente sullo stampo del DNA parentale; 2) deve esistere un meccanismo che impedisca all’intera molecola di cccDNA di ruotare, poiché essa, oltre a essere covalentemente chiusa ad anello, è lunga in tutto 3,4x4,6x106 Å 1,6 mm, ossia circa 1000 volte la lunghezza media (2 m) di una cellula di E. coli , entro cui è contenuta essendo parecchie volte avvolta su sé stessa. La rotazione della doppia elica porterebbe perciò a problemi idrodinamici e meccanici, con riscaldamento dell’acqua intracellulare e rottura della molecola di DNA.2 Oltre a questi aspetti cinetici, geometrici e meccanici del processo di replicazione, occorre anche considerare il lato termodinamico: col progredire delle forcelle replicative, lo svolgimento della doppia elica assorbe energia (necessaria per spezzare i legami non covalenti tra le coppie di basi) e questa dovrà essere fornita attraverso opportuni meccanismi. 5.3. Superavvolgimento e supereliche: la topologia del DNA e le DNA topoisomerasi. Il superavvolgimento (supercoil) del DNA si verifica ogni volta che in una doppia elica vincolata alle estremità vi è un numero di avvolgimenti (di un filamento sull’altro) inferiore o superiore a quelli previsti per una data lunghezza della molecola in forma B. Se il numero di avvolgimenti è in difetto, si ha superavvolgimento negativo, se è in eccesso si ha superavvolgimento positivo. Questo fatto si osserva tipicamente nel cccDNA (che è vincolato per chiusura su sé stesso), ma il modello si può estendere anche a molecole molto lunghe di DNA lineare, come quelle dei cromosomi eucariotici, vincolate inoltre all’involucro nucleare. Si considerano qui molecole di DNA a doppia elica in forma B, in cui l’avvolgimento dei due filamenti è destrorso, ossia ciascun filamento ruota intorno all’altro in senso orario se si guarda lungo l’asse di avvolgimento. Il superavvolgimento di una molecola di DNA, in assenza di influenze esterne (ad es., proteine che si legano alla doppia elica distorcendone i parametri; agenti intercalanti che alterano il passo dell’elica, ecc.), richiede una deformazione globale dell’asse della doppia elica che compensi la perdita o l’acquisto di giri di elica, ripristinando nelle altre parti la geometria della forma B. Queste deformazioni fanno assumere alla molecola di cccDNA un andamento elicoidale, in cui ogni tratto di doppia elica si avvolge intorno a un altro (superelica), o in alternativa una disposizione a spire giacenti su un piano con intrecci della doppia elica con sé stessa3. Quando il superavvolgimento è 2 Su ciascuna forcella replicativa c’è un complesso molecolare di proteine con massa di circa 1 MDa che si sposta sul DNA come una vettura da “montagne russe” che duplichi dietro di sé il proprio binario. L’energia cinetica di tale complesso, che avanza alla velocità istantanea di 0,31 m al secondo (solo cento volte inferiore a quella con cui nuota il batterio che lo contiene), è almeno 3.000 volte superiore a quella media del moto termico a 37°C. È possibile (e plausibile) perciò che sia il DNA a scorrere entro questo complesso, che resterebbe stazionario rispetto all’intera cellula. 3 È opportuno ricordare quanto detto al § 3.1 sulla flessibilità della doppia elica in forma B. Le deformazioni necessarie alle varietà topologiche del DNA e in generale alla sua compattazione nelle cellule sfruttano tale flessibilità. 33 Sono stati scoperti e caratterizzati diversi enzimi, sia batterici che eucariotici, che catalizzano l’interconversione tra diversi isomeri topologici di una stessa molecola di DNA; essi sono in grado di modificare il valore di W e di L in circoli di DNA a doppia elica. Tali enzimi sono stati denominati DNA topoisomerasi e sono stati distinti in tre classi, in base al meccanismo d’azione e alla parentela evolutiva per similarità di struttura primaria. Va notato che, a temperatura nettamente inferiore a Tm e a forza ionica moderata, la forma rilassata del DNA è favorita termodinamicamente rispetto a quelle superavvolte; per introdurre giri di superelica (sia positivi che negativi) occorre pertanto fornire energia al processo, mentre il processo che va verso la forma rilassata è spontaneo. Classe I-5’: sono enzimi monomerici che rilassano parzialmente il DNA superavvolto in senso negativo (L<T, W<0), facendo variare L di +1 ad ogni ciclo catalitico. Non richiedono ATP; si devono legare a una breve regione di DNA a singolo filamento (che si forma facilmente, quando L<<T, in regioni ricche di coppie A-T); per questo loro requisito, non possono rilassare il DNA superavvolto in senso positivo (poiché questo non genera tratti a singolo filamento) e non riescono a rilassare in modo completo quello con superavvolgimento negativo. Il loro meccanismo consiste in una scissione a singolo filamento, per transesterificazione del fosfato in 5’ che viene legato a un residuo di tirosina; il 3’-OH libero viene mantenuto in posizione da legami non covalenti, mentre attraverso l’apertura può passare l’altro filamento (intatto). Dopo il cambiamento di L, la reazione di transesterificazione avviene in senso inverso per richiudere il filamento di DNA. Ne sono esempi le DNA topoisomerasi I e III di E. coli e un enzima di Saccharomyces cerevisiæ. Per ragioni di similarità di sequenza, sebbene idrolizzi ATP e introduca superavvolgimento positivo in un DNA superavvolto negativamente, si fa appartenere a questa classe la cosiddetta girasi inversa, che si trova in eubatteri e archebatteri termofili (ad es., in Sulpholobus acidocaldarius). Classe I-3’: rilassano completamente il DNA superavvolto sia in senso negativo (L<T, W<0) che positivo (L>T, W>0), facendo variare L di una o poche unità ad ogni ciclo catalitico. Non richiedono ATP; si legano a regioni a doppia elica e il loro meccanismo consiste in una scissione a singolo filamento, con la quale il fosfato in 3’ viene legato a un residuo di tirosina, lasciando libero il 5’-OH. Il filamento intatto fa quindi da perno intorno al quale ruota liberamente il tratto di DNA che contiene il filamento interrotto al 5’; il ciclo catalitico si chiude con la saldatura del filamento tramite l’inverso della reazione di transesterificazione. Questi enzimi sono tipici degli eucarioti, ma ne è stato trovato un esempio in un procariote ipertermofilo (Methanopyrus kandleri). Classe II: questi enzimi con struttura a simmetria dimerica introducono superavvolgimento positivo o negativo nel DNA, facendo variare L di 2 unità in valore assoluto ad ogni ciclo catalitico, durante il quale idrolizzano una molecola di ATP in ADP e Pi. L’isomerizzazione comporta una scissione a doppio filamento (a distanza di 4 pb), il trasferimento dei due legami fosfodiestere a due residui di tirosina (i 3’-OH liberi vengono però tenuti in posizione da legami non covalenti) e il passaggio di un altro segmento di doppia elica attraverso la rottura; l’idrolisi di ATP è richiesta per un cambiamento conformazionale dell’enzima necessario per riprendere il ciclo catalitico. Si trovano in tutti i gruppi filetici e sono essenziali per la replicazione del DNA; nei procarioti, subunità distinte catalizzano il cambiamento di L e l’idrolisi di ATP, mentre negli eucarioti queste funzioni risiedono nella stessa catena polipeptidica. Le DNA topoisomerasi di questa classe operano spesso su due molecole di DNA a doppia elica o su tratti distanti della stessa molecola (sottoclasse IIA). Invece, la DNA girasi di E. coli è una particolare topoisomerasi di classe II (sottoclasse IIB), che introduce superavvolgimenti solo negativi (L varia di 2 ad ogni ciclo catalitico) idrolizzando ATP e agisce su due tratti vicini della stessa molecola di DNA a doppia elica avvolta come un nodo intorno alle subunità dell’enzima. Tuttavia, in assenza di ATP (condizione non fisiologica), essa può rilassare il DNA superavvolto negativamente (facendo variare L di +2 ad ogni ciclo catalitico). Il confronto strutturale ha mostrato che gli enzimi di classe I-5’ sono evolutivamente imparentati con quelli della classe IIA, differendone solo per l’assenza del dominio ATPasico. 34 La rottura e risaldatura dei legami fosfodiestere in tutte le classi di DNA topoisomerasi non richiede energia perché è reversibile, in quanto consiste in reazioni di transesterificazione. L’enzima scinde un filamento trasferendo il legame fosfodiestere nel DNA dalla posizione 3’ (o 5’, nella classe I-3’) a un residuo di tirosina del sito attivo. La risaldatura avviene per inversione di questa stessa reazione. Nelle DNA topoisomerasi che hanno attività ATPasica, l’idrolisi di ATP serve per un cambiamento di conformazione dell’enzima (classe II) o per l’attività che separa i due filamenti (girasi inversa). [Altri dettagli nel file “BiologiaMolecolare4_Appendice.pdf”.] Il DNA circolare genomico e plasmidico che si trova nella cellula batterica, quando viene estratto con cautela, è intatto e mostra sempre un certo grado di superavvolgimento negativo (compresa tra 0,03 e 0,09). Questo stato è richiesto, come vedremo, sia per l’azione degli enzimi che iniziano la replicazione, sia per consentire la trascrizione ad opera della RNA polimerasi. Negli eucarioti, il superavvolgimento negativo contribuisce alla compattazione della cromatina: al livello inferiore di struttura (“perle sul filo”), un tratto di 146 pb di doppia elica forma 1,8 spire sinistrorse intorno a ciascun ottamero istonico: ciò richiede che il DNA sia superavvolto negativamente. Inoltre, durante la sintesi del DNA (fase S del ciclo cellulare) e nella metafase- anafase della mitosi, devono agire DNA topoisomerasi per separare le doppie eliche derivanti dalla replicazione della cromatina e per risolvere eventuali nodi tra DNA di cromatidi fratelli. 5.4. La DNA polimerasi di Kornberg (DNA polimerasi I di E. coli). Storicamente, il primo tentativo di accostamento ai meccanismi della replicazione del DNA nei batteri è di tipo biochimico. Nel 1957 (e quindi quasi contemporaneamente agli esperimenti di Meselson e Stahl), Arthur Kornberg purifica e successivamente caratterizza in vitro un enzima da E. coli che egli chiama DNA polimerasi. Questo enzima spesso è detto “polimerasi di Kornberg”, ma oggi è denominato, per le ragioni che vedremo in seguito, DNA polimerasi I di E. coli; esso è costituito da un’unica catena polipeptidica di massa molecolare pari a circa 103 kDa e rivela alcune caratteristiche sorprendenti e altre interessanti: 1) la sintesi del filamento di DNA avviene nella direzione 5’3’ e questa attività polimerasica utilizza come substrati monomerici i 2’-desossinucleosidi 5’-trifosfati (dNTP), complessati con Mg2+; durante la reazione di polimerizzazione, viene prodotto pirofosfato inorganico (PPi); 2) tale attività si ha solo in presenza di molecole di DNA preformate, che fungono da stampo per il filamento di nuova sintesi, il quale mostra caratteristiche di complementarità con lo stampo; 3) il DNA preformato deve inoltre possedere almeno un tratto in cui un filamento terminante con un gruppo 3’-OH sia perfettamente appaiato con un secondo filamento che funge da stampo, in maniera che quest’ultimo sopravanzi senza interruzioni tale terminazione: il gruppo 3’-OH libero dell’ultimo nucleotide ha la funzione di innesco essenziale per l’attività polimerasica; 4) la stessa proteina che porta l’attività polimerasica è dotata di un’attività esonucleasica che si esplica – in modo retrogrado rispetto all’attività polinerasica – sulla terminazione dell’innesco (esonucleasi 3’5’), rimuovendone per idrolisi 2’-desossinucleosidi 5’-monofosfati (dNMP) e ricreando quindi l’estremità 3’-OH libera; questa azione enzimatica si attua, in presenza di dNTP, quando l’innesco è mal appaiato con lo stampo, oppure in assenza di dNTP; 5) usando alcuni stampi di DNA opportuni, è possibile dimostrare una terza attività enzimatica portata dalla medesima proteina: se “a valle” dell’innesco appaiato al filamento che fungerà da stampo si trova un altro filamento, terminante con un gruppo 5’-fosfato, non perfettamente appaiato con lo stampo, questo verrà rimosso per idrolisi di un legame fosfodiestere interno alla catena e successivamente idrolizzato in 2’-desossinucleosidi 5’-monofosfati (nucleasi 5’3’). I diversi stampi-inneschi sui quali può agire la DNA polimerasi I sono illustrati nella Fig. 5.2. La sintesi di nuovo DNA a partire da queste molecole può essere descritta dai seguenti passaggi: 35 a) l’enzima si lega allo stampo-innesco in maniera che il sito attivo della polimerasi si trovi all’altezza del gruppo 3’-OH dell’innesco; b) un dNTP si colloca nel sito attivo in maniera da appaiarsi correttamente col primo residuo nucleotidico disponibile sul filamento stampo; c) l’atomo di ossigeno del gruppo 3’-OH compie un attacco nucleofilo sull’atomo di fosforo del dNTP, sostituendo il pirofosfato (gruppo uscente). Si forma in tal modo il legame fosfodiestere. Il nuovo residuo nucleotidico costituisce ora l’estremità 3’-OH (innesco) del filamento di DNA in crescita; l’enzima si sposta di un nucleotide sullo stampo per compiere un nuovo ciclo catalitico. Esso non riconosce specificamente quale dei quattro dNTP sta usando, ma solo il fatto che essi siano correttamente appaiati col nucleotide corrispondente sul filamento stampo. Fig. 5.2. Diversi tipi di stampo-innesco sui quali può agire la DNA polimerasi I di E. coli (“polimerasi di Kornberg”). L’azione della sola polimerasi su A) e C) permette la sintesi fino al termine dello stampo. Su B), essa terminerebbe davanti all’estremità 5’-fosfato (5’P) del filamento già appaiato allo stampo a valle dell’innesco, ma può procedere oltre se l’attività nucleasica 5’3’ degrada contemporaneamente tale filamento dall’estremità 5’P. Su D), l’attività polimerasica si può esplicare solo se la nucleasi 5’3’ rimuove per idrolisi almeno una parte del filamento a valle dell’interruzione (nick); in tal caso, il numero di nucleotidi appaiati allo stampo non varia e l’unico effetto delle azioni enzimatiche è lo spostamento del nick (“nick translation”) verso l’estremo 3’ del filamento sul quale si trova. Le punte di freccia indicano gli inneschi, le estremità tronche indicano le estremità 5’P interne ai filamenti-stampo. 5.5. Processività e attività catalitica scarse della DNA polimerasi I di E coli. Una domanda importante sull’azione delle DNA polimerasi (come di altri enzimi che agiscono su uno stampo polimerico) è la seguente: ad ogni ciclo catalitico, la proteina enzimatica si dissocia dalla molecola su cui agisce e si riassocia poi ad altre di ugual tipo, o resta associata alla stessa 38 figure sono perciò dette forme theta. Nulla però impedisce di pensare che una delle biforcazioni sia “fissa” e che l’altra si muova per tutto il circolo replicando la doppia elica fino a tornare nel punto d’inizio (modello unidirezionale). Furono tuttavia fornite prove sperimentali convincenti che il processo è bidirezionale, con le due forcelle che si muovono allontanandosi una dall’altra rispetto al punto di origine e replicando ciascuna una metà del circolo di DNA. La prima prova è di tipo genetico e per comprenderla adeguatamente occorre rendersi conto di come avvenga l’attivazione dell’inizio della replicazione e di come essa sia coordinata con la divisione della cellula batterica. Si è detto che un giro completo di replicazione in E. coli richiede 42 minuti in condizioni ottimali e a 37°C; tuttavia, il raddoppio del numero di cellule può avvenire anche ogni 20 minuti, durante la fase esponenziale di crescita in un terreno fresco ricco di nutrienti. Questo è possibile solo se la replicazione che termina con la produzione di due genomi separati per dare origine a due cellule figlie è stata cominciata 22 minuti prima della precedente divisione cellulare; di conseguenza, in una cellula che sta per dividersi, la replicazione sta procedendo con due forcelle replicative vicine alla terminazione, altre quattro forcelle (due per ciascuna doppia elica figlia) che sono circa a metà del giro di replicazione che produrrà la seconda generazione di doppie eliche e probabilmente altre otto forcelle (due per ciascuna dello quattro eliche della seconda generazione) che hanno iniziato la replicazione da circa 2 min (Fig. 5.3). Questo significa che, in un dato numero di cellule, i loci genici adiacenti all’origine di replicazione sono presenti in quantità maggiore (fino a quattro volte) rispetto a quelli che si trovano vicini alla terminazione e anche (circa due volte) rispetto a quelli che si trovano a metà strada tra l’origine e la terminazione. Fig. 5.3. Schema della replicazione del cccDNA genomico di E. coli durante la crescita in condizioni ottimali a 37°C. I pallini neri indicano i siti oriC (replicatori; se ne contano 8), T indica dove terminerà la replicazione, i numeri da 1 a 3 indicano le varie forcelle replicative di 1ª, 2ª e 3ª generazione, rispettivamente in numero di 2, 4 e 8. Lo schema mostra lo stato di replicazione pochi minuti prima della divisione cellulare, quando saranno completate le doppie eliche di 1ª generazione, la cui sintesi è iniziata 42 min prima; poiché l’intervallo tra una divisione e l’altra è ~20 min, la replicazione di seconda generazione è già arrivata circa a metà ed è già iniziata da qualche minuto quella di 3ª generazione. Quando fu fatta una stima quantitativa del numero di copie di diversi geni sparsi in vari punti della mappa di E. coli, durante la sua crescita esponenziale, fu trovato che in una direzione fissata sulla mappa a partire dall’origine di replicazione, il numero di copie dei loci genici (che era alto per 39 quelli adiacenti all’origine nel verso considerato) decresceva man mano che ci si allontanava dal replicatore, raggiungeva un minimo in punti della mappa diametralmente opposti a quello dell’origine e nuovamente aumentava nella seconda metà della mappa, fino a raggiungere gli stessi valori iniziali per loci vicini all’origine, ma dall’altro lato rispetto a quelli di partenza (Fig. 5.4, a sinistra). In altre parole, la molteplicità di copie decresceva simmetricamente su entrambi i lati dell’origine. Questo è il comportamento atteso se le due forcelle replicative si formano inizialmente nel locus del replicatore e si muovono poi con uguale velocità in direzioni opposte, ossia per una modalità di replicazione bidirezionale. Nel caso di una modalità unidirezionale, ci aspetteremmo invece una variazione monotòna del numero di copie dei vari geni a partire dall’origine, decrescente o crescente lungo tutta la mappa a seconda del verso in cui avviene il movimento dell’unica forcella replicativa (Fig. 5.4, a destra). Notiamo inoltre che il modello unidirezionale richiederebbe una velocità di avanzamento doppia per l’unica forcella replicativa, con un’attività minima di 1840 nucleotidi polimerizzati al secondo, e una frequenza doppia di attivazione di oriC (infatti il numero di copie di geni per cellula tenderebbe a 8). MODELLO BIDIREZIONALE MODELLI UNIDIREZIONALI Fig. 5.4. Il grafico a sinistra riporta il numero di copie per cellula, stimato sperimentalmente per diversi geni di E. coli, in funzione della loro posizione nella mappa genomica di questo batterio; la posizione a 84 min è quella dell’origine di replicazione oriC. I dati sono in accordo col modello di replicazione bidirezionale. Il grafico a destra mostra quale sarebbe l’andamento dei dati per modelli di replicazione unidirezionale, con forcella replicativa che segua la mappa (A) in senso orario (...) o (B) in senso antiorario (...). La seconda prova del modello di replicazione bidirezionale fu ottenuta con esperimenti di marcatura differenziale del DNA tramite radioisotopi introdotti nei suoi precursori monomerici e successiva autoradiografia osservata con tecniche di microscopia elettronica. L’idea che è alla base dell’esperimento è la seguente: 1) Se si introduce nel DNA una marcatura di intensità costante, dopo un certo tempo si osservano nell’autoradiografia file di macchioline per l’impressionamento della pellicola da parte dei raggi emessi dal radioisotopo; queste macchioline seguiranno la traccia del filamento di nuova sintesi, ma ovviamente non potranno indicare se il nucleotide che contiene il radioisotopo è stato incorporato prima o dopo un certo altro; se la marcatura è stata introdotta al momento dell’inizio della replicazione, la si troverà su tutte e due le doppie eliche comprese tra le forcelle in allontanamento e non ci sarà alcuna indicazione riguardo al movimento di una sola o di entrambe rispetto allo stampo. 2) Se però durante l’esperimento è possibile aumentare in misura notevole l’intensità della marcatura nel precursore dei nucleotidi, le macchioline saranno più fitte 40 nel tratto di DNA che è stato sintetizzato durante il periodo di marcatura più intensa e sarà quindi possibile individuare quali tratti di doppia elica sono stati replicati prima di altri. Nell’esperimento, i batteri in crescita erano trasferiti in un mezzo contenente [3H]timidina a radioattività specifica moderata e ivi mantenuti per alcuni minuti; in seguito, essi erano trasferiti in un mezzo contenente [3H]timidina con radioattività specifica assai elevata e ivi mantenuti per alcuni minuti; infine, ne veniva estratto il DNA con procedimenti blandi, tali da garantire la massima integrità della doppia elica. Dopo essere stato disteso su una superficie liquida, il DNA veniva raccolto e fissato su una pellicola sensibile alle radiazioni. Dopo il tempo necessario a un impressionamento adeguato, l’autoradiografia era infine osservata al microscopio elettronico. Il risultato dava un’immagine come quella riportata e schematizzata in Fig. 5.5. È evidente la simmetria nella distribuzione dei puntini: dove essi sono meno fitti, la sintesi del DNA è avvenuta durante il periodo di marcatura a bassa radioattività specifica, dove sono più fitti, la sintesi di DNA è avvenuta nel periodo di marcatura ad alta radioattività specifica; questi due tipi di regioni si trovano orientate nella stessa successione andando verso ciascuna forcella replicativa. La sintesi di nuovi filamenti di DNA avviene quindi simultaneamente a livello di tutte e due le forcelle. Fig. 5.5. A sinistra: autoradiografia al microscopio elettronico del DNA batterico in corso di replicazione con incorporazione di [3H]timidina a bassa e alta radioattività specifica: le frecce indicano la posizione stimata delle forcelle replicative. A destra (schema): le frecce orizzontali in basso mostrano i due periodi di diverso livello di radioattività specifica (freccia sottile, bassa radioattività specifica; freccia larga, alta radioattività specifica), durante i quali si è avuta replicazione di diversi tratti di doppia elica. Le frecce corte sottili (verticali) indicano i siti oriC, quelle corte (diagonali) indicano la doppia elica parentale non ancora replicata (i tratti di DNA non marcati sono invisibili nell’autoradiografia). 5.9. Biochimica della replicazione in vivo: il problema dell’antiparallelismo. Lo studio delle proprietà enzimologiche delle DNA polimerasi batteriche, messo a confronto coi dati sul movimento delle forcelle replicative, faceva sorgere una domanda imbarazzante. Poiché la sintesi di un nuovo filamento procede nella direzione della sua estremità 3’ e poiché i due filamenti di una doppia elica che fanno da stampo sono antiparalleli, come avverrà questo processo a livello di una forcella replicativa? In altre parole, nel verso di avanzamento di ogni forcella replicativa, uno dei filamenti stampo ha il giusto orientamento (3’5’ nel verso fisico di movimento della forcella) per produrre il proprio complementare orientato, secondo lo stesso verso, da 5’3’; viceversa, l’altro filamento stampo ha orientamento opposto (5’3’ nel verso fisico di movimento della forcella) e produrrebbe la crescita del nuovo filamento complementare a sé stesso con un movimento lungo lo stampo, retrogrado rispetto a quello della forcella replicativa. Il moto concorde sui due stampi potrebbe avvenire solo se ci fossero due enzimi diversi per ognuno di essi, uno del tipo di DNA polimerasi già noto, l’altro attivo su inneschi 5’-OH che usi 2’-desossinucleosidi 3’- trifosfati (anziché 5’-trifosfati) come precursori attivati. In tal modo, un filamento crescerebbe in direzione 3’ e l’altro in direzione 5’, col complesso dei due enzimi in moto in una sola direzione. 43 Gli esperimenti vennero perciò ripetuti utilizzando un ceppo mutante di E. coli che mancava della DNA-uracil glicosilasi. In questo caso, ci si aspettava che l’incorporazione errata di residui di uracile avvenisse ugualmente, ma che essa non fosse seguita dalla loro rimozione; i filamenti di nuova sintesi non sarebbero perciò stati tagliati in tali siti. In questi nuovi esperimenti, la marcatura si distribuiva a tempi brevi in due popolazioni di polideossinucleotidi: circa la metà del DNA appena sintetizzato appariva come materiale ad alto peso molecolare, mentre l’altra metà aveva peso molecolare corrispondente a filamenti di circa 2kpb. La marcatura a tempi lunghi mostrava, come nei precedenti esperimenti, che tutto il DNA di nuova sintesi era ad alto peso molecolare. I frammenti di Okazaki (come furono battezzati) erano quindi una realtà, ma rappresentavano gli intermedi transitori della replicazione solo per metà del DNA di nuova sintesi. L’interpretazione più semplice di questi risultati era la seguente: 1) il filamento con polarità 5’3’ nello stesso verso fisico di avanzamento della forcella replicativa è sintetizzato in maniera continua (leading strand o “filamento-guida”); 2) l’altro filamento è sintetizzato in maniera discontinua, sotto forma di frammenti di Okazaki, appaiati in successione sullo stampo del filamento parentale, e fu detto lagging strand o “filamento in ritardo”5; 3) la DNA ligasi salda infine uno all’altro i frammenti di Okazaki e produce un duplex con filamenti privi di discontinuità. cim a a ss e de l la p rove tt a f on doc ima as se de lla prov e t ta fo ndo 0000 c pmc pmA2 60 A2 60 cim a a ss e de l la p rove tt a f on doc ima as se de lla prov e t ta fo ndo 0000 c pmc pmA2 60 A2 60 Fig. 5.7. Profili di sedimentazione, in gradienti alcalini di saccarosio, del DNA estratto da cellule di E. coli dopo marcatura a impulso in presenza di [3H]timidina. La linea tratteggiata indica l’assorbanza a 260 nm, quella continua indica la radioattività (conti per minuto) nelle varie frazioni del gradiente; la freccia orizzontale indica la direzione di sedimentazione. In alto, esperimento originale fatto con ceppo selvatico; in basso, esperimento fatto col mutante privo di DNA-uracil glicosidasi; in 1 e 3, marcatura a impulso per 10 secondi; in 2 e 4, marcatura a impulso per 5 minuti. La Fig. 5.7 riassume schematicamente i risultati di un esperimento di Okazaki e collaboratori. Da essi, e dai precedenti esperimenti di altro genere, possiamo riassumere nel modo seguente le attuali 5 È opportuno sottolineare che ci si riferisce alla condizione dell’esperimento di Okazaki, cioè al ritardo col quale il DNA di nuova sintesi appare come polimero ad alto peso molecolare, non al ritardo nella sua sintesi come frammento di Okazaki rispetto al tempo di sintesi del suo complementare nel filamento-guida. Indicheremo perciò nel seguito i filamenti in replicazione usando i termini “filamento in sintesi continua”, “filamento in sintesi discontinua”. 44 conoscenze sul processo di replicazione in E. coli: la replicazione del DNA avviene in modo semiconservativo, semidiscontinuo e bidirezionale. Queste tre caratteristiche generali si ritrovano anche nei sistemi eucariotici, dove i frammenti di Okazaki sono più corti (poche centinaia di nucleotidi). In alcuni batteriofagi e virus si possono tuttavia trovare delle modalità di replicazione particolari che non richiedono la formazione di frammenti di Okazaki o con replicon unidirezionali; la modalità semi-conservativa è però quasi universale (vedi § 5.22). Il meccanismo di replicazione del DNA richiede comunque che genomi a singolo filamento (siano essi di RNA o di DNA) si replichino tramite intermedi a doppia elica, anche parziali e transitori. 5.12. La DNA polimerasi III di E. coli. Procedendo nell’esame della replicazione del DNA nei Batteri, riprendiamo l’aspetto biochimico di tale processo, esponendo le proprietà funzionali e strutturali degli enzimi che vi partecipano. In E. coli, sono state fino a oggi individuate e purificate cinque attività DNA polimerasiche, distinte nella nomenclatura da numeri romani: DNA polimerasi I, II, III (fino agli anni ‘80), IV e V (nel 1999). Abbiamo già preso in esame le proprietà molecolari della DNA polimerasi I, codificata dal gene polA (§ 5.4); la Tabella 5.1A mette a confronto alcune caratteristiche delle prime tre DNA polimerasi batteriche. Diciamo subito che la DNA polimerasi III, nella sua forma completa che contiene dieci tipi diversi di subunità (DNA polimerasi III oloenzima o Pol III*; le subunità e le loro funzioni sono riportate nella Tabella 5.1B), è l’enzima fondamentale nella replicazione; le mutazioni condizionali nel gene polC [dnaE] (che codifica la subunità catalitica ) sono sempre letali nelle condizioni non permissive. La DNA polimerasi II ha proprietà e funzioni che si possono capire solo in relazione a certi meccanismi di riparazione del DNA in cui è implicata; sembra inoltre che la sua subunità catalitica (codificata dal gene polB) sia l’unica specifica per questo enzima, ma essa è attiva in un complesso contenente altre subunità comuni all’oloenzima DNA polimerasi III come minimo le subunità , e . L’espressione del gene polB è inducibile dai danni al DNA che richiedono la riparazione “SOS”, sistema in cui la sintesi di DNA avviene anche su stampi danneggiati e senza rispettare l’appaiamento tra basi (sistema detto “incline all’errore”, poiché non copia fedelmente il filamento stampo). Ciò spiega il livello bassissimo di DNA polimerasi II trovato in cellule batteriche cresciute in condizioni normali. Poiché l’enzima non è richiesto per la crescita in tali condizioni, non sono noti mutanti letali condizionali del gene polB. Lo stesso vale per le DNA polimerasi IV e V, richieste per la riparazione del DNA. Tabella 5.1A Confronto fra le tre DNA polimerasi I, II e III di E. coli. Proprietà Pol I Pol II Pol III Numero di subunità diverse 1 4 o più 10 P.M. della subunità catalitica (kDa) 103 88 130 P.M. complessivo (kDa) 103 ? 842 Numero medio di molecole per cellula 4·10 1020 Massima attività polimerasica (nucleotidi·s) 20 7 750 ª Processività (nucleotidi aggiunti senza dissociarsi) 50 (media) >10 >5·10 Possiede una attività esonucleasica 3’5’ SÌ SÌ SÌ Possiede una attività nucleasica 5’3’ SÌ NO NO Richiede un innesco di DNA o RNA SÌ SÌ SÌ ª Aumenta fino a circa 1.000 in presenza di SSBP che mantengono lo stampo di DNA nella forma a singolo filamento. 45 Tabella 5.1B Subunità della DNA polimerasi III di E. coli: proprietà molecolari e funzionali. Subunità P.M. (KDa) copie per oloenzima Gene Funzione (alfa) 130 2 polC (dnaE) attività polimerasica (beta) 41 4 (2 x 2) dnaN massima processività (gamma) 48 2 dnaX ª ATPasi, processività (delta) 39 1 holA interagisce con ’ (delta primo) 37 1 holB stimola l’ATPasi di (epsilon) 27 2 dnaQ attività esonucleasica 3’5’ (theta) 9 2 holE stimola l’attività di (tau) 71 2 dnaX ª dimerizzazione dell’oloenzima (chi) 17 1 holC Lega le SSBP (psi) 15 1 holD Unisce e ª Il trascritto di dnaX può subire uno slittamento del quadro di lettura su un codone stop durante la traduzione: quando essa termina al codone stop, la proteina prodotta è , quando procede sul quadro di lettura alternativo, viene prodotta . Come si può osservare, l’oloenzima DNA pol III è il solo ad avere: 1) un’attività catalitica per molecola compatibile con la velocità di avanzamento delle forcelle replicative; 2) la processività elevata richiesta per questa funzione, proprietà che risulta dall’azione di diverse subunità, principalmente dalla , il cui dimero ha la forma di un “dado esagonale apribile” o “morsetto scorrevole”, in grado di circondare una doppia elica di DNA. La struttura di questo oloenzima sarà descritta più avanti (§ 5.18). Infine, il numero di molecole presenti in una cellula (da 10 a 20) è all’incirca quello richiesto per la massima velocità di crescita ottimale a 37°C. La richiesta di un innesco appaiato allo stampo è una caratteristica comune delle tre DNA polimerasi: anche su questo aspetto torneremo in seguito. Tutti e tre gli enzimi mostrano l’attività esonucleasica 3’5’: nella DNA polimerasi I essa è portata dalla stessa catena polipeptidica che contiene l’attività polimerasica, nell’oloenzima DNA polimerasi III le due funzioni sono portate da polipeptidi distinti (ed , rispettivamente). Viceversa, solo la DNA polimerasi I mostra attività nucleasica 5’3’, assente negli altri due enzimi. Esamineremo ora più in dettaglio qual è la funzione proposta per l’esonucleasi 3’5’ nella replicazione del DNA; vedremo più avanti che anche quella nucleasica 5’3’ associata alla DNA polimerasi I ha un ruolo nella replicazione (oltre che nella riparazione) del DNA. 5.13. La fedeltà della replicazione e l’attività correttiva associata alle DNA polimerasi. Come abbiamo già detto in precedenza, il tipo di nucleotide che una DNA polimerasi aggiunge all’estremità 3’-OH dell’innesco dipende dal residuo corrispondente sul filamento stampo. Ci aspettiamo quindi che a una C corrisponda sempre una G, a una T corrisponda sempre una A, eccetera. Tuttavia, ciò avviene se le basi puriniche e pirimidiniche si presentano nella loro forma tautomera più stabile (quella con gruppi amminici primari e gruppi chetonici come sostituenti). Se invece una base si trova in una forma tautomera meno stabile (ad es., con un sostituente in forma di gruppo imminico o un altro in forma di gruppo enolico), essa si appaia secondo regole diverse da quelle del modello di Watson e Crick. La citosina in forma 4-imminica si appaia all’adenina anziché alla guanina; la timina in forma 4-enolica si appaia alla guanina anziché all’adenina, e così via (la Fig. 5.7 riporta solo questi due esempi, ma le possibili coppie non canoniche sono molte di più). La frequenza con cui si verifica il fenomeno su ogni singola base è nell’intervallo 10÷10. 48 È quindi chiaro che alcuni errori del tipo mismatch possono essere corretti dalla DNA polimerasi in corso di sintesi. Si è detto “alcuni” per i seguenti motivi: 1) dal punto di vista probabilistico, la forma tautomera che ha prodotto l’errore di copiatura dello stampo può “resistere” per un tempo tale da garantire l’allungamento dell’innesco come se fosse appaiato in una coppia canonica di basi, mettendo fuori gioco l’azione correttiva dell’esonucleasi; il mismatch potrà quindi essere eliminato solo dall’altro sistema riparativo; 2) dal punto di vista cinetico, se un’accuratezza della replicazione quale è stata osservata dipendesse solo dall’azione proofreading, ciascun residuo nucleotidico del nuovo filamento dovrebbe essere “polimerizzato” in media poco più di due volte (così infatti la frequenza massima di errore passerebbe da 10a 10) e neppure l’oloenzima DNA polimerasi III ce la farebbe a completare il processo nei tempi osservati; 3) dal punto di vista energetico, una replicazione “raddoppiata” dlla correzione integrale avrebbe per la cellula un costo doppio, mentre una riparazione solo dei tratti contenenti mismatch ha prezzi energetici assai più contenuti. 5.14. Produzione degli inneschi necessari alla sintesi del nuovo filamento di DNA: la primasi. Come già detto (vedi § 5.12), le DNA polimerasi richiedono obbligatoriamente la presenza di un innesco appaiato al filamento stampo per poter esplicare la loro attività sintetica. Ci si può quindi chiedere in che modo l’enzima che opera la replicazione (secondo tutte le prove finora raccolte, la DNA polimerasi III) possa iniziare la sintesi di nuovi filamenti di DNA sugli stampi della doppia elica parentale. Questo innesco (in inglese: primer) è richiesto, per il filamento sintetizzato in maniera continua e per ciascuna forcella replicativa, solo nel sito di origine della replicazione; è invece richiesto per ciascuno dei frammenti di Okazaki, che sono gli intermedi per la replicazione del filamento sintetizzato in maniera discontinua, lungo l’intera molecola circolare di DNA. Non è quindi sorprendente che la ricerca sulla natura e l’origine degli inneschi sia partita dall’affermarsi del modello semidiscontinuo della replicazione. Negli esperimenti iniziali, prima dell’analisi su gradienti alcalini di saccarosio, il DNA era isolato su un gradiente di densità di solfato di cesio: a tempi brevi, il DNA radioattivo mostrava una densità di poco superiore a quella del DNA di E. coli (usato come riferimento), mentre a tempi lunghi la sua densità si sovrapponeva esattamente a quella di riferimento; questo dato si spiega con l’incorporazione di tratti di RNA nel DNA. Divenne ben presto chiaro che i frammenti di Okazaki avevano al 5’ dei brevissimi tratti di RNA, contenenti al massimo una decina di ribonucleotidi, sintetizzati sullo stampo a singolo filamento di DNA. La lunghezza di questi inneschi di RNA varia leggermente da una specie all’altra, come pure la sequenza dei primi residui, che talvolta è costante [in E. coli, l’innesco è del tipo pppApC(pN)8]. Notiamo che, essendo sintetizzati da zero, questi inneschi (come tutti gli RNA sintetizzati inizialmente da una RNA polimerasi) hanno il trifosfato al 5’ appartenente al primo nucleotide polimerizzato, in quanto il primo legame fosfodiestere, col distacco di pirofosfato, è formato tramite il fosforile del secondo nucleotide. È possibile capire che, a partire da questi inneschi, la DNA polimerasi III produce i frammenti di Okazaki terminanti in posizione 3’ subito a monte della terminazione 5’ del frammento di Okazaki sintetizzato in precedenza. Occorre quindi trovare un modello che preveda un avanzamento della DNA polimerasi III sullo stampo per il filamento in ritardo nello stesso senso di avanzamento della forcella replicativa, fino a trovare un innesco di RNA, e uno spostamento dell’enzima in direzione opposta per la sintesi successiva di un nuovo frammento di Okazaki. Vedremo più avanti un possibile modello per questo movimento (§5.18). Al momento in cui furono scoperti gli inneschi di RNA, doveva però anche essere identificato un enzima in grado di produrli: la RNA polimerasi che interviene nella trascrizione dei geni non aveva proprietà adeguate a questo ruolo. Fu invece trovato un altro enzima per questa funzione specifica: esso è detto primasi e consta di una proteina di 60 kDa codificata dal gene dnaG; tuttavia, tale enzima mostra in vitro un’attività molto bassa. Infatti, la sintesi degli inneschi di RNA richiede 49 nella cellula l’intervento di altre cinque proteine, due delle quali (DnaB e Dna C) sono implicate anche nelle fasi d’inizio della replicazione. Nell’insieme, esse formano con la primasi una struttura proteica detta primosoma, che partecipa alla replicazione del DNA in associazione con l’oloenzima DNA polimerasi III e con altre proteine, in un complesso detto replisoma. Prima di esaminare il funzionamento di tali complessi multiproteici, è tuttavia opportuno analizzare processi di altro genere, indispensabili all’intera e corretta replicazione del DNA. DNA parentale non ancora replicato 5’ 5’ 5’ 5’ 5’ 3’ 3’ 3’ 3’ 3’ filamento in ritardo filamento guida innesco di RNA verso di avanzamento della forca replicativa verso di sintesi continua del filamento guida verso di sintesi dei frammenti di Okazakisenso di spostamento del primosoma per produrre nuovi inneschi di RNA Fig. 5.9. Schema dei movimenti relativi della forcella replicativa e del primosoma che produce gli inneschi di RNA (indicati col tratto più spesso in grigio), e verso di sintesi dei due nuovi filamenti di DNA. Sono mostrati l’ultimo innesco prodotto in ordine di tempo (vicino alla forcella), l’ultimo frammento di Okazaki in corso di sintesi e l’estremità 5’ del filamento “in ritardo”. Le teste di freccia alle estremità dei filamenti indicano il gruppo 3’-OH sul quale possono agire le DNA polimerasi. Diamo quindi per scontato che l’avanzamento della forcella replicativa produce la sintesi di un nuovo filamento in maniera continua su uno dei filamenti stampo e di una serie di frammenti di Okazaki sull’altro filamento stampo tramite un replisoma che si muove nella direzione di avanzamento della forcella replicativa. La Fig. 5.9 illustra che il primo di questi due processi riguarda il nuovo filamento che cresce dalla propria estremità 5’ verso quella 3’ nella stessa direzione in cui si muove la forcella replicativa (il filamento stampo viene quindi letto nella stessa direzione da 3’ a 5’); il secondo processo invece riguarda la sintesi di frammenti di Okazaki che crescono ciascuno dalla propria estremità 5’ (fatta di RNA ad opera della primasi) verso quella 3’ in direzione opposta a quella di avanzamento della forcella replicativa, andando lungo il filamento 50 stampo da 3’ a 5’. Notiamo tuttavia che la sintesi di ogni nuovo innesco si sposta lungo lo stampo, rispetto al precedente, in direzione concorde al verso di avanzamento della forcella replicativa (ossia, da 5’ a 3’ sul filamento che fa da stampo ai frammenti di Okazaki). La sintesi di un frammento di Okazaki in E. coli richiede da 1 a 2 secondi (la loro lunghezza è infatti compresa tra 1 e 2 Kb e 1 kb/s è la velocità di sintesi raggiungibile dall’oloenzima DNA polimerasi III). Sappiamo che dopo una decina di secondi il filamento sintetizzato in maniera discontinua diviene continuo, e questo processo avverrà quindi a una certa distanza (circa 10 kpb) dalla forcella replicativa. Esso infatti richiede due enzimi indipendenti dal replisoma e deve necessariamente comportare: 1) l’eliminazione dei tratti al 5’ dei frammenti di Okazaki che contengono ribonucleotidi anziché desossiribonucleotidi; 2) la ricopiatura dello stampo fino all’ultimo nucleotide affinché non restino lacune nel filamento “in ritardo” (completamento dei frammenti di Okazaki); 3) la saldatura tra l’estremo 3’-OH di un frammento e il 5’-P del filamento in ritardo. In queste tre operazioni sono coinvolti due enzimi, uno dei quali ci è già noto (la DNA polimerasi I), mentre le proprietà funzionali dell’altro (DNA ligasi) verranno descritte più avanti. Perché gli inneschi sono prodotti dall’enzima che usa ribonucleotidi e non desossiribonucleotidi? A questa domanda non vi è una risposta semplice. Una domanda più adeguata è invece: potrebbe una DNA polimerasi (tra quelle conosciute) iniziare ex novo una catena polinucleotidica, facendo così a meno di un innesco? In questo caso la risposta è no. Infatti, l’appaiamento di un dinucleotide o di un trinucleotide è piuttosto labile e, dato che questi enzimi sono dotati di attività correttiva (esonucleasi 3’5’), essi mostrerebbero un “effetto Penelope”, disfacendo continuamente e rifacendo lo stesso tratto iniziale di DNA. Invece una RNA polimerasi come la primasi non è dotata di una attività correttiva e può iniziare ex novo una catena polinucleotidica, pur commettendo ogni tanto degli errori; tale sequenza di RNA, dopo aver assolto la sua funzione di innesco, può essere rimossa e sostituita da una sequenza di DNA prodotta da una DNA polimerasi fornita di attività correttiva. Così, tutto il DNA genomico può essere replicato con lo stesso livello di accuratezza. 5.15. Completamento e saldatura dei frammenti di Okazaki. La DNA ligasi. Prove sperimentali mostrano che, insieme alla DNA polimerasi I coinvolta nel completamento di ciascun frammento di Okazaki, la rimozione del tratto di RNA che si trova al 5’ del filamento in ritardo richiede una particolare RNasi (detta RNasi H, da hybrid, poiché agisce solo su un duplex RNA•DNA). Il primo di questi due processi richiede l’aggiunta di pochi nucleotidi (da 10 a 30) ed è quindi compatibile con la bassa processività dell’enzima suddetto; il secondo richiede invece anche l’azione di una nucleasi 5’3’, attività peculiare della DNA polimerasi I. Il risultato di queste azioni combinate è la formazione di una doppia elica di DNA mancante di un legame fosfodiestere tra il punto in cui la polimerasi ha cessato la sintesi e quello in cui la nucleasi ha operato il taglio per eliminare il tratto di RNA (vedi lo schema sottostante). Questa interruzione (nick) non può essere eliminata dalla DNA polimerasi: la saldatura avviene ad opera della DNA ligasi, che prenderemo tra breve in considerazione. Le attività nucleasiche rimuovono l’innesco di RNA poiché: 1) esso ha una struttura a doppia elica in forma A (anziché B, essendo un ibrido DNA-RNA); 2) esso presenta un trifosfato al 5’ (che non si troverebbe lì se il filamento fosse tutto di DNA) e che rende labile l’appaiamento del nucleotide che lo porta (repulsione elettrostatica dei fosfati); 3) nel caso illustrato dallo schema, la primasi aveva commesso un errore introducendo un U al posto di una C (la doppia elica è distorta). Si noti che lo schema mostra la nucleasi che taglia un paio di residui oltre la fine dell’innesco: la struttura A è infatti conservata per uno o due residui oltre quel punto. La DNA polimerasi sintetizza quindi un tratto di DNA di poche decine di nucleotidi, da qualche nucleotide al 3’ di un frammento di Okazaki fino a diversi nucleotidi entro l’estremità 5’ del filamento in ritardo (ossia l’estremità 5’ del frammento di Okazaki sintetizzato in precedenza). Se 53 Con un procedimento come quello descritto, fu identificato un tratto di DNA batterico dotato delle caratteristiche di origine della replicazione; con successive operazioni di “accorciamento” sull’uno e sull’altro estremo di questo frammento, fu definita una sequenza minima in grado di funzionare come oriC. Essa comprende in tutto 248 pb e presenta alcuni elementi caratteristici altamente conservati in tutti gli Enterobatteri finora studiati e riassunti nello SCHEMA 5.1. SCHEMA 5.I ELEMENTI DI SEQUENZA RILEVANTI NELLA REGIONE ATTIVA DI oriC 1 10 20 30 40 50 5’GATCTNTTTATTTNNGATCTNTTNTATTNNGATCTCTTATTAGGATCTCATTCACA- 3’CTAGANAAATAAANNCTAGANAANATAANNCTAGAGAATAATCCTAGAGTAAGTGT- 3 tridecameri ricchi in A·T che iniziano col palindromo 5’GATC3’ sito M 57 65 166 174 201 209 240 248 -TGTGGATAAN100TTATACACAN26TTTGGATAAN30TTATCCACA 3’ -ACACCTATTN100AATATGTGTN26AAACCTATTN30AATAGGTGT 5’ boxA R1boxA R2boxA R3boxA R4 4 nonameri di sequenza pressoché identica ma ad orientamento alternato Nel tratto di 100 pb compreso tra il primo e il secondo nonamero (N100) si trova per 4 volte il palindromo 5’GATC3’ che così compare 8 volte in tutta la sequenza. N = nucleotide variabile. Il nucleo di oriC contiene due tipi di elementi cis-attivi: nonameri (cioè sequenze di 9 pb) a orientazione alterna, e tridecameri (sequenze di 13 pb) ricchi in A·T; inoltre, contiene 8 ripetizioni del palindromo GATC, tre delle quali all’inizio dei tridecameri. Rimandando per ora il discorso sul palindromo GATC, vediamo come intervengono nonameri e tridecameri nell’attivazione di oriC , processo che è stato studiato in vitro su opportune molecole di DNA. Si noti che la definizione di replicatore afferma che esso ha un’attività genoma-specifica. Infatti, come vedremo subito, il riconoscimento e l’attivazione di un replicatore dipendono strettamente da proteine specifiche (iniziatori) che vi si legano. La definizione si può estendere ad altri gruppi tassonomici, qualora la manipolazione delle sequenze dotate di attività di replicatore sia possibile come nei batteri: in questo caso, occorre che la replicazione del DNA contenente tali sequenze sia osservabile nell’organismo considerato. Il lievito è un organismo eucariote in cui tali sequenze sono state identificate e sono dette ARS (Autonomous Replicating Sequences; vedi § 5.21). Un piccolo DNA circolare plasmidico intatto che porti oriC come unico replicatore può iniziare la replicazione in vitro se è superavvolto negativamente ed è posto a 30°C in presenza di ATP e di una particolare proteina, detta DnaA. In queste condizioni, i nonameri di oriC fungono da sito di legame specifico per il complesso DnaA·ATP, identificata come essenziale per il processo d’inizio della replicazione; in altre parole, DnaA è un iniziatore. Mutazioni letali sensibili alla temperatura nel gene dnaA (dnaAts) provocano un arresto lento nella replicazione del DNA. Questo significa che, nelle condizioni non permissive, i mutanti dnaAts completano la sintesi del DNA già iniziata nelle condizioni permissive, ma non possono dare inizio a una nuova replicazione. Viceversa, una mutazione condizionale in un gene che agisce nella fase di allungamento della replicazione (ad es., nel gene polC che codifica per la subunità catalitica della DNA polimerasi III) produce un arresto immediato della sintesi di DNA quando il mutante è nelle condizioni non permissive. Ma torniamo al modello plasmidico in vitro. Dopo che singoli complessi DnaA·ATP si sono legati ai quattro nonameri detti boxA (da R1 a R4) e al sito M di sequenza simile, altre molecole si aggregano a quelli iniziali tramite interazioni 54 tra proteine, finché la regione dei nonameri lega da 20 a 40 molecole di DnaA (complesso iniziale); la doppia elica in questa regione è avvolta intorno a questo aggregato proteico e ciò facilita la denaturazione delle regioni ricche di A·T presenti nei tridecameri, portando al complesso aperto. A questo punto, l’inizio della replicazione coinvolge altre due proteine che saranno richieste anche nella fase di allungamento: DnaB e DnaC, la prima delle quali ha attività di DNA elicasi. Due copie di DnaB·DnaC·ATP si legano al complesso aperto nella regione dei tridecameri, aprendo ulteriormente la doppia elica in una direzione e nell’altra, grazie all’azione di DnaB: si forma così il complesso di pre-innesco, dal quale può iniziare la sintesi vera e propria del DNA. Man mano che la doppia elica si apre, la proteina DnaA viene scalzata dalla regione dei nonameri. Vediamo come questo modello sperimentale si può ricondurre alle osservazioni in vivo. Anche se è noto che il DNA batterico è superavvolto negativamente, è probabile che la densità media di superelica non sia sufficiente ad attivare l’origine. In effetti, risulta necessaria l’attività della RNA polimerasi che opera la trascrizione; in un primo tempo, questo fatto era stato interpretato come se questo enzima producesse gli inneschi di RNA per il filamento sintetizzato in maniera continua. Ci sono infatti un paio di promotori (elementi cis-attivi richiesti per l’inizio della trascrizione) intorno all’origine, che portano alla sintesi di trascritti piuttosto corti (il gene dnaA è in questa regione). Poiché tuttavia l’attività della primasi è indispensabile per avviare la sintesi del DNA (anche del filamento sintetizzato in maniera continua), oggi si ritiene che gli eventi trascrizionali osservati abbiano la funzione di “concentrare” un superavvolgimento negativo a livello di oriC (ogni “bolla di trascrizione” introduce una variazione locale del superavvolgimento del DNA con W = 1,5); il fenomeno è quindi detto attivazione trascrizionale del replicatore. I due complessi DnaB·DnaC sono il nucleo intorno a cui si organizza la struttura dei primosomi. Dopo che si sono formati gli inneschi nell’origine di replicazione, le due forcelle replicative sorgono tramite l’organizzazione dei replisomi: l’oloenzima DNA polimerasi III inizia la sua attività e si associa subito ai primosomi, che proseguiranno la loro attività sintetizzando gli inneschi per i frammenti di Okazaki. Ma prima di arrivare al quadro d’insieme dell’avanzamento di una forcella replicativa, dobbiamo considerare altri due tipi di proteine importanti per questo processo. 5.17. Le DNA elicasi aprono la doppia elica e le SSBP stabilizzano il filamento singolo. Affinché una molecola di DNA parentale possa fungere da stampo per la replicazione, occorre che i due filamenti che la compongono siano separati e restino separati per un certo tempo e per un certo tratto. In condizioni cellulari e alla temperatura di 37°C alla quale è normalmente coltivato E. coli, la doppia elica è assai stabile: denaturazioni parziali e locali sono possibili grazie al superavvolgimento negativo introdotto dalla DNA girasi, ma la replicazione completa richiede che ciascun filamento venga separato del tutto dal suo complementare. Man mano che procede questa separazione (richiesta dall’avanzamento della forcella replicativa), una topoisomerasi di tipo II deve rilassare il superavvolgimento positivo (oppure introdurre superavvolgimento negativo) nel DNA che ancora non è stato raggiunto dalla forcella. 55 La stabilità termodinamica della doppia elica impone però che la sua apertura sia un processo attivo. Per questo sono necessarie le proteine dette DNA elicasi. Questi sono enzimi che idrolizzano ATP scorrendo su un filamento di DNA in una determinata direzione; richiedono quindi un breve tratto di DNA denaturato. Qualunque sia la specificità direzionale (da 3’ a 5’ o in verso opposto) e la modalità di azione (che vedremo più avanti), è stato misurato che le DNA elicasi idrolizzano 2 moli di ATP per mole di coppie di basi separate; poiché l’energia libera utilizzata per rompere i legami tra le basi è assai minore di quella dissipata, è probabile che l’idrolisi di ATP sia necessaria per due cambiamenti conformazionali della proteina ad ogni coppia di basi separata. L’azione di separare le basi sarebbe quindi spontanea per l’elicasi, ma produrrebbe un cambio conformazionale, dal quale l’enzima tornerebbe indietro attraverso reazioni che richiedono l’idrolisi di ATP. In E. coli sono state descritte e caratterizzate finora dodici DNA elicasi (nell’uomo ne sono state scoperte ventidue). Una l’abbiamo già citata: si tratta della proteina DnaB, che agisce nell’apertura dell’origine di replicazione e che entra a far parte successivamente del primosoma. Le mutazioni condizionali nel gene dnaB sono infatti letali con arresto rapido della replicazione, poiché la mancanza dell’elicasi attiva nel primosoma impedisce il procedere della replicazione sul filamento a sintesi discontinua; come vedremo più avanti, tale difetto blocca però anche la replicazione sul filamento a sintesi continua. Lo Schema 5.2 nella pagina successiva riassume proprietà generali e ruolo funzionale delle cinque DNA elicasi, alcune delle quali risultano necessarie alla replicazione (altre sono implicate nei meccanismi di riparazione e di ricombinazione); la prima elicasi caratterizzata (DNA elicasi I) ha modalità un po’ particolari di procedere sul DNA. Le altre quattro sono in un modo o nell’altro implicate nella replicazione, anche se il ruolo della proteina Rep non è del tutto chiaro. Si ritiene che l’elicasi II (e forse la proteina Rep) si trovino di fronte al replisoma per aprire la doppia elica parentale per l’avanzamento della forcella replicativa. Le proteine DNA B e PriA sono componenti del primosoma e quindi hanno sicuramente un ruolo nel preparare lo stampo per la sintesi del filamento in ritardo, con la modalità che prenderemo in esame più avanti. L’azione delle DNA elicasi è coadiuvata da quello della proteina che lega il singolo filamento (Single Strand Binding Protein = SSBP), soprattutto se l’elicasi ha azione processiva e catalitica (come è certamente il caso per le proteine DnaB, Rep e PriA). Le SSBP non hanno azione enzimatica, ma si legano al DNA a singolo filamento con alta affinità e senza riguardo per la sua sequenza nucleotidica. Sono facilmente spiazzate dalle DNA polimerasi e dalla primasi; esse mantengono il DNA a singolo filamento in maniera che sia disponibile per la sua funzione di stampo nella replicazione e lo preservano dall’azione di nucleasi che lo attaccherebbero. Ogni SSBP è un omotetramero di 76 kDa; mutazioni che ne inficiano l’azione producono arresto immediato della replicazione, il che dimostra che questa dipende dalla presenza di stampi a singolo filamento. Funzionamento schematico di una elicasi che svolge in direzione 3’5’come le proteine Rep e PriA 58 Pol III Oloenzima ' (CoPol III*) "Complesso " Pol III* Pol III' (Pol III) "core" x 2 ' x 2 (3'-5' esonucleasi) (DNA polimerasi) (+ ATP) (+ DNA stampo-innesco)(+ ATP) Fig. 5.11. Processo di automontaggio funzionale in vitro dell’oloenzima DNA Polimerasi III. Per i dettagli vedi il testo. 59 ATP ATP ATP ATP ATP ATP ATP + DNA stampo-innesco ADP + Pi 2 ’ ("core") + dNTP allungamento dell'innesco Fig. 5.12. Azione del complesso nel caricare il “morsetto mobile” su DNA stampo-innesco e successiva associazione del core a per allungare l’innesco in maniera processiva. Dopo il legame di ATP al complesso , la subunità cambia conformazione e può legare un dimero ; il DNA viene in qualche modo “inanellato” con , forse tramite l’apertura del dimero su uno dei lati; l’idrolisi di ATP riporta alla conformazione iniziale e fa dissociare il complesso . Il core, che spontaneamente tende a legarsi alla regione dell’innesco, s’incontra con e opera processivamente la sintesi di DNA. Il principale problema da risolvere è però l’orientazione opposta di sintesi dei frammenti di Okazaki e del filamento guida rispetto alla direzione globale di avanzamento della forcella replicativa. In base a osservazioni dettagliate al microscopio elettronico di forcelle replicative, e considerando il modello di DNA polimerasi III oloenzima descritto nella Fig. 5.11 (in cui le due subunità sono orientate nello stesso verso), è stato proposto il seguente modello (vedi Fig. 5.13): a) Il singolo filamento parentale che fa da stampo per la sintesi del filamento guida (e su cui la forcella scorre in direzione 3’5’) passa attraverso la subunità della DNA polimerasi e attraverso l’anello ad essa associato in questa metà dell’oloenzima, portando alla sintesi processiva del nuovo filamento a sintesi continua nella direzione 5’3’, concorde col verso fisico di avanzamento della forcella replicativa. Questa parte dell’oloenzima è stata montata nell’origine su ciascuna delle due forcelle replicative a livello degli inneschi per il filamento guida: il “morsetto mobile” rimane in tal modo sempre impegnato con questa subunità e con la doppia elica di DNA formata dal filamento stampo e da quello “guida” di nuova sintesi. b) Il singolo filamento parentale che fa da stampo per la sintesi dei frammenti di Okazaki (e su cui la forcella scorre in direzione 5’3’) passa nel primosoma e viene “filato” dalla elicasi DnaB per formare un’ansa che si ripiega poi verso il sito attivo della DNA polimerasi al quale è associato 60 il primosoma; in tal modo, questo filamento stampo cambia il suo orientamento spaziale rispetto all’oloenzima e si presenta al sito catalitico della subunità della DNA polimerasi III (che per tutta la sintesi di un frammento di Okazaki è associata a un “morsetto mobile” ) come se fosse parallelo all’altro stampo, suo complementare (modello “a coulisse”). L’ansa a singolo filamento è rivestita da SSBP e il primosoma può procedere su di essa grazie all’azione delle elicasi DnaB, che lo trascina verso la forcella, e PriA, che fila l’ansa in direzione opposta a quella di DnaB; l’ansa interagisce inoltre con il complesso dell’oloenzima tramite la subunità , che può legare le SSBP. Nello stesso tempo, la primasi sintetizza gli inneschi di RNA nel tratto iniziale dell’ansa, interrompendosi periodicamente (per ragioni di sequenza sullo stampo o altro meccanismo non ancora chiarito) per lasciare lo spazio necessario alla sintesi di un frammento di Okazaki. La DNA polimerasi III allunga questi inneschi e quando giunge in prossimità dell’innesco usato in precedenza, si dissocia (in <1 s) dall’elemento e si riassocia a un altro elemento simile, montato (in 0,5 s) dal proprio complesso sul nuovo innesco di RNA. Gli stampi a singolo filamento non impegnati con vari componenti del replisoma o del primosoma sono rivestiti da SSBP. Fig. 5.13. Uno dei due modelli proposti per l’azione della DNA Pol III oloenzima, delle elicasi e della primasi alla forcella replicativa (vedi testo a p. 61). Le tre fasi illustrate (A, B e C) si succedono ciclicamente in senso orario. Il DNA parentale è mostrato in nero, quello di nuova sintesi in grigio, gli inneschi di RNA sono in rosso scuro. In A è indicata la polarità 5’3’ dei filamenti di nuova sintesi. I frammenti di Okazaki sono indicati con O’, O”, O”’, O”” secondo l’ordine di sintesi: si noti, in A sul filamento in ritardo, la presenza del nick tra O” e O’ e l’innesco di RNA sull’estremità 5’ di quest’ultimo, in B la presenza di tre morsetti 2 . La freccia nera grande indica il verso d'avanzamento della forcella replicativa, quelle nere piccole indicano il verso di sintesi del DNA, quelle vuote sulla subunità dell’oloenzima mostrano la direzione dell’azione catalitica della DNA polimerasi. Nel primosoma, l’elicasi DnaB è indicata con la sagoma grigio-azzurro, senza dettaglio della sua struttura esamerica (per semplicità). 63 La proteina Tus, prodotta dal gene tus (da ter utilization substance, ossia “sostanza che utilizza le sequenze di terminazione”), media l’azione di terminazione sui replisomi legandosi a ciascuna delle sei sequenze ter (Fig. 5.14). Quando il replisoma giunge sul sito che ha l’orientazione opportuna, Tus inibisce l’elicasi DnaB del primosoma, e la replicazione ha termine. Poiché nella regione di terminazione, quando le due forcelle replicative si avvicinano ai segnali ter, rimane un tratto di DNA parentale a doppia elica troppo corto per consentire l’azione della DNA girasi (che deve avvolgere su di sé un segmento di DNA substrato), l’ultima fase della replicazione avviene in assenza di questo enzima. Il fatto non è più incompatibile con una rotazione dei filamenti stampo (si tratta di un migliaio di pb, ossia poche centinaia di avvolgimenti) e le due forcelle replicative proseguono la loro azione separandoli e replicandoli. Ovviamente, il prodotto di questa azione, dopo che tutte le lacune sono state colmate e i nick saldati, sono due cccDNA superavvolti e intrecciati uno sull’altro, configurazione topologica detta catenano. La ripartizione dei due genomi tra le cellule figlie non potrebbe avvenire senza l’intervento di una DNA topoisomerasi di classe II. La DNA girasi è incapace di questa azione, affidata alla DNA topoisomerasi IV, che risolve il catenano liberando le due doppie eliche dalla reciproca connessione; mutazioni condizionali nel gene per tale enzima sono letali in condizioni non permissive e le cellule mutanti, in queste condizioni, mostrano un abnorme accumulo di sostanza nucleoide (complessi DNA-proteine) fortemente aggrovigliata. Fig. 5.14. Complesso tra una sequenza ter e la proteina Tus, visto in due proiezioni ortogonali; in B si può notare che i residui (porzioni in rosso e in giallo) importanti per bloccare DnaB si trovano su un lato della doppia elica, possibile spiegazione per la direzionalità di azione delle sequenze ter. 5.21. Cenni sulla replicazione del DNA negli eucarioti. Quanto appreso fino a oggi sui sistemi eucariotici, principalmente ricavato da studi fatti su cellule di mammifero (anche umane) e sui loro virus, riguarda: a) le proprietà biochimiche delle loro DNA polimerasi (ne sono conosciute parecchie nel nucleo, una nel mitocondrio e una nel cloroplasto, per la replicazione dei DNA presenti in questi organuli); b) il modello di replicazione in vitro del DNA circolare di virus eucariotici, che hanno quindi svolto un ruolo importante, simile a quello dei plasmidi per lo studio dello stesso processo nei procarioti. La replicazione in vitro del cromosoma circolare del virus SV40 (un virus tumorigeno dei mammiferi) richiede solo otto componenti proteici purificati da cellule di mammifero e una proteina virale. L’origine di replicazione è unica e viene riconosciuta ed aperta dall’antigene tumorale 64 grande (antigene T grande) di SV40, una proteina multifunzionale che ha attività sia di iniziatore sia di DNA elicasi; in questa azione, l’antigene T grande è assistito dal fattore di replicazione A (RFA) cellulare, che agisce come SSBP. La sintesi del DNA segue il modello già visto in E. coli: è bidirezionale e semidiscontinua. Tuttavia, sono necessarie due diverse DNA polimerasi (entrambe multimeriche) per la sintesi dei due filamenti, quello continuo e quello discontinuo: il primo è prodotto dalla DNA polimerasi , mentre il secondo è prodotto sotto forma di corti frammenti di Okazaki dalla DNA polimerasi . Quest’ultima porta anche, su una della sue subunità, un’attività di primasi. Non si ha la formazione di un primosoma e la sintesi degli inneschi e dei tratti iniziali dei due filamenti continui nell’origine avviene ad opera della DNA polimerasi in associazione con il fattore di replicazione C (RFC) che la attiva. Dopo poche centinaia di nucleotidi sintetizzati, un’altra proteina cellulare si associa alla forcella replicativa nascente: è l’antigene nucleare delle cellule proliferanti (PCNA). Esso inibisce e spiazza la DNA polimerasi alla quale si sostituisce la , anch’essa combinata con RFC che la attiva, e la sintesi del filamento continuo prosegue in maniera altamente processiva. PCNA è un omotrimero ad anello, la cui subunità mostra similarità di sequenza con la subunità della DNA polimerasi III di E. coli. A questo punto, la DNA polimerasi (in complesso con RFC) si lega all’altro filamento stampo su ciascuna forcella replicativa e inizia la sintesi dei frammenti di Okazaki. L’avanzamento e la terminazione presentano caratteristiche simili a quelle viste nei batteri: occorrono almeno un’elicasi, una DNA ligasi e una DNA topoisomerasi di tipo II. Ci sono due differenze sostanziali tra il modello virale e il cromosoma della cellula eucariotica. La prima è che il cromosoma ha moltissime origini di replicazione (il cromosoma più lungo di Drosophila melanogaster ne contiene circa 10.000) e ciò permette che la fase S nel ciclo cellulare mitotico duri poco più di un’ora, anche se le forcelle replicative eucariotiche sono trenta volte più lente di quelle batteriche. I cromosomi eucariotici contengono perciò moltissimi replicon. Finora si sa poco sulla natura dei replicatori eucariotici, salvo che nel lievito Saccharomyces cerevisiæ; qui sono stati identificati, nei 400 replicon dei suoi 17 cromosomi, elementi di circa 180 pb ricchi di A·T detti ARS (autonomously replicating sequences, sequenze che si replicano autonomamente). La seconda differenza è che i cromosomi contengono molecole di DNA a doppia elica lineari e non circolari, il che richiede meccanismi particolari affinché ad ogni ciclo cellulare la replicazione di queste molecole sia completa e avvenga una sola volta. Le ARS contengono elementi di sequenza conservati, che legano il complesso di riconoscimento dell’origine (ORC). L’ORC contiene sei polipeptidi separati, Orc1-6, alcuni dei quali posseggono domini ATPasici AAA+ (ATPasi Associate a varie Attività cellulari). Orc1 è anche simile a un altro fattore di replicazione, Cdc6 (Cdc18 in Schizosaccharomyces pombe), a indicazione che Orc1 e Cdc6 potrebbero avere un antenato comune. Anche se ORC agisce da complesso che si lega al DNA a sequenze specifiche nel lievito di pane, in S. pombe e negli eucarioti più complessi non c’è una chiara sequenza di consenso per le origini, pur se in molti casi essi tendono a essere regioni ricche di A-T. Infatti, in oociti di Xenopus laevis, qualunque sequenza sembra in grado di iniziare la replicazione del DNA. Un cumulo crescente di prove indica che, anziché basarsi sul riconoscimento sequenza-specifico del DNA da parte di ORC, negli eucarioti più complessi le origini sono definite dal reclutamento facilitato di ORC da varie altre proteine che legano il DNA. Non è ancora chiaro fino a che punto questo sia un effetto diretto o mediato da alterazioni secondarie nella cromatina. 5.22. Cenni sulla replicazione del DNA lineare: i modelli fagici e la telomerasi degli eucarioti. Il modello di DNA circolare dei batteri, plasmidi e di alcuni fagi e virus eucariotici ha un pregio: non lascia alcuna sequenza non replicata. Infatti, è possibile addirittura che nel medesimo ciclo di replicazione la regione della terminazione sia in parte degradata e risintetizzata. Questo spreco apparentemente inutile lascia intuire che il problema della completezza è tutt’altro che secondario: 65 nelle molecole lineari di DNA, questo problema deriva dall’impossibilità di produrre alle estremità 5’ dei nuovi filamenti un frammento di Okazaki. I batteriofagi mostrano una molteplicità di meccanismi dettagliati per la replicazione del loro genoma, anche in funzione del fatto che esso sia DNA circolare o lineare, a singolo o a doppio filamento, o ancora che sia fatto di RNA. Consideriamo quanto avviene nel caso della molecola di DNA lineare a doppia elica del batteriofago T7 (Fig. 5.15). Teniamo presente che, quando un fago si moltiplica all’interno dell’ospite, si producono diverse centinaia di unità genomiche fagiche per cellula. Poiché la replicazione del genoma di T7 deve avvenire secondo il modello bidirezionale e semidiscontinuo, le porzioni al 5’ di ciascun nuovo filamento (che sono tratti di filamento a sintesi discontinua) non vengono sintetizzate poiché manca lo spazio all’estremo 3’ del filamento stampo per la produzione di un ultimo innesco per un frammento di Okazaki. Tuttavia, il genoma di T7 mostra una particolarità: la sequenza di 160 pb alla sua estremità sinistra è ripetuta in orientamento diretto anche all’estremità destra. Ne deriva che le estremità 3’ dei due filamenti sono complementari in senso antiparallelo (nella figura, per semplicità, sono indicate cinque lettere per simbolizzare questa situazione; ovviamente, lo stesso discorso vale per le estremità 5’, ma qui ci serve mettere in evidenza il primo fatto). ATGA C TACTG A TGAC TA CTGO a) b) c) d) e) f) TACTG ATGA C ATGA C TACTG TA CTG A TGAC A TGAC TA CTG Fig. 5.15. Replicazione tramite estremità con sequenze ripetute dirette di 160 pb (simbolizzate dal tratto spesso e dalle lettere) e formazione di concatenameri nel DNA lineare di T7. Le punte di freccia indicano le estremità 3’. a) struttura del genoma completo (O è l’origine di replicazione bidirezionale); b) la replicazione produce due filamenti incompleti al 5’ a causa della mancanza di un ultimo frammento di Okazaki; c) i genomi si appaiano tramite le estremità ripetute non replicate (sticky ends = “estremità adesive”), la DNA polimerasi I riempie le lacune allungando le estremità 3’ e la DNA ligasi salda i nick, formando un concatenamero; d) un’endonucleasi specifica del fago compie un taglio molto sfalsato a doppio filamento che lascia sporgente il 5’; e) i due genomi si dissociano, con filamenti (ora incompleti al 3’) che sono completati [f)] tramite una DNA polimerasi. I genomi incompleti possono quindi appaiarsi come mostrato in Fig. 5.15c: le estremità 3’ che sporgono ai due lati di ciascun genoma sono “appiccicose” (in figura, per semplicità, è mostrato solo l’appaiamento tra due genomi incompleti, ma si formano in realtà catene di parecchi genomi). Ora i tratti non replicati sono lacune a singolo filamento in doppie eliche altrimenti complete e possono essere riempite dalle DNA polimerasi I o III allungando le estremità 3’ dei filamenti