Scarica Biologia molecolare di base e più Dispense in PDF di Biologia Molecolare solo su Docsity! 67 CAPITOLO 6 6.1. I meccanismi fondamentali dell’espressione genica. Espressione genica significa realizzazione del programma di funzioni cellulari codificato nel genoma. Ciascun gene può quindi dirigere la formazione di una macromolecola cellulare (prodotto genico) attraverso determinate istruzioni in esso codificate. Come abbiamo già visto per il processo di replicazione del DNA, occorre tenere presente che queste istruzioni richiedono, per essere eseguite, l’intervento di parecchi altri prodotti genici con diverse funzioni biochimiche, che hanno ruoli di rilevanza generale. L’espressione genica non è quindi un processo lineare, ma il risultato di moltissime operazioni tra loro interconnesse in una rete complessa. I prodotti genici sono essenzialmente di due tipi: RNA e proteine. 1) Gli RNA si distinguono in stabili (RNA ribosomale o rRNA; RNA transfer o tRNA; negli Eucarioti esistono altre classi di RNA stabili che sono prodotti di specifici geni) e instabili, degradati entro poco tempo dalla loro sintesi (quasi tutti gli RNA messaggeri o mRNA, RNA antisenso in Procarioti e microRNA o miRNA in Eucarioti, con funzioni regolatorie sugli mRNA); 2) I geni per le proteine sono trascritti dapprima in mRNA, poi tradotti da ribosomi. Tutti gli RNA vengono prodotti dal processo della trascrizione, che consiste nella sintesi di un filamento di RNA (denominato trascritto) complementare a uno solo dei filamenti di DNA del gene; è possibile quindi riconoscere, nella sequenza di basi dell’altro filamento, la sequenza di basi dell’RNA che costituisce il prodotto genico, tenendo conto della sostituzione della timina con l’uracile. Ogni gene contiene quindi un filamento che ha la stessa sequenza del trascritto, per cui viene detto filamento-sequenza o filamento-senso, mentre l’altro avrà sequenza complementare al trascritto e viene perciò detto filamento-stampo o filamento-antisenso. La trascrizione richiede diverse proteine, tra cui la principale è la RNA polimerasi; inoltre richiede specifici segnali sul DNA (sequenze di controllo cis-attive) che indichino quale sia il filamento-stampo da copiare e in che direzione debba avvenire la trascrizione, dove essa debba iniziare e terminare (ossia quali siano i limiti del gene propriamente detto), quanto debba essere abbondante la trascrizione di quel gene, se essa debba essere diminuita o aumentata in determinate circostanze, ecc. Si numera nella sequenza del filamento-senso la posizione dei vari nucleotidi rispetto a quello da cui inizia la trascrizione (detto IS = Initiation Site, o sito d’inizio); questo è indicato con “+1” e le posizioni successive trascritte in direzione 3’ del filamento-senso sono numerate con interi positivi successivi. La sequenza non trascritta che precede IS è numerata con interi negativi: il nucleotide subito prima di IS è “–1” (non c’è la posizione “0”) e via retrocedendo verso il 5’ del filamento- senso; le regioni in tale sequenza sono indicate con “a monte” (upstream) e “a valle” (downstream) secondo che si trovino verso il 5’ o verso il 3’ rispetto a IS. I polipeptidi sono sintetizzati con meccanismo complesso, che richiede prima la trascrizione del gene in mRNA, poi la traduzione della sequenza di basi dell’mRNA in sequenza di amminoacidi nel polipeptide. Per la seconda operazione è richiesto innanzitutto un codice di traduzione (detto codice genetico) che fa corrispondere a una disposizione in sequenza di tre nucleotidi da 5’ a 3’ (tripletta o codon) un determinato amminoacido. Infatti, poiché le basi negli mRNA sono quattro, solo con un codice a triplette, capace di 43 = 64 disposizioni, è possibile specificare i 20 diversi amminoacidi proteici. Dei 64 codon possibili, 61 codificano amminoacidi (codon sense; ci sono più codon, da 1 a 6, per uno stesso amminoacido, ossia il codice è ridondante); i restanti 3, UAA, UGA e UAG, non codificano amminoacidi e servono da segnali di terminazione della traduzione (codon STOP o nonsense)1. 1 Ci si riferisce qui al cosiddetto “codice genetico standard”, che non è universale per via di diverse varianti (ad es., quelle dei Protisti Ciliati, e quelle dei mitocondri e cloroplasti, organuli che hanno propri distinti apparati di traduzione). Poiché qui si parlerà di traduzione nei Procarioti e in particolare negli Batteri Gram+ o Gram–, il codice standard sarà ritenuto senza eccezioni, salvo diversa indicazione. 68 Data una sequenza polinucleotidica, è possibile dividerla in triplette in tre modi diversi (sei, se si considera la possibilità che nel DNA il filamento-sequenza sia l’uno o l’altro): ognuno di tali modi è detto quadro di lettura. Un polipeptide è codificato in un quadro di lettura aperto (open reading frame, ORF) cioè un quadro di lettura con parecchie decine o centinaia di codon sense consecutivi senza l’interposizione di codon STOP; l’ORF deve iniziare con un particolare codon sense (AUG) detto codon d’inizio della traduzione (nel codice AUGmetionina). Se però AUG è seguito a breve distanza da un codon STOP, si parla di quadro di lettura chiuso. Sono inoltre richiesti apparati molecolari per operare la traduzione di mRNA e realizzare la biosintesi proteica: essi comprendono gli rRNA, che con le proteine ribosomali (RP) costituiscono i ribosomi, i tRNA, che fanno da adattatori tra amminoacidi e codon sense, enzimi specifici che uniscono ciascun amminoacido al tRNA che gli corrisponde, e fattori proteici che intervengono nelle varie tappe del ciclo di funzionamento del ribosoma. Il prodotto immediato della trascrizione (trascritto primario) e della traduzione (polipeptide nascente), può subire modificazioni nella struttura covalente che ne determinano il raggiungimento della forma funzionalmente attiva. Si parla in generale di modificazioni post-trascrizionali (o maturazione) per gli RNA, e modificazioni post-traduzionali (o elaborazione) per i polipeptidi. Notiamo che in entrambi i casi le modificazioni sono operate da enzimi specifici, che per lo più hanno natura proteica, ma che in alcuni casi possono essere di natura poliribonucleotidica (catalisi da RNA). Tutte le altre macromolecole e molecole intra- ed extra-cellulari specifiche della specie o del tipo cellulare sono prodotte da reazioni catalizzate dagli enzimi che derivano dall’espressione dei propri rispettivi geni. Alcuni aspetti biochimici della trascrizione e della traduzione risultano essere identici in tutti gli organismi, Procarioti ed Eucarioti. Ad esempio, a causa del meccanismo con cui funzionano tutte le RNA polimerasi, la trascrizione inizia sempre all’estremità 5’ del trascritto con un trifosfato e termina alla sua estremità 3’ il cui gruppo -OH è libero. I codon sono tutti orientati da 5’ a 3’, cosicché l’mRNA è tradotto seguendo questa direzione di scansione della sua sequenza. Infine, in tutti i sistemi viventi, la biosintesi proteica inizia dal terminale –NH2 di un polipeptide e procede verso quello -COOH; ciò significa che i primi amminoacidi (N-terminali) di una proteina sono codificati nella porzione di mRNA più vicina all’estremità 5’, mentre gli ultimi residui (C-terminali) sono codificati dalla porzione più vicina all’estremità 3’. 6.2. Importanti differenze tra Procarioti ed Eucarioti nei meccanismi dell’espressione genica. La principale caratteristica distintiva tra Procarioti ed Eucarioti è l’assenza di un involucro nucleare nei primi, mentre nei secondi è presente questa struttura a doppia membrana che per gran parte del ciclo cellulare divide fisicamente il contenuto nucleare dal citoplasma. Vi sono anche differenze connesse all’organizzazione fisica del DNA: la tipica struttura della cromatina eucariotica non si trova nei batteri, sebbene anche il DNA di questi organismi sia associato a proteine basiche. Inoltre, il modo in cui i geni sono organizzati tra loro e al proprio interno è diverso nei due Domini2. Tutte queste distinzioni si riflettono sulle modalità di esecuzione dei meccanismi di espressione genica. Consideriamo la prima differenza basale, dovuta alla presenza/assenza di un involucro nucleare. Negli Eucarioti vi è necessariamente una separazione spaziale e temporale fra la trascrizione di un gene che codifica una proteina e la traduzione del corrispondente mRNA: la prima avviene nel nucleoplasma e deve completarsi prima che nel citoplasma abbia inizio la seconda; tra i due eventi deve attuarsi (come minimo) il trasporto dell’mRNA dal nucleo al citosol attraverso i pori nucleari. Invece nei Procarioti, non essendovi questa separazione, l’estremità 5’ del trascritto 2 Si fa riferimento alla classificazione dei viventi secondo Woese (1977), che distingue tre Domini, Eukaryota, Prokaryota e Archaea. Il terzo Dominio qui non è nominato, perché alcuni aspetti dei meccanismi di trascrizione sembrano simili a quelli studiati nei Procarioti (ai quali gli Archei erano assimilati nelle precedenti classificazioni, come quella di Whittaker, e inclusi con loro in un solo “Impero” da Cavalier-Smith in anni recenti), mentre la struttura della RNA polimerasi sembra più vicina a quella di Eucarioti come i lieviti (Saccharomyces cerevisiæ). 71 alcune decine di nucleotidi senza quadro di lettura aperto tra un codon di STOP e il successivo codon d’inizio: queste sono dette regioni intercistroniche e il loro significato è trattato in seguito. La sequenza dell’mRNA procariotico ora descritta ricalca fedelmente (o, con termine più tecnico, è colineare) quella corrispondente nel DNA dell’unità trascrizionale, con l’importante differenza che questa è costituita da una doppia elica, mentre il trascritto è a singolo filamento. Inoltre, questa è soltanto la regione trascritta: come si è già detto, fa parte essenziale dell’unità trascrizionale la regione di controllo della trascrizione, composta come minimo dal promotore, e della quale diremo nel prossimo paragrafo. Tale regione si trova a monte della regione trascritta. 6.4. La RNA polimerasi di E. coli e i suoi promotori. Poiché la regione di controllo di un’unità trascrizionale non è trascritta, occorrono metodiche particolari per metterla in evidenza e per studiarne la struttura. Essa deve contenere sequenze di DNA riconosciute dalla RNA polimerasi, in modo che essa vi si leghi; un certo tratto della doppia elica dovrà aprirsi esponendo le basi sui singoli filamenti, uno dei quali, il filamento-antisenso, fungerà da stampo per iniziare e poi proseguire la sintesi del trascritto. Perché questo processo vada a buon fine, occorre che le sequenze del promotore e la stessa RNA polimerasi abbiano una struttura asimmetrica, ossia orientata in un verso univoco sulla doppia elica di DNA. Una definizione operativa di promotore basata su un saggio in vitro è la seguente: un frammento specifico di DNA che, se è saldato a un qualunque altro frammento, ne determina la trascrizione, ossia la sintesi di un poliribonucleotide (pRN) con sequenza specificata da tale frammento, in presenza di RNA polimerasi, di ioni Mg2+ e dei quattro ribonucleosidi 5’-trifosfati (NTP). La RNA poimerasi catalizza la la sintesi del pRN secondo l’equazione bilanciata: DNA contenente un promotore aATP + cCTP + gGTP + uUTP pRNa+c+g+u + (a+c+g+u – 1 )PPi RNA polimerasi + Mg2+ Il promotore è quindi un elemento di sequenza (o gene) cis-attivo, poiché determina la trascrizione della molecola di DNA sulla quale esso stesso si trova. La misura quantitativa della velocità di trascrizione (quantità di trascritto prodotta nell’unità di tempo) consente di definire l’efficienza del promotore. Una volta identificato il tratto di DNA dotato di questa caratteristica, è possibile analizzarne la sequenza e individuarne gli elementi essenziali. Poiché non tutti i promotori della stessa classe hanno esattamente la stessa sequenza, questa è indicata con un “paradigma”, detto “sequenza di consenso” o consenso. Esso riporta le basi più frequenti in ogni posizione o la lunghezza più frequente di sequenze non specifiche, come illustrato nella nota (1) della Tabella 6.I. La RNA polimerasi (RNAP) di E. coli è un enzima composto da diverse subunità: si distingue innanzitutto un core (parte centrale) dell’enzima, ’, di massa molecolare (M) ~390 kDa; le subunità hanno le seguenti M: = 36,5 kDa, = 151 kDa, ’ = 155 kDa, = 10 kDa. L’attività catalitica risiede nella subunità : diverse mutazioni che rendono l’enzima resistente all’azione inibitoria degli antibiotici rifampicina e streptolidigina (che bloccano rispettivamente l’inizio e l’allungamento del trascritto) mappano nel gene che codifica questa subunità (rpoB). Un modello della struttura tridimensionale dell’enzima è stato ottenuto nel 2002 per la RNAP di Thermus aquaticus, mentre le sequenze amminoacidiche di tutte le subunità sono note in vari batteri. Le subunità e ’, per quanto di dimensioni simili, non presentano rilevanti omologie; quella ’ (gene rpoC) lega il filamento stampo di DNA nella regione trascritta; la coppia di subunità (gene rpoA) interagisce col tratto di DNA che si trova più a monte e che in alcuni promotori presenta elementi di sequenza rilevanti per l’attività, di cui si dirà più avanti. La concentrazione intracellulare di RNA polimerasi in E. coli è intorno a 5x10 M, corrispondente a circa 5000 molecole per cellula. La subunità (gene rpoZ) fu considerata per anni una curiosità, poiché non era nota la sua funzione e non risultava necessaria per l’attività. Si sa oggi che essa è necessaria per ripristinare la RNAP denaturata in vitro e per dare la forma completamente funzionante. Si lega simultaneamente alle estremità N- e C-terminali della subunità ’. 72 Il core della RNA polimerasi, tuttavia, non può da solo dare inizio alla trascrizione; esso può invece legarsi al DNA senza riconoscere alcuna sequenza specifica (Kdiss 5x10 M) e se ne dissocia lentamente (t½ per la dissociazione 60 min). Per riconoscere un promotore, è necessario che al core si associ un altro tipo di subunità, chiamata sigma (). Il complesso ’, detto RNA polimerasi oloenzima, ha un’affinità elevata per i promotori (Kdiss 5x10 M) dai quali si dissocia lentamente (t½ per la dissociazione 23 h), ma un’affinità bassa per il DNA fuori dei promotori (Kdiss 2x10 M) dal quale si dissocia prontamente (t½ per la dissociazione 3 s). Pertanto, il core inattivo si può legare in un punto qualunque del DNA; se la subunità vi si associa, l’oloenzima scorre sul DNA fino a trovare un promotore, formando un complesso chiuso oloenzimapromotore; si ritiene che l’oloenzima scorra sul DNA (anziché associarsi e dissociarsi ripetutamente) perché la costante di velocità sperimentale per la formazione del complesso chiuso è circa 1010 M s, nettamente superiore al valore massimo possibile (108 M s) se l’oloenzima libero diffondesse in tre dimensioni per cercare il promotore. A questo punto inizia l’attività trascrizionale: il complesso chiuso si trasforma lentamente in complesso aperto, ossia un tratto del promotore di ~ 12 pb si denatura in singoli filamenti (in vitro e a 37°C, questa reazione richiede da 1 a 10 minuti); in tal modo i NTP possono appaiarsi col filamento-stampo e subito dopo si forma il legame fosfodiestere tra i primi due ribonucleotidi. Ci sono in E. coli varie forme alternative di subunità che permettono a RNAP di riconoscere diversi tipi di promotore; esse sono indicate dalla lettera greca con all’apice la massa molecolare in kDa oppure sigle riferite ai rispettivi geni (vedi Tabella 6.I). La forma “standard” (richiesta per trascrivere la maggior parte dei geni per le funzioni cellulari comuni) ha M=70 kDa ed è perciò detta 70. L’oloenzima ’70 (indicata in seguito come oloenzima 70) ha massa molecolare complessiva di ~460 kDa e un diametro di ~200 Å, se si assume che sia di forma sferica. Tabella 6.I Specificità delle diverse subunità e dei rispettivi promotori in E. coli Subunità Promotori riconosciuti Sequenza a monte(1) Sequenza a valle(1) 70 (rpoD) Funzioni cellulari comuni TTGACA (box 35) TATAAT (Pribnow box o box 10) 32 (rpoH) Indotti da shock termico TCTCNCCCTTGAA CCCCATNTA 28 o F (rpoF) Motilità e chemotassi CTAAA CCGATAT 38 o S (rpoS) Per la fase stazionaria ancora ignota ancora ignota 54 [rpoN (ntrA, glnF)] Metabolismo azotato CTGGNA (box 24) TTGCA (box 12) (2) E (rpoE) (3) stress termico/ossidativo, proteine extracitoplasmiche GAACTTTT GTCA/TA/GA (4) FecI (fecI) trasporto del ferro dicitrato ancora ignota ancora ignota (1) Sequenze tipiche (“consenso”) del promotore sul filamento-senso precedenti il nucleotide IS (“a monte” e “a valle” indicano qui che la prima sequenza è più spostata della seconda verso l’estremità 5’ del filamento-senso, ma entrambe sono a monte di IS). Formula di frequenza del consenso per 70: T69T79G61A56C54A54-161717431817- T77A76T60A61A56T82. (2) L’oloenzima richiede anche l’attivazione da parte di una proteina che si lega ancora più a monte del promotore e che idrolizza ATP affinché si formi il complesso aperto. Gli altri oloenzimi non richiedono ATP per questo processo. (3) La lettera E abbrevia l’acronimo ECF (Extra-Cytoplasmic Functions); il fattore E è l’isoforma più abbondante tra quelle alternative a 70 e i geni che fa esprimere sono implicati nella regolazione di un vasto repertorio di risposte a stress ambientali e variazioni differenziative. (4) Le basi in carattere più piccolo separate dalla sbarra sono alternative col 50% ciascuna di attività. Il complesso chiuso dell’oloenzima 70 con un suo promotore (che a 10°C è stabile per ore) può essere sfruttato per l’analisi in vitro delle sequenze specifiche che interagiscono con l’oloenzima. Infatti, se il complesso è digerito con DNasi I (che idrolizza qualunque legame fosfodiestere nel DNA a doppia elica), resteranno intatti i legami dei nucleotidi coperti dalla proteina legata sul DNA, che impedirà alla DNasi I (anch’essa una proteina) di agire. Un’analisi simile, detta footprint 73 analysis (lett.: “analisi dell’impronta”) si può fare per ogni proteina che si leghi specificamente e stabilmente a una certa sequenza di DNA; essa si esegue come descritto al Riquadro 6.1 di pag. 74. Il footprint della RNA polimerasi oloenzima 70 su un suo promotore tipico mostra che questa proteina enzimatica copre un tratto di DNA di ~75 pb che si estende all’incirca dal 60° nucleotide a monte fino al 15° nucleotide a valle del punto di inizio della trascrizione. Come si è detto, le posizioni dei nucleotidi vengono indicate sul filamento-senso numerandole con numeri positivi verso il 3’ a partire dal nucleotide IS e con numeri negativi verso il 5’ a partire dal nucleotide precedente; quindi il contatto della RNA polimerasi si estende dalla posizione 60 a quella +15. Sul filamento-senso, più facile da analizzare per ragioni tecniche, c’è un’impronta netta (assenza o forte diminuzione di idrolisi da DNasi I) in tre zone: tra la posizione 21 e la +15, tra la 40 e la 25 e tra la 60 e la 40; invece, le tre posizioni da 24 a 22 risultano più attaccabili con la proteina legata al DNA che in sua assenza. Oltre al footprint, si può eseguire un saggio di interferenza con la metilazione: il DNA viene metilato con dimetilsolfato (DMS) in presenza e in assenza di oloenzima, per osservare quali siti (basi o altri gruppi) sono protetti perchè in contatto con la proteina (vedi Fig. 6.1 a p. 80). A dimostrazione del fatto che l’enzima ha un contatto asimmetrico col promotore, il filamento-senso è assai più protetto di quello antisenso. Infatti, la RNA polimerasi oloenzima si lega su un lato della doppia elica, distorcendola in alcuni punti. Le subunità di maggiori dimensioni ( e ’) coprono le regioni da 40 a +15, e la regione più a monte è coperta dalle subunità . La subunità invece riconosce sequenze specifiche del promotore e queste possono essere individuate solo confrontando le sequenze di diversi promotori o analizzando le mutazioni che ne diminuiscono l’efficienza. Confrontando la sequenza di diversi promotori di E. coli per la RNA polimerasi oloenzima 70, si osserva la conservazione delle seguenti sequenze caratteristiche: a) un box (o “cassetta”) di 6 pb centrata intorno alla posizione 10 (detta Pribnow box o sequenza 10) il cui consenso sul filamento-senso è 5’-TATAAT-3’; b) un box di 6 pb centrato intorno alla posizione 35 (sequenza 35, consenso 5’-TTGACA-3’); c) un tratto di 1618 pb di sequenza più variabile interposto tra i due box ora descritti. Nei promotori delle unità trascrizionali per gli rRNA, il tratto da 60 a 40 (che lega le subunità della RNA polimerasi) è ricco di coppie A·T (elemento UP): mutazioni che alterano la composizione di questa sequenza diminuiscono l’alta efficienza di questi promotori. Viceversa, negli altri promotori non vi è nessuna caratteristica di sequenza in questo tratto. Nei bacilli Gram+ (come Bacillus subtilis) che formano spore, esiste una batteria di fattori sigma specifici per il differenziamento della cellula vegetativa in spora dormiente. La Tabella 6.II riporta le funzioni di queste forme alternative di subunità sigma: notiamo che le dimensioni del fattore sigma principale (cioè ortologo a 70) sono diverse da quello di E. coli. Tabella 6.II – Diverse subunità sigma trovate in Bacillus subtilis Subunità Gene che la codifica Funzione 43, A rpoD, sigA Fattore sigma principale B sigB Fase prestazionaria in condizioni avverse alla sporulazione D sigD Espressione geni flagellari (motilità, chemotassi) E sigE (spoIIGB) Espressione dei geni nella cellula madre della spora F sigF (spoIIAC) Espressione dei geni nella prespora G sigG (spoIIIG) Espressione dei geni all’interno della prespora H sigH (spoOH) Trascrizione dei geni precoci della sporulazione K sigK (spoIVCB-spoIIIC) Espressione dei geni tardivi nella cellula madre della spora 76 una funzione nell’allungamento di alcuni trascritti, soprattutto del fago (vedi Capitolo 10) e che interviene in alcuni fenomeni di terminazione che esamineremo più avanti; tuttavia, la presenza di questa proteina non è essenziale per l’attività basale del core nella fase di allungamento del trascritto. Notiamo che il core è adesso attivo da solo, poiché ha già iniziato il trascritto sul promotore ed è legato al DNA localmente denaturato (“bolla di trascrizione”); questa condizione è molto diversa da quella in cui il core si lega in un punto qualunque del DNA a doppia elica perfettamente appaiata. L’attività della RNA polimerasi durante la fase di allungamento è totalmente processiva: qualunque fenomeno che ne interrompa l’azione, provocando il distacco dell’enzima dal DNA, termina il processo in modo irreversibile (a meno che non intervenga di nuovo una subunità ). La velocità di sintesi del trascritto è abbastanza costante, essendo compresa, per diversi tratti dello stampo, tra 30 e 85 nucleotidi al secondo (in media 50 n/s); ciò che determina l’entità della trascrizione è quindi la frequenza con cui inizia la sintesi di un nuovo trascritto, anziché la velocità con cui viene allungato. Vedremo in seguito che tutti i meccanismi di regolazione della trascrizione, sia positivi che negativi, agiscono mediante variazioni della frequenza di inizio, o tutt’al più influendo sul progredire delle fasi iniziali dell’allungamento. Tuttavia, in molte unità trascrizionali, si osserva un curioso fenomeno: la RNA polimerasi sospende la sua attività in certi punti, detti siti di pausa, sui quali può sostare per diverso tempo senza dissociarsi dallo stampo, per poi riprendere la sintesi del trascritto in maniera continua. I siti di pausa corrispondono a regioni del trascritto che possono assumere una struttura secondaria a forcina e il loro significato sarà compreso meglio quando analizzeremo la terza fase della trascrizione, ossia la sua terminazione (vedi § 6.7), e considerando inoltre il collegamento “in tempo reale” fra trascrizione e traduzione nei Procarioti. Poiché la RNA polimerasi, avanzando nella sintesi del trascritto, deve separare il filamento- stampo dal filamento-sequenza, sembrerebbe che essa necessiti di una attività topoisomerasica. Tuttavia, si consideri che il DNA è già superavvolto negativamente e che il trascritto nascente rimane associato allo stampo per un tratto non superiore a 1012 nucleotidi per poi liberarsene: la “bolla di trascrizione” non è mai più lunga di 17 nucleotidi, si apre davanti alla RNA polimerasi ma si richiude dietro di essa. Inoltre, l’attività trascrizionale più intensa si ha durante la fase di crescita esponenziale, quando la DNA girasi agisce in misura notevole in concomitanza con la replicazione del DNA; nella fase stazionaria, una densità di superelica pari a 0,06 (che è come dire che il 6% del DNA può denaturarsi completamente senza eccessiva torsione) può garantire una regolare attività trascrizionale. 6.6. Trascrizione e traduzione degli operon proteici in E. coli. Esaminiamo ora quanto avviene durante la trascrizione di un operone che codifica proteine; poiché il trascritto è un mRNA, esso deve essere tradotto dai ribosomi per dare il prodotto genico finale. Dopo essere entrato nella fase di allungamento, l’apparato di trascrizione comincia a far uscire dalla bolla di trascrizione l’estremità 5’ dell’mRNA nascente. Appena questo ha raggiunto una lunghezza di qualche decina di nucleotidi, la sua traduzione può cominciare. Affinché il ribosoma individui il quadro di lettura giusto e trovi il giusto codon d’inizio, la sequenza leader dell’mRNA procariotico contiene un segnale particolare per la subunità minore (30S) che deve legarsi all’mRNA. Questa è una sequenza ricca di purine lunga da 4 a 9 nucleotidi (sequenza massima trovata: 5’...UAAGGAGGU...3’; quelle più corte possono avere sequenze AGGA, GAGG, GGAG, e simili) che è complementare in senso antiparallelo all’estremità 3’ dell’rRNA 16S contenuto nel ribosoma 30S (HO-3’-AUUCCUCCA-N1533-5’); essa è comunemente detta sequenza (o segnale) di Shine-Dalgarno, dal nome dei due ricercatori che ne misero in evidenza il ruolo. Tale sequenza è seguita, dopo un tratto di lunghezza variabile da 3 a 10 nucleotidi, dal primo codon AUG possibile. È intuibile che, quanto più forte è il segnale di Shine-Dalgarno, tanto più prontamente inizierà la 77 traduzione. Quando un mRNA policistronico contiene una regione intercistronica piuttosto lunga, al termine di essa si può trovare un nuovo segnale di Shine-Dalgarno per indirizzare un ribosoma 30S sul cistrone successivo. I rari mRNA procariotici che non contengono questo segnale vengono tradotti con bassa efficienza (ne è un esempio notevole il trascritto dal promotore PRM del gene cI nel profago , che ha il proprio IS sull’adenina del codone d’inizio AUG; vedi Capitolo 10). 6.7. La terminazione della trascrizione in E. coli. Il segnale di terminazione (o terminatore) è una sequenza cis-attiva che si trova all’estremità di ogni unità trascrizionale e presenta le caratteristiche seguenti: 1) nel DNA esso è costituito da una sequenza parzialmente palindroma, assai ricca di coppie G•C nelle due metà simmetriche, separate da un breve tratto centrale non simmetrico; 2) dopo questa sequenza palindroma, sul filamento-senso si trovano 48 residui di T, che saranno trascritti in un tratto di U; 3) il terminatore agisce dopo essere stato trascritto, e la sua sequenza trascritta è interna alla porzione all’estremità 3’ che negli mRNA non viene tradotta perché successiva all’ultimo codon di STOP dell’ultimo cistrone. Il trascritto, nella regione del terminatore, si ripiega assumendo una struttura secondaria a forcina che determina una pausa nell’attività polimerasica. Poiché la forcina ha uno stelo formato quasi esclusivamente da coppie G•C (fra le basi delle due metà del palindromo), essa è piuttosto stabile e tende a formarsi appena la sequenza palindroma è stata trascritta. Infatti, a parità di lunghezza e composizione in basi, un tratto a doppia elica di RNA è più stabile di un ibrido DNA•RNA, che a sua volta è più stabile della doppia elica di DNA. La forcina costituisce un sito di pausa probabilmente perché interagisce con la proteina NusA; in tal modo, il trascritto resta appaiato nella bolla di trascrizione solo con la coda di U appaiata alla fila di A sul filamento-stampo. Questo legame fra stampo e trascritto è piuttosto debole; poiché l’attività polimerasica è in pausa, il trascritto si dissocia del tutto dallo stampo e la doppia elica di DNA si richiude. Il core polimerasico non potrà iniziare un nuovo trascritto finché una subunità non si riassocerà ad esso e gli farà incontrare un promotore. Notiamo che il terminatore ora descritto ha una struttura pressoché permanente: infatti, venendo dopo un codon di STOP, su di esso non passeranno mai ribosomi, che altrimenti tendono a far dissociare le strutture secondarie negli mRNA. Terminatori simili si trovano ovviamente anche alla fine delle unità trascrizionali per rRNA e tRNA, che non sono tradotte e la cui maturazione richiede che assumano e mantengano parecchi tratti con struttura secondaria. In effetti, i terminatori di questi trascritti vengono eliminati durante le modificazioni post-trascrizionali che portano a maturazione gli RNA stabili. Possiamo ora capire in che cosa consistono i siti di pausa: sono regioni di una unità trascrizionale che producono nel trascritto la formazione di strutture a stelo e ansa, talvolta anche con “bolle” (zone non appaiate che interrompono lo stelo); quando queste strutture vengono legate dalla proteina NusA in qualità di subunità della RNAP, questa fa una sosta nella sua attività di sintesi del trascritto. Tuttavia, poiché queste strutture non sono particolarmente stabili e non sono seguite da una fila di U, l’attività di sintesi riprende dopo poco. Se il trascritto è un precursore di RNA stabili (rRNA e/o tRNA), tali strutture secondarie permangono fino alla maturazione (se questa non produce tagli in esse). Negli mRNA, invece, esse vengono rapidamente distrutte dai ribosomi in corso di traduzione, a meno che non si formino in una regione intercistronica abbastanza lunga. In questo caso può verificarsi un fenomeno diverso di terminazione, che richiede l’intervento di una nuova proteina. In E. coli si trova infatti una proteina esamerica (6 x 46 kDa) chiamata (rho), in grado di legarsi all’estremità 5’ di un trascritto su brevi sequenze dette rut (rho utilization). Quando è legata all’RNA, rho esplica attività ATPasica; idrolizzando ATP in ADP + Pi, essa scorre sull’RNA avvolgendosi su di esso in direzione 5’3’. In tal modo, rho può raggiungere il complesso di 78 allungamento della trascrizione e far dissociare da esso il trascritto. Per far ciò, il filamento su cui si avvolge rho deve essere sgombro da ribosomi e la RNAP deve fermarsi su un sito di pausa. Quando rho raggiunge il core polimerasico, interagisce con la subunità e agisce da elicasi dell’ibrido DNA·RNA. Questo tipo di terminazione è detta “dipendente da rho” e le strutture a stelo e ansa che possono consentire questa terminazione sono detti terminatori dipendenti da rho. Essi si distinguono dal tipo di terminatore che abbiamo descritto per primo e che viene detto spesso terminatore indipendente da rho, giacché agisce anche in assenza di questa proteina: i terminatori dipendenti da rho non hanno infatti una forcina con stelo assai ricco di G•C, possono avere bolle e nel trascritto non sono mai seguiti da lunghe file di U. Vediamo ora due situazioni in cui la terminazione dipendente da rho interviene in unità trascrizionali di E. coli. In una unità trascrizionale policistronica che abbia lunghe regioni intercistroniche, quando la trascrizione viene avviata, il primo cistrone viene tradotto man mano che viene trascritto; dopo che uno o più ribosomi vi si sono associati, la proteina rho inizia a scorrere su di esso dal 5’, ma deve restare in coda ai ribosomi che la precedono. Quando questi giungono al codon di STOP del cistrone, si dissociano e consentono a rho di procedere sulla regione intercistronica: se la polimerasi è in pausa, rho può terminare la trascrizione prima che questa raggiunga il secondo cistrone. Se invece non ce la fa, sarà probabilmente preceduto da un ribosoma che inizierà a tradurre il secondo cistrone. Dopo che questo è stato tradotto completamente e il ribosoma si è dissociato al codon di STOP, rho può procedere sulla seconda regione intercistronica e far terminare la trascrizione; in alternativa, la trascrizione procederà fino al terminatore indipendente da rho. Questo meccanismo attuato da rho, che interviene solo in quegli operoni che hanno regioni intercistroniche, produce mRNA di lunghezze diverse dalla stessa unità trascrizionale: i cistroni più a monte saranno espressi in misura maggiore rispetto a quelli più a valle. Il fenomeno prende il nome di polarità genica ed ha la funzione di regolare sottilmente i livelli relativi dei vari prodotti genici di uno stesso operone; ad esempio, una proteina è richiesta in maggiori quantità di un’altra, o perché la sua molecola è meno attiva dell’altra, o perché è veramente necessario che il suo livello di attività sia maggiore. Una situazione diversa si verifica quando una unità trascrizionale subisce una mutazione nonsense (sostituzione di basi che cambia un codon sense in un codon di STOP); la traduzione del cistrone cessa al codon mutato, producendo una proteina tronca quasi sempre priva di attività funzionale. Poiché facilmente questo codon non è seguito subito da un nuovo segnale di inizio della traduzione, i ribosomi che si dissociano al codon mutato lasciano via libera a rho, che può così far terminare la trascrizione precocemente. Questo meccanismo consente al batterio di risparmiarsi la sintesi di un lungo trascritto prevedibilmente inutilizzabile e dei polipeptidi in esso codificati, giacché le proteine dell’operon non saranno di molta utilità, mancandone una. Ad esempio, non è di alcuna utilità per il batterio sintetizzare la proteina che fa entrare il lattosio nella cellula (codificata dal 2° cistrone dell’operon lac) se l’enzima deputato a degradare questo disaccaride (codificato dal 1° cistrone dello stesso operon) non viene prodotto in forma attiva. Un tipo piuttosto diverso di controllo trascrizionale in cui interviene la proteina rho (e grazie al quale essa è stata scoperta) sarà descritto al Capitolo 10 riguardo alle fasi precoci dell’espressione genica del fago . In quel caso, la polarità genica diviene un fatto estremo, permettendo di esprimere trascritti più corti o più lunghi, a seconda del momento dell’infezione fagica. Alle pagine successive, il Riquadro 6.2 riassume alcune proprietà delle proteine che intervengono nelle varie fasi della trascrizione in E. coli. La Fig. 6.1 mostra l’organizzazione di sequenza di un promotore per 70 e le zone interessate dal contatto con l’oloenzima, determinate tramite il saggio di interferenza con la metilazione (simile per molti aspetti alla footprint analysis, ma più dettagliata nell’informazione). La Fig. 6.2 è uno schema della distribuzione delle molecole di RNA polimerasi tra le varie fasi del suo ciclo di attività. La Fig. 6.3 illustra i vari tratti di un mRNA batterico, mentre la Fig. 6.4 riporta le caratteristiche strutturali dei terminatori dipendenti e indipendenti da rho, e la Fig. 6.5 mostra in dettaglio la terminazione indipendente da rho. 81 Fig. 6.2. Distribuzione percentuale approssimativa delle molecole di RNA polimerasi tra le varie fasi del suo ciclo funzionale in una cellula di Escherichia coli. P e T indicano rispettivamente il promotore e il terminatore di una unità trascrizionale. Da sinistra a destra: oloenzima nel complesso d’inizio col promotore; core in corso di allungamento del trascritto (sul quale sono associati i ribosomi); core inattivo associato su una sequenza qualunque di DNA: ad esso si può unire la subunità ; core dissociato dal DNA (come avviene alla terminazione della trascrizione). Non è indicata la proteina NusA, che si può associare al core attivo in certi momenti della fase di allungamento. Il numero assoluto di molecole per cellula varia da un ceppo batterico all’altro: esso è di poche migliaia per il core RNAP, un migliaio per 70 e poche centinaia per NusA. Le subunità alternative hanno concentrazioni variabili in funzione delle condizioni fisiologiche e ambientali, salvo quella per la motilità (F), presente sempre a livelli che sono la metà rispetto a . 82 pppN . . AAGGAGG . . AUG . . . (N3n) . . . UAA . . . (N30-70) . . . AUG . . . (N3m) . . . UAAUG . . . (N3h) . . . UAAUGAGCGCGCAUUCGCGCGCAUUUUUU3 '-OH 5' sequenza di Shine- Dalgarno codone d'inizio codone di stop codoni di inizio e di stop in parte sovrapposti codone d'inizio codoni di stop forcina fila di U 3' o sequenza-guida (non tradotta) leader dell'mRNA 1° cistrone regione intercistronica (non tradotta) 2° cistrone 3° cistrone regione non tradotta al 3' terminatore Fig. 6.3. Organizzazione della sequenza in un mRNA batterico policistronico. Le sequenze mostrate sono del tutto ipotetiche, anche se ricalcano la struttura di quelle realmente espresse nelle cellule batteriche. Non sono mostrati i possibili terminatori dipendenti da rho, che sarebbero localizzati nella regione intercistronica, alla fine della quale potrebbe trovarsi anche una sequenza di Shine-Dalgarno. 83 5'...TAATCCCACAGCCGCCAGTTCCGCTGGCGGCATTTTAACTTTCTTTAATGA...3' 3'...ATTAGGGTGTCGGCGGTCAAGGCGACCGCCGTAAAATTGAAAGAAATTACT...5' 5'...UAAUCCCACAGCCGCCAGUUCCGCUGGCGGCAUUUU3'-OH A B C D 5'...UAAUCCACA C A G C C G C C A G U UCC G C U G G G G C UUUU 3'-OH UAA UUUU 3' 5' 5' UAA UUU U AAAA AAAA GCGC CGCG C G G C CGCG CGCG AAAA U UUU UAA 5' 3' 3' E F G UCAA3'-OH U G U U U A C G CAA5'...UAAUCGACU GU AU A GC U CG UA AU UA U U lo stelo è ricco in C·G fila di Ucodone di STOP codone di STOP manca la fila di U lo stelo non è ricco in C·G CGG C C G G C C G G C CG G C Fig. 6.4. Caratteristiche strutturali dei terminatori della trascrizione batterici e loro funzionamento. In A è mostrata la sequenza sul DNA, in B la struttura primaria del trascritto e in C la relativa struttura secondaria per un terminatore indipendente da rho. Si noti che nel DNA vi è una struttura a parziale simmetria diadica (due emisiti palindromici separati da una corta sequenza centrale non simmetrica, indicata con ); ad essa corrisponde nel trascritto (singolo filamento) la regione autocomplementare che forma lo stelo della forcina. Questo tipo di terminatore è contraddistinto dall’alta percentuale di C•G nello stelo e dal fatto che la forcina è seguita da una fila di U; esso si trova inoltre (per definizione) solo alla fine dell’unità trascrizionale. Queste caratteristiche mancano invece nei terminatori dipendenti da rho, come quello mostrato in D. Nelle immagini a destra è illustrato in successione quanto avviene alla terminazione della trascrizione: E, la sintesi del trascritto è giunta al terminatore; F, si forma la forcina ricca di C•G e il trascritto rimane associato allo stampo solo con la fila di U; G, il trascritto viene liberato, RNAP si dissocia dal DNA e la doppia elica si richiude. In tutte e tre le immagini, sono schematizzati ribosomi in traduzione che si dissociano al codon di stop (UAA).