Scarica Biologia molecolare di base e più Dispense in PDF di Biologia Molecolare solo su Docsity! 120 CAPITOLO 9 9.1. Introduzione storica alle tecniche di manipolazione del DNA. Fino all’inizio degli anni ‘70, mentre era già nota la sequenza amminoacidica di parecchie proteine e la struttura tridimensionale di alcune di esse era già stata risolta tramite la diffrazione dei raggi X, la possibilità di conoscere la precisa sequenza di DNA contenuta in geni specifici sembrava una meta quasi irraggiungibile. La determinazione della sequenza di un tRNA di 76 nucleotidi, da parte di un gruppo di ricercatori capeggiati da R. W. Holley, parve nel 1965 un impresa quasi eroica; nei dieci anni successivi si giunse a conoscere gran parte della sequenza degli RNA ribosomali dei procarioti (un migliaio di nucleotidi o poco più) e la struttura tridimensionale dei cristalli di tRNA. Questi risultati erano possibili, con le tecniche chimiche e biochimiche allora disponibili, solo perché si aveva a che fare con campioni puri di una ben precisa molecola di acido nucleico, e richiedevano comunque anni di lavoro di diversi ricercatori. Il tentativo di isolare un frammento omogeneo di DNA a doppia elica era invece senza speranza: i genomi (di lunghezza da 105 a 109 pb) potevano essere spezzettati solo casualmente e si trasformavano così in miscugli eterogenei e non assoggettabili a un’analisi di sequenza. Inoltre, il DNA è presente nelle cellule in un numero di copie molto basso rispetto a quello delle proteine e degli RNA, per cui l’uso di sistemi convenzionali di analisi biochimica (anche potendo disporre di campioni omogenei) si sarebbe rivelato spesso inconcludente. Nella prima metà degli anni ‘70, tuttavia, si succedettero a valanga una serie di scoperte biologiche e di perfezionamenti tecnici di principii già noti che permisero il superamento di questo colossale gradino nel progredire della biologia molecolare. La prima scoperta importante (Hamilton Smith, 1970), e di gran lunga determinante per i successivi sviluppi, fu che i batteri producono enzimi (della categoria delle endonucleasi) capaci di scindere il DNA a doppia elica tramite un taglio a doppio filamento riconoscendo corte sequenze specifiche (sito bersaglio); con certi enzimi il taglio avviene sullo stesso lato di una coppia di basi (taglio pari che produce “estremità smussate” o blunt ends), con altri il taglio è sfalsato, cosicché su ogni troncone sporge un breve tratto a singolo filamento e i due tratti sporgenti sono complementari tra di loro (taglio sfalsato che produce “estremità coesive” o sticky ends). In tutti i casi, l’idrolisi dei legami fosfodiesterei avviene in modo da lasciare il residuo fosfato al 5’ e il gruppo OH al 3’. L’individuazione di queste endonucleasi specifiche derivò dagli studi iniziati nel 1962 dallo svizzero W. Arber sul fenomeno della restrizione (ossia degradazione) del DNA fagico da parte di certi batteri, che impediva ai batteriofagi di riprodursi se non all’interno di determinati ospiti. Quegli enzimi furono perciò denominati endonucleasi di restrizione e se ne conoscono oggi alcune centinaia di tipi diversi, prodotti da svariati ceppi batterici; i rispettivi siti bersaglio sul DNA sono perciò anche detti siti di restrizione. È evidente che l’azione di uno di questi enzimi su una data molecola di DNA circolare produrrà tanti frammenti quanti sono i siti di restrizione, mentre ne produrrà uno in più nel caso di DNA lineare. Se la molecola di DNA non è troppo lunga e i siti di restrizione sono in numero limitato, anche i tipi di frammenti saranno pochi ma diversi e sarà relativamente facile separarli, evidenziarli e isolarli. Questa seconda fase della manipolazione del DNA richiede una tecnica già nota, ossia l’elettroforesi su gel. Una molecola di acido nucleico ha una carica netta a pH 7 (dovuta ai residui fosforici ionizzati) che cresce con la lunghezza dei filamenti (una carica negativa per ogni nucleotide), per cui tutte le molecole di acido nucleico migrano verso l’anodo; essendo costante il rapporto carica/massa, la mobilità in soluzione sarebbe la stessa per tutte le molecole, ma nel gel si oppone a essa la forza di attrito che aumenta con le dimensioni delle molecole e con la loro divergenza dalla forma sferica. A seconda delle dimensioni dei frammenti di DNA, si usano gel di agaroso o di poliacrilammide; le molecole lineari di DNA migrano con mobilità elettroforetiche decrescenti col logaritmo del loro peso molecolare e quindi della lunghezza in pb. La stessa caratteristica è mostrata da molecole circolari di DNA, ma ricordiamo che in tal caso il grado di 121 superavvolgimento influenza la mobilità elettroforetica a parità di lunghezza (gli isomeri topologici con maggiore densità di superelica migrano più velocemente). Se si vuol separare DNA a singolo filamento, la relazione tra mobilità e lunghezza della molecola è rispettata in condizioni denaturanti (T 50°C, alte concentrazioni di formammide o urea), poiché in condizioni native il singolo filamento assume strutture secondarie, dipendenti dalla sequenza, che alterano la mobilità elettroforetica; un discorso simile vale per le molecole di RNA, che si possono separare in base allo stesso principio. La seconda scoperta importante fu quella della DNA ligasi, il cui ruolo nella replicazione del DNA è già stato esposto (vedi Cap. 5). Nel 1972, Paul Berg e collaboratori usarono per la prima volta questo enzima per unire frammenti diversi di DNA ottenuti dalla digestione con un’endonucleasi di restrizione che produceva estremità smussate, previa aggiunta di brevi tratti di T o di A al 3’-OH di questi frammenti. Diventava dunque possibile operare una ricombinazione artificiale tra frammenti di DNA di diversa provenienza, tramite l’uso di opportuni enzimi in provetta. La DNA ligasi che si è rivelata più adeguata per questa applicazione è quella codificata dal colifago T4, che utilizza ATP come cofattore e che è in grado di saldare anche due frammenti di DNA con estremità smussate, purché siano ad alta concentrazione. Il terzo aspetto essenziale consiste nella possibilità di aumentare la quantità dei frammenti di DNA a cui si è interessati. Poiché in natura il DNA viene replicato dalle cellule tramite i loro sistemi enzimatici, la strategia più semplice appariva quella di introdurre il DNA ricombinato nelle cellule e recuperarlo dopo che queste erano cresciute e lo avevano replicato diverse volte. Tuttavia, una molecola di DNA si replica in un dato tipo cellulare solo se contiene un’origine di replicazione riconosciuta dal sistema (vedi Cap. 5). Lo studio delle piccole molecole di DNA circolare extragenomico (plasmidi), presenti in determinati ceppi di E. coli, fornì lo strumento necessario; nel 1973, H. Boyer e S. Cohen inserirono in un plasmide un segmento di un altro plasmide, operando con un enzima di restrizione che produceva estremità coesive. I plasmidi sono di per sé dotati di un’origine di replicazione e hanno un numero di siti di restrizione limitato a causa della loro lunghezza (questa è compresa tra 5 e 100 Kpb, ma i plasmidi usati a tale scopo sono i più piccoli e sono stati ulteriormente “accorciati”); essi contengono inoltre quasi sempre uno o più geni che danno vantaggi selettivi alla cellula batterica che li ospita, come la resistenza a certi antibiotici. Questa è una caratteristica desiderabile, poiché permette, come vedremo più avanti, di selezionare le cellule contenenti i plasmidi ricombinanti. Infatti, una volta tagliato il DNA plasmidico con una endonucleasi di restrizione che abbia su di esso un unico sito bersaglio, è possibile inserire in quel taglio e poi saldare con la DNA ligasi un frammento di DNA di qualunque provenienza (inserto), ottenuto col medesimo enzima di restrizione (o altro che produca estremità coesive compatibili). Introdotta in cellule batteriche, questa molecola di DNA ricombinante si replicherà portando alla formazione di un gran numero di copie dell’inserto (clonazione), che potrà essere recuperato, dopo estrazione e isolamento del plasmide dalle cellule, incidendo il DNA con lo stesso enzima di restrizione usato per produrre il sito di inserzione. Il frammento di DNA così amplificato viene quindi detto clone. I successivi progressi di queste nuove metodologie furono: 1) uso di enzimi per operare la marcatura di molecole di DNA con radioisotopi (sonde di DNA); 2) allestimento di tecniche di ibridazione in vitro per riconoscere specifici frammenti di DNA, separati per elettroforesi, con l’uso delle sonde di DNA (E. M. Southern, 1975); 3) sviluppo di metodi chimici o enzimatici rapidi per determinare la sequenza del DNA, favoriti dal perfezionamento delle tecniche elettroforetiche (Maxam & Gilbert, 1977; Sanger e coll., 1977); 4) uso della trascrittasi inversa, enzima scoperto nei retrovirus da H. Temin e da D. Baltimore nel 1970, per generare da un RNA una copia di DNA a doppia elica (DNA complementare o cDNA); 5) elaborazione di molecole di DNA derivate da plasmidi, batteriofagi o virus (vettori di clonazione o semplicemente vettori) per costruire collezioni di DNA complementari agli (m)RNA di un certo tipo cellulare (banche di cDNA) o di frammenti del DNA genomico di una specie 124 fornisce esempi di alcuni enzimi di classe II e dei siti bersaglio relativi; sono inclusi per confronto due enzimi di classe III. I nomi delle endonucleasi di restrizione derivano da quello del ceppo batterico di origine in base alle regole di nomenclatura seguenti: tre lettere, l’iniziale (maiuscola) del genere batterico più le prime due lettere (minuscole) della specie; una lettera per indicare il ceppo particolare (non sempre c’è); un numero romano progressivo, per distinguere i diversi enzimi ottenuti da quel ceppo. Ad es.: HindII è la seconda endonucleasi di restrizione trovata nel ceppo Rd di Hæmophilus influenzæ; PstI è il primo enzima di restrizione isolato dalla specie Providencia stuartii (ceppo 164). La sigla dell’enzima viene comunemente usata anche per indicare un sito di restrizione per quell’enzima in una doppia elica di DNA. Tabella 9.II - Alcuni esempi di endonucleasi di restrizione e delle loro sequenze bersaglio Specie/ceppo del batterio produttore Sigla dell’ enzima Sequenza bersaglio e sito di scissione§ Proprietà della sequenza bersaglio e dei prodotti di scissione Arthrobacter luteus AluI AGCT Palindromo, 4 pb; estremità smussate Moraxella bovis MboI GATC Palindromo, 4 pb; estremità sporgenti al 5’ Bacillus amyloliquefaciens H BamHI GGATCC Palindromo, 6 pb; estremità sporgenti al 5’ Bacillus globigii BglII AGATCT Palindromo, 6 pb; estremità sporgenti al 5’ Escherichia coli RY13 EcoRV GATATC Palindromo, 6 pb; estremità smussate Escherichia coli RY13 EcoRI GAATTC Palindromo, 6 pb; estremità sporgenti al 5’ Hæmophilus influenzæ Rd HindII GTYRAC* Palindromo parziale, 2+(2)+2 pb, estremità smussate Hæmophilus influenzæ Rd HindIII AAGCTT Palindromo, 6 pb; estremità sporgenti al 5’ Providencia stuartii 164 PstI CTGCAG Palindromo, 6 pb; estremità sporgenti al 3’ Serratia marcescens Sb SmaI CCCGGG Palindromo, 6 pb; estremità smussate Nocardia otitidis-caviarum NotI ** GCGGCCGC Palindromo, 8 pb; estremità sporgenti al 5’ Streptomyces fimbriatus SfiI ** GGCCN4NGGCC Palindromo parziale, 4+(5)+4 pb; estremità sporgenti al 3’ Haemophilus gallinarum HgaI GACGCN5 CTGCGN10 Enzima di classe III: sito bersaglio non palindromo; taglio sfalsato di 5 pb Moraxella bovis MboII GAAGAN8 CTT CTN7 Enzima di classe III: sito bersaglio non palindromo; taglio sfalsato di 1 pb § Il sito bersaglio è indicato con la sequenza del filamento che decorre da 5’ a 3’ andando da sinistra a destra; la freccia rivolta verso il basso indica il legame idrolizzato dalla endonucleasi. Si deve intendere che il legame corrispondente sull’altro filamento è quello in posizione simmetrica. Questo non vale nel caso degli enzimi di classe III, che fanno tagli su un solo lato del sito di riconoscimento (in questo caso la sequenza è indicata per chiarezza su entrambi i filamenti). * Y/R = T/A oppure C/G. ** I siti bersaglio di questi enzimi sono alquanto rari (una caratteristica pregevole per certe applicazioni) per cui sono noti nella letteratura specifica come rare cutters (= “che tagliano raramente”). Le dimensioni dei frammenti di DNA che si ottengono con le endonucleasi di restrizione (di classe II) dipendono in prima approssimazione dalla lunghezza della sequenza bersaglio. Infatti, una particolare sequenza di 4 pb si troverà in media ogni 256 pb, una di 6 pb ogni 4 kpb, una di 8 pb ogni 65,5 kpb. Le dimensioni dei frammenti sono in realtà assai disparate (poiché le sequenze di 125 DNA non sono casuali), ma il numero di siti per una certa endonucleasi di restrizione su una data molecola di DNA diminuisce all’aumentare della lunghezza della sequenza bersaglio: teoricamente esso è all’incirca pari a L/4n, dove L è la lunghezza (in pb) della molecola intatta di DNA e n è la lunghezza in pb del sito bersaglio. Tuttavia, questa frequenza dei siti di restrizione dipende anche dalla composizione percentuale in basi del DNA: siti come quelli di NotI (la cui sequenza è composta solo di G/C) si trovano tanto più raramente quanto più bassa è la percentuale di G+C nel DNA tagliato con quell’enzima. A titolo di esempio, nel DNA dell’adenovirus 2 (lunghezza 36 kpb), i siti di restrizione sono 158 per AluI, 12 per HindIII e 3 per SfiI. Notiamo una caratteristica interessante nei siti bersaglio dei due enzimi BamHI e BglII: i tratti a singolo filamento, sporgenti al 5’, prodotti dalla scissione sono gli stessi: un’estremità prodotta col primo enzima si potrà quindi appaiare con un’estremità prodotta col secondo enzima, anche se i due enzimi hanno agito su siti bersaglio distinti (le basi diverse sono rimaste al 3’ rientrante). In alcuni casi si trovano anche enzimi che agiscono su siti bersaglio identici: se entrambi tagliano a livello della stesso posizione, essi sono detti isoschizomeri (= “che scindono in estremità equivalenti”); se invece tagliano in posizioni diverse sulla stessa sequenza, sono detti neoschizomeri. Questo ed altri accorgimenti che vedremo ora e in seguito aumentano le possibilità di riunire frammenti di DNA di diversa provenienza, per poi saldarli in presenza di ATP e di DNA ligasi del fago T4. 9.3. Un primo uso delle endonucleasi di restrizione: le mappe di restrizione. Per poter conoscere la sequenza di una molecola di DNA lunga parecchie migliaia di pb, occorre determinare tale sequenza (vedi § 9.8) su frammenti di dimensioni intorno a 1 Kpb, ottenuti per lo più con enzimi di restrizione che riconoscono siti di 4 pb. L’ordine dei vari frammenti di sequenza nota è ricavabile dalla cosiddetta mappa di restrizione, ottenuta trattando con enzimi di restrizione diversi la molecola di DNA originaria (frammento più lungo, plasmide, genoma virale, ecc.). Consideriamo una molecola di DNA lineare (se è circolare, si può sempre trovare un enzima di restrizione che ha su essa un unico sito, in modo da renderla lineare). Poiché la sua sequenza non è ancora nota, la lunghezza dei frammenti viene indicata come frazione (lunghezza totale = 1,0). Dopo ogni digestione con un determinato enzima, i frammenti sono separati per elettroforesi su gel e indicati con le lettere maiuscole nell’ordine in cui cresce la mobilità elettroforetica (dal più grande al più piccolo); le dimensioni approssimative in kpb sono stimate dal raffronto con uno standard, rappresentato dai frammenti, a lunghezza nota, di una molecola di DNA (plasmide, vettore, fago o altro) digerita con un opportuno enzima di restrizione. Le metodiche di mappatura sono due: 1) digestione completa del DNA con diverse endonucleasi, prima da sole e poi in combinazione, e analisi elettroforetica della lunghezza dei frammenti ottenuti da ogni digestione; si ottiene così la posizione relativa di un tipo di sito di restrizione rispetto ad altri tipi di siti; 2) marcatura di una estremità della molecola di DNA con P, seguita da digestione parziale con un solo enzima di restrizione, separazione elettroforetica e autoradiografia; si ottiene così la successione e la lunghezza dei frammenti prodotti da un enzima che abbia più siti di restrizione sulla molecola di DNA. Il primo metodo richiede ovviamente maggiori quantità di DNA, che è evidenziato nelle elettroforesi con il bromuro di etidio, sostanza intercalante che si lega al DNA a doppia elica e che ha una fluorescenza arancione sotto luce ultravioletta. Il secondo metodo è concettualmente simile alla tecnica di Maxam e Gilbert per determinare la sequenza di basi del DNA (vedi § 9.8). La scala delle dimensioni dei frammenti in entrambi i metodi viene ricavata da uno standard di frammenti DNA a peso molecolare noto (nel secondo metodo devono essere radioattivi). Il principio del primo metodo è illustrato dal seguente esempio semplice (vedi SCHEMA 9.1). L’enzima X produce due frammenti di lunghezza relativa A=0,55 e B=0,45; l’enzima Y produce due frammenti di lunghezza A’=0,80 e B’=0,20. Per sapere se il sito Y si trova in A o in B (ossia, se è a sinistra del sito X ovvero alla sua destra), la molecola di DNA intatta è digerita con X e Y mescolati. Ci aspettiamo che si producano tre frammenti: se hanno dimensioni 0,45/0,35/0,20, il sito Y si trova a sinistra di X (all’interno del frammento A); se si osservano tre bande di dimensioni 126 0,55/0,25/0,20, il sito Y si trova a destra di X (all’interno del frammento B). Quindi l’ordine dei tre frammenti sarà 0,2-Y-0,35-X-0,45 (1° caso), altrimenti sarà 0,55-X-0,25-Y-0,2 (2° caso). SCHEMA 9.1. Mappatura della posizione relativa di due siti unici di restrizione su una molecola di DNA C X Y X+Y C X Y X+Y 1ª possibilità 2ª possibilità Mappe di restrizione dedotte Y X X Y 1ª 2ª C = DNA non digerito X = DNA digerito con l'enzima X Y = DNA digerito con l'enzima Y X+Y = DNA digerito con i due enzimi 1,0 0,7 0,5 0,4 0,3 0,2 0,1 0,6 0,8 0,9 1,0 0,7 0,5 0,4 0,3 0,2 0,1 0,6 0,8 0,9 + + anodo anodo Notiamo che la sola duplice digestione (X+Y) lascia indecisi sull’ordine dei frammenti. Se vi sono altri siti di restrizione unici, si procede con diverse combinazioni di enzimi fino alla determinazione di una mappa abbastanza dettagliata (vedi Esercizio alla fine del Capitolo). Nel caso che lo stesso enzima abbia due o tre siti bersaglio, si procede in maniera analoga, anche se le combinazioni necessarie per ottenere una mappa definita sono necessariamente maggiori; si può tuttavia ricorrere al secondo metodo, che ora descriveremo in breve e che è applicabile a casi con un alto numero di siti di restrizione uguali. La molecola di DNA, già lineare o resa tale, viene dapprima trattata con fosfatasi alcalina, che rimuove il fosfato dai gruppi terminali in 5’, e successivamente marcata con P alle stesse estremità 5’ in presenza di [-P]ATP tramite l’enzima polinucleotide cinasi, che catalizza il trasferimento del fosfato dell’ATP ai gruppi 5’-OH di catene polinucleotidiche. Avendo in precedenza ottenuto una mappa di restrizione dei siti unici sulla stessa molecola di DNA, si sceglie quello in assoluto più vicino a una estremità della molecola. Il trattamento prolungato con l’enzima rispettivo (Z) eliminerà un breve tratto di DNA e insieme ad esso una delle estremità marcate con P. Dopo aver isolato il frammento lungo, si opera su esso una digestione parziale con l’altro enzima di restrizione (M, quello che ha diversi siti bersaglio) in modo che esso agisca al massimo su un solo sito di restrizione per ogni singola molecola; su diverse molecole dello stesso tipo, il sito sarà bersagliato a caso tra tutti quelli presenti. L’elettroforesi e l’autoradiografia mostreranno, oltre al frammento iniziale ottenuto con Z, una serie di frammenti via via più corti, tanti quanti sono i siti di restrizione M. Nell’autoradiografia si vedono solo i frammenti marcati con P, quindi solo quelli “a sinistra” del sito di scissione prodotto dall’enzima M. In questa analisi la dimensione di ciascun frammento fornisce la distanza di ciascun sito M dall’estremità marcata e quindi consente di costruire la mappa (vedi SCHEMA 9.2). Nell’esempio qui riportato, l’enzima M ha quattro siti sul DNA; il trattamento prolungato con l’enzima M produrrà 5 frammenti dalla molecola lineare, delle seguenti dimensioni relative 0,29, 0,27 (= 0,560,29), 0,14 (= 0,700,56), 0,21 (= 0,910,70) e 0,09 (= 129 inconveniente, si può trattare il vettore aperto con fosfatasi alcalina per rimuovere i gruppi 5’- fosfato: così, l’inserto sarà saldato dalla DNA ligasi con due legami alle estremità 3’ del vettore, mentre questo, se non contiene l’inserto, resterà in forma lineare, avendo meno probabilità di trasformare le cellule batteriche (a parità di lunghezza, il DNA circolare è assai più efficiente di quello lineare nella trasformazione). Il vettore ricombinante sarà quindi una molecola con due nick senza gruppo fosforico, ma questi saranno efficacemente riparati all’interno dell’ospite (Fig. 9.2 B). Si noti che anche l’inserto può andare incontro alla saldatura su sé stesso, ma esso non è in grado di replicarsi nel batterio (come invece fa il vettore) e quindi rappresenta un problema secondario, come lo è anche la formazione di concatenameri della stessa molecola (più frammenti legati in tandem). Vi è comunque una strategia diversa che consente di evitare le circolarizzazioni (ma non la formazione di concatenameri, che è in tutti i casi meno probabile), ossia disporre di due estremità diverse su ogni molecola, prodotte con due diversi enzimi di restrizione; questa metodica (vedi ad es. § 9.7.2 e § 9.9) prende il nome di clonazione direzionale. 9.5. I vettori derivati da plasmidi. Come detto nell’introduzione, l’uso di endonucleasi di restrizione e DNA ligasi consente di costruire in vitro molecole di DNA ricombinante e se queste sono capaci di essere replicate in cellule batteriche, se ne ottiene l’amplificazione in vivo, ossia la clonazione. Dal momento che gli ospiti più opportuni sono spesso i batteri (particolari ceppi di laboratorio di E. coli), i primi vettori realizzati derivarono da plasmidi di E. coli e sono detti perciò vettori plasmidici . In linea di principio, tutto quello che servirebbe a un vettore per la clonazione sarebbe un’origine di replicazione e una breve sequenza contenente uno o più siti di restrizione diversi per unirvi un inserto di DNA. In realtà, occorre anche che vi siano un paio di geni selezionabili in terreni adeguati. Infatti, la clonazione richiede l’apertura del vettore con un enzima di restrizione (spesso quello usato per produrre i frammenti di DNA da inserirvi), la reazione di saldatura con la DNA ligasi (“ligation”) e il mescolamento del vettore ricombinante con le cellule batteriche affinché lo captino al loro interno. Mentre la prima fase non presenta problemi, la seconda e la terza hanno un rendimento nettamente inferiore al 100%: il vettore può richiudersi su sé stesso senza l’inserto (vettore non ricombinante) e non tutte le cellule capteranno le molecole di vettore (ricombinante o meno). Occorre quindi favorire la crescita delle colonie da cellule batteriche che hanno comunque captato il vettore e tra queste individuare quelle che contengono il vettore con l’inserto. Diciamo subito, prima di vedere come si opera questa selezione, che la captazione dei vettori plasmidici da parte delle cellule batteriche si attua con la tecnica della trasformazione (il fenomeno osservato negli esperimenti di Griffith e di Avery e colleghi, vedi Cap. 1). Per rendere efficace questo trasferimento (che ha comunque un rendimento non troppo alto), il DNA viene messo a contatto con le cellule in una soluzione di CaCl2, che produce una microprecipitazione del DNA sulla superficie cellulare come sale di calcio (insieme a fosfato di calcio, derivante dal fosfato del terreno di coltura); questo facilita la captazione del DNA plasmidico da parte delle cellule. Si può anche usare una metodica che consiste nel sottoporre le cellule a contatto col DNA, a brevissimi impulsi elettrici ad alto voltaggio (400-600 V) per aumentare la permeabilità delle loro membrane (elettroporazione). Con entrambi i metodi, l’efficienza migliora col diminuire delle dimensioni del DNA ed è più alta per il DNA circolare. Un carattere genetico facilmente selezionabile nei batteri è la resistenza agli antibiotici. Plasmidi naturali portano spesso geni che codificano proteine capaci di rendere inefficaci in varia maniera specifici antibiotici. Uno dei primi vettori usati correntemente (pBR322, lungo 4,36 kpb; vedi Figura 9.3) fu derivato proprio da un plasmide recante un gene per la resistenza alla tetraciclina (tetr) e uno per la resistenza all’ampicillina (ampr). Vi sono siti di restrizione unici per alcune endonucleasi di classe II all’interno di questi geni in pBR322: tre nel gene tetr e uno nel gene ampr. Quando il vettore plasmidico viene aperto in uno di questi siti e poi saldato con l’inserto di DNA da clonare, la sequenza codificante di uno dei due geni risulta interrotta; se viceversa il vettore subisce la saldatura senza aver incorporato l’inserto, il gene viene ripristinato nella sua integrità; come 130 esempio, consideriamo che l’inserto abbia interrotto il gene ampr. Cellule di un ceppo sensibile a entrambi gli antibiotici vengono trasformate col vettore pBR322 ricombinante (ma tra queste molecole ve ne sono alcune non ricombinanti) e piastrate su un terreno contenente tetraciclina. Ogni cellula effettivamente trasformata forma una colonia, mentre quelle non trasformate non crescono. Di questa piastra madre vengono fatte due repliche, una ancora in terreno con tetraciclina e l’altra in terreno con tetraciclina+ampicillina. La prima replica dovrebbe apparire identica alla piastra madre, mentre nella seconda replica mancheranno tutte le colonie derivanti da cellule che contengono il pBR322 ricombinante (e perciò sensibili all’ampicillina). Come tutte le applicazioni tecniche, anche i vettori sono stati migliorati via via che ci si rendeva conto di nuove possibilità ed erano disponibili altri procedimenti. Vettori plasmidici derivati da pBR322 sono quelli della serie pUC (2,7 kpb), che al posto del gene tetr hanno il gene lacZ preceduto dal suo promotore-operatore. Inoltre, ben nove siti di restrizione unici sono raggruppati in un segmento di DNA sintetico, detto polylinker (= adattatore multiplo), collocato all’inizio del cistrone lacZ; quando esso è intatto, il gene per la - galattosidasi viene espresso, mentre ciò non avviene se il polylinker è stato interrotto da un inserto di DNA. Il ceppo di E. coli usato come ospite è lacZe sensibile all’ampicillina. Dopo la trasformazione, le cellule sono piastrate su un terreno con ampicillina, e qui cresceranno solo le cellule trasformate; quelle che contengono il vettore senza l’inserto, in presenza dell’induttore IPTG esprimono la -galattosidasi, mentre ciò non avviene nelle cellule che hanno ricevuto il vettore ricombinante. Le colonie dei due tipi possono essere facilmente distinte, dopo il trattamento con IPTG, in presenza di X- GAL, il substrato cromogeno per la -galattosidasi: le colonie che restano bianche contengono il vettore ricombinante (e quindi l’inserto di DNA che interessa), mentre quelle colorate in blu sono state trasformate col vettore che si è risaldato senza inserto. L’uso del gene per la -galattosidasi è divenuto assai comune nei vettori delle successive generazioni, mentre il polylinker ne è divenuto una caratteristica essenziale. Man mano che crescevano le esigenze della clonazione del DNA e dello studio di interi genomi, anche eucariotici, era però necessario sviluppare vettori di diverso genere. Da un lato, occorreva superare il limite delle dimensioni massime (1015 Kpb) per gli inserti clonabili con discreta efficienza nei vettori plasmidici; d’altro lato, anche restando nell’ambito di questi vettori, si richiedeva di poter trascrivere in RNA e tradurre in proteina un inserto la cui sequenza fosse codificante, sia per poterne studiare la struttura e le funzioni (se ancora ignote) sia per scopi di tipo applicativo (produzione industriale di proteine eucariotiche nei batteri). Inoltre, i vettori di espressione possono consentire di produrre la proteina in vitro e riconoscerla con anticorpi specifici, oppure di farla produrre (anche in quantità diverse) all’interno di particolari tipi cellulari per studiarne la funzione in vivo. PstI HindIII BamHI SalI ampr tetr 4,36Kpb pBR322 origine della replicazione Figura 9.3. Il vettore di clonazione pBR322. Sono indicati i geni per la resistenza all’ampicillina e alla tetraciclina, l’origine di replicazione e i siti unici di restrizione per 4 diversi enzimi di classe II. Se l’inserto è clonato nel sito PstI, il gene ampr è interrotto e il vettore ricombinante conferisce all’ospite batterico il fenotipo amprtetr+. Se invece è clonato in uno degli altri tre siti, il fenotipo dei batteri trasformati col vettore ricombinante è ampr+tetr. 131 9.6. I vettori derivati dal fago e i cosmidi. Le cellule batteriche possono ricevere DNA estraneo, oltre che con la trasformazione, anche con l’infezione fagica, che risulta assai più efficiente della trasformazione, soprattutto quando le dimensioni del DNA circolare superano le 10 Kpb. Su questo principio, e sulla base delle ampie conoscenze acquisite sui genomi di alcuni fagi e sul loro funzionamento, sono stati elaborati vettori derivati, in particolare, dai genomi del fago e del fago M13 (un fago filamentoso con DNA circolare a singolo filamento). Come vedremo, questi due tipi di vettori presentano caratteristiche e utilizzi diversi. Il fago si è prestato facilmente ad essere convertito in un vettore di DNA ricombinante, per svariate ragioni, tra cui la conoscenza approfondita del funzionamento del suo genoma. Per poter fungere da vettore è inoltre sufficiente e necessario che il fago compia nell’ospite solo il ciclo litico: ciò significa che intere porzioni del DNA genomico del fago (ad es., tutti i geni implicati nella lisogenia) possono essere eliminate e sostituite da DNA estraneo. Poiché l’automontaggio delle particelle fagiche può essere fatto in vitro con l’impiego di due sole proteine fagiche, la produzione di particelle contenenti DNA ricombinante è relativamente semplice (a partire da genomi lineari sia singoli che saldati ai siti cos, dalle “teste vuote” e dalle “code” premontate). La modificazione base per base di particolari tratti di sequenze geniche ha poi permesso di avere in unica copia determinati siti di restrizione, di inserire un polylinker e geni marcatori o selettori per opportuni ceppi di E. coli. L’infezione è altamente efficiente (100 volte più della trasformazione a parità di quantità di DNA), soprattutto in ospiti cresciuti su maltosio che fa aumentare l’espressione dei siti recettoriali (pili) per le particelle . Il vaglio di svariati cloni di DNA ricombinante è infine agevolato perché non si cercano colonie di batteri, ma placche di lisi fagiche, dove il DNA è già libero da qualsiasi involucro cellulare batterico. La placca di lisi copre un’area assai inferiore a un colonia batterica e quindi consente anche un risparmio nel numero di piastre che si devono allestire (si arriva a distinguere fino a 10.000 placche di lisi per piastra, su capsule Petri di grande diametro). I vettori basati sul fago sono di svariati tipi, a seconda degli usi che se ne debbono fare e dell’ospite batterico usato per produrre le placche di lisi e vagliare i cloni; essi differiscono per i siti di restrizione presenti nel polylinker, per i geni selettivi e per la lunghezza minima e massima di inserto che possono accettare. Infatti, l’impacchettamento del DNA lineare nella testa della particella fagica consente che esso sia di lunghezza poco inferiore (di circa il 20%) o pochissimo superiore (del 5%) a 48,5 Kpb, ma non avviene se si esce da questo intervallo. Alcuni vettori di questa classe possono accettare inserti fino a 24 Kpb; quindi il vettore non ricombinato non entrerà nelle particelle e sarà eliminato nella fase pre-infezione di tutto il procedimento. Questa elevata capacità di inserzione, oltre a consentire la clonazione di cDNA, può essere sfruttata anche per clonare frammenti di DNA genomico che rientri in quelle dimensioni. Tuttavia, alcuni frammenti di dimensioni maggiori sfuggiranno alla clonazione e non saranno rappresentati nella genoteca. Allo scopo di avere vettori utili per la clonazione di lunghi inserti di DNA genomico, sono stati invece sviluppati i cosmidi, vettori artificiali che uniscono, in una sola corta molecola di DNA, i siti cos (capaci di pilotare l’impacchettamento nelle particelle del fago ) con alcuni elementi dei plasmidi. Un cosmide tipico (5 kpb) contiene quindi: un’origine di replicazione plasmidica (di solito capace di consentire la replicazione in parecchie copie nella stessa cellula ospite), un gene di selezione (di solito, per la resistenza alla tetraciclina ovvero alla kanamicina), un polylinker e un sito cos. Si possono clonare nel cosmide inserti di DNA lunghi da 33 a 46 kpb. I cosmidi ricombinanti vengono poi impacchettati nelle particelle del fago e con queste si infetta l’ospite batterico adeguato. I cosmidi si replicano al suo interno come fossero plasmidi di grosse dimensioni: l’espediente dell’impacchettamento serve a rendere efficiente il trasferimento all’ospite, che con la trasformazione sarebbe assai poco efficiente (viste le dimensioni del cosmide ricombinante), oltre a rendere automatica l’esclusione dei cosmidi privi d’inserto (perché troppo piccoli per essere impacchettati). 134 SCHEMA 9.3. Metodo di nick translation per produrre sonde radioattive: il tratto di DNA marcato con P è mostrato dalla linea spessa. SCHEMA 9.4. Metodo di random priming per produrre sonde radioattive da un DNA a doppia elica: simboli come nello SCHEMA 9.3. 9.7.3. Sonde di DNA o di RNA prodotte da frammenti inseriti in vettori. Le metodiche che ora descriveremo si basano sull’uso di particolari vettori derivati dai batteriofagi filamentosi f1 o M13, che vengono sfruttati anche per la determinazione della sequenza del DNA secondo Sanger (vedi § 9.8). Premettiamo per chiarezza che quanto segue si riferisce a manipolazioni di un singolo tipo di frammento di DNA già clonato per altra via; quasi sempre si tratta di un clone di cDNA. Il genoma contenuto nella particella infettiva di questi fagi è un singolo filamento circolare, che assume una forma allungata essendo rivestito dalle proteine che costituiscono il capside; tali particelle possono attraversare le membrane cellulari batteriche senza produrre lisi, grazie a particolari proteine idrofobiche che consentono loro di permeare i doppi strati di fosfolipidi. Durante il ciclo riproduttivo nella cellula ospite, si genera una forma replicativa a doppio filamento circolare. È possibile inserire frammenti non troppo grandi di DNA in vettori derivati da M13, che mantengono la capacità di crescere infettivamente in una popolazione batterica. Le modifiche al genoma di M13 per costruire i vettori sono state operate entro la regione intergenica (IG) e comprendono: 1) un polylinker; 2) due promotori (vedi sotto); 3) il segmento genico lacz() di E. coli che rende lacZ+ opportuni ceppi batterici per -complementazione. L’inserzione del clone di DNA viene ovviamente effettuata in vitro nelle forme a doppia elica circolare (fagemide con cui si possono trasformare i batteri e che si può estrarre dagli omogenati di batteri infettati dopo la loro crescita); superinfettando i batteri con un fago M13 helper (che produce le proteine dell’involucro e della replicazione, ma non può essere riprodotto), il vettore clonato che si recupera dalla coltura batterica (sotto forma di particelle fagiche) è a singolo filamento e quindi contiene solo uno dei due filamenti dell’inserto (quello legato al filamento genomico del vettore fagico). Per ottenere separatamente la clonazione dell’uno e dell’altro filamento, si può effettuare una inserzione direzionale del clone di DNA, usando l’una e l’altra forma alternativa del vettore (M13mp8 e M13mp9; vedi Fig. 9.3 A), distinte dall’orientamento del polylinker; la raccolta delle particelle fagiche fornirà nei due casi vettori a singolo filamento, contenenti ognuno uno dei due filamenti dell’inserto. Sull’uno e l’altro lato del polylinker dei vettori M13, sono inseriti, orientati entrambi verso l’inserto, due promotori derivati da altri fagi: per l’RNA polimerasi del fago T7 e per quella del fago SP6. Questi due enzimi e i rispettivi promotori sono estremamente semplici e molto efficienti, anche in vitro (ad es.: la RNA polimerasi di T7 è formata da una sola catena polipeptidica e il suo promotore è una sequenza di 17 pb subito a monte del sito d’inizio; la trascrizione è veloce e non DNA polimerasi I di E. coli + dNTP32 DNA polimerasi I di E. coli (attività 5'-3' nucleasica) 5' 5' 5' 5' 5' 5'3' 3' 3' 3' 3' 3' elettroforesi su gel alcalino sonda radioattiva a singolo filamento 5' 5' 5'3' 3' 5' 5'3' 3' Riscaldamento a 100°C seguito dalla ibridazione a una temperatura più bassa con gli inneschi casuali DNA polimerasi (frammento di Klenow) + dNTP 32 5' 5'3' 3' elettroforesi su gel alcalino sonde a singolo filamento inneschi di diversa sequenza 135 soggetta a meccanismi di controllo). Vediamo ora come si prepara una sonda radioattiva di DNA complementare alla sequenza dell’inserto. A T7 SP6 polylinker parte essenziale del genoma di M13 T7 SP6 polylinker parte essenziale del genoma di M13 IG = regione intergenica IG M13mp8 M13mp9 EcoRI-SmaI-BamHI-SalI-PstI-HindIII HindIII-PstI-SalI-BamHI-SmaI-EcoRI P(lac) P(lac) IG modificata nei due vettori B (USP) innesco DNA pol Klenow + dNTP 32 inserto a singolo filamento in M13mp9 (USP) innesco DNA pol Klenow + dNTP 32 inserto a doppio filamento EcoRI(EcoRI) t EcoRI frammento radioattivo frammento radioattivo di lunghezza precisadi lunghezza variabile C HindIII EcoRI HindIII EcoRI HindIII EcoRI T7 SP6 SP6 SP6 T7T7 HindIII EcoRI RNA polimerasi di SP6 + NTP 32 RNA polimerasi di T7 + NTP 32 "+" "-" Sonde radioattive di RNA Figura 9.3. A: Schema dei due vettori complementari basati sul fago M13. B: Sintesi di una sonda radioattiva di DNA a partire da un clone a singolo filamento inserito in M13mp9; il frammento radioattivo complementare all’inserto viene separato per elettroforesi denaturante ed eluito dal gel. C: Sintesi di una sonda radioattiva di RNA a partire da un clone a doppio filamento inserito in M13mp9 (forma replicativa). 136 Partiamo dal clone a singolo filamento inserito nel vettore mp9 (Fig. 9.3 B). Si usa come innesco un oligodeossinucleotide complementare alla sequenza subito a monte dell’inserto e il frammento di Klenow di DNA polimerasi I in presenza di [P]dNTP; in tal modo, il filamento viene copiato nel suo complementare radioattivo; si può in alternativa usare l’innesco con sonda fluorescente al 5’. Dopo un tempo sufficiente a coprire con la sintesi tutto l’inserto, si arresta la reazione e si tratta la miscela con l’enzima di restrizione che ha il sito a destra dell’inserto (a valle del promotore di SP6). In tal modo, tutti i filamenti radioattivi complementari all’inserto avranno la stessa lunghezza (su ogni molecola stampo la polimerasi ha proseguito oltre fino a punti diversi); dopo riscaldamento a 100°C, l’elettroforesi su gel di agarosio denaturante produrrà una banda netta radioattiva o fluorescente. Gli altri frammenti saranno dispersi nella parte anodica del gel, mentre il filamento stampo linearizzato sarà nella parte catodica del gel. Si può sintetizzare l’altra sonda (complementare alla prima) usando il clone a singolo filamento inserito nel vettore mp8. Per la sintesi di sonde radioattive di RNA, si usa la forma a dsDNA del vettore basato su M13. Il cerchio a doppia elica viene prima tagliato con uno dei due enzimi di restrizione che hanno il sito bersaglio ai lati dell’inserto. In presenza di [P]NTP, la RNA polimerasi fagica per il promotore rimasto a monte dell’inserto trascriverà uno dei due filamenti in RNA radioattivo, fino a uscire dallo stampo (run-off). Facendo l’operazione alternativa con l’altro enzima di restrizione e con l’altra RNA polimerasi fagica, si otterrà la sonda di RNA complementare alla precedente. In entrambi i casi, si procede per via elettroforetica a isolare e recuperare la sonda radioattiva. 9.7.4. Sonde sintetiche di DNA prodotte in base a sequenze amminoacidiche. In parecchi casi, soprattutto applicando conoscenze biochimiche (isolamento del gene corrispondente a una proteina già individuata), non si dispone di alcun frammento di DNA della sequenza ricercata. Tuttavia, se la proteina è sufficientemente pura, se ne può determinare la sequenza amminoacidica, anche parziale; in effetti, basta conoscere la sequenza di pochi oligopeptidi comprendenti tra 12 e 15 amminoacidi. Con un’operazione al computer che possiamo chiamare “retrotraduzione”, si scrive la sequenza di DNA che codifica quella sequenza peptidica; tale oligodeossinucleotide (lungo da 36 a 45 nucleotidi) può essere sintetizzato per via chimica, di solito col sintetizzatore automatico, utilizzando precursori radioattivi oppure legando un gruppo fluorescente o specificamente riconoscibile con anticorpo (ad es., biotinile o digossigenina) all’estremità 5’. Tuttavia, il procedimento è complicato dal fatto che ci sono più codon corrispondenti a un dato amminoacido (degenerazione del codice). Si possono allora seguire due metodi: in entrambi i casi, se sono disponibili più peptidi, si sceglie quello con la minor degenerazione nei codon (ad esempio, si preferiscono peptidi contenenti metionina e triptofano, amminoacidi che hanno un solo codon). Nel primo metodo, si sintetizzano tutti gli oligodeossinucleotidi possibili codificanti quella data sequenza amminoacidica; la miscela così prodotta viene usata nelle ibridazioni (“sonda degenere”). Nel secondo metodo, si sfrutta (se è disponibile) la conoscenza della frequenza di uso dei codoni nella specie oggetto dell’indagine: così viene sintetizzata solo la sonda che più probabilmente corrisponde all’esatta sequenza cercata (nella letteratura anglosassone, la sonda è detta guess-mer, termine traducibile più o meno come “azzeccàmero”). Col primo metodo, le condizioni per l’ibridazione sono di alta stringenza (vedi § 9.7.5.), poiché almeno un tipo di molecola nella sonda degenere avrà sicuramente la sequenza esatta; col secondo metodo, se condizioni di alta stringenza non dànno esito positivo, si può calare moderatamente la stringenza fino a ottenere un risultato (il guess-mer potrebbe non coincidere con la sequenza naturale in una o due posizioni nucleotidiche). 9.7.5. Diverse situazioni e condizioni per l’ibridazione. Tutte le molecole marcate sopra descritte possono essere usate come sonde in diversi tipi di esperimenti che richiedano l’individuazione, la visualizzazione e talvolta la stima quantitativa di una determinata sequenza di DNA o di RNA. Queste diverse situazioni sperimentali sono schematicamente riassunte nella Tabella 9.III. Per le ibridazioni in situ (in qualche caso anche per quelle su filtro) sono spesso usate sonde non radioattive, bensì marcate (di solito all’estremità 5’) con un residuo facilmente rivelabile tramite reazione con un anticorpo reso fluorescente (apteni come la digossigenina e la biotina). 139 5) Poiché la separazione ottimale delle bande richiede tempi di corsa diversi per frammenti di lunghezza assai differente, si fanno in genere tre gel caricati con gli stessi campioni. Il primo è fatto correre finché il fronte giunge all’estremità anodica (short run), e serve per leggere, tipicamente, la sequenza dei primi 160-180 nucleotidi; gli altri due sono fatti correre per tempi più lunghi (long run), in modo che i frammenti corti escano all’estremità anodica. Nel secondo si distinguono le bande corrispondenti ai nucleotidi da 150-170 a 320-360 e nel terzo quelle da 310-350 a 480-500 (la sovrapposizione serve a evitare discontinuità; il limite dipende anche dalla lunghezza del gel). 6) È possibile così determinare in modo continuo una sequenza fino a ~1000 nucleotidi; poiché è quasi sempre disponibile per il sequenziamento anche il filamento complementare, esso è “letto” in direzione opposta, fornendo anche conferma per la sequenza nelle zone più lontane dalle estremità sull’altro filamento. Si arriva così a determinare la sequenza di ~2 kpb. Se il clone di DNA è più lungo, si usano suoi frammenti più corti, secondo procedure che dipendono dal metodo usato. 7) Il risultato illustrato è quello ottenibile da operatori umani. Oggi sono però in uso strumenti robotizzati (Sequenator) che lavorano con quattro sonde fluorescenti (una per ogni base = punto di scissione) e operano con elettroforesi capillare ad alta risoluzione; le bande dei vari colori sono lette da uno scanner a filtri che legge direttamente la sequenza in corsa nel gel. In tre ore, un Sequenator multicanale (centinaia di colonne in parallelo) può arrivare a leggere sequenze per 200 kpb complessive. In effetti, quasi nessun ricercatore determina oggi la sequenza di un DNA, ma lo manda a una ditta che lo fa a pagamento in pochi giorni (gli apparecchi automatici rendono se usati in modo continuo e a pieno regime, situazione che si ha difficilmente in un laboratorio di ricerca). Questi principi risultano più comprensibili entrando nel dettaglio specifico dei due metodi. 9.8.1 Il metodo chimico di Maxam & Gilbert . È il meno popolare dei due, in quanto richiede diverse manipolazioni tipiche della microanalisi e della radiochimica; la precisione nell’esecuzione e il rispetto esatto dei tempi di reazione in ogni passaggio sono essenziali. La complicazione più seria, per come spesso si isolano le molecole di DNA, consiste nel fatto che il frammento di DNA (di solito presente come inserto in un vettore) deve essere prima escisso dal vettore con opportuni enzimi di restrizione, separato in due filamenti singoli, poi purificati. Tuttavia, questo metodo è utile in alcuni tipi di analisi di sequenza per i quali risulta di applicazione più immediata, tipicamente quando si generano in vitro singoli filamenti di DNA già marcati al 5’ con P. Infatti, la prima operazione da effettuare sul campione nel metodo di Maxam & Gilbert è la rimozione dei gruppi 5’-fosfato terminali con fosfatasi alcalina e la loro risintesi in presenza di [P]ATP tramite la polinucleotide cinasi. Dopo separazione dei due filamenti, il campione è diviso in quattro aliquote per subire i trattamenti che provocano la scissione a livello di un determinato tipo di nucleotide. Questa operazione si svolge in due fasi: 1) modificazione e distacco della base, secondo quattro modalità che attaccano le G (metilazione su N7 con dimetilsolfato), le A e le G (metilazione e depurinazione a pH 2 con HCOOH), le C e le T (idrazinolisi a bassa forza ionica) e le C (idrazinolisi in NaOH); 2) rottura della catena nei punti privi di base per eliminazione del residuo deossiribosilico e fosforico (trattamento uguale in tutti e quattro i casi con piperidina a caldo, pH>12). Nell’autoradiografia dell’elettroforesi, le G sono le bande che compaiono sia nella 1ª che nella 2ª corsia, le A quelle che compaiono solo nella 2ª corsia, le T quelle che compaiono solo nella 3ª e le C quelle che compaiono sia nella 3ª che nella 4ª corsia. Come già detto nei principi generali dei due metodi (punto 2), la scissione dovrà avvenire a caso su una delle posizioni con le basi indicate in maniera da ottenere tutti i possibili frammenti contenenti l’estremità 5’ originaria. La scissione entro la stessa molecola in due o più punti distinti produrrà un solo frammento rivelabile (quello tra l’estremità marcata e il sito di scissione ad essa prossimale), poichè gli altri frammenti non saranno più marcati (vedi punto 4). Perciò un trattamento troppo lungo darà un gel di sequenza troppo “carico” nelle bande più veloci (frammenti visibili più corti) meno “carico” nelle bande più lente; invece, il trattamento troppo breve dà un gel ovunque sbiadito, con bande poco distinguibili. 9.8.1 Il metodo dideossi di Sanger. Il principio specifico di questo metodo consiste nel far agire una DNA polimerasi per copiare il filamento di un inserto clonato, in presenza dei quattro 2’-dNTP e di una piccola quantità di un 2’,3’-ddNTP (2’,3’-dideossinucleoside trifosfato) con la base 140 specifica di cui si vogliono determinare le posizioni. Quando il residuo 2’,3’-ddNMP (terminatore di catena) è incorporato al posto del corrispondente residuo naturale, si forma nel polinucleotide sintetizzato un’estremità priva di gruppo 3’-OH e quindi incapace di fungere da innesco per l’aggiunta di un nuovo nucleotide (Fig. 9.4). Per far sì che vengano generati tutti i frammenti terminanti con una certa base, occorre bilanciare opportunamente la concentrazione del 2’,3’- ddNTP con quella dell’omologo 2’-dNTP. In ciascuna delle quattro incubazioni diverse si metterà uno dei quattro 2’,3’-ddNTP. Queste miscele sono già preparate dalla ditta che vende il kit per la determinazione di sequenza, dopo di che l’incubazione con la DNA polimerasi I di E. coli non presenta difficoltà. A T C A G T G T A G T C -3'OH P P P A -3'H A T C A G T G T A G T C P A -3'H filamento copia privo di innesco PPi DNA polimerasi filamento stampo filamento copia 2',3'-ddATP residuo di 2',3'-ddAMP PPPP PPPPPP P PPPP PPP P P Figura 9.4. Dettaglio di uno stampo-innesco di DNA durante la copiatura del filamento secondo il metodo di Sanger. La DNA polimerasi incorpora all’estremità 3’ un residuo di 2’,3’-ddAMP, unendolo con legame fosfodiestereo al precedente residuo di 2’-dCMP. Il successivo nucleotide da usare come substrato sarebbe il 2’-dCTP, in appaiamento col residuo di dGMP sul filamento stampo; il legame fosfodiestereo non può tuttavia essere formato per la mancanza del gruppo 3’-OH sull’innesco. N.B.: quattro residui prima era stato incorporato nella stessa catena il 2’-dAMP, poiché l’inserimento dell’analogo “dideossi” avviene raramente e casualmente. Occorre ovviamente fornire un innesco e scegliere il modo di marcare i frammenti. Di solito si determina la sequenza del frammento inserito in un vettore M13: la sequenza del vettore a monte dell’inserto è nota e basterà usare l’oligonucleotide ad essa complementare (USP = Universal Sequencing Primer). Questo può essere: a) radioattivo, perché sintetizzato con 32P nei gruppi fosfati; b) fluorescente perchè ha legato al 5’ un gruppo fluorescente (ne sono anche disponibili in commercio quattro, con colori diversi); c) non marcato, perché si opera la marcatura durante la sintesi del filamento complementare all’inserto. In quest’ultimo caso, la marcatura può essere operata: a) con [32P]2’-dNTP aggiunto nella miscela; b) con [35S]2’-dNTP (-fosforotioato) aggiunto nella miscela; c) con l’uso dello specifico [32P]2’,3’-ddNTP in ciascuna miscela (metodo più costoso, ma affidabile). L’uso dell’analogo fosforotioato marcato con zolfo radioattivo è assai popolare, dato che permette di avere una buona sensibilità (molti atomi incorporati per 141 filamento) senza avere i rischi del 32P che emette raggi e quindi rischioso per l’operatore e per la stabilità dei frammenti di DNA generati dalla DNA polimerasi, a causa della rottura dei legami fosfodiesterei se colpiti dai raggi (fenomeno della radiolisi). La marcatura con inneschi fluorescenti ha l’ovvio vantaggio di non usare composti radioattivi, il che significa anche evitare inneschi o precursori che decadono rapidamente nel tempo (32P ha una emivita di 14 giorni, 35S di 87 giorni); la sensibilità di questa marcatura è solo di poco inferiore a quella ottenibile coi radioisotopi. Dopo la corsa elettroforetica il gel può essere “letto” con uno spettrofluorimetro a scansione; poiché questo è in grado di discriminare gli spettri di emissione dei quattro diversi marcatori fluorescenti, le quattro miscele per le quattro basi innescate con i quattro marcatori diversi possono anche essere applicate sul gel nella stessa corsia (ciò permette di analizzare sullo stesso gel 12 cloni diversi su entrambi i filamenti, usando 24 corsie). La Fig. 9.5 mostra schematicamente l’aspetto di un gel di sequenza secondo Sanger, con l’indicazione della sequenza che si può “leggere” direttamente sul gel. La sequenza ottenuta è ovviamente quella del filamento complementare: se ad esempio si è usato il filamento clonato in M13mp8, si otterrà la sequenza del filamento clonato dallo stesso inserto in M13mp9, e viceversa; è anche ovvio che ciascuna delle due (col sequenziamento completo) dà la sequenza dell’uno e dell’altro filamento. Vi sono quindi due piccole differenze, più formali che sostanziali, nel visualizzare le sequenze nei due metodi: in quello chimico si osservano bande contenenti frammenti che terminano prima di una certa base (il residuo è distrutto dal trattamento di scissione) e la sequenza ottenuta è quella del filamento dato; in quello di Sanger si osservano bande contenenti frammenti che terminano con una certa base (presente nel residuo dideossi) e la sequenza letta è complementare al filamento dato. Figura 9.5. Schema di un pezzo di gel di sequenza determinata secondo il metodo di Sanger. Le quattro lettere in alto indicano i pozzetti e le relative corsie del gel in cui si trovano i frammenti marcati che terminano con la base indicata. Frammenti più lunghi (cioè terminanti in posizione più lontana dall’innesco) hanno mobilità anodica minore; la mobilità è proporzionale infatti a log(PM). Dalle bande più anodiche si può quindi risalire verso l’origine delle quattro corsie con un cammino a zig-zag che tocchi progressivamente tutte le bande, che saranno “lette” col nome della base. La sequenza scritta a lato del gel è proprio la sequenza del filamento copia sintetizzato dalla DNA polimerasi (complementare al filamento inserito nel vettore). Nella regione più alta del gel, le bande dei frammenti più lunghi (indicate in grigio) non sono adeguatamente risolte e non consentono di leggere la sequenza. Esse possono essere risolte con elettroforesi più prolungata; un singolo gel consente tuttavia di leggere un numero di bande superiore a quelle indicate nell’esempio (fino a 180). Quasi sempre un gel viene caricato con 6 campioni (2 filamenti di 3 cloni diversi), poiché la larghezza consente di analizzare con comodo 24 corsie. La lettura è fatta sul gel solo con la fluorimetria; nel caso di radiomarcatura, è fatta sulla lastra autoradiografica. G A C T estremità 3' estremità 5' + anodo G CT AA C G T T A C T T T T C C C C A A A G G G origine fronte 144 SCHEMA 9.6. Costruzione di una banca di cDNA dall’mRNA-poliA+ estratto da un tipo cellulare. Cellule che esprimono il gene che interessa cromatografia su colonna di oligo-dT mRNA-poliA+ RNA totale estrazione dell'RNA 5'-cap AAAAAA(A)n 3'TTTTTTCGCCGGCG5' sito per NotI CG5' 5'-cap AAAAAA(A) -3'OHnTTTTTTCGCCGG HO-3'trascrittasi inversa + dNTP 5'-cap AAAAAA(A) -3'OHnTTTTTTCG CC GGCG5'idrolisi alcalina TTTTTTCGCCGGCG5' nucleotidil trasferasi + dGTP filamento (-) di cDNA TTTTTTCGCCGGCG5'GGGGGG HO-3' 5'GTCGACCCCCCC3' sito per SalI TTTTTTCGCCGGCG5'GGGGGG 5'GTCGACCCCCCC TTTTTTCGCCGGCG5'3'CAGCTGGGGGGG 5'GTCGACCCCCCC DNA polimerasi di Klenow (oppure trascrittasi inversa) + dNTP AAAAAAGCGGCCGC3' HO-3' HO-3' HO-3' 3'-OH filamento (+) di cDNA TTTTTTCGCCGG5'3'GGGGGGG 5'TCGACCCCCCC AAAAAAGC3' digestione con Sal e NotI I vettore gt22 digerito con I e ISal Not DNA ligasi di T4 + ATP Impacchettamento nelle particelle del batteriofago lambda Il procedimento descritto nello SCHEMA 9.6 mette in evidenza la necessità di curare alcuni dettagli. Il punto (5) si potrebbe effettuare completando i filamenti con la TNT e gli opportuni nucleotidi, col che si avrebbero cDNA a estremità smussate (terminante con diverse coppie A·T da 145 un lato e con diverse coppie G·C dall’altro) che potrebbero essere inseriti in un vettore aperto con qualunque enzima di restrizione che produca estremità smussate. Il procedimento sarebbe però assai poco efficiente (vedi § 9.4); inoltre, avrebbe l’inconveniente che nel punto di saldatura non ci sarebbe un sito di restrizione e sarebbe pressoché impossibile recuperare l’inserto per escissione dal vettore dopo la clonazione. L’uso dei due inneschi descritti nello SCHEMA 9.6 risolve il problema e consente di clonare gli inserti in maniera sicura, rescindibile e direzionale. Infatti, al 5’ dell’oligo- dT è legata la sequenza a singolo filamento del sito NotI, che non si appaia durante la sintesi dei filamenti (), ma è usata come stampo alla fine della sintesi dei filamenti (+);similmente si fa con la coda di oligo-dG, a cui si appaia un innesco di oligo-dC che ha al 5’ il sito a singolo filamento di SalI: questo è completato dalla polimerasi al 3’ dei filamenti () per allungamento dell’oligo-dG. La scelta di questi due siti di restrizione è opportuna: infatti essi sono dei ‘rare cutters’ e sarà poco probabile che i loro siti si trovino all’interno dei cDNA appena sintetizzati; il vettore gt22 e diversi altri vettori di clonazione e di espressione contengono un polylinker con tali siti. Quindi, la miscela dei cDNA e il vettore sono separatamente trattati con NotI e SalI, poi sono mescolati e saldati con la ligasi (gt22 è linearizzato nei due tronconi, ‘braccio destro’ e ‘braccio sinistro’: il primo inizia col sito cos e finisce col mezzo sito SalI, il secondo inizia col mezzo sito NotI e finisce col sito cos). Infine si ha il montaggio nelle particelle di . Il cDNA è inserito direzionalmente, con l’estremità 5’ del filamento-senso dal lato del sito SalI e l’estremità 3’ dal lato del sito NotI. Naturalmente, questo non è l’unico tipo di vettore per costruire banche di cDNA, ma gli altri sfruttano principi simili, anche se con siti di taglio diversi e talvolta senza la finezza dell’inserzione direzionale, che nel vettore di clonazione per vagliare una banca non è necessaria in modo assoluto (ma eviterà una manovra in più nelle operazioni successive all’isolamento dei cloni di interesse). Va notato che la trascrittasi inversa è poco processiva ed è piuttosto probabile trovare cloni di cDNA che mancano della porzione corrispondente a quella in 5’ dell’mRNA (cloni incompleti); tale probabilità cresce con la lunghezza dell’mRNA. Nel vagliare una banca di cDNA, si potranno perciò trovare cloni di diversa lunghezza che si ibridano con la medesima sonda specifica; un clone incompleto inizia alla sua estremità 5’ col quadro di lettura aperto (ORF = open reading frame) che prosegue fino a un codone di stop, seguito da una regione non tradotta (3’-UTR = 3’ untranslated region). Invece, in un clone completo ci sarà al 5’ una regione leader non tradotta (5’-UTR = 5’ untranslated region) di varia lunghezza, seguita da un codone di inizio ATG (= AUG sull’mRNA). Più raramente si trovano cloni con ORF interrotti all’estremità 3’ o a entrambe le estremità: questi derivano per lo più dalla presenza accidentale nel retrotrascritto di un sito di restrizione per l’enzima (o gli enzimi) scelti per l’inserzione nel vettore. Naturalmente, si cerca di isolare un clone completo; quando esso non è reperibile nella banca con le migliori sonde, è possibile che più cloni incompleti diversi possano consentire di mettere insieme la sequenza completa (con operazioni di saldatura tra inserti e completamenti anche per sintesi chimica); si può anche usare un innesco specifico da una sequenza centrale in un clone incompleto per retrotrascrivere la porzione 5’ dell’mRNA ricercato. L’ultima alternativa è sempre la ripreparazione della banca di cDNA dagli mRNA originari (magari con una strategia e un vettore diversi). Una volta ottenuto un clone completo di cDNA retrotrascritto da un particolare mRNA, oltre allo studio della sequenza codificante e alla sua espressione per ottenere la proteina, si possono studiare le sequenze UTR e cercare di individuarne l’eventuale ruolo (ad esempio, nel controllare la stabilità dell’mRNA). Come detto nel RIQUADRO 9.1, le sonde costruite a partire da un clone di cDNA sono utilissime per identificare i cloni di DNA genomico e per avviare la ricostruzione di un gene completo. In seguito, è possibile determinare: a) il numero e la lunghezza degli esoni e degli introni che compongono il gene; b) la sequenza precisa nei punti di giunzione esone-introne e introne- esone; c) la sequenza intorno al sito di inizio della trascrizione, da cui partire per identificare le sequenze attive del promotore e altri elementi di controllo trascrizionale del gene. Esamineremo ora brevemente le tecniche biochimiche che consentono questa mappatura del gene. 146 9.10. Mappatura fine di un gene e studio dei suoi elementi di controllo. Alcune nucleasi prive di specificità di sequenza (che hanno quelle di restrizione) sono assai utili per disegnare mappe dettagliate di regioni geniche. Un esempio di questo tipo è l’uso della DNasi I nella footprint analysis (vedi Capitolo 6), usata anche per studiare lo stato di attività trascrizionale dell’eucromatina (vedi § 9.11). Un altro enzima assai utile per lavori di mappatura è la nucleasi S1. Enzima è del tutto aspecifico (idrolizza sia RNA che DNA senza riguardo per la sequenza), non può attaccare legami fosfodiestere in tratti a doppia elica (forma A o B, DNA-DNA, RNA-DNA, ecc.); in vitro è di solito fatto agire a 20°C, temperatura alla quale degrada rapidamente qualunque tratto di polinucleotide a singolo filamento in oligo- e mononucleotidi. Se usato a 45 °C, è anche in grado di idrolizzare il legame fosfodiestere sul filamento intatto dalla parte opposta di un nick. Vediamo come si possono sfruttare queste proprietà per analizzare l’organizzazione di un gene eucariotico. Le tecniche qui descritte sono indicate genericamente come S1 mapping (mappatura con S1). 9.10.1. Determinare numero e lunghezza degli esoni in un gene. Si ha un clone completo di cDNA (o mRNA isolato da cellule) e il corrispondente DNA genomico contenente tutte le sequenze trascritte. Dopo aver preparato da cDNA (se questo è il caso) il singolo filamento (RNA o DNA, ad es., quello senso), lo si ibrida al clone di DNA genomico denaturato, o meglio ancora al suo singolo filamento antisenso. Le regioni del gene non trascritte (a monte di IS e a valle del segnale di scissione/poliadenilazione) o eliminate tramite splicing per maturare l’mRNA (introni) non sono presenti nel filamento di cDNA o nell’RNA. L’ibrido (vedi Fig. 9.6) mostra perciò sequenze di DNA genomico a singolo filamento alle due estremità e nelle zone corrispondenti agli introni (sotto forma di anse). La digestione con nucleasi S1 eliminerà tutti i tratti a singolo filamento, dividendo il DNA genomico in tanti pezzi quanti sono gli esoni; i frammenti sono separabili per elettroforesi. Se il filamento senso era RNA, si fa l’elettroforesi su gel alcalino; se era di DNA, si fa agire la nucleasi S1 a 45°C, in modo da spezzare anche il filamento di cDNA a livello delle anse introniche e si fa l’elettroforesi nativa o alcalina. I frammenti si rivelano per Southern blot con una sonda senso radioattiva preparata dallo stesso clone di cDNA; le dimensioni sono stimate per confronto con standard opportuni (Fig. 9.6). Si possono preparare sonde parziali da varie regioni del clone di cDNA in modo da identificare la successione dei frammenti nella sequenza genomica. filamento genomico filamento di cDNA nucleasi S1 ( = qui la nucleasi agisce solo a 45°C) + - M CS1 identificabili una per una con sonde parziali ansa dovuta a un introne Figura 9.6. Identificazione del numero e della lunghezza approssimativa degli esoni in un gene tramite l’uso della nucleasi S1. Il filamento di cDNA o di RNA è indicato in grigio, quello di DNA genomico in nero: il disegno è schematico e non in scala con le proporzioni reali. Nelle corsie elettroforetiche, M sono gli standard, S1 il campione trattato con nucleasi e C quello non trattato. 149 Una volta individuato il sito d’inizio della trascrizione su un clone di DNA genomico, diviene possibile eseguire su questo l’analisi strutturale e funzionale della regione di controllo a monte di tale sito. A sua volta, ciò consentirà di stabilire le proprietà regolative del gene in esame, mediante tecniche di espressione transitoria per trasfezione in cellule eucariotiche o di inserimento permanente in interi organismi (organismi transgenici). 9.11. Analisi in situ dello stato di funzionalità dell’eucromatina e della sua espressione. L’uso delle DNasi e delle RNasi per l’analisi del genoma e dei suoi trascritti non è limitato al materiale isolato in vitro. Informazioni preziose sulla organizzazione strutturale della cromatina, sul suo stato di funzionalità trascrizionale e sui livelli di specifici mRNA nei vari tipi cellulari, derivano da esperimenti che sfruttano le proprietà di quegli enzimi, anche in associazione con sonde opportune. Quando i nuclei estratti da un tessuto vengono trattati con la nucleasi di micrococco, la successiva analisi elettroforetica del DNA mostra frammenti di dimensioni multiple di un’unità lunga circa 140 pb e corrispondente al tratto di DNA avvolto intorno all’ottamero istonico nel nucleosoma; questa digestione riguarda tutta la cromatina. La nucleasi di micrococco è quindi in grado di attaccare la cromatina interfasica indipendentemente dal suo stato strutturale e funzionale, e dalla sua associazione con vari tipi di proteine basiche. La DNasi I pancreatica (che abbiamo già visto utilizzata per gli esperimenti di footprint analysis) è invece più selettiva: a concentrazioni <0,01 g/mL non attacca il DNA cromatinico, ma a concentrazioni sopra 1 g/mL essa lascia intatta l’eterocromatina e l’eucromatina che non può essere trascritta nel tessuto da cui sono stati estratti i nuclei, mentre digerisce le regioni potenzialmente trascrivibili. Questo si dimostra nel seguente modo: si trattano i nuclei con DNasi I a 1 g/mL, poi se ne estrae il DNA e si fa agire su di esso un enzima di restrizione che produca su determinati geni frammenti (lunghi almeno 3-4 Kpb) identificabili con sonde specifiche; dopo elettroforesi su gel, si fanno Southern blotting ibridando con tali sonde. I geni normalmente espressi in quel tessuto non mostrano segnali di ibridazione, mentre quelli non espressi lo mostrano (Fig. 9.9); questo fenomeno viene detto sensibilità della cromatina trascrivibile alla DNasi I. Il risultato viene interpretato in base ad altri dati che dimostrano come la cromatina trascrivibile si trovi in uno stato di avvolgimento meno stretto (limitato alla struttura nucleosomica, ma senza i livelli superiori di compattazione) di quello della rimanente cromatina. La DNasi I agisce su tali siti come la nucleasi di micrococco, attaccando il DNA in regioni internucleosomiche e spezzandolo in frammenti di poche centinaia di pb. L’analisi più dettagliata delle regioni geniche attaccate dalla DNasi I mostra che a concentrazioni assai inferiori (tra 0,05 e 0,1 g/mL) avvengono tuttavia tagli nel DNA che alterano le dimensioni dei frammenti genici di restrizione riconoscibili dalle sonde specifiche, lasciandoli però di dimensioni cospicue. Tali frammenti hanno di solito un’estremità 3’ risultante dal taglio con l’enzima di restrizione, mentre quella 5’ deriva dall’attacco della DNasi I in un tratto piuttosto circoscritto. La posizione di tali tratti (che per lo più si trovano nelle regioni regolatrici dei geni: elementi a monte dei promotori, enhancer, ecc.) è mappabile con una certa precisione (misurando la lunghezza dei frammenti sopra detti e conoscendo la posizione dei siti di restrizione scelti); essi vengono detti siti ipersensibili alla digestione con DNasi I (Fig. 9.9). Si ritiene, in base ai casi finora studiati, che tali siti si trovino in regioni del DNA prive di nucleosomi perché impegnate nel legame con proteine specifiche che regolano la trascrizione del gene. In molti casi, si trova che la struttura del DNA nei siti ipersensibili è così alterata da renderli suscettibili all’attacco con la nucleasi S1, che tipicamente attacca il singolo filamento. Risulta chiaro che la mappatura dei siti ipersensibili alla DNasi I in un gene fornisce preziose informazioni sulla localizzazione dei suoi elementi di controllo cis-attivi. Come già accennato al § 9.7.5.A (p. 129), l’espressione di un gene specifico in un determinato tipo di cellule può essere messa in evidenza in situ tramite un altro tipo di tecnica: la protezione di una ribosonda antisenso (specifica per l’mRNA di quel gene) rispetto alla digestione dalle RNasi. Questa procedura, già vista come alternativa alla mappatura con S1 nella caratterizzazione della struttura fine di un gene, può essere applicata a vetrini per microscopia ottica con fettine di tessuti o 150 con embrioni (whole embryo mounts). La sonda può essere radiomarcata, ma più spesso (per non dover ricorrere all’autoradiografia microscopica) si ricorre a una marcatura in 5’ con un aptene riconoscibile da un anticorpo reso fluorescente (molto usata è la digossigenina). Si isolano i nuclei Si incubano i nuclei Si estrae il DNA Si digerisce il DNA con un enzima di restrizione con diverse concentrazioni di DNasi I cellule C1 che esprimono il gene cellule C2 che non esprimono il gene 0 0,01 0,1 1,5 1,5 DNA da cellule C1 DNA da cellule C2 g/mL di DNasi I Elettroforesi in gel di agarosio e trasferimento su filtro + anodo autoradiografia del filtro ibridato con sonda specifica per il gene in esame Figura 9.9. Saggio della sensibilità e ipersensibilità alla DNasi I della eucromatina attiva. 9.12. Clonare in vitro: la reazione a catena della polimerasi o polymerase chain reaction (PCR). La clonazione molecolare è sostanzialmente la replicazione molteplice di un frammento di DNA. Con i vettori di clonazione tale processo è realizzato da apparati replicativi cellulari che sfruttano una origine di replicazione da essi riconosciuta. Se tuttavia si dispone di inneschi specifici in grado di appaiarsi a certe sequenze in un campione di DNA e se ne effettua l’allungamento con una opportuna DNA polimerasi, è possibile amplificare (= clonare) un determinato segmento di DNA. Questo è il principio alla base della tecnica detta polymerase chain reaction (PCR, reazione a catena della polimerasi), ideata da K. Mullis nel 1985 e che da allora è stata enormemente variata e migliorata. Si può dire che quasi tutti i procedimenti di clonazione effettuabili coi vettori nei batteri, e quelli che utilizzano i vettori in vitro, come la produzione di sonde, sono sostituibili con la PCR. Questa consente inoltre di fare alcune operazioni difficilmente realizzabili con altre tecniche biomolecolari. Lo schema di base della PCR è il seguente. Una provetta contiene una soluzione di DNA estratto coi procedimenti consueti da un tessuto, da una coltura batterica, da una coltura di cellule o da qualunque altro materiale biologico. Le molecole sono di varia lunghezza e sequenza: la quantità di ciascuna di esse è estremamente bassa. Sono in qualche modo note due brevi sequenze che delimitano e localizzano una sequenza bersaglio (ad es., il gene che codifica una certa proteina, della quale si conoscono brevi sequenze amminoacidiche vicino al terminale amminico e a quello carbossilico). Si sintetizzano per via chimica due diversi oligodeossinucleotidi, ciascuno dei quali è complementare a una delle brevi sequenze, in modo che le loro estremità 3’-OH siano rivolte entrambe verso la sequenza bersaglio. Dopo aver denaturato termicamente il DNA a 93°C, si aggiunge nella provetta un forte eccesso molare dei due oligodeossinucleotidi e si abbassa gradualmente la temperatura fino a un valore che consenta l’appaiamento tra le sequenze complementari (50-60°C, a seconda della percentuale di G+C negli oligonucleotidi). I filamenti originari che contenevano le sequenze bersaglio si ibrideranno con gli oligodeossinucleotidi, che così formerano su ciascun filamento singolo un innesco per una DNA polimerasi. In presenza dei quattro 2’-dNTP, questo enzima sintetizzerà un filamento complementare allo stampo nel tratto a valle dell’innesco; dopo un certo tempo, avrà superato la sequenza corrispondente all’altro innesco 151 sull’altro filamento. A questo punto il DNA viene nuovamente portato a 93°C e poi raffreddato alla temperatura di ibridazione. Gli inneschi ora si appaiano sia sui filamenti originari sia su quelli sintetizzati in precedenza. Una nuova fase di sintesi permette di raddoppiare il numero di filamenti che contengono la sequenza bersaglio. Se si prosegue per diversi cicli e non vi è limitazione né degli inneschi né dei 2’-dNTP, la quantità di molecole di DNA con sequenza bersaglio cresce esponenziamente ad ogni ciclo; dopo un certo numero di cicli, queste sono quasi tutte molecole che finiscono in corrispondenza delle sequenze di innesco, come è facile verificare considerando lo SCHEMA 9.7. Infatti, dopo il 3° ciclo ci sono in tutto 8 (23) sequenze bersaglio a doppia elica, di cui 2 delimitate dalle sequenze innesco e 6 che le sopravanzano da uno, dall’altro o da entrambi i lati. Dopo il 4° ciclo, i numeri sono 16 (24) = 8 + 8. Dopo il 20° ciclo, delle 220 doppie eliche formate solo una ventina sopravanzano la sequenza bersaglio da almeno un lato, le rimanenti (che sono poco più di un milione) sono delimitate dagli inneschi. Infatti, il numero di filamenti lunghi come la sequenza bersaglio aumenta in ragione geometrica 2 ad ogni ciclo, mentre quello dei filamenti che la sopravanzano aumenta solo in ragione aritmetica 2. Ciò dipende dal fatto che qualunque filamento che contenga le due sequenze complementari agli inneschi può produrre un filamento di lunghezza almeno pari alla sequenza bersaglio, ma gli stampi che consentiranno di allungare il nuovo filamento al di là di tali sequenze sono solo quelli che sopravanzano una sequenza innesco al 5’ e questi possono solo aumentare di due unità (= 1 doppia elica) ad ogni ciclo. 90 80 70 60 50 t (°C) 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 tempo (min) D D I I E E D I E D Ciclo 1 Ciclo 2 Ciclo 3 Ciclo 4 Figura 9.10. Variazioni di temperatura nelle 3 fasi dei cicli di funzionamento di un apparato PCR. D=denaturazione (93-95°C); I=ibridazione (50-60°C); E=estensione degli inneschi (72°C). Il prodotto della PCR è una notevole quantità di una sequenza specifica (frammento omogeneo di DNA, detto amplificato) ottenuta senza procedimenti di amplificazione indiscriminata seguita da un’operazione di selezione (come nella clonazione in batteri tramite genoteche costruite in vettori). Ovviamente, le temperature necessarie per compiere ogni ciclo sarebbero proibitive per la conservazione dell’attività catalitica di un enzima ordinario, come la DNA polimerasi I di E. coli. Questo enzima fu usato nei primi esperimenti di PCR, ma doveva essere aggiunto di fresco ad ogni ciclo; la temperatura per l’allungamento degli inneschi era inoltre non superiore ai 40°C, condizione che produce un certo grado di ibridazione spuria degli inneschi con sequenze non perfettamente complementari, causando l’amplificazione anche di sequenze diverse da quella bersaglio e abbassando così la resa e soprattutto la semplicità del processo. La caratterizzazione di un enzima omologo estratto dal batterio termofilo Thermus aquaticus, resistente a temperature vicine a 100°C e con attività catalitica ottimale a 72°C, permise di far funzionare il processo a ciclo chiuso, cioè senza aggiunte tra un ciclo e l’altro. L’enzima Taq polimerasi, agisce come la DNA polimerasi I, ma non ha l’attività esonucleasica 3’5’. La Fig. 9.10 illustra un tipico programma di temperatura in un apparecchio automatico per eseguire la PCR. Di solito le sequenze da amplificare sono lunghe 154 9.12.3. PCR quantitativa. Per misurare l’entità dell’amplificazione, e quindi la quantità di DNA nel campione di partenza, si possono adottare tre tecniche dette genericamente real-time PCR. 1) Con standard esterni, colorazione con bromuro di etidio del gel e densitometria quantitativa; dà una stima con errore intorno al 50%. 2) Standard esterni con rivelazione diretta usando il colorante Sybr Green che si lega al DNA dando un segnale fluorescente ad ogni ciclo proporzionale alla concentrazione di DNA. 3) con standard interno (RT-PCR competitiva) misurato dopo separazione per HPLC e lettura nell’UV; uno standard “mutante” è co-amplificato nella stessa miscela di reazione con l’mRNA d’interesse. Col terzo metodo si può determinare con precisione la quantità (anche piccolissima) di una certa sequenza di cDNA (o RNA) in un campione. (In linea di principio, potrebbe sembrare che, conoscendo il numero dei cicli e misurando la quantità di amplificato, si possa risalire alla quantità di sequenza bersaglio iniziale; in pratica, dopo alcune decine di cicli, il fattore di amplificazione è stimabile solo con approssimazione grossolana.) Il metodo si basa sul fatto che due sequenze con gli stessi inneschi e approssimativamente della stessa lunghezza vengono amplificate nella stessa misura se hanno uguale concentrazione; diversamente, viene amplificata di preferenza la più concentrata. Si procede inizialmente con una normale PCR, che produce una amplificazione notevole del DNA bersaglio; se non è già nota, se ne determina la sequenza totale. Tramite opportuni enzimi di restrizione, all’interno del frammento amplificato si introduce un linker o si produce una breve delezione (la variazione di lunghezza della molecola deve essere in valore assoluto intorno al 5%). Si determina accuratamente (tramite l’assorbanza nell’ultravioletto) la concentrazione del frammento così modificato, detto DNA competitore, e si passa alla PCR competitiva (Fig. 9.12). A diversi campioni identici del materiale di partenza si aggiungono concentrazioni crescenti e note di DNA competitore: quindi si procede all’amplificazione con la stessa coppia di inneschi usati nella prima PCR. I campioni amplificati vengono assoggettati a elettroforesi in gel di agarosio e colorazione con bromuro di etidio: in ogni corsia compariranno due bande di mobilità leggermente diversa (la sequenza bersaglio Originale e il Competitore), con intensità relative O e C diverse da corsia a corsia. Si riporta in grafico il rapporto C/O tra le intensità delle due bande in funzione di [C]: l’ascissa corrispondente al valore C/O = 1 dà la concentrazione della sequenza bersaglio nel campione di partenza. 9.12.4. Sintesi di sonde a singolo filamento. Lo stampo è costituito da una doppia elica di DNA (quasi sempre un cDNA); scelti gli inneschi, si opera a concentrazioni che facciano esaurire uno dei due dopo una decina di cicli, mentre l’altro è sufficiente a sostenere la sintesi del filamento corrispondente (ad es., quello antisenso) per 20-30 cicli. Uno dei 2’-dNTP è radiomarcato al fosfato in . In tal modo, il numero di stampi cresce esponenzialmente durante i primi 10 cicli, rendendo abbastanza efficiente la fase successiva di sintesi del singolo filamento, la cui quantità crescerà solo in ragione aritmetica. Invertendo il rapporto molare tra i due inneschi, si ottiene la sonda complementare (filamento senso). 9.12.5. Costruzione di un clone di cDNA da mRNA-poliA+ (RT-PCR). Come si è visto, la costruzione di banche di cDNA si basa sullo sfruttamento delle proprietà della trascrittasi inversa retrovirale. Conoscendo una breve sequenza specifica al 5’ di un particolare mRNA-poliA+ , è possibile amplificarlo selettivamente con PCR sotto forma di cDNA. Un innesco di oligo-dT permette la sintesi del filamento di DNA; in questa fase la trascrittasi inversa copia tutti gli mRNA. Un breve trattamento in alcali distrugge gli RNA; poi il campione neutralizzato viene introdotto nell’apparecchio per la PCR, insieme alla Taq polimerasi, ai 2’-dNTP e agli inneschi (oligo-dT + innesco con la sequenza nota al 5’): il filamento di DNA derivante dallo specifico mRNA viene copiato in un filamento di DNA; da qui in poi, i due inneschi funzionano per produrre l’amplificazione del cDNA specifico. Come nello SCHEMA 9.6, è utile preparare gli inneschi con le sequenze di due siti di restrizione agli estremi 5’: così, dopo la PCR, è facile inserire direzionalmente il cDNA, dopo trattamento con i due enzimi di restrizione, in un vettore di qualunque genere. NOTA: La trascrittasi inversa o retrotrascrittasi (RT) è una DNA polimerasi RNA/DNA dipendente: in presenza di uno stampo di RNA a singolo filamento e un innesco (di DNA o di RNA) 155 ad esso appaiato, sintetizza un filamento di DNA complementare (usando 2’-dNTP come substrati). L’enzima è anche dotato di un sito con attività RNasi H, che degrada il filamento di RNA nell’ibrido DNA-RNA. Il filamento di DNA complementare viene poi usato dalla trascrittasi inversa come stampo (sempre appaiato con un innesco) per sintetizzare un filamento di DNA, completando così una doppia elica di DNA, che viene detta cDNA (= DNA complementare) poiché è una copia dell’RNA di partenza. SEQUENZA BERSAGLIO NEL CAMPIONE INIZIALE PCR DNA amplificato taglio con enzima di restrizioneinserzione di un linker DNA competitore sequenze di innesco stessa quantità di campione iniziale quantità nota e crescente di DNA competitore PCR e analisi elettroforetica anodo 1 2 3 4 5 6 1 2 3 4 5 6 0 C O [C] 2 4 6 10 20 30 pmol/mL C O Figura 9.12. Schema di PCR quantitativa con DNA competitore. Nell’esempio il DNA competitore era allungato con l’inserzione di un linker, per cui ha mobilità elettroforetica leggermente inferiore a quella della sequenza naturale dopo amplificazione. Se è possibile fare una breve delezione, si ottiene un DNA competitore a mobilità elettroforetica superiore a quella dell’amplificato naturale. 156 Esercizio sulle mappe di restrizione. Un virus ha genoma di DNA a doppia elica circolare di 10,2 kpb. La digestione completa di tale DNA con diversi enzimi di restrizione ha dato i seguenti risultati: Endonucleasi Lunghezza dei frammenti (Kpb) EcoRI 7,1 3,1 HindIII 5,3 4,4 0,5 BamHI 10,2 EcoRI + HindIII 3,8 3,3 1,5 1,1 0,5 EcoRI + BamHI 5,1 3,1 2,0 HindIII + BamHI 4,4 3,5 1,8 0,5 EcoRI + HindIII + BamHI 3,3 2,0 1,8 1,5 1,1 0,5 Disegna la mappa di restrizione del DNA circolare del virus. Risposta: Indico con B, E, H i siti di restrizione per BamHI, EcoRI, HindIII, rispettivamente. La digestione con B+E mi dà due possibili alternative: M1 e M2. Se considero però la digestione con B+H (M3) e la confronto con la digestione triplice (B+E+H), l’unica mappa compatibile è la M2 e quindi la mappa definitiva è la M4. E E B E E B 3,1 2,0 5,1 5,1 2,0 3,1 B H H 1,8 3,5 H 0,5 4,4 E E B H H H 3,3 1,1 0,5 1,5 2,01,8 M1 M2 M3 M4 E E B H H H 3,3 1,1 0,5 2,0 1,8 M4R N.B.: È possibile tracciare mappe nel verso rotatorio opposto a quello indicato (come M4R); queste mappe sono però indistinguibili dalle corrispondenti (ossia, queste sono uniche) finché non si conosca la sequenza nucleotidica dei frammenti (ciò equivale a dire: è ignota l’identità di un filamento e del suo complementare).