Scarica Biologia molecolare di base e più Dispense in PDF di Biologia Molecolare solo su Docsity! 1 DNA ricombinante: clonare e produrre geni chimerici Agli inizi degli anni ‘970, cominciarono ad emergere le tecnologie per la manipolazione degli acidi nucleici in laboratorio. Queste tecnologie permisero la costruzione di molecole di DNA composte da sequenze nucleotidiche prese da fonti differenti. I prodotti di queste innovazioni, dette molecole di DNA ricombinanti, aprirono nuove vie alla ricerca nella biologia e nella genetica molecolari, con la fondazione di una nuova disciplina — la tecnologia del DNA ricombinante. L’ingegneria genetica è l’applicazione di questa tecnologia alla manipolazione dei geni. Tali progressi furono resi possibili da metodi per l’amplificazione di qualunque segmento particolare di DNA, di qualunque origine, entro cellule ospiti batteriche, ossia la clonazione di quasi ogni possibile sequenza di DNA. 1. Clonazione Nella biologia tradizionale, un clone è una popolazione di organismi identici derivati da un singolo organismo genitore. Ad esempio, le cellule in una colonia batterica derivanti da una singola cellula in una piastra Petri sono cloni. In biologia molecolare il termine sta a indicare una collezione di molecole o cellule tutte identiche ai rispettivi originali. Perciò, se la cellula originale sulla piastra Petri conteneva una molecola di DNA ricombinante in forma di plasmide, i plasmidi nei milioni di cellule in una colonia batterica rappresentano un clone della molecola di DNA originale; queste molecole si possono isolare e studiare. Inoltre, se la molecola di DNA clonata è un gene (o parte di esso), ossia codifica un prodotto funzionale, si apre la strada all’isolamento e allo studio di tale prodotto. Plasmidi I plasmidi sono molecole di cccDNA naturali extracromosomiche. Ceppi naturali di E. coli isolati da varie fonti contengono plasmidi diversi. Spesso tali plasmidi portano geni che specificano nuove attività metaboliche vantaggiose per il batterio che li ospita. Tali attività vanno dal catabolismo di sostanze organiche insolite alle funzioni metaboliche in grado di conferire alle cellule ospiti la resistenza a certi antibiotici, a metalli pesanti o a batteriofagi. I plasmidi in grado di riprodursi in E. coli sono divenuti strumenti preziosi per la tecnologia del DNA ricombinante. Poiché la digestione dei plasmidi con endonucleasi di restrizione può generare frammenti con estremità complementari o “adesive”, si possono costruire plasmidi artificiali legando insieme frammenti diversi. Questi plasmidi artificiali sono state le prime molecole di DNA ricombinante. Esse si possono replicare autonomamente, e quindi propagare, in cellule batteriche ospiti adeguate, purché posseggano un’origine di replicazione, o replicatore, riconosciuta dai sistemi dell’ospite. I plasmidi come vettori di clonazione L’idea di base è che sequenze “estranee” di DNA potevano essere inserite in plasmidi artificiali e che tali sequenze potevano entrare in E. coli e propagarsi come parte del plasmide. In altre parole, i plasmidi potevano servire da vettori di clonazione di vari geni (perciò il termine vettore ha qui il senso di “veicolo o mezzo di trasporto”). I plasmidi utili come vettori di clonazione possiedono tre proprietà comuni: un replicatore, un marcatore selezionabile e un sito di clonazione (Figura 1). Il replicatore è l’origine di replicazione (ori). Il marcatore selezionabile è di solito un gene che conferisce resistenza a un antibiotico. Solo le cellule contenenti il vettore cresceranno in presenza di quell’antibiotico. Quindi, la crescita su un terreno contenente antibiotico “seleziona” le cellule che contengono il plasmide. Il sito di clonazione è una sequenza nucleotidica che contiene uno o più siti di scissione con endonucleasi di restrizione. Tali siti sono situati dove l’inserzione di DNA estraneo non elimina la capacità del plasmide di replicarsi e non inattiva marcatori essenziali. 2 Figura 1 – Uno dei primi vettori di clonazione ampiamente utilizzati, il plasmide pBR322. Questo cccDNA di 4363-bp contiene un’origine di replicazione (ori) e geni che codificano proteine per la resistenza al farmaco ampicillina (ampr) e al farmaco tetraciclina (tetr). Sono indicate le posizioni dei siti di scissione per varie endonucleasi di restrizione. È possibile clonare praticamente qualsiasi sequenza di DNA La scissione nucleasica su un sito di restrizione apre, o linearizza, il plasmide circolare in modo da poter inserire un frammento di DNA estraneo. Le estremità del plasmide linearizzato sono unite a quelle del frammento in modo che il circolo si chiuda nuovamente, formando un plasmide ricombinante (Figura 2). Figura 2 – Sequenze estranee di DNA possono essere inserite in vettori plasmidici aprendo il plasmide circolare con un’endonucleasi di restrizione. Le estremità del DNA plasmidico linearizzato sono poi unite a quelle della sequenza estranea, richiudendo il circolo per formare un plasmide chimerico. I plasmidi ricombinanti sono molecole ibride di DNA formate da DNA del plasmide più elementi di DNA inseriti (detti inserti). Queste molecole ibride sono anche dette costrutti chimerici o plasmidi chimerici. La presenza di sequenze estranee di DNA non ha alcun effetto negativo sulla replicazione del plasmide, quindi i plasmidi chimerici si possono propagare nei batteri proprio come il plasmide originale. I batteri ospitano spesso alcune centinaia di copie per cellula dei comuni vettori di clonazione. Perciò, si possono recuperare dalle colture batteriche grandi quantità di una sequenza di DNA clonata. Le potenzialità notevoli della tecnologia del DNA ricombinante deriva in parte dal fatto che praticamente qualsiasi sequenza di DNA può essere selettivamente clonata e amplificata in questo modo. Sequenze di DNA difficili da clonare comprendono le ripetizioni invertite (palindromi), le origini di replicazione, e sequenze altamente ripetute come centromeri e telomeri. La sola limitazione pratica è la dimensione del segmento di DNA da inserire: la maggior 5 Figura 6 – Clonazione direzionale o orientata. Molecole di DNA con estremità sporgenti diverse sono utili per formare costrutti chimerici in cui il DNA estraneo può inserirsi nel plasmide solo in un'orientazione. Il DNA estraneo è digerito con due enzimi di restrizione differenti (HindIII e BamHI), il plasmide è trattato nello stesso modo. Infatti il vettore pUC19 ha un polylinker o sito di clonazione universale (pUC è una sigla che sta per plasmid [for] Universal Cloning). I plasmidi chimerici sono biologicamente funzionanti Le prime molecole di DNA chimeriche biologicamente funzionanti costruite in vitro furono montate da parti di plasmidi differenti nel 1973 da Stanley Cohen, Annie Chang, Herbert Boyer e Robert Helling. Questi plasmidi furono usati per trasformare cellule riceventi di E. coli. Le cellule batteriche erano rese in parte permeabili al DNA per trattamento con Ca2+ e un breve shock termico di due minuti a 42°C. Anche se meno dello 0,1% dei batteri così trattati divennero competenti per la trasformazione, i batteri trasformati potevano essere selezionati per la loro resistenza a certi antibiotici (Figura 7). Di conseguenza, i plasmidi chimerici dovevano essere biologicamente funzionanti in almeno due aspetti: a) si replicavano stabilmente nei loro ospiti; b) esprimevano i marcatori da loro portati per la resistenza al farmaco. In generale, i plasmidi usati come vettori di clonazione sono ingegnerizzati per essere piccoli, da 2,5 kpb a circa 10 kpb, in modo da massimizzare le dimensioni dell’inserto di DNA. Questi plasmidi hanno una sola origine di replicazione, perciò il tempo necessario per la loro replicazione completa dipende dalle dimensioni totali del plasmide ricombinante. Sotto pressione selettiva in una coltura di batteri in crescita, plasmidi eccessivamente grandi sono inclini a subire delezioni di qualunque “gene” non essenziale, come lo è ogni inserto estraneo. Una tale delezione tarperebbe lo scopo della maggior parte di esperimenti di clonazione. Il limite superiore utile degli inserti da clonare nei plasmidi è quindi circa di 10 kpb. Molti geni eucariotici superano questa dimensione. Il batteriofago come vettore di clonazione Il genoma del batteriofago (lambda) (Figura 8) è una molecola lineare di DNA da 48,5 kpb impacchettata nella testa (capside) del batteriofago. Un terzo nella parte centrale di questo genoma non è essenziale per l’infezione fagica, di modo che il DNA del fago è stato ingegnerizzato per poter inserire molecole di DNA estraneo lunghe fino a 16 kpb in questa regione a scopo di clonazione. Si possono poi usare sistemi di impacchettamento in vitro per incorporare il DNA 6 chimerico nelle teste del fago che, quando sono montate con le code del fago, formano particelle fagiche infettive. I batteri infettati con questo fago ricombinante producono una progenie fagica assai numerosa prima della lisi, e si possono facilmente purificare dal lisato grandi quantità del DNA ricombinante. Figura 7 – Un esperimento tipico di trasformazione batterica con vettore plasmidico. Il vettore di clonazione è pBR322. (1) Scissione di pBR322 con l’enzima di restrizione BamH1; (2) appaiamento e ligation di inserto generato da scissione con BamH1 da qualche DNA estraneo; (3) formazione del plasmide chimerico. (4) Col plasmide chimerico si trasformano cellule di E. coli trattate con Ca2+ e sottoposte a shock termico, poi il campione batterico è seminato su una piastra Petri con terreno contenente ampicillina. (5) Dopo incubazione nottetempo a 37°C, (6) le colonie di batteri amp r sono cresciute. (7) La piastratura in replica (replica plating) di queste colonie su piastre contenenti tetraciclina (8) rivela quali colonie sono tetr e quali sono sensibili alla tetraciclina (tets). Solo le colonie tets hanno plasmidi con l’inserto. Cosmidi Il DNA incorporato nelle teste del fago dai sistemi di impacchettamento del batteriofago devono soddisfare solo pochi criteri. Devono possedere una sequenza di 14 pb (di cui 12 a singolo filamento) detta cos (sigla che sta per sito a estremità coesive) a ciascuna delle sue estremità; queste sequenze cos devono essere separate da non meno di 36 kpb e non più di 51 kpb di DNA. Praticamente qualunque DNA che soddisfi questi requisiti minimi sarà impacchettato e montato in una particella fagica infettiva. Altre caratteristiche per la clonazione, come un sito ori, marcatori selezionabili e un polylinker sono uniti alla sequenza cos in modo che il DNA clonato possa essere 7 propagato e selezionato nelle cellule ospiti. Queste caratteristiche sono state ottenute piazzando le sequenze cos su ciascun lato dei siti di clonazione dei plasmidi per formare vettori cosmidi che sono in grado di portare inserti di DNA lunghi circa 40 kpb (Figura 8). Poiché i cosmidi sono privi dei geni essenziali per la riproduzione del fago attraverso il ciclo litico, essi si riproducono nei batteri ospiti come plasmidi. Figura 8 – Vettori cosmidi per clonare ampi frammenti di DNA. (a) I vettori cosmidi sono plasmidi che recano un marcatore selezionabile come amp r, un’origine di replicazione (ori ), un polylinker adatto all’inserzione di DNA estraneo, e (b) una sequenza cos. Sia il cosmide sia il DNA estraneo da clonare sono tagliati con lo stesso enzima di restrizione, e le due molecole di DNA sono poi saldate insieme. (c) La reazione di ligation porta alla formazione di concatenameri ibridi, molecole in cui le sequenze cosmidiche e del DNA estraneo sono unite in serie senza un ordine particolare. L’estratto di batteriofago per l’impacchettamento contiene l’enzima fagico terminasi, un’endonucleasi che riconosce i siti cos e li taglia mentre inserisce il DNA lineare nella testa del fago. (d) Molecole di DNA delle dimensioni opportune (da 36 a 51 kpb) sono impacchettate nelle teste del fago, formando particelle fagiche infettive. I concatenameri del vettore senza inserti, quando sono tagliati ai siti cos, sono troppo corti per essere impacchettati, mentre i concatenameri dell’inserto senza vettore non possono essere impacchettati perché mancano dei siti cos. Qui sotto è riportata la sequenza cos: 5'-TACGGGGCGGCGACCTCGCG-3' 3'-ATGCCCCGCCGCTGGAGCGC-5' L’endonucleasi scinde a livello delle frecce, lasciando su ogni lato estremità coesive a singolo filamento di 12 pb. Vettori navetta I vettori navetta sono plasmidi capaci di propagarsi in due diversi organismi e trasferire (“traghettare”) geni dall’uno all’altro organismo, uno dei quali è tipicamente un procariote (E. coli) e l’altro un eucariote (ad esempio, Saccharomyces cerevisiae). I vettori navetta devono avere origini di replicazione distinte per ciascun tipo cellulare e anche marcatori differenti per la selezione delle cellule ospiti trasformate dei due tipi che ospitano il vettore (Figura 9). I vettori navetta hanno il 10 indicati per frammenti di DNA che siano da 500 a 30.000 pb. La maggior parte dei preparati di DNA genomico mostrano una gamma ampia si dimensione, tra meno di 1 kpb a più di 20 kpb. Tipicamente, dopo l’elettroforesi non si vedono bande discrete, ma solo uno “striscio” di DNA lungo tutto il gel. 2) Blotting (trasferimento su filtro) Una volta separati i frammenti per elettroforesi (passaggio 3), il gel è immerso in una soluzione di NaOH: il dsDNA si denatura, convertendosi in ssDNA. Il pH del gel è poi neutralizzato con un tampone, e su esso si appoggia un foglio di nitrocellulosa intinto in una soluzione salina concentrata (c); la stessa soluzione salina è fatta permeare attraverso il gel in direzione perpendicolare al foglio (passaggio 4). L’operazione si può effettuare in tre modi: trasporto per azione capillare (blotting), trazione per aspirazione (vacuum blotting), o elettroforesi (electroblotting). Il movimento della soluzione salina attraverso il gel trasporta il DNA sul foglio di nitrocellulosa. La nitrocellulosa lega le molecole di ssDNA molto strettamente, in pratica immobilizzandole in posizione sul foglio.1 Il profilo di distribuzione del DNA separato per elettroforesi si mantiene quando le molecole di ssDNA si legano alla nitrocellulosa (passaggio 5 in Figura 10). Poi la nitrocellulosa è seccata in una stufa a vuoto2; l’operazione fissa il ssDNA alla nitrocellulosa. Quindi, nello stadio di preibridazione, il foglio di nitrocellulosa è incubato con una soluzione contenente una proteina (albumina di siero, ad esempio) e/o un detergente come il dodecil-solfato di sodio. Le molecole di proteina e detergente saturano tutti i restanti siti di legame per DNA sulla nitrocellulosa. In tal modo, non può esservi legame aspecifico di DNA al foglio di nitrocellulosa. 3) Ibridazione Per rivelare un DNA particolare nello striscio elettroforetico degli innumerevoli frammenti di DNA, il foglio di nitrocellulosa è incubato in un sacchetto di plastica sigillato con una soluzione della sonda specifica (passaggio 6 in Figura 10). Una sonda è di solito un ssDNA di sequenza definita marcato in modo da evidenziarlo, o con un radioisotopo (come 32P) o con qualche altro gruppo identificabile. La sequenza nucleotidica della sonda è progettata per essere complementare al frammento di DNA ricercato o bersaglio. La sonda di ssDNA si appaia al ssDNA bersaglio legato alla nitrocellulosa mediante appaiamenti specifici tra basi per formare un DNA duplex. Questo appaiamento, o ibridazione, marca il DNA bersaglio, rivelandone la posizione sulla nitrocellulosa. Ad esempio, se la sonda è marcata con 32P, la sua posizione può essere rivelata per autoradiografia su un pezzo di pellicola da raggi X appoggiata sul foglio di nitrocellulosa (passaggio 7, Figura 10). Il procedimento di Southern è stato esteso all’identificazione di molecole specifiche di RNA e proteine. Giocando sul nome di Southern (in inglese significa “meridionale”, l’identificazione di RNA particolari dopo separazione per elettroforesi su gel, blotting e ibridazione con la sonda è detto Northern blotting (trasferimento “settentrionale”). La tecnica analoga per trasferire molecole di proteine è detta Western blotting (trasferimento “occidentale”): in questo caso, la sonda è quasi sempre un anticorpo specifico per la proteina bersaglio,per cui la tecnica è nota anche col termine di immunoblotting o immunoblot (immunorivelazione). 1 Il motivo per cui il DNA si lega alla nitrocellulosa non è chiaro, ma forse implica una combinazione di legami a idrogeno, interazioni idrofobiche e ponti salini. 2 L’essiccamento a vuoto è essenziale perché la nitrocellulosa reagisce con violenza se scaldata con O2 . Per tale ragione, sono preferibili le membrane di nylon a quelle di nitrocellulosa. 11 Figura 10 – La tecnica del Southern blotting comporta il trasferimento di frammenti di DNA separati per elettroforesi a un foglio di nitrocellulosa e la rivelazione successiva di sequenze specifiche di DNA. Un preparato di frammenti di DNA [tipicamente, ottenuti dalla digestione con un enzima di restrizione, (1)] è separato secondo le dimensioni molecolari per elettroforesi su gel (2). Il profilo separativo può essere visualizzato immergendo il gel in bromuro di etidio per colorare il DNA che appare arancione sotto luce UV per fluorescenza dell’agente intercalante (3). Poi il gel è trattato con basi forti per denaturare il DNA e neutralizzato in tampone. successivamente, il gel è posto su un foglio di nitrocellulosa (o una membrana di nylon che lega il DNA), e una soluzione salina concentrata è passata attraverso il gel (4) per trasferire i frammenti di DNA fuori dal gel dove si legano strettamente alla nitrocellulosa (5). L’incubazione del foglio di nitrocellulosa con una soluzione di una sonda di ssDNA opportunamente marcata (6) consente alla sonda di ibridarsi alle sequenze bersaglio di DNA che le sono complementari. La posizione di queste sequenze bersaglio è poi rivelata con mezzi di rilevazione appositi, come l’autoradiografia (7). Il vaglio delle genoteche Un metodo comune per vagliare genoteche basate su plasmidi consiste nell’eseguire un esperimento di ibridazione su colonie. Il protocollo è simile anche per le genoteche basate su fagi, con la sola differenza che si vagliano le placche prodotte dal batteriofago, anziché le colonie batteriche. In un esperimento tipico, i batteri ospiti contenenti una genoteca basata su plasmide o basata su batteriofago sono seminati su una piastra Petri e lasciati crescere nottetempo per formare colonie o placche di lisi, nel caso di genoteche con vettore fagico (Figura 11). 12 Si ottiene una replica delle colonie batteriche (o delle placche) stendendo sulla piastra un disco di nitrocellulosa. Il disc è tolto, trattato con alcali per far dissociare le doppie eliche di DNA sul filtro in singoli filamenti, asciugato e posto in un sacchetto sigillato con la sonda marcata (come nel Southern blotting). Se la sonda di DNA è a doppia elica, deve prima essere denaturata portandola a 70°C. La sonda e la sequenza complementare di DNA devono essere a singolo filamento per potersi ibridare una con l’altra. Qualunque sequenza di DNA complementare alla sonda sarà rivelata dall’autoradiografia del disco di nitrocellulosa. Le colonie batteriche (o le placche fagiche) con i cloni che portano il DNA ricercato sono identificate sulla pellicola e quindi rintracciate e recuperate dalla piastra madre. Figura 11 – Vaglio di una genoteca per ibridazione su colonie (o su placche di lisi). I batteri trasformati con una genoteca basata su plasmide o infettati con una genoteca basata su batteriofago sono seminati su piastre Petri e incubati nottetempo per far formare le colonie batteriche (o le placche di lisi del fago). Si ottiene poi una replica delle colonie batteriche (o delle placche) distendendo su ciascuna piastra un disco di nitrocellulosa (1). Questo materiale lega in modo stretto gli acidi nucleici; quelli a singolo filamento si legano meglio di quelli a doppia elica. (Si possono usare membrane di nylon con proprietà di legame simili per acidi nucleici e proteine.) Dopo che la nitrocellulosa ha legato un po’ delle colonie batteriche (o delle placche), si toglie il filtro e le piastre Petri vengono riposte e conservate. Il disco è trattato con NaOH 2 M, neutralizzato e fatto seccare. Il trattamento in NaOH lisa tutti i batteri (o le particelle fagiche) e dissocia i filamenti di DNA (2). Quando il disco è secco, i filamenti di DNA sono immobilizzati sul filtro. Il disco secco è posto in un sacchetto di plastica sigillabile, nel quale si aggiunge una soluzione contenente la sonda marcata, denaturata al calore o a singolo filamento (3). Il sacchetto è incubato per consentire l’appaiamento del DNA della sonda a qualunque sequenza di DNA che sia presente sulla nitrocellulosa. Quindi il filtro viene lavato, asciugato e posto su un pezzo di pellicola da raggi X per ottenere un autoradiogramma (4). La posizione delle macchie sulla pellicola da raggi X rivela dove la sonda marcata si è ibridata col DNA bersaglio (5). La posizione di queste macchie serve a localizzare e recuperare il clone genomico ottenuto dai batteri (o dalle placche) dalle piastre Petri originali. Sonde per ibridazione dedotte da sequenze amminoacidiche È chiaro che le sonde specifiche sono reagenti essenziali al fine di identificare un gene particolare sullo sfondo di innumerevoli sequenze di DNA. Di solito, le sonde usate per vagliare genoteche sono sequenze nucleotidiche complementari a una certa parte del gene bersaglio. Per produrre sonde utili occorre qualche informazione sulla sequenza nucleotidica del gene. Talvolta tale informazione è disponibile. In alternativa, se è nota la sequenza amminoacidica della proteina codificata dal gene, è possibile risalire col codice genetico alla sequenza di DNA (Figura 12). 15 Figura 14 – Sintesi avviata da trascrittasi inversa di cDNA con inneschi di oligo(dT) appaiati alle code poli(A) degli mRNA eucariotici purificati. (a) Gli oligo(dT) fanno da inneschi per sintetizzare una copia in DNA degli mRNA da parte della trascrittasi inversa. Dopo il completamento della sintesi del primo filamento di cDNA, si aggiungono la RNasiH e la DNA polimerasi (b). La RNasiH digerisce specificamente i filamenti di RNA nelle doppie eliche ibride DNA-RNA. La DNA polimerasi copia il primo filamento di cDNA usando come inneschi i segmenti residui di RNA dopo che la RNasiH ha prodotto nick e lacune (c). La DNA polimerasi con l’attività 5'3' nucleasica rimuove l’RNA residuo e lo sostituisce con DNA. I nick che restano nel secondo filamento di DNA sono saldati dalla DNA ligasi (d), producendo un cDNA duplex. Gli adattatori (linker) con estremità sporgenti al 5’ per EcoRI sono saldati ai cDNA duplex (e) usando la DNA ligasi del fago T4 per produrre cDNA che terminano con siti EcoRI per l’inserzione in un vettore di clonazione. Poiché tipi cellulari differenti negli organismi eucariotici esprimono sottoinsiemi selezionati di geni, i preparati di RNA da queste cellule o tessuti, in cui i geni d’interesse sono trascritti selettivamente sono arricchiti degli mRNA desiderati. Le banche di cDNA preparate da tali mRNA rappresentano il quadro qualitativo e quantitativo di espressione genica che definisce in modo unico tipi particolari di cellule differenziate: tale quadro è detto il trascrittoma di quel tipo cellulare in quell’organismo e in determinate condizioni fisio(-pato)logiche. Sono anche disponibili commercialmente banche di cDNA di molti tipi cellulari umani normali e patologici, tra cui quelle di molti tipi di cellule tumorali. Questi quadri presentati dal trascrittoma va confrontato con quello che si ottiene dal proteoma, di solito ottenuto con l’analisi tramite l’elettroforesi bidimensionale su gel (elettroforesi 2D) delle proteine prodotte dallo stesso tipo cellulare nelle stesse condizioni. Vettori di espressione I vettori di espressione sono costruiti in modo che qualunque inserto clonato sia trascrivibile in RNA, e, in molti casi, anche tradotto in proteina. Le genoteche di espressione da cDNA si possono costruire in vettori appositamente progettati, derivati o da plasmidi o dal batteriofago . Proteine codificate dai vari cloni di cDNA in tali genoteche di espressione possono essere sintetizzate nelle cellule ospiti, e se sono disponibili saggi adeguati per identificare una proteina particolare, il suo rispettivo clone di cDNA può essere identificato e isolato. Sono disponibili vettori di espressione progettati per esprimere l’RNA o la proteina, o entrambi. Espressione di RNA Un vettore per l’espressione in vitro di inserti di DNA come trascritti in RNA può essere costruito collocando un promotore assai efficiente in adiacenza a un sito di clonazione versatile. La Figura 15 illustra un tal genere di vettore d’espressione. Il DNA linearizzato del vettore ricombinante è trascritto in vitro usando la RNA polimerasi del fago SP6. In tal modo si possono ottenere grandi quantità di RNA; se si usano come substrati ribonucleotidi radioattivi, si producono molecole di RNA marcate utilizzabili come sonde. 16 Figura 15 – I vettori di espressione recanti il promotore riconosciuto dalla RNA polimerasi del batteriofago SP6 sono utili per produrre trascritti di RNA in vitro. La RNA polimerasi di SP6 lavora efficientemente in vitro e riconosce il proprio promotore con alta specificità. Questi vettori hanno tipicamente un polylinker adiacente al promotore di SP6. Cicli multipli di trascrizione iniziati dalla RNA polimerasi di SP6 su questo promotore portano alla produzione di molte copie di RNA da qualunque DNA inserito nel polylinker. Prima di dare inizio alla trascrizione, il vettore di espressione circolare è linearizzato in un sito di scissione singolo alla fine dell’inserto o poco a valle di esso in modo che la trascrizione termini in un punto preciso (metodo di “trascrizione run-off”). Espressione di proteine Poiché i cDNA sono copie in DNA di mRNA, essi sono copie non interrotte degli esoni dei geni espressi. Essendo questi cDNA privi di introni, si possono esprimere queste versioni in cDNA dei geni eucariotici in ospiti procariotici che non possono maturare i complessi trascritti primari derivanti dai geni eucariotici. Per esprimere una proteina eucariotica in E. coli, il cDNA eucariotico deve essere clonato in un vettore di espressione che contenga segnali regolatori sia per la trascrizione sia per la traduzione. Pertanto, sono progettati e costruiti nel vettore, subito a monte del sito di restrizione per inserire il DNA estraneo: a) un promotore dove la RNA polimerasi di E. coli inizia la trascrizione; b) un operatore in grado di legare un repressore espresso dal batterio; c) un sito di legame per il ribosoma (sequenza di Shine-Dalgarno) per facilitare la traduzione. Il codon d’inizio AUG è di solito presente nell’inserto (Figura 16). Figura 16 – Un tipico vettore di espressione. Le sequenze codificanti del gene eucariotico sono inserite nel sito di restrizione subito a valle di un promotore dove la RNA polimerasi batterica si lega per iniziare la trascrizione; questa può essere bloccata da un repressore che si lega all’operatore posto nel vettore tra il sito di attacco al ribosoma e l’inserto. Quando i batteri sono arrivati alla fine della crescita esponenziale, l’aggiunta dell’induttore elimina la repressione e induce la trascrizione dell’inserto. La presenza del segnale batterico per il ribosoma (sequenza di Shine- Dalgarno) nel trascritto garantisce che l’RNA sia tradotto efficientemente in proteina dai ribosomi dei batteri ospiti. 17 Per controllare l’espressione della proteina eterologa e farla avvenire al momento giusto, occorre usare promotori controllati da repressori e quindi dotati di operatori; tuttavia, è desiderabile che questi promotori siano forti, per ottenere una trascrizione efficiente dopo l’aggiunta dell’induttore opportuno. Sono stati costruiti, nei vettori di questo tipo, promotori in grado di spingere la sintesi di proteine eterologhe a livelli pari al 30% o più delle proteine cellulari totali in E. coli. Un esempio è il promotore ibrido Ptac, costruito fondendo parte del promotore-operatore dell’operon lacUV5 di E. coli (controllato dal repressore di lac) con parte del promotore dell’operon trp per la biosintesi del triptofano (Figura 17). Figura 17 – Un vettore di espressione per proteine contenente il promotore ibrido Ptac derivato dalla fusione tra porzioni dei promotori lacUV5 e trp. In alto sono rappresentati sul filamento sequenza le porzioni dei due promotori fuse tra loro e gli elementi caratteristici che consentono il controllo e l’efficienza di trascrizione e traduzione. L’espressione da Ptac nelle cellule di E. coli è superiore di 10 volte a quella dell’uno o l’altro promotore selvatico. Per indurre la trascrizione da Ptac (come da Plac) si aggiunge alla coltura batterica isopropil--D-tiogalattoside (IPTG), che funge da induttore non metabolizzabile dell’operon lac e dei promotori derivati da esso. In cellule che recano vettori di espressione con Ptac il promotore non è indotto a trascrivere l’inserto fino a che le cellule non siano esposte a induttori che ne consentano l’apertura. Analoghi del lattosio (un-galattoside) come l’isopropil--tiogalattoside (IPTG) sono induttori eccellenti di Ptac. È quindi possibile controllare facilmente l’espressione della proteina eterologa. La produzione nei batteri di proteine eucariotiche preziose rappresenta uno degli usi più importanti della tecnologia del DNA ricombinante. Ad es., l’insulina umana per la cura del diabete si produce oggi nei batteri. Sistemi analoghi per l’espressione di geni estranei in cellule eucariotiche usano vettori recanti elementi di promotori derivati da virus di mammiferi, come il Simian Virus 40 (SV40), il Virus di Epstein-Barr e il Citomegalovirus umano (CMV). Un sistema per esprimere ad alto livello geni estranei fa uso di cellule di insetto coltivate in vitro infettate con un vettore d’espressione basato sul baculovirus. I baculovirus infettano i lepidotteri (farfalle). Nei vettori costruiti sui baculovirus, il gene estraneo è inserito a valle del promotore per la poliedrina, la proteina strutturale principale codificata dal virus, e il vettore ricombinante è incorporato nelle cellule di insetto coltivate in vitro. L’espressione dal promotore della poliedrina può produrre l’accumulo del prodotto genico eterologo a livelli che arrivano a 500 mg/L. Questo sistema di cellule di insetto e vettori basati su baculovirus ha un vantaggio interessante, non ottenibile nei sistemi procariotici: se la proteina da esprimere è una glicoproteina, la modificazione post-traduzionale consistente nell’aggiunta dei residui di carboidrati all’apoproteina è fedelmente eseguita dalle cellule di insetto. 20 X-gal è un substrato cromogeno, ossia una sostanza incolore che in seguito a una reazione enzimatica si trasforma in un prodotto colorato. Dopo l’induzione con IPTG, le colonie batteriche (o le placche) contenenti vettori in cui il gene per la -galattosidasi è intatto (cioè quelli privi di inserto) esprimono una -galattosidasi attiva che idrolizza X-gal, liberando galattosio e 5-bromo-4- cloro-3-indossile; quest’ultimo dimerizza e forma un colorante blu indaco. Queste colonie o placche blu rappresentano cloni privi di inserti. Il gene per la -galattosidasi è inattivato nei cloni con gli inserti, cosicché le colonie (o le placche) rimangono “bianche” (ossia, incolori) e rappresentano I cloni ricombinanti. Costrutti con geni reporter Le regioni geniche con potenziale regolatorio (come i promotori e altre sequenze cis-attive che regolano la trascrizione) si possono indagare ponendole in plasmidi a monte di un gene, detto gene reporter, la cui espressione si misura facilmente. Questi plasmidi chimerici sono poi introdotti in cellule opportunamente scelte (anche eucariotiche) per valutare la possibile funzione regolatoria della sequenza nucleotidica, poiché l’espressione del gene reporter servirà da segnale dell’efficacia dell’elemento regolatorio. Sono stati usati come reporter parecchi geni differenti, tra cui il gene lacZ, il gene per l’enzima cloramfenicolo acetil trasferasi (CAT), e quello per la fosfatasi alcalina. Un gene reporter con molti vantaggi inerenti è quello della proteina fluorescente verde (green fluorescent protein o GFP). A differenza degli enzimi espressi da altri geni reporter, la GFP non richiede alcun substrato per rivelarne la presenza, e non dipende da alcun cofattore o gruppo prostetico. La rilevazione della GFP richiede solo irraggiamento con luce nel vicino UV o nel blu (una sorgente a 400 nm è ottimale), e la fluorescenza che ne deriva (banda del verde, a 500 nm) si osserva facilmente, e può essere misurata precisamente con un fluorimetro e con un microscopio a fluorescenza confocale, nel caso di preparati microscopici. La Figura 20 mostra l’uso della GFP come gene reporter. Figura 20 – La proteina fluorescente verde (GFP) come reporter. Il promotore del gene per è stato inserito a monte del gene per la GFP in un plasmide col quale è stata trasformata la Drosophila (moscerino della frutta). Il gene per codifica una proteina coinvolta nel controllare i ritmi circadiani di attività del moscerino. La fluorescenza mostrata in figura è quella della testa isolata di un moscerino e segue un andamento ritmico sulle 24 ore; si riscontra in minor misura in tutto il corpo dell’insetto, a indicazione che l’espressione del gene per può avvenire in ogni cellula somatica. Questa uniformità suggerisce che ogni cellula ha il proprio orologio biologico indipendente. Approfondimento Il sistema a doppio ibrido per identificare le interazioni specifiche tra determinate proteine Interazioni specifiche tra proteine (le cosiddette interazioni proteina-proteina) sono alla base di molti processi biologici essenziali. Un metodo per identificare interazioni proteina-proteina specifiche in vivo usa l’espressione di un gene reporter la cui trascrizione dipende dalla funzionalità di un attivatore trascrizionale, la proteina GAL4 del lievito S. cerevisiae. GAL4 consiste di due domini: un dominio che si lega a specifiche sequenze di DNA (DB) e un dominio di attivazione 21 della trascrizione (TA). Anche se espressi come polipeptidi separati, questi due domini continuano a funzionare, purché essi siano posti in stretta prossimità. Il metodo utilizza due plasmidi separati che codificano ciascuno una proteina ibrida: la prima consiste del dominio DB di GAL4 fuso alla proteina X che si vuol studiare, la seconda consiste del dominio TA di GAL4 fuso alla proteina Y che si suppone interagisca con X (Figura 21, parte a); un terzo plasmide porta invece il gene reporter messo sotto il controllo del promotore GAL4. Se le proteine X e Y interagiscono in un’interazione specifica proteina-proteina, i domini DB e TA di GAL4 saranno portati in contatto, così che possa avvenire la trascrizione di un gene reporter avviata dal promotore GAL4 (Figura 21, parte b). La proteina X, fusa al dominio DB di GAL4 (e quindi legata sul promotore), serve da “esca” per pescare la proteina Y “bersaglio” che è fusa col dominio AT di GAL4. Questo metodo può essere usato per analizzare le cellule e cercare “bersagli” proteici che interagiscono specificamente con una proteina “esca” particolare. A tale scopo, i cDNA che codificano le proteine del tipo cellulare di interesse sono inserite nel plasmide contenente TA per formare fusioni tra le sequenze codificanti dei cDNA e quelle del dominio TA di GAL4; in tal modo si esprime una genoteca di proteine di fusione. L’identificazione di un bersaglio della proteina “esca” con questo metodo fornisce anche direttamente il cDNA del gene che codifica la proteina “bersaglio”. Figura 21 – Illustrazione del metodo del doppio ibrido per studiare a livello cellulare le interazioni specifiche proteina- proteina. (a) L’espressione della proteina di fusione tra dominio DB di GAL4 e proteina X (che fa da “esca”) fa sì che tale prodotto di fusione si leghi al DNA nella regione di controllo del promotore GAL4; l’espressione dell’altro prodotto di fusione tra la proteina Y (“bersaglio”) e il dominio TA di GAL4 mette alla prova la possibile interazione tra X e Y: se ciò non avviene, il gene reporter (in questo caso lacZ: notiamo che è un’attività eterologa nel tipo cellulare studiato, quindi non è presente se non è espressa dal costrutto reporter) non è espresso. (b) Le proteine X e Y interagiscono, facendo sì che i due domini di GAL4 siano in contatto e agiscano da attivatore della trascrizione dal promotore GAL4: il risultato è l’espressione del gene reporter (in questo caso, si avrà la colorazione blu nel test blu/bianco). La reazione a catena della polimerasi (Polymerase Chain Reaction o PCR) La reazione a catena della polimerasi o PCR è una tecnica per amplificare in modo spettacolare la quantità di un segmento specifico di DNA. Un preparato di DNA denaturato contenente il segmento d’interesse serve da stampo per una DNA polimerasi, e due oligonucleotidi specifici fungono da inneschi per la sintesi del DNA (vedi Figura 21). Essi sono progettati per essere complementari alle due estremità 3’ del segmento specifico di DNA da amplificare, sono aggiunti in eccesso di 1000 o più volte (Figura 21), per innescare la sintesi catalizzata da DNA polimerasi dei due filamenti complementari del segmento cercato, raddoppiando di fatto la sua concentrazione nella soluzione. Poi la temperatura è innalzata per dissociare il dsDNA e poi riabbassata in modo che gli inneschi si leghino ai filamenti vecchi e nuovi. Segue un altro ciclo di sintesi del DNA. Il protocollo è stato automatizzato con l’invenzione dei termociclizzatori che alternatamente scaldano la miscela di reazione a 95°C per dissociare il DNA, poi la raffreddano per far appaiare gli inneschi, poi fanno avvenire un altro ciclo di sintesi del DNA. L’isolamento di DNA polimerasi termostabili da batteri termofili (come la Taq DNA polimerasi da Thermus aquaticus) ha reso superfluo aggiungere nuovo enzima per ogni ciclo di sintesi. Poiché la quantità del DNA bersaglio raddoppia praticamente a ogni ciclo, 25 cicli aumenterebbero la sua concentrazione di circa 33 milioni di volte. In pratica, l’aumento più verosimile è circa un milione di volte, che è più che sufficiente per isolare il gene. 22 Quindi, partendo da minuscoli campioni di DNA genomico totale, in poche ore si può produrre una sequenza particolare in quantità notevoli. Figura 21 – La reazione a catena della polimerasi (PCR). Una coppia di oligonucleotidi complementari agli estremi di una data sequenza di DNA innescano la sintesi solo di quella sequenza. La Taq DNA polimerasi termostabile resiste a molti cicli di riscaldamento a 95°C. In teoria la quantità della sequenza innescata specificamente raddoppia a ogni ciclo. 25 Nuove frontiere scientifiche Le strategie e metodologie qui descritte sono solo una panoramica del repertorio di approcci sperimentali che sono stati inventati dai biologi molecolari per manipolare il DNA e l’informazione in esso contenuta. L’enorme successo della tecnologia del DNA ricombinante significa che il compito del biologo molecolare nello scovare geni nei genomi è oggi simile a quello di un lessicografo che compili un dizionario, ma questo dizionario consta di “voci,” ossia sequenze nucleotidiche, non formate da parole e concetti, ma da geni e dal loro significato. I biologi molecolari non hanno indici delle pagine o analitici che servano da guida attraverso il vasto volume d’informazione in un genoma; ciò nonostante, questa informazione e la sua organizzazione sono in rapido corso di svelamento dagli sforzi immaginativi e dalla diligenza di questo scienziati e del loro crescente arsenale di schemi analitici. La tecnologia del DNA ricombinante ora si articola nell’abilità di ingegnerizzare di proposito la costituzione genetica di organismi a fini voluti. La produzione commerciale di biomolecole terapeutiche in colture microbiche è già affermata (ad esempio, la produzione di insulina umana in quantità nelle cellule di E. coli). Sono entrate nella pratica agricola coltivazioni con attributi scelti, come l’accresciuta resistenza agli erbicidi. Il gene per l’ormone della crescita di ratto è stato clonato e trasferito in embrioni di topo, generando topi transgenici che da adulti sono grandi il doppio del normale. Sono state sviluppate a vantaggio dell’uomo versioni transgeniche di animali domestici come maiali, pecore e perfino pesci. Alcune di queste applicazioni hanno sollevato aspre critiche e forti dubbi sulle loro conseguenze potenzialmente pericolose. Forse il risultato più importante, in diversi casi, è stato però l’approvazione di protocolli clinici per la terapia di sostituzione genica (o, più semplicemente, terapia genica) per correggere particolari patologie ereditarie dell’uomo. I difetti biochimici nella fibrosi cistica e nella SCID ADA– Il gene difettoso nella fibrosi cistica codifica il regolatore della conduttanza transmembrana della fibrosi cistica (CFTR), una proteina di membrana che pompa Cl– fuori delle cellule. Se questa pompa del cloruro è difettosa, gli ioni Cl– restano all’interno delle cellule, che quindi captano acqua dal muco esterno per osmosi. Il muco si ispessisce e si accumula in vari organi, soprattutto nei polmoni, dove la sua presenza favorisce infezioni come la polmonite. Se non curati, i bambini malati di fibrosi cistica raramente sopravvivono oltre l’età di 5 anni. La SCID ADA– (immunodeficienza combinata grave da mancanza di adenosina deamminasi) è un disordine genetico fatale causato da difetti nel gene che codifica l’adenosina deamminasi (ADA). La conseguenza della deficienza di ADA è l’accumulo di adenosina e 2’-deossiadenosina, che sono tossiche per i linfociti, cellule di primaria importanza nella risposta immunitaria. In particolare è tossica la 2’-deossiadenosina poiché la sua presenza porta all’accumulo del suo nucleotide dATP, substrato essenziale per la sintesi di DNA. Infatti, livelli elevati di dATP bloccano la replicazione del DNA e la divisione cellulare inibendo la sintesi degli altri deossinucleosidi 5'-trifosfati. L’accumulo di dATP porta anche a una deplezione selettiva di ATP cellulare, drenando le scorte di energia delle cellule. I bambini affetti da SCID ADA– non sviluppano le normali risposte immuni e sono suscettibili a infezioni fatali, a meno che non siano tenuti in costante isolamento protettivo. La terapia genica nell’uomo La terapia genica umana cerca di riparare il danno causato da una deficienza genetica tramite l’introduzione di una versione funzionale del gene difettoso. A tale scopo, una variante clonata e attiva del gene dev’essere incorporata nell’organismo in modo tale che sia espresso solo al momento opportuno e nei tipi cellulari appropriati. Al momento attuale, tali condizioni impongono 26 serie difficoltà tecniche e cliniche. Negli USA e in altre Nazioni, molte terapie geniche hanno ricevuto l’approvazione dalle istituzioni mediche di controllo competenti (ad es., negli USA, i National Institutes of Health) per trial clinici in pazienti umani che prevedano l’introduzione di costrutti genici nei pazienti. Tra questi ci sono costrutti progettati per curare la SCID ADA–, il neuroblastoma, la fibrosi cistica o per curare i tumori tramite l’espressione dei geni soppressori di tumori i cui prodotti sono le proteine E1A e p53. Una strategia di base nella terapia genica umana implica l’incorporazione di un gene funzionale nelle cellule bersaglio. Questo gene è di solito in forma di expression cassette (modulo di espressione) contenente una versione in cDNA del gene a valle di un promotore che attiva la sua espressione. Si introduce nelle cellule bersaglio un vettore recante un modulo d’espressione, o ex vivo tramite trasferimento genico in cellule coltivate in laboratorio (di solito del paziente stesso) e la somministrazione delle cellule modificate al paziente, o in vivo tramite incorporazione diretta del gene nelle cellule del paziente. Poiché i retrovirus sono in grado di trasferire le proprie informazioni genetiche direttamente dentro il genoma delle cellule ospiti, i vettori basati su essi forniscono una via per la modificazione permanente delle cellule ospiti ex vivo. Una versione deficiente nella replicazione del virus della leucemia murina di Maloney (MMLV) può fungere da vettore per moduli di espressione di dimensioni fino a 9 kpb. La Figura 23 descrive una strategia per l’inserimento di geni mediato da vettori retrovirali. In tale strategia, si spera che il modulo di espressione si integri stabilmente nel DNA delle cellule del paziente e si esprima per produrre il prodotto genico desiderato. In alternativa, l’uso di vettori basati su adenovirus che possono portare moduli di espressione fino a 7,5 kpb rappresenta un possibile metodo in vivo per la terapia genica umana (Figura 24). Gli adenovirus ricombinanti, difettosi di replicazione, entrano nelle cellule bersaglio tramite recettori specifici sul plasmalemma; l’informazione genetica inserita è espressa direttamente dal DNA adenovirale ricombinante e non è mai incorporata nel genoma della cellula ospite. Anche se restano da risolvere molti problemi, la terapia genica nell’uomo come strategia clinica è percorribile. Figura 23 – Inserimento di un gene ex vivo mediato da retrovirus. I retrovirus sono virus a RNA che replicano il proprio genoma generando un intermedio a dsDNA che si integra nel genoma dell’ospite. Il virus della leucemia murina di Maloney (MMLV) è il retrovirus usato nella terapia genica umana. La delezione dei geni essenziali gag, pol ed env dal MMLV lo rende deficiente nella replicazione (in modo che non si riproduca) (a) e crea spazio per inserire un modulo d’espressione (b). Il MMLV modificato agisce da vettore per il modulo d’espressione; anche se difettivo di replicazione, è ancora infettivo. L’infezione di una linea cellulare d’impacchettamento che porta i geni gag, pol ed env consente di riprodurre il MMLV modificato (c), e i vettori retrovirali avvolti in capsidi possono essere raccolti e usati per infettare un paziente (d). Nel citosol delle cellule del paziente, la trascrittasi inversa del virus (contenuta nelle particelle virali) sintetizza una copia di DNA dell’RNA nel vettore. Questo DNA è poi integrato casualmente nel genoma della cellula ospite, dove la sua espressione porta alla formazione del prodotto del modulo d’espressione. 27 Figura 24 – Inserimento di un gene in vivo mediato da adenovirus. Gli adenovirus sono virus a DNA. Il genoma adenovirale (36 kpb) è diviso in geni precoci (E1E4) e geni tardivi (L1L5) (a). I vettori adenovirali sono generati per delezione del gene E1 (talvolta anche di E3 se necessario fare più spazio per un modulo d’espressione) (b); la delezione di E1 rende l’adenovirus incapace di replicarsi se non introdotto in una linea cellulare complementante che esprime il gene E1 (c). Si può usare la progenie adenovirale prodotta dalla linea cellulare per infettare un paziente. Qui il vettore adenovirale col modulo d’espressione entra nelle cellule tramite recettori specifici (d). Il dsDNA lineare accede infine al nucleo cellulare, dove funziona da DNA extracromosomico ed esprime il prodotto del modulo d’espressione (e). Appendice – Collezioni combinatorie di molecole Il riconoscimento specifico e il legame di altre molecole è caratteristica propria di ogni proteina o acido nucleico. Spesso, non sono noti i ligandi di una proteina particolare, o, in altri casi, si cerca un ligando per una proteina nota nella speranza di bloccarne l’attività o perturbare comunque la sua funzione. Le collezioni combinatorie di molecole sono il prodotto di strategie emergenti per facilitare l’identificazione e la caratterizzazione di possibili ligandi di una proteina. Tali strategie sono applicabili anche allo studio degli acidi nucleici. A differenza delle genoteche, le collezioni combinatorie consistono di oligomeri sintetici. Deposizioni ordinate di oligonucleotidi sintetici stampati come puntini su supporti solidi in miniatura sono noti come DNA chips. Specificamente, le collezioni combinatorie contengono numeri elevatissimi di molecole sintetizzate chimicamente (come peptidi od oligonucleotidi) con sequenze o strutture del tutto casuali. Queste collezioni sono progettate e costruite con l’attesa che una molecola tra le tante sia riconosciuta come ligando dalla proteina (o acido nucleico) d’interesse. Se ciò accade, forse la molecola sarà utile in applicazioni farmaceutiche, ad esempio come farmaco per il trattamento di una malattia in cui è implicata la proteina che vi si lega. Un esempio di questa strategia è la preparazione di una collezione combinatoria sintetica di esapeptidi. Il numero massimo di sequenze diverse per esapeptidi è 206 = 6,4x107. Un modo per semplificare la preparazione e vagliare le possibilità in tale collezione è specificare i primi due amminoacidi dell’esapeptide mentre gli altri quattro sono scelti a caso. In tal modo, devono essere sintetizzate 400 raccolte (202), ciascuna delle quali si distingue per gli amminoacidi in posizioni 1 e 2, mentre le altre quattro posizioni sono variabili (come in AAXXXX, ABXXXX, ACXXXX, ADXXXX, ecc.) in modo che ciascuna delle 400 collezioni contiene 204 = 160.000 differenti disposizioni in sequenza. Il vaglio tra queste collezioni con la proteina d’interesse rivela quale tra le 400 contiene un ligando con alta affinità. Questa collezione è poi espansa sistematicamente specificando i primi 3 amminoacidi (sapendo già dalla prima selezione quali amminoacidi vanno meglio come primi due); sono necessarie ora solo 20 collezioni sintetiche (ciascuna con 203 = 8000 esapeptidi, ciascuna con uno dei possibili amminoacidi in terza posizione, gli altri tre scelti a caso). La nuova selezione con la proteina d’interesse rivela qual è la migliore tra le 20, e questa particolare raccolta è nuovamente variata sistematicamente sulla quarta posizione, formando altre 20 collezioni (ciascuna con 202 = 400 esapeptidi). Questo ciclo di sintesi, vaglio e selezione si ripete finché tutte e sei le posizioni dell’esapeptide sono ottimizzate a formulare il miglior ligando per la proteina. Una variante di questa strategia di base usando oligonucleotidi sintetici anziché peptidi ha identificato un 15-mero unico (di sequenza GGTTGGTGTGGTTGG) con alta affinità (KD = 2,7 nM) per la trombina, una proteasi a serina della via di coagulazione del plasma. La trombina è un bersaglio primario nella prevenzione farmacologica della formazione di trombi nelle trombosi delle coronarie.