Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


ORIENTAMENTO BIOINFORMATICA, Dispense di Bioinformatica

approfondimento di vari punti presenti nel piano di studi universitario riguardo la bioinformatica.

Tipologia: Dispense

2019/2020

In vendita dal 07/05/2020

luis110295
luis110295 🇮🇹

1 documento

1 / 11

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Luisantonio Lasorsa
Bioinformatica e analisi del genoma
umano
La lezione di “Orientamento consapevole per le biotecnologie innovative” è
stata divisa nei seguenti punti:
Cosa è il genoma
Come è fatto il genoma
Sequenziamento del genoma umano
La Bioinformatica per l’analisi del genoma
Risultati dell’analisi del genoma umano
Il Microbioma umano
Che cosa è il genoma?
Il genoma è l’insieme di tutte le informazioni biologiche necessarie alla
costruzione e al mantenimento di organismo vivente (tali informazioni sono
depositate nella sequenza del DNA).
Come è fatto il genoma?
Per prima cosa il genoma è “scritto” nel Deoxyribonucleic Acid, ovvero il
DNA.
Una caratteristica importante da ricordare è che il DNA è identico per tutte
le cellule di un individuo ma, esse sfruttano le medesime informazioni in
modi diversi (un esempio è l’evidente differenza fra un globulo rosso da un
neurone).
----------------------------------------------------------------------------------------------------
--------
Il DNA
Nello specifico il DNA è un polimero composto da unità chiamate nucleotidi
a loro volta composte da: uno zucchero pentoso (desossiribosio), una base
azotata (Timina, Adenina, Citosina, Guanina) e un gruppo fosfato.
Il DNA è identificabile come una lunga catena (scheletro del DNA) a doppia
elica costituita dai vari nucleotidi legati fra loro attraverso legami
fosfodiesterici. Lo scheletro è quindi un'alternanza dei gruppi fosfati e degli
zuccheri mentre le varie basi azotate sporgono lateralmente, come
mostrato nella figura seguente:
La doppia elica del DNA è composta da due filamenti ed hanno un
pf3
pf4
pf5
pf8
pf9
pfa

Anteprima parziale del testo

Scarica ORIENTAMENTO BIOINFORMATICA e più Dispense in PDF di Bioinformatica solo su Docsity!

Luisantonio Lasorsa

Bioinformatica e analisi del genoma

umano

La lezione di “Orientamento consapevole per le biotecnologie innovative” è stata divisa nei seguenti punti:

  • Cosa è il genoma
  • Come è fatto il genoma
  • Sequenziamento del genoma umano
  • La Bioinformatica per l’analisi del genoma
  • Risultati dell’analisi del genoma umano
  • Il Microbioma umano

Che cosa è il genoma?

Il genoma è l’insieme di tutte le informazioni biologiche necessarie alla costruzione e al mantenimento di organismo vivente (tali informazioni sono depositate nella sequenza del DNA).

Come è fatto il genoma?

Per prima cosa il genoma è “scritto” nel Deoxyribonucleic Acid, ovvero il DNA. Una caratteristica importante da ricordare è che il DNA è identico per tutte le cellule di un individuo ma, esse sfruttano le medesime informazioni in modi diversi (un esempio è l’evidente differenza fra un globulo rosso da un neurone). ---------------------------------------------------------------------------------------------------- --------

Il DNA

Nello specifico il DNA è un polimero composto da unità chiamate nucleotidi a loro volta composte da: uno zucchero pentoso ( desossiribosio ), una base azotata ( Timina, Adenina, Citosina, Guanina ) e un gruppo fosfato. Il DNA è identificabile come una lunga catena ( scheletro del DNA ) a doppia elica costituita dai vari nucleotidi legati fra loro attraverso legami fosfodiesterici. Lo scheletro è quindi un'alternanza dei gruppi fosfati e degli zuccheri mentre le varie basi azotate sporgono lateralmente, come mostrato nella figura seguente: La doppia elica del DNA è composta da due filamenti ed hanno un

orientamento antiparallelo , ovvero un filamento segue l’ordine 5’-3’, mentre il suo complementare 3’-5’. Grazie a questa forma del DNA l’impalcatura di zucchero rimane all’esterno permettendo alle basi azotate di legarsi attraverso legami a idrogeno seguendo una regola ben precisa: ADENINA-TIMINA con 2 legami e CITOSINA-GUANINA 3 legami. La sequenza della molecola di DNA è definita dalla successione delle 4 basi azotate rappresentate dalle lettee A===>Adenina T===>Timina C===>Citosina G===>Guanina La replicazione semiconservativa del DNA avviene grazie all’enzima chiamato elicasi il quale separa i due filamenti di DNA rompendo i legami a idrogeno fra le basi azotate cosicché entrambi i singoli filamenti possa fungere da stampo. ---------------------------------------------------------------------------------------------------- --------

Il genoma umano

Il genoma umano è costituito da un genoma nucleare e dal genoma mitocondriale (piccola curiosità, il DNA mitocondriale è ereditato dalla madre dell’individuo che a sua volta è ereditato dalla sua e così via facendo nascere l’idea di una “Eva mitocondriale” dalla quale tutti gli esseri umani che vivono hanno ereditato il loro DNA mitocondriale) Il genoma nucleare Contiene circa 3x109nucleotidi organizzati in Cromosomi Le cellule somatiche sono diploidi, contengono cioè due copie di ciascun cromosoma: •22 coppie di autosomi (coppie di cromosomi uguali) •1 coppia di cromosomi sessuali, X e Y–XX nelle donne, XY Negli uomini Le cellule sessuali, o gameti, sono aploidi, contengono cioè solo una copia per cromosoma (23 cromosomi in tutto) Il genoma mitocondriale –È una molecola di DNA circolare di circa 16000 nucleotidi, presente in

Per comprendere la biologia completa di un organismo bisogna conoscere e determinare tutta l’informazione racchiusa nel genoma. (Segreto della vita) La sequenza del genoma umano avrebbe permesso di:

- identificare tutti i geni umani

  • determinare la struttura dei geni
  • identificare le funzioni dei geni
  • identificare i geni responsabili delle malattie mendeliane
  • determinare le regioni non codificanti con funzione regolatoria
  • scoprire l’inatteso In sintesi lo studio dei geni può portare risposte a domande più “comuni”, ovvero:
  • Cosa abbiamo in comune con gli altri esseri viventi?
  • Da dove veniamo?
  • Come siamo fatti?
  • Perché ci ammaliamo?
  • Dove andiamo? Gli studi del genoma umano sono iniziati nel 1990 per terminare nel 2003 avendo sequenziato il 99% del DNA con una accuratezza del 99.9%. Il DNA è detto sequenziato quando si determina la sequenza lineare delle basi leggendo l’ordine in cu A T C G sono disposte. Nell’uomo sono 3 miliardi di paia di basi. Metodo di Sanger Il sequenziamento del genoma umano fu realizzato mediante il Metodo di Sanger, che utilizza nucleotidi modificati (dideossinucleotiditrifosfato, ddNTPs) per interrompere la reazione di sintesi in posizioni specifiche. IddNTPs si differenziano dai dNTP per l'assenza del gruppo idrossilico sul carbonio 3' della molecola. IddNTP, a causa della loro struttura, impediscono che un altro nucleotide si leghi ad essi, inquanto non si possono formare legami fosfodiesterici. Metodo di sequenziamento secondo Sanger Il protocollo classico richiedeva le seguenti componenti:
  • Uno stampo di DNA a singolo filamento.
  • Un primer per iniziare la reazione di polimerizzazione (corto

filamento che viene sintetizzato chimicamente e complementare al DNA di stampo).

  • Enzima (DNA polimerasi di E.coli per copiare la sequenza del DNA).
  • Deossinucleotidi (dATP, dCTP, dGTP, dTTP).
  • Dideossinucleotidi (ddNTPs) marcati radioattivamente per visualizzare i frammenti di DNA sintetizzati. In parallelo 4 reazioni di polimerizzazione ciascuna delle quali contiene il primer, la DNA polimerasi, i 4 dNTP e un singolo ddNTP (100:1). Ogni miscela conterrà una popolazione di filamenti che avranno in comune l’estremità 5’ ma con lunghezze diverse perché la loro sintesi è stata bloccata in diverse posizioni al 3’ Sequenziamento automatico del DNA
  • tecnica non radioattiva.
  • il DNA stampo da sequenziare a doppio filamento.
  • la Taq DNA polimerasi.
  • una miscela dei 4 dNTP.
  • una miscela dei 4 ddNTP marcati.
  • si genera un’unica miscela di frammenti a singolo filamento che vengono poi caricati in un unico pozzetto e separati per elettroforesi.
  • durante l'elettroforesi i frammenti vengono eccitati da una luce laser, passano davanti a un rilevatore che capta la lunghezza d'onda e l'intensità delle emissioni fluorescenti e identifica quale nucleotide è presente nella banda.
  • le informazioni vengono integrate e trasformate in picchi di colore diverso (uno per ogni nucleotide) con aree proporzionali all'intensità di emissione. La realizzazione del progetto genoma umano fu possibile grazie ai progressi delle tecniche del DNA ricombinante, e allo sviluppo dei sequenziatori automatici capaci di sequenziare sino 400.000 basi/giorno. Approccio Utilizzato dalla Celera Genomics Shotgun Sequencing
  • Frammentazione casuale del DNA umano in frammenti da 1000- 10.000pb
  • Clonaggio dei frammenti in vettore plasmidico
  • Sequenziamento dei frammenti nei sequenziatori automatici
  • Assemblaggio delle sequenze Dopo il sequenziamento del genoma umano
  • sviluppare metodologie per l’analisi dei dati biologici. La Bioinformatica è per sua natura multidisciplinare, richiedendo competenze diverse (Biologia Molecolare, Informatica, Matematica, Statistica, Fisica, Ingegneria, ecc.) ed ha applicazioni pratiche in vasti settori della scienza. Immagazzinamento dei dati di sequenziamento Le banche biologiche contengono determinate informazioni. In base ad esse si distinguono due classi principali:
  • Banche dati primarie: raccolgono giornalmente tutte le informazioni che riguardano le biomolecole predette in tutti i laboratori. Sono: l'EMBL / GenBank/ DDBJ. - Banche dati secondarie o specializzate: raccolgono insiemi di dati omogenei dal punto di vista tassonomico e/o funzionale disponibili nelle Banche dati Primarie e/o in Letteratura, rivisti e annotati con informazioni di valore aggiunto (es. banche dati genomiche). Analisi dei dati di sequenziamento Annotazione L'annotazione ha lo scopo di identificare i geni degli elementi funzionali analizzandoli attraverso strumenti bioinformatici. Questo studio permette di rispondere alle seguenti domande:
  • Quanti geni contiene?
  • Dove sono localizzati i geni?
  • A cosa serve ciascun gene (ovvero, qual è la funzione della proteina codificata)?
  • Quale è la struttura dei geni?
  • Quali sono le regioni regolatorie? I “browser” genomici I dati raccolti delineano la struttura e la funzione del genoma dei diversi organismi. Per facilitarne la ricerca sono stati riuniti in collezioni rese disponibili alla comunità scientifica accessibili via web, ovvero i browser genomici. Essi Sono interfacce web collegate alle banche dati contenenti le sequenze prodotte dai vari progetti di sequenziamento genomico e le relative annotazioni e analisi funzionali. I browser genomici principali sono: Ensembl (sviluppato da EMBL-EBI e dal Sanger Center) disponibile al sito: http://www.ensembl.org UCSC (University of California Santa Cruz) - disponibile al sito

http://genome.ucsc.edu La complessità dell’organismo umano non è correlata al numero dei geni. Lo splicing alternativo È un meccanismo attraverso il quale uno stesso pre-mRNA può subire eventi di splicing differenti con la produzione di mRNA maturi alternativi che possono dare origine a proteine diverse. Le proteine alternative generate dallo splicing (isoforme) possono avere funzioni simili, distinte o perfino antagoniste. Lo splicing alternativo contribuisce all’espansione della capacità di espressione del genoma umano

  • Oltre il 95% dei geni umani è espresso mediante splicing alternativo
  • Il numero medio trascritti prodotti da un gene è di circa 9- Numero di trascritti umani è maggiore di 200. Aumento della complessità del trascrittoma e del proteoma di almeno un ordine di grandezza Regolazione Epigenetica Il meccanismo di controllo dei geni che non è dipendente dalla sequenza di DNA è definito regolazione epigenetica. Il fenotipo di una cellula è determinato non solo dal genoma ereditato, quanto anche da una sorta di 'impronta" che ne influenza il comportamento funzionale. I principali meccanismi alla base dell’ereditarietà epigenetica sono:
  • la metilazione del DNA;
  • il rimodellamento della struttura della cromatina (modificazione dei nucleosomi) Regolazione epigenetica nell’uomo
  • I gemelli omozigoti hanno identico corredo genetico.
  • Ma due gemelli omozigoti non sono identici dal punto epigenetico!
  • Due gemelli geneticamente predisposti all’insorgenza di una malattia, potranno o non sviluppare entrambi la malattia.
  • In tal caso entrano in gioco i fattori epigenetici che determinano l’insorgenza della malattia in uno e non nell’altro.
  • Il 99.9% del DNA è identico in tutti gli individui
  • Lo 0.1% del DNA mostra variabilità
  • infiammazioni croniche intestinali
  • Obesità
  • Diabete di tipo I
  • Cancro del colon-retto
  • Malattie neurodegenerative (es. Alzheimer, Parkinson, …) Metagenomica La metagenomica è una nuova disciplina che studia l’insieme dei diversi materiali genetici (detto metagenoma ) derivanti dalle diverse specie presenti in un determinato ambiente. L'approccio metagenomico è applicato con successo per rivelare la diversità genetica e tassonomica delle comunità microbiche. Il Progetto Genoma Umano Dal 2003 ad oggi Cosa ancora non sappiamo :
  • L’ esatto numero di geni presenti nel genoma umano
  • La funzione di circa il 50% dei geni
  • La regolazione dell’espressione dei geni
  • L'informazione contenuta nella porzione non codificante e la sua funzione
  • I geni coinvolti nelle malattie complesse
  • La correlazione tra variazioni della sequenza del genoma tra singoli individui e la suscettibilità a specifiche malattie
  • La relazione tra microbioma e organismo Benefici del progetto Genoma Umano Medicina
  • migliorare la diagnosi delle malattie
  • identificazione di predisposizione genetica a specifiche malattie
  • creazione di farmaci sulla base di informazioni molecolari
  • produzione di “farmaci personalizzati” sulla base dei profili genetici individuali Forense
  • identificazione di responsabili di crimini
  • identificazione di vittime di catastrofi ecc.... Il Progetto Genoma Umano oggi

La conoscenza della sequenza del genoma umano ancora non ci ha fornito le informazioni necessarie per la comprensione di tutti meccanismi alla base dei processi fisiologici e patologici dell'uomo. L’analisi integrata di tutti i dati molecolari (genoma, trascrittoma, proteoma, microbioma), metabolici, funzionali, ecc. potrà finalmente far luce sul segreto della vita…. La strada è molto lunga!