Tema 1 epidemiologia genética, Apuntes de Estadística. Universitat Politècnica de Catalunya. BarcelonaTech (UPC)
henaralon
henaralon

Tema 1 epidemiologia genética, Apuntes de Estadística. Universitat Politècnica de Catalunya. BarcelonaTech (UPC)

15 páginas
10Número de visitas
Descripción
Asignatura: Epidemioliga genetica, Profesor: V Moreno, Carrera: Ciències i Tècniques Estadístiques (2n cicle), Universidad: UPC
20 Puntos
Puntos necesarios para descargar
este documento
Descarga el documento
Vista previa3 páginas / 15
Esta solo es una vista previa
3 páginas mostradas de 15 páginas totales
Descarga el documento
Esta solo es una vista previa
3 páginas mostradas de 15 páginas totales
Descarga el documento
Esta solo es una vista previa
3 páginas mostradas de 15 páginas totales
Descarga el documento
Esta solo es una vista previa
3 páginas mostradas de 15 páginas totales
Descarga el documento
Microsoft PowerPoint - 01-introduccion.ppt

EPIDEMIOLOGÍA GENÉTICA

Victor Moreno

Unidad de Bioestadistica y Bioinformàtica, UB e Insitut Català d’Oncologia (ICO)

MEIO UB-UPC

Contenidos

• Introducción a la epidemiología genética

• Análisis de asociación

– Haplotipos

– Interacciones

• Estudios de asociación global (GWAS)

• Análisis de CNVs

• Métodos multivariantes

• Ejercicio de análisis

1. Introducción a la epidemiología genética

Objetivos • Establecer el papel de los genes y el

ambiente en la variabilidad

(diferencias interindividuales) de la enfermedad y de rasgos complejos

• Encontrar esos genes

Etapas en el estudio de genes

• ¿Los genes influencian? – Estudios de agregación familiar ...

• ¿Qué modelo de herencia siguen? – Análisis de segregación

• ¿Dónde están esos genes? – Analisis de ligamiento

• ¿Qué genes son? – Análisis de asociación

• ¿Interaccionan con otras exposiciones? – Análisis de interacciones GxE

Nomenclatura

Gen

• Secuencia de ADN que codifica una

proteína

• Localizados en cromosomas (locus)

– 22 pares de autosomas y 2 cromosomas

sexuales (XX / XY)

• En un locus pueden darse múltiples formas de un gen (alelos), pero un

individuo como máximo tiene 2 de ellas

Cromosomas

Locus y Alelo

• Locus: la posición que ocupa un gen en un cromosoma

• Alelo: una de las versiones alternativas de un gen que puede ocupar un locus

CFTR locus

Chromosome 7

Graphic from OMIM: http://www3.ncbi.nlm.nih.gov/omim/

All definitions from Thompson & Thompson: Genetics in Medicine, 6th Edition, 2001

Polimorfismos

• Las posibles variantes en posiciones concretas del genoma se denominan

polimorfismos

• Si están en genes determinan alelos

• Sirven de marcadores genéticos que permitirán identificar alelos relacionados con la enfermedad

Marcadores genéticos

• SNP “Single Nucleotide Polymorphism” AGCATAC

AGCTTAC A>T

– Hay > 10.000.000 en el genoma

• Microsatélites: VNTR “Variable Number Tandem Repeat”

CGATATATATATGGT (5R)

CGATATATGGT (3R)

– Puede haber >1.0000, multialélicos

• CNV: “Copy Number Variant”

Genotipo

• Genotipo: combinación de alelos que posee un individuo en un locus:

A1A1 / A1A2 / A2A2

– Homozigoto: A1A1 , A2A2

– Heterozigoto: A1A2

• En ocasiones usaremos otros códigos:

– TT/TG/GG, AA/AB/BB, Aa/Aa/aa

Primera Ley de Mendel

Ley de segregación (transmisión)

• Para un locus concreto, cada progenitor transmite un alelo de manera

independiente a cada descendiente

• En el caso de un locus autosómico con 2 alelos A1A1

• Tres genotipos posibles A1A2 A2A2

Genotipo

parental

alelos P(transmitir el alelo)

A1A1 A1 1

A1A2

A1 A2

½

½

A2A2 A2 1

Emparejamiento A1A2 x A1A2

Alelos

A1 (½)

A2 (½)

Alelos A1 (½) A1A1 (¼) A1A2 (¼)

A2 (½) A1A2 (¼) A2A2 (¼)

Genotipos descencencia = A1A1 A1A2 A2A2

Pr(genotipo) = ¼ ½ ¼

Posibles emparejamientos

• 9 posibles pero sólo 6 diferentes si se

ignora el sexo de los progenitores: Tipo de

emparejamiento Pr(genotipo descencencia|tipo emparejamiento)

A1A1 A1A2 A2A2

A1A1 x A1A1 1

A1A1 x A1A2 ½ ½

A1A1 x A2A2 1

A1A2 x A1A2 ¼ ½ ¼

A1A2 x A2A2 ½ ½

A2A2 x A2A2 1

Segregación de cromosomas

sexuales

• En hombres, los cromosomas X e Y no son homólogos

• X se transmite a las hijas

• Y se transmite a los hijos

• Los genes en el cromosoma X se

transmiten de forma particular:

Tipo de

emparejamiento

Pr(genotipo descencencia |

tipo emparejamiento)

hijas hijos

X1X1 X1X2 X2X2 X1Y X2Y

X1X1 X1Y ½ ½

X1X1 X2Y ½ ½

X1X2 X1Y ¼ ¼ ¼ ¼

X1X2 X2Y ¼ ¼ ¼ ¼

X2X2 X1Y ½ ½

X2X2 X2Y ½ ½

Fenotipo

• Apariencia del individuo:

– Tensión arterial, peso, enfermedades …

• Resultado del genotipo + ambiente

• Ambiente:

– Nutrición

– Infecciones

– Alcohol / tabaco

– Exposiciones ocupacionales

– …

Genotipo  Fenotipo

A1A1 A1A2 A2A2

A dominante A1 A1 A2

A recesivo A1 A2 A2

Codominante A1 A1 A2 A2

Relación genotipo / fenotipo

• Penetrancia: Pr(fenotipo | genotipo)

– Pr(enfermedad | genotipo):

Genotipo A dominante A recesivo

A1A1 1 1 A1A2 1 0 A2A2 0 0

• Penetrancia incompleta: no se observa el fenotipo aunque se disponga del gen

• Fenocopia: individuo con la enfermedad

pero sin el gen

Penetrancia ligada a la edad

• Si el alelo confiere susceptibilidad para

padecer la enfermedad (son necesarios otros factores), a menudo la enfermedad

sólo aparece en edades avanzadas

• Es un caso de penetrancia incompleta, dependiente de otra variable

• P.e. cáncer, enf. cardiovasculares ...

Genética de poblaciones

• Estudio de la distribución de los genotipos y

fenotipos en una población

• Premisas

– Población de tamaño grande

– Segregación normal

– Frecuencias alélicas iguales en hombres y mujeres

– Ausencia de

• mutación

• selección

• migración

– Emparejamientos aleatorios (respecto del genotipo

de interés)

Un locus autosómico

• En general pueden darse K alelos en la

población, pero sólo 2 en un individuo

• K alelos: A1, A2, …, Ak • Posibles genotipos: (combinaciones de 2

en 2)

– Homozigotos: K

– Heterozigotos: K(K-1)/2

– Total: K + K(K-1)/2 = K(K+1)/2

Frecuencia alélica

• En una población de N personas, cada

una con 2 alelos hay 2N alelos

• La frecuencia (relativa) del alelo Ai:

• En genética frecuencia  probabilidad

iNúmero de alelos A

2N iF =

Frecuencias genotípicas

• La frecuencia de los posibles genotipos suele

depender exclusivamente de las frecuencias alélicas: proporciones de Hardy-Weinberg:

GenotipoFrecuencia (Ai: qi)

AiAi qi 2

AiAj 2qiqj

• Caso bialélico: A1A1 q 2

A1A2 2q(1-q)

A2A2 (1-q) 2

Proporciones de H-W

• Las frecuencias de los posibles genotipos alcanzan las proporciones H-W tras 1

generación de emparejamientos aleatorios, independientemente de las frecuencias genotípicas de origen

• Si las frecuencias alélicas no cambian: equilibrio

• Proporciones HW + equilibrio =

Equilibrio de Hardy-Weinberg

Convergencia a HW

Tipo de emparejamiento Pr(genotipo descencencia| tipo emparejamiento)

Frecuencia

descendencia

A1A1 A1A2 A2A2

A1A1 x A1A1 1 u2

A1A1 x A1A2 ½ ½ 2uv

A1A1 x A2A2 1 2uw

A1A2 x A1A2 ¼ ½ ¼ v2

A1A2 x A2A2 ½ ½ 2vw

A2A2 x A2A2 1 w2

Frecuencias iniciales: Pr(A1A1)=u

Pr(A1A2)=v

Pr(A2A2)=w

2 2 21 1 1 1 4 2

21 1 1 1 2 2 2 2

2 2 21 1 2 2 4 2

1 1 2 2

2

1 1

1 2

2

2 2

Pr( ) ( )

Pr( ) 2 2( )( )

Pr( ) ( )

( ); ( )

1 1

Pr( )

Pr( ) 2 (1 )

Pr( ) (1 )

A A u uv v u v

A A uv uw v vw u v w v

A A w vw v w v

si

q u v p w v

u v w p q

A A q

A A q q

A A q

= + + = +

= + + + = + +

= + + = +

= + = +

+ + = ⇒ = −

=

= −

= −

En 1 generación

Test H-W

Genotipo A1A1 A1A2 A2A2 Total

Observado (O) n11 n12 n22 N

Esperado (E) q2N 2q(1-q)N (1-q)2N N

χ =

− =∑

23 2

1 1

( ) ~i i

i i

O E c c

E

1 grado de libertad:

3 genotipos

– 1 las frecuencias suman 1

– 1 parámetro estimado (q)

Mejoras del test de HW

• Cuando alguna frecuencia alélica es

pequeña, la aproximación a χ2 no es buena.

• Si algún Ei <3 es recomendable

– Calcular el p-valor con simulaciones tipo bootstrap

– Realizar un test exacto

No equilibrio H-W

• No se cumple alguna premisa

• Problemas en la técnica de genotipado

– Mayor facilidad para detectar una combinación de alelos que otra (p.e. los heterozigotos)

Análisis con R

• Librería genetics Gregory R. Warnes

– “Obsoleta”, pero más simple

• Bioconductor – http:/rgenetics.org

• SNPassoc

Pasos en el análisis

1. Lectura de datos

2. Comprobación

3. Análisis descriptivo

a. Frecuencias genotípicas

• Valores perdidos

b. Frecuencias alélicas

c. Equilibrio HW

• En controles

Ejercicio

• Leer los datos del fichero cox2.txt

– Precauciones:

• los alelos no están separados (usar sep=“”)

• El código de missing es NN (usar na.string=“NN”)

• Inspeccionar los datos

• Describir las frecuencias

• Evaluar el equilibrio HW

Segunda ley de Mendel

Ley de independencia

• Describe el comportamiento conjunto de loci que controlan 2 rasgos diferentes

• Los alelos de cada locus se transmiten de manera independiente

• Sólo es cierto para loci ubicados en

cromosomas diferentes

Análisis de multiples loci

• Los genes “viajan” en cromosomas

• La distribución de genotipos en locus de

diferentes cromosomas o del mismo cromosoma pero lejanos muestra independencia estadística

• Los genotipos de loci cercanos no

Ligamiento

• Los genes se transmiten en cromosomas

con estructura fija

• La posición de cada locus en el

cromosoma no se altera

– Excepciones raras: translocaciones y

reorganizaciones

• Dos loci están ligados si se encuentran

próximos en un cromosoma

Haplotipo

• Conjunto de alelos de múltiples loci que

se transmiten juntos de padres a hijos

A B a b

a B a b

A B a b

Alelos en loci ligados

• La transmisión de alelos en loci cercanos no siempre se mantiene entre generaciones

• El fenómeno de recombinación hace que

en sucesivas generaciones los haplotipos transmitidos puedan cambiar

• Tras de aparecer una variante, en

sucesivas generaciones se equilibran las frecuencias

Mitosis

• División celular que da por resultado 2

células idénticas con 46 cromosomas (diploides)

• Los cromosomas se duplican y se separan

Mitosis

Célula madre

diploide

Células hijas

diploides

• Mutaciones en células somáticas pueden

tener consecuencias importantes

– Cáncer

• Pero no se transmiten a la descendencia

Meiosis

• División celular que produce los gametos

(óvulo o espermatozoide)

• Se reduce el número de cromosomas de

46 (diploide) a 23 (haploide)

• Se producen entrecruzamientos entre cromátides, que pueden dar lugar a

recombinación de material

• Permite aumentar la variabilidad

Meiosis

• Duplicación

• Entrecruzamiento

• Reducción I

• Reducción II

Célula diploide

Gametos haploides

Desequilibrio de ligamiento (DL)

• “linkage disequilibrium”

• Asociación estadística entre alelos de loci cercanos de un cromosoma

• Es una “violación” de la segunda ley de Mendel

• Se genera por mutación y selección

• Tiende a desaparecer en sucesivas generaciones por las recombinaciones

Frecuencias esperadas en equilibrio

A1A1 p

2

A1A2 2pq

A2A2 q

2

B1B1 r 2

p

2 r 2

2pq r

2

2pq r

2

B1B2 2rs

p

2 2rs

4pqrs

q

2 2rs

B2B2 s

2

p

2 s

2

2pq s

2

q

2 s

2

Frecuencias en HW

Frecuencias de los haplotipos

• Caso de 2 loci bialélicos: A1A2 x B1B2 • Haplotipos:

A1B1: H1 = pApB +D

A1B2: H2 = pA(1-pB) - D

A2B1: H3 = (1-pA)pB - D

A2B2: H4 = (1-pA)(1-pB) +D

D: Desviación de la frecuencia esperada por la asociación (DL)

D = H1H4 - H2H3

Medida de DL

• D mide la diferencia absoluta respecto a

la frecuencia esperada, pero depende de las frecuencias marginales (pA, pB)

• No es comparable

D’

• D‘ reescala D al rango [-1,1]

D' = D / Dmax

– D > 0: Dmax = min( pApb, pBpa )

– D < 0: Dmax = max( -pApB, -papb )

• D’ se afecta menos por las frecuencias alélicas pequeñas, pero tiene una distribución muestral intratable

Correlación

• El coeficiente de correlación entre 2

alelos ignorando otros alelos se puede calcular así:

A a B b

2 2

1

D r =

p p p p

2nr χ:

DL puede ser útil

• Objetivo: identificar polimorfismos de un

gen candidato asociados a enfermedad

• Las bases de datos de genómica recogen

múltiples polimorfismos.

• No es necesario estudiar todos. Se pueden elegir una selección distribuida de

manera espaciada a lo largo del gen

• La asociación entre los polimorfismos por DL permitirá detectar la zona de interés

Análisis del DL en R

• library( SNPassoc ) [genetics]

• LD  LD.snp(s1,s2) LD.setupSNP

• plot

– LDtable: heatmap (matriz de LD coloreada)

– LDplot: gráfica de pares

Linkage Disequilibrium Explained

Variations in Chromosomes Within a Population

Common Ancestor

Emergence of Variations Over Time

time present

Disease Mutation

From D Reich, Harvard Medical School

Evolución de las frecuencias

• En sucesivas generaciones

Di+1 = (1-θ)Di • En g generaciones

Dg = (1-θ) gD0

• θ fracción de recombinación (0< θ < 1/2)

• El DL es un fenómeno coyuntural, que declina hacia 0 en sucesivas generaciones

• La tasa de declinación es -log(2)/log(1-θ)

0 10 20 30 40 50

0

.

0

0

.

1

0

.

2

0

.

3

0

.

4

0

.

5

generación

D

L

Notas sobre DL

• Puede darse DL “estático”, que no decline

en sucesivas generaciones

– Selección

• También puede observarse asociación

entre alelos sin que exista ligamiento (sin que estén físicamente cercanos en el cromosoma)

– Poblaciones estratificadas (justifica el uso de

familias)

No hay comentarios
Esta solo es una vista previa
3 páginas mostradas de 15 páginas totales
Descarga el documento