



















Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Una serie de ejercicios resueltos sobre probabilidad condicionada y el teorema de bayes. Incluye problemas que abarcan desde el cálculo de probabilidades en diferentes contextos hasta la aplicación de leyes de morgan y el uso de árboles de decisión. Se exploran conceptos como la probabilidad pretest y postest, el factor de bayes y su aplicación en la interpretación de resultados de pruebas diagnósticas, así como la influencia de la prevalencia de una enfermedad en la probabilidad de un diagnóstico positivo. Los ejercicios están diseñados para fortalecer la comprensión y aplicación de estos conceptos fundamentales en estadística y probabilidad.
Tipo: Apuntes
1 / 27
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!




















Notas previas.
Para poder realizar estos ejercicios es conveniente que repases tus notas sobre
probabilidad condicionada, teorema de Bayes y uso del factor bayes.
Estos problemas recogen algunos de los utilizados en exámenes de años anteriores, por
eso en algún apartado veréis puntuaciones. Lo he dejado para que os hagáis una idea,
pero puede que en aquellos en los que haya incluido nuevos apartados, la puntuación
del problema no sume diez. Esta es también la razón de que en algún párrafo notéis
cambios en la fuente o el interlineado.
En algunos de esos problemas se cita el artículo en el que está inspirado el problema,
con la adaptación necesaria para adecuarlo al nivel de una asignatura de introducción
como esta. Por lo tanto, algunas de las cifras utilizadas son reales, pero otras son
inventadas, por lo que los resultados son extrapolables al problema planteado pero no,
al menos no siempre, a la realidad clínica.
Aunque algunos de los resultados han sido redondeados al cuarto decimal (otros no), la
mayor parte de las operaciones han sido resueltas utilizando las fracciones
correspondientes en vez del valor redondeado. Esto evita que cuando se comparan
varias formas de resolución, los resultados salgan diferentes debido a los redondeos
previos.
Hemos revisado el texto pero, al tratarse de problemas reciclados de otros, puede que
se nos hayan escapado erratas, repeticiones, frases inacabadas... Si encontráis algunos
de estos defectos, por favor escribidnos a [email protected].
Aunque colgaré las soluciones a todos ellos, en un par de semanas celebraremos un
seminario de una hora u hora y media, en grupo reducido (no más de 30), de asistencia
voluntaria para resolver las dudas que os hayan surgido en su resolución. Resolución de
dudas, no resolución de problemas completos. Como posiblemente serán necesarios
varios grupos, abriremos un formulario para apuntarse y reservar los espacios
necesarios en función de la demanda. Hablaré con vuestros representantes para buscar
el mejor hueco de los disponibles en vuestro horario.
En el último ejercicio he incluido código de R que os permitirá resolver problemas
similares.
2
Una prueba diagnóstica para determinar la presencia de diabetes tiene una probabilidad de dar
positivo y no tener diabetes del 0.04 y una probabilidad de dar negativo y estar enfermo del
0.05. Además se sabe que la prevalencia de diabetes en la población donde se usa esta prueba
es del 7% (Prevalencia=probabilidad de tener diabetes).
Preguntas:
resultado positivo?
resultado negativo?
métodos.
Información a partir del enunciado:
Solución apartado 1.
o más sencillo en este caso.
Solución apartado 2.
4
Como se puede observar, con los datos facilitados sería fácil obtener las probabilidades que
solicita el problema.
(ୈ∩ି )
(ୈ)
.ହ
.
Con esta, podemos obtener
y sustituyendo en la primera…
.ଶ
.ଶା.ସ
De forma similar
luego
y por tanto
sustituyendo en la primera…
5
Por último, construir una tabla a partir de la información recibida, también puede facilitar la
tarea. (Nota: con el fondo en color verde aparecen las celdas que podemos deducir a partir de
la información que suministra el problema. Después de introducir estas, el resto de celdas,
quedan determinadas.
DIABETES nDIABETES
marginales
marginales → 0.07 0.
Información del problema para
construir la tabla
P(nDIABETES∩T+) 0.
A partir de la tabla anterior:
P(T+|DIABETES) 0.2857 s P(T+|nDIABETES) 0.0430 1-e
P(T-|nDIABETES) 0.9570 e P(T-|DIABETES) 0.7143 1-s
P(DIABETES|T+) 0.3333 RV+ 6.6429 s/(1-e)
P(nDIABETES|T-) 0.9468 RV- 0.7464 (1-s)/e
probpreE-> 0.0700 0.9300 <-probpre_nE
oddpreE-> 0.0753 13.2857 <-oddpre_nE
7
୨
୨
୨
୧
୧
୩
୧ୀଵ
୧
8
𝐢
୧
𝐢
𝐢
𝐢
En cierta población, se estima que la probabilidad de que una mujer de entre 40 y 80
años tenga cáncer de mama es del 1%. Se sabe que el 90% de las mujeres con este tumor y el
9% de las que no lo tienen darían positivo en la prueba. Imagine que utilizásemos esta prueba
para realizar cribado
1
en la población.
muestreo que asegura una buena representación de las características de la población
de mujeres de entre 40 y 80 años sin síntomas de la enfermedad. (2 puntos)
CÁNCER DE MAMA LESIÓN BENIGNA
MAMOGRAFÍA + 36 356 392
MAMOGRAFÍA - 4 3604 3608
40 3960 4000
puntos)
P(CANCER ∩+)= P(+|CÁNCER) * P(CÁNCER)= 90% X 1% =.9 .01 =0.009 o 9 ‰
1 El cribado (en inglés screening) es una estrategia de prevención secundaria (se estudiará con detalle en la asignatura de epidemiología) cuyo objetivo
es encontrar personas sin síntomas pero que ya tienen la enfermedad (en este caso el tumor) en el grupo de población sobre el que se aplican.
10
Tabla 2 Peso de cada grupo de edad en el conjunto de la población de mujeres para el rango de edades analizado.
Validez de la prueba y prevalencia del tumor en cada grupo de edad.
3
ver nota
3
Preguntas.
grupo de 45-49 años que había dado positivo en la mamografía, esta padezca la forma
invasiva de tumor?
grupo de 70-79 años?
) han pasado a ser 0.8 y 0.
respectivamente. Asumiendo que las prevalencias específicas de cada grupo de edad
no hayan cambiado, obtenga las probabilidades posteriores para ese año.
70-79 años? Para responder a esta pregunta, asuma que la distribución de los grupos
de edad en la población es la que figura en la tabla.
Cuestiones 1 y 2: P(T|+) en los años 90.
Solución 1: Recuerde que estamos restringiendo la estimación a un solo grupo de edad que
solo puede o no tener la forma invasiva del tumor.
Solución 2:
También podemos utilizar la relación entre la probabilidad pretest y la postest
utilizando las odds pre-test a priori) y el factor bayes, en este caso el fb+ (también llamado RV+
o LR+)
3
Aunque vamos a asumir que estas probabilidades son independientes del grupo de edad, en la realidad esto no tiene por qué ser cierto. Aunque
sumen 1 (0.7 y 0.3), recuerda que +|T y −|T
ഥ no son sucesos complementarios.
11
= Odd
· fb +
Odd(E|S) =
Odd(E|S) =
Odd(E|S)
1+Odd(E|S)
బ.బభ
బ.వవ
ଵା
బ.బభ
బ.వవ
P(E|S) = 0.
Como se puede observar, el hecho de conocer que la mamografía ha dado positiva no
ha mejorado nuestro conocimiento sobre la probabilidad de tenerla (factor de bayes=1). Dado
que el factor bayes + es el mismo, tampoco modificará la probabilidad a priori de tener un
tumor invasivo de mama en el grupo de 70-79 años. En la Tabla 3 del siguiente apartado, se
recoge el resumen para ambos grupos de edad y periodos.
Cuestión 3: P(T|+) en 2016.
Mismas estimaciones para el año 2016.
Las P(+|T) y la 𝑃(−|T
) han pasado a ser 0.8 y 0.
.଼
.଼ା .ଵସ଼ହ
=0.
Tabla 3Probabilidades pre y postest para ambos periodos y grupos de edad.
1990 2016
Probabilidad pre-test P post-test+ P post-test+
P(T|40-49yr) 1.00% 1.00% 5.11%
P(T|70-79yr) 7.20% 7.20% 29.27%
Como se recoge en la tabla resumen, la mejora tecnológica se traduce en que, sin haber
cambiado la prevalencia, el rendimiento de la prueba es superior, pero esto no debe hacer
olvidar el hecho que de todas las mujeres a las que se realiza la prueba y dan positivo, el
94.89% de las que pertenecen al grupo de edad 40-49 años y el 70.23% de las que pertenecen
al grupo de edad 70-79 años, no tendrán un tumor invasivo (falsos positivos). Esta es la razón
por la cual tras la mamografía, es necesario realizar otras pruebas más específicas (menor
probabilidad de falsos positivos).
Cuestión 4: P(70-79 años|+) en los años 90.
13
14
Esto mismo se puede observar en las siguientes tablas construidas proyectando las probabilidades conocidas sobre una población de 106 mujeres.
TABLA DE CONTINGENCIA Peso grupo Intra grupo
୧
) P(+|T) P(+|noT) P(T) P(G
୧
T noT subtotal 0.
subtotal 2500 247500 250000
T noT subtotal 0.
subtotal 7890 292110 300000
T noT subtotal 0.
subtotal 13580 266420 280000
T noT subtotal 0.14 0.7 0.3 0.0720 0.
subtotal 10080 129920 140000
T noT subtotal 0.03 0.7 0.3 0.0760 0.
subtotal 2280 27720 30000
T noT subtotal 100% 0.7 0.3 0.0363 1
subtotal 36330 963670 1000000
T noT subtotal
16
𝐹𝑎𝑐𝑡𝑜𝑟𝑏𝑎𝑦𝑒𝑠+=
𝑃
(
| 𝐻𝐺𝐴
)
𝑃൫+ห𝐻𝐺𝐴൯
=
1
= 25
Tabla 4 Resumen de los diferentes escenarios: Estudio, Prevalencia del 3%; B Prevalencia del 80%
En el estudio
P(+|HGI)->s 1 1 1
P(-|noHGI)->e 0.96 0.96 0.
fb+ 25 25 25
fb- 0 0 0
P(-|HGI)->1-s 0 0 0
P(+|noHGI)->1-e 0.04 0.04 0.
P(noHGI) 59.57% 97.00% 20.00%
En este enlace podéis construir vuestras tablas de 2x2 y obtener el nomograma..
http://araw.mede.uic.edu/cgi-bin/testcalc.pl
Prevalencia 3% Prevalencia 80%
17
Como ocurre con muchos otros tumores, el diagnóstico precoz del cáncer de próstata es
un objetivo esencial en prevención secundaria
7
. Un estudio publicado en 2009 (Ouyang et al.,
8
evaluó la validez diagnóstica de un nuevo marcador llamado PCA3. Esta técnica
detectaba la presencia de mRNA (ARN mensajero) en el sedimento urinario.
Para ello recogió muestras de orina de 92 pacientes, 43 con y 49 sin cáncer de próstata
(en adelante CaP) confirmado mediante biopsia. Tras la cuantificación se consideraron positivos
aquellos que superaban un umbral dado de este marcador. Los resultados se muestran en la
siguiente tabla.
CaP No CaP Total
PCA3 > 19.9 31 20 51
PCA3 ≤19.9 12 29 41
Total 43 49 92
Preguntas.
A partir de la tabla, obtenga las siguientes probabilidades.
muestra del estudio (1.5 PUNTOS).
muestra del estudio (1.5 PUNTOS).
hombres mayores de 50 años asintomáticos que tienen el tumor es de 1/
5
. Calcule la
probabilidad de que un hombre de ese grupo de edad escogido al azar de la población
tenga el tumor habiendo dado positivo en el test (2.5 PUNTOS). Explique la diferencia,
si la hay, con la obtenida en el punto 2.
hombres mayores de 50 años sintomáticos que tiene el tumor es de 1/
3
calcule la
probabilidad de que un hombre de ese grupo de edad escogido al azar de la población
no tenga el tumor habiendo dado negativo en el test (2.5 PUNTOS). Explique la
diferencia, si la hay, con la obtenida en el punto 3.
Tabla 5 Respuestas a las preguntas del problema 1.
7 Prevención secundaria es aquella que se realiza sobre sujetos que ya padecen la enfermedad. El cribado poblacional y las técnicas de diagnóstico
precoz intentan detectarla cuando no hay signos o síntomas de su presencia o cuando estos son demasiado inespecíficos o leves como sugerirla.
8
Problema adaptado a partir del artículo Ouyang B, Bracken B, Burke B, Chung E, Liang J, Ho S-M. A Duplex Quantitative Polymerase Chain Reaction
Assay Based on Quantification of α-Methylacyl-CoA Racemase Transcripts and Prostate Cancer Antigen 3 in Urine Sediments Improved Diagnostic
Accuracy for Prostate Cancer. Journal of Urology 2009;181:2508–14. https://doi.org/10.1016/j.juro.2009.01.110.
19
Grupo de >50 años, sintomáticos.
P(CaP|PCA3−) =
P൫CaP൯ ⋅ P൫PCA3 − |CaP൯
P൫CaP൯ · P൫PCA3 − หCaP൯ + P
( CaP
) · P
( PCA3 − |CaP
)
=
(1 − 10
ିଷ
) ⋅
29
49
(1 − 10
ିଷ
) ⋅
29
49
ି ଷ
·
12
43
=
0.5912449 + 0.
= 𝟎. 𝟗𝟗𝟗𝟓𝟐𝟖𝟐
Otra forma de obtenerlo a través de la odd.
𝑂𝑑𝑑
ೄ
ଵ
షయ
ଵିଵ
షయ
= 0.
𝑓𝑏
ଷି
=
𝑃(𝑃𝐶𝐴3 − |𝐶𝑎𝑃)
𝑃(𝑃𝐶𝐴3 − |CaP)
𝑓𝑏
ଷି
=
12/
29/
= 0.
𝑂𝑑𝑑
( 𝐸
| −
) = 𝑂𝑑𝑑
( 𝐸
ௌ
) · 𝑓𝑏
ଷି
0.001001001 · 0.4715317 = 0.
P
( E
| −
Odd(E|−)
1 + Odd(E|−)
P
( E
| −
) = 0.
P(E
ഥ
|−) = 1 − 0.
𝐏(𝐄
ത
|−) = 𝟎. 𝟗𝟗𝟗𝟓𝟐𝟖𝟐
La prevalencia de la enfermedad (prior) en este grupo es muy baja (100 veces menor
que en el grupo de pacientes sintomáticos) y por tanto la probabilidad posterior también lo es.
Por este motivo es muy importante no conformarse solo con la información de la validez de la
prueba (sensibilidad y especificidad) para evaluar su rendimiento en condiciones reales de
aplicación.
El diagnóstico de la infección por SARS-CoV-2 ha evolucionado considerablemente
desde el inicio de la pandemia. En la actualidad los test de antígenos son utilizados como
herramienta de salud pública por la rapidez en obtener el resultado (15 minutos), aspecto
esencial para detener las cadenas de transmisión, y por su bajo coste.
20
Entre los estudios realizados para evaluar la capacidad del test para detectar
correctamente los casos, el 1 de enero de 2021 se publicaron los resultados de uno
9
realizado
en dos universidades americanas a partir de muestras nasales tomadas en estudiantes,
profesorado y plantilla con edades comprendidas entre los 15 y los 64 años.
Para estimar la validez de la prueba, se comparó con los resultados de la prueba PCR
10
asumiendo que esta última no tiene falsos positivos ni falsos negativos y por tanto que clasifica
correctamente a todos los pacientes
11
La tabla 2 de dicho artículo muestra el análisis estratificando en función de que se
tratase de pacientes sintomáticos o asintomáticos con los siguientes resultados.
ASINTOMÁTICOS
SINTOMÁTICOS
tabtest.sym
Outcome + Outcome - Total
Test + 32 2 34
Test - 8 185 193
Total 40 187 227
Point estimates and 95 % CIs:
Apparent prevalence 0.15 (0.11, 0.20)
True prevalence 0.18 (0.13, 0.23)
Sensitivity 0.80 (0.64, 0.91)
Specificity 0.99 (0.96, 1.00)
Positive predictive value 0.94 (0.80, 0.99)
Negative predictive value 0.96 (0.92, 0.98)
Positive likelihood ratio 74.80 (18.68, 299.46)
Negative likelihood ratio 0.20 (0.11, 0.38)
> tabtest.asym
Outcome + Outcome - Total
Test + 7 14 21
Test - 10 840 850
Total 17 854 871
Point estimates and 95 % CIs:
Apparent prevalence 0.02 (0.01, 0.04)
True prevalence 0.02 (0.01, 0.03)
Sensitivity 0.41 (0.18, 0.67)
Specificity 0.98 (0.97, 0.99)
Positive predictive value 0.33 (0.15, 0.57)
Negative predictive value 0.99 (0.98, 0.99)
9 Adaptado a partir de Pray, Ian W. ‘Performance of an Antigen-Based Test for Asymptomatic and Symptomatic SARS-CoV-2 Testing at Two University
Campuses — Wisconsin, September–October 2020’. MMWR. Morbidity and Mortality Weekly Report, vol. 69, 2021. www.cdc.gov,
doi:10.15585/mmwr.mm695152a3.
10
PCR es el acrónimo de Polymerase Chain Reaction, un conjunto de técnicas de laboratorio que permite amplificar (hacer copias) de pequeños
fragmentos de un genoma que, si son suficientemente específicos, permiten la identificación de la presencia de dicho genoma en diferentes medios,
aunque esté en concentraciones muy bajas.
11
En realidad esto no es del todo cierto pues diversos factores, de manera importante la técnica de toma de la muestra, mantienen una pequeña
proporción de falsos negativos. En términos de epidemiología clínica, en este estudio se utiliza la PCR como patrón oro (Gold standard) y por tanto se
asume que la PCR identifica inequívocamente la presencia de infección (en realidad identifica la presencia del genoma del virus).