Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Distribuciones de Probabilidad: Normal, Binomial, Poisson y t de Student - Prof. Segura Fr, Apuntes de Estadística

Una introducción a las distribuciones de probabilidad más importantes en estadística: normal, binomial, poisson y t de student. Se explica cómo calcular áreas bajo las curvas de distribución y se dan ejemplos para determinar probabilidades. Se incluyen tablas para facilitar el cálculo.

Tipo: Apuntes

2012/2013

Subido el 08/10/2013

riensita
riensita 🇪🇸

4.4

(96)

80 documentos

1 / 46

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
APUNTES
DE
BIOESTADÍSTICA APLICADA
EN
CIENCIAS DE LA SALUD
Capítulo 5
Distribuciones de probabilidad.
Antonio Segura Fragoso
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e

Vista previa parcial del texto

¡Descarga Distribuciones de Probabilidad: Normal, Binomial, Poisson y t de Student - Prof. Segura Fr y más Apuntes en PDF de Estadística solo en Docsity!

APUNTES

DE

BIOESTADÍSTICA APLICADA

EN

CIENCIAS DE LA SALUD

Capítulo 5

Distribuciones de probabilidad.

Antonio Segura Fragoso

Distribuciones de probabilidad 2

CAPÍTULO 5

DISTRIBUCIONES DE PROBABILIDAD

Recordatorio sobre investigación, población, muestra y variables aleatorias

Estamos viendo en este curso que la investigación es el método que usamos en Ciencias de la Salud para obtener nuevos conocimientos y responder preguntas relevantes cuyas respuestas puedan beneficiar a los pacientes. Las preguntas que nos hacemos, están referidas a una población. Por ejemplo ¿cómo son los niveles de colesterol en la población adulta de Talavera de la Reina?. Esta pregunta se refiere a “toda” la población adulta de Talavera que son decenas de miles de personas. Para responder esta pregunta, no estudiamos a toda la población, sino a una muestra. En la Figura siguiente se muestran dos histogramas del nivel en la escala del Dolor hechos con distinta anchura de las barras.

Recordemos que cada columna del histograma representa la frecuencia relativa o proporción (porcentaje en este caso) con la que se observa en la muestra el rango de valores correspondiente. Cuanto más grande fuera la muestra de sujetos, las barras podríamos hacerlas más finas y dibujarían mejor el comportamiento de esta variable aleatoria. Vemos, pues, que podemos describir razonablemente lo que pasa en la muestra mediante la distribución de frecuencias (mejor cuando la muestra sea más grande). Si consiguiéramos hacer las barras infinitamente pequeñas, obtendríamos una línea continua y una superficie continua como la que se aprecia en la siguiente figura:

Distribuciones de probabilidad 4

= 204 = 33,

σ

D

Tomemos el histograma: ¿Qué significa la superficie que ocupan todas las barras del histograma?. Significa la frecuencia relativa (porcentaje) de los diferentes valores de colesterol observados en la muestra estudiada. ¿Cuánto vale? La frecuencia total acumulada, es decir, 100%. Si lo expresáramos en tantos por uno, 100% = 1 de probabilidad. Pasemos ahora a la curva, a la distribución de probabilidad: ¿Qué significa la superficie que hay bajo la curva?. Significa la probabilidad de todos los diferentes valores de colesterol en la muestra. ¿Cuánto vale? La probabilidad de encontrar cualquier valor de colesterol es el suceso seguro, y su probabilidad es también = 1.

Por tanto, dos ideas fundamentales :

  1. Toda el área bajo la curva (es decir, la probabilidad de observar cualquiera de los valores de la variable = suceso seguro) es igual a 1.
  2. La probabilidad de observar valores de X comprendidos en un intervalo (por ejemplo entre 200 y 250 mg/dl es igual a la superficie bajo ese tramo de la curva.

Es por esto que, conocida la función de probabilidad de una variable (la ecuación de su distribución de probabilidad), es posible calcular las probabilidades de cualesquiera intervalos de valores de la variable.

A pesar de que cada variable aleatoria, sea categórica o continua, tiene su propia distribución de probabilidad, existen una serie de familias “tipo” de distribuciones. Las más importantes son la distribución Normal que siguen la mayoría de variables cuantitativas continuas, la Binomial que siguen muchas variables cualitativas, la de Poisson o de los “sucesos raros” también para variables

Distribuciones de probabilidad 5

cualitativas, la distribución “t” de Student , la distribución Exponencial, etc. A continuación describiremos las que más utilidad tienen por su aplicación en estudios de investigación.

Recuerdo del concepto de función

Una función es una ecuación que relaciona una variable independiente X y una variable dependiente Y.

La ecuación proporciona un modelo matemático que permite predecir los valores que tomará la variable dependiente (Y) en función de los valores de la variable independiente (X).

Por ejemplo, predecir la calidad de vida de las personas con discapacidad en función del Índice de Barthel.

La calidad de vida se mide con el SF36 físico (Y) en una escala de 0 a 100. Cuanto más alta, mejor.

El Índice de Barthel (X), en una escala de 0 a 100. Cuanto más alta, mejor.

La ecuación es (datos reales):

Y = 30 + 0,61X; o SF36 = 30 + 0,61 IBarthel

Por ejemplo, una persona que tenga un Barthel de 100, tendrá un SF36 de

SF36 = 30 + 0,61 x 100 = 30 + 61 = 91

Una persona con discapacidad, con I Barthel = 40, tendría un SF36 de

SF36 = 30 + 0,61 x 40 = 30 + 24,4 ≈ 54

Esta ecuación se llama función de enlace (entre variable independiente X y variable dependiente Y). En este caso, la ecuación es la de una línea recta.

En teoría existen infinitas funciones posibles de enlace.

Distribuciones de probabilidad de variables cuantitativas

Distribución Normal

Es la distribución más importante en la práctica estadística. El término “Normal” no se refiere al concepto habitual que tenemos (no patológico) sino a la creencia de los estadísticos durante mucho tiempo de que todas las variables continuas (cuantitativas) de la naturaleza seguían este tipo de distribución. La distribución Normal es la que siguen muchas variables cuantitativas continuas cuyos valores en diferentes sujetos son resultado de gran número de factores que actúan de forma independiente con influencias pequeñas cada uno de ellos. Por ejemplo, la presión arterial de un sujeto depende de su edad, ejercicio físico, ingesta de sal, obesidad, factores genéticos, estado anímico, circunstancias exteriores, alimentación, etc... cada uno de estos factores actúa en una pequeña parte, y la suma de todos ellos (y otros muchos más) determina el nivel de presión arterial. Esto produce que los valores muy altos o muy bajos de presión arterial, sean menos frecuentes que los valores intermedios. Para que un sujeto tenga la presión muy alta, debe coincidir que todos los factores componentes apunten en la misma dirección extrema (edad avanzada, escaso ejercicio físico, alta ingesta de sal, gran obesidad, etc…). Esto puede ocurrir, pero es mucho más probable que, aunque haya algunos factores extremos, otros no lo sean, y el resultado final de la presión del sujeto tienda más a los valores medios.

Distribuciones de probabilidad 7

Propiedades de la curva Normal Probabilidad

Valor de la Media variable Mediana Moda

  • 2 - 1^ + 1^ + 2

σ

σ σ^ σ σ

2,5%^ 2,5%

Punto de inflexión

95 %

Su ecuación es la siguiente:

2

( )^2 2

1

2

1 ( )^ σ

μ

π

− − =

x

f x e

Donde: π = número pi, cuyo valor es 3,

e = número e, que es la base de los logaritmos neperianos cuyo valor es 2,

x = un valor cualquiera de la variable

μ = la media de la variable σ = desviación estándar de la variable

Vemos, pues, cómo la función viene definida por la media μ y la desviación estándar σ , además

de por dos constantes que son el número π y el número e y obviamente por el valor que queramos

darle a X. El valor de la media sitúa a la curva en un determinado punto del eje horizontal de abscisas, donde se encuentran los posibles valores de la variable. La desviación estándar determina la forma de la curva, hace que sea más ancha y achatada (con una DE grande) o más estrecha y puntiaguda (cuando la DE sea menor).

Una variable (por ejemplo la presión arterial sistólica) tendrá una curva Normal diferente para cada muestra o grupo que queramos estudiar, que tendrá un valor diferente de la media y la desviación estándar. Veamos cómo serían las curvas normales de la presión arterial de los sujetos estudiados en TALARISK, por grupos de edad. En la Tabla siguiente se muestran sus medias y desviaciones estándar.

Distribuciones de probabilidad 8

Presiones sistólicas medias de los sujetos del estudio TALARISK, por grupos de edad

Y en la Figura siguiente las correspondientes curvas normales

Presión sistólica mmHg

< 54 años

124,6 148,

75 o más años

Probabilidad

Presiones sistólicas de los sujetos del estudio TALARISK, < 54 años y de 75 o más años

Se aprecia cómo la media coloca a cada una de las dos curvas en un punto distinto del eje de abscisas. También vemos que la forma de las curvas es diferente. La de la derecha tiene una DE mayor, por lo que es más plana y ancha.

En la Figura siguente vemos a la izquierda (a) varias curvas Normales con la misma media y distinta DE. Y a la derecha (b) varias curvas con la misma DE y distinta media.

Distribuciones de probabilidad

Probabilidad = área bajo la curva de presiones sistólicas entre 140 y 160 mmHg en la muestra de TALARISK

Media = 135 DE = 20

P = 0,

135

¿Hay otra forma más sencilla de poder calcular este tipo de áreas y probabilidades que no sea resolviendo integrales? Sí. Puede hacerse utilizando tablas, ya que todas las curvas Normales de todas las posibles variables pueden transformarse en una única curva Normal ESTANDARIZADA que tiene μ = 0 y σ = 1 y puede ser aplicada a todas las variables.

Curva Normal estandarizada

La estandarización de una curva normal concreta a la curva estandarizada es sencilla y se basa en estandarizar las desviaciones absolutas de cada dato X respecto a la media, dividiéndolas por la desviación estándar σ. Es decir: estandarizar significa dividir por la desviación estándar. De esta forma el desvío absoluto de un dato respecto a la media se transforma en desvío estandarizado denominado z. La fórmula para la estandarización es la siguiente:

σ

− μ

x z

Ejemplo : Supongamos que al estudiar la frecuencia cardiaca de una población, se ha observado que sigue una distribución Normal con μ = 80 p/m y σ = 10 p/m , es decir, N(80; 10). ¿ Cual será el desvío estandarizado correspondiente a una frecuencia cardiaca de 110 p/m ?.

Desviación absoluta = 110 - 80 = 30 p/m

Desviación estandarizada = 3 10

30

10

110 80 = =

σ

x μ z

Es decir, en términos absolutos el valor de X = 110 p/m se separa 30 p/m de la media y en términos estandarizados, se separa de z = 3 desviaciones estándar. Nótese que z carece de unidades ya que

Distribuciones de probabilidad

al dividir 30 pp/m por 10 pm/m, las unidades desaparecen.

Ejemplo: Veamos cómo se estandarizaría una curva normal, por ejemplo la distribución de presiones sistólicas de 25 sujetos del estudio TALARISK (Tabla siguiente). Para ello procederemos a estandarizar cada uno de los valores de X.

Estandarización de una curva normal de presión arterial

Z =

Z es el desvío estandarizado o desvío reducido y significa el número de desviaciones estándar que un cierto valor de X se separa de su media. Z carece de unidades por lo que puede ser utilizado con todo tipo de variables. Dicho de otro modo, cualquier distribución normal expresada en sus propias unidades, puede ser transformada en una única distribución normal carente de unidades,

con μ = 0 y σ =1. Observamos en la Tabla anterior que la media de los Z es cero y la DE es 1.

Veamos en la Figura siguiente el proceso de estandarización y la curva resultante.

Distribuciones de probabilidad

Explicación de la tabla de áreas bajo la curva estándar normal: Es una tabla en la que, dado un valor de Z, se puede hallar el área desde menos infinito hasta ese valor. Por ejemplo: Para z = 3; p = 0,9987. Para z = 1,42; p = 0, Para z = 0,41; p= 0,

**S e g u n d a c i f r a d e c i m a l d e l v a l o r d e z z 0. 0 0. 0 1. 0 2. 0 3. 0 4. 0 5. 0 6. 0 7. 0 8. 0 9

  1. 0**. 5 0 0 0. 5 0 4 0. 5 0 8 0. 5 1 2 0. 5 1 6 0. 5 1 9 9. 5 2 3 9. 5 2 7 9. 5 3 1 9. 5 3 5 9 0. 1. 5 3 9 8. 5 4 3 8. 5 4 7 8. 5 5 1 7. 5 5 5 7. 5 5 9 6. 5 6 3 6. 5 6 7 5. 5 7 1 4. 5 7 5 3 0. 2. 5 7 9 3. 5 8 3 2. 5 8 7 1. 5 9 1 0. 5 9 4 8. 5 9 8 7. 6 0 2 6. 6 0 6 4. 6 1 0 3. 6 1 4 1 0. 3. 6 1 7 9. 6 2 1 7. 6 2 5 5. 6 2 9 3. 6 3 3 1. 6 3 6 8. 6 4 0 6. 6 4 4 3. 6 4 8 0. 6 5 1 7 0. 4. 6 5 5 4. 6 5 9 1. 6 6 2 8. 6 6 6 4. 6 7 0 0. 6 7 3 6. 6 7 7 2. 6 8 0 8. 6 8 4 4. 6 8 7 9 0. 5. 6 9 1 5. 6 9 5 0. 6 9 8 5. 7 0 1 9. 7 0 5 4. 7 0 8 8. 7 1 2 3. 7 1 5 7. 7 1 9 0. 7 2 2 4 0. 6. 7 2 5 7. 7 2 9 1. 7 3 2 4. 7 3 5 7. 7 3 8 9. 7 4 2 2. 7 4 5 4. 7 4 8 6. 7 5 1 7. 7 5 4 9 0. 7. 7 5 8 0. 7 6 1 1. 7 6 4 2. 7 6 7 3. 7 7 0 4. 7 7 3 4. 7 7 6 4. 7 7 9 4. 7 8 2 3. 7 8 5 2 0. 8. 7 8 8 1. 7 9 1 0. 7 9 3 9. 7 9 6 7. 7 9 9 5. 8 0 2 3. 8 0 5 1. 8 0 7 8. 8 1 0 6. 8 1 3 3 0. 9. 8 1 5 9. 8 1 8 6. 8 2 1 2. 8 2 3 8. 8 2 6 4. 8 2 8 9. 8 3 1 5. 8 3 4 0. 8 3 6 5. 8 3 8 9 1. 0. 8 4 1 3. 8 4 3 8. 8 4 6 1. 8 4 8 5. 8 5 0 8. 8 5 3 1. 8 5 5 4. 8 5 7 7. 8 5 9 9. 8 6 2 1 1. 1. 8 6 4 3. 8 6 6 5. 8 6 8 6. 8 7 0 8. 8 7 2 9. 8 7 4 9. 8 7 7 0. 8 7 9 0. 8 8 1 0. 8 8 3 0 1. 2. 8 8 4 9. 8 8 6 9. 8 8 8 8. 8 9 0 7. 8 9 2 5. 8 9 4 4. 8 9 6 2. 8 9 8 0. 8 9 9 7. 9 0 1 5 1. 3. 9 0 3 2. 9 0 4 9. 9 0 6 6. 9 0 8 2. 9 0 9 9. 9 1 1 5. 9 1 3 1. 9 1 4 7. 9 1 6 2. 9 1 7 7 1. 4. 9 1 9 2. 9 2 0 7. 9 2 2 2. 9 2 3 6. 9 2 5 1. 9 2 6 5. 9 2 7 9. 9 2 9 2. 9 3 0 6. 9 3 1 9 1. 5. 9 3 3 2. 9 3 4 5. 9 3 5 7. 9 3 7 0. 9 3 8 2. 9 3 9 4. 9 4 0 6. 9 4 1 8. 9 4 2 9. 9 4 4 1 1. 6. 9 4 5 2. 9 4 6 3. 9 4 7 4. 9 4 8 4. 9 4 9 5. 9 5 0 5. 9 5 1 5. 9 5 2 5. 9 5 3 5. 9 5 4 5 1. 7. 9 5 5 4. 9 5 6 4. 9 5 7 3. 9 5 8 2. 9 5 9 1. 9 5 9 9. 9 6 0 8. 9 6 1 6. 9 6 2 5. 9 6 3 3 1. 8. 9 6 4 1. 9 6 4 9. 9 6 5 6. 9 6 6 4. 9 6 7 1. 9 6 7 8. 9 6 8 6. 9 6 9 3. 9 6 9 9. 9 7 0 6 1. 9. 9 7 1 3. 9 7 1 9. 9 7 2 6. 9 7 3 2. 9 7 3 8. 9 7 4 4. 9 7 5 0. 9 7 5 6. 9 7 6 1. 9 7 6 7 2. 0. 9 7 7 2. 9 7 7 8. 9 7 8 3. 9 7 8 8. 9 7 9 3. 9 7 9 8. 9 8 0 3. 9 8 0 8. 9 8 1 2. 9 8 1 7 2. 1. 9 8 2 1. 9 8 2 6. 9 8 3 0. 9 8 3 4. 9 8 3 8. 9 8 4 2. 9 8 4 6. 9 8 5 0. 9 8 5 4. 9 8 5 7 2. 2. 9 8 6 1. 9 8 6 4. 9 8 6 8. 9 8 7 1. 9 8 7 5. 4 8 7 8. 9 8 8 1. 9 8 8 4. 9 8 8 7. 9 8 9 0 2. 3. 9 8 9 3. 9 8 9 6. 9 8 9 8. 9 9 0 1. 9 9 0 4. 9 9 0 6. 9 9 0 9. 9 9 1 1. 9 9 1 3. 9 9 1 6 2. 4. 9 9 1 8. 9 9 2 0. 9 9 2 2. 9 9 2 5. 9 9 2 7. 9 9 2 9. 9 9 3 1. 9 9 3 2. 9 9 3 4. 9 9 3 6 2. 5. 9 9 3 8. 9 9 4 0. 9 9 4 1. 9 9 4 3. 9 9 4 5. 9 9 4 6. 9 9 4 8. 9 9 4 9. 9 9 5 1. 9 9 5 2 2. 6. 9 9 5 3. 9 9 5 5. 9 9 5 6. 9 9 5 7. 9 9 5 9. 9 9 6 0. 9 9 6 1. 9 9 6 2. 9 9 6 3. 9 9 6 4 2. 7. 9 9 6 5. 9 9 6 6. 9 9 6 7. 9 9 6 8. 9 9 6 9. 9 9 7 0. 9 9 7 1. 9 9 7 2. 9 9 7 3. 9 9 7 4 2. 8. 9 9 7 4. 9 9 7 5. 9 9 7 6. 9 9 7 7. 9 9 7 7. 9 9 7 8. 9 9 7 9. 9 9 7 9. 9 9 8 0. 9 9 8 1 2. 9. 9 9 8 1. 9 9 8 2. 9 9 8 2. 9 9 8 3. 9 9 8 4. 9 9 8 4. 9 9 8 5. 9 9 8 5. 9 9 8 6. 9 9 8 6 3. 0. 9 9 8 7. 9 9 8 7. 9 9 8 7. 9 9 8 8. 9 9 8 8. 9 9 8 9. 9 9 8 9. 9 9 8 9. 9 9 9 0. 9 9 9 0 3. 1. 9 9 9 0. 9 9 9 1. 9 9 9 1. 9 9 9 1. 9 9 9 2. 9 9 9 2. 9 9 9 2. 9 9 9 2. 9 9 9 3. 9 9 9 3 3. 2. 9 9 9 3. 9 9 9 3. 9 9 9 4. 9 9 9 4. 9 9 9 4. 9 9 9 4. 9 9 9 4. 9 9 9 5. 9 9 9 5. 9 9 9 5 3. 3. 9 9 9 5. 9 9 9 5. 9 9 9 5. 9 9 9 6. 9 9 9 6. 9 9 9 6. 9 9 9 6. 9 9 9 6. 9 9 9 6. 9 9 9 7 3. 4. 9 9 9 7. 9 9 9 7. 9 9 9 7. 9 9 9 7. 9 9 9 7. 9 9 9 7. 9 9 9 7. 9 9 9 7. 9 9 9 7. 9 9 9 8

z

p

Tabla de la distribuciTabla de la distribuci Tabla de la distribución Normal estandarizada)óón Normal estandarizada)n Normal estandarizada)

Explicación de la tabla de áreas bajo la curva estándar normal: En esta tabla, dado un valor de Z, se puede hallar el área (es decir la probabilidad p) desde menos infinito hasta ese valor de z. Ejemplos:

Para z = 3; p = 0,9987. Para z = 1,42; p = 0, Para z = 0,41; p= 0,

Ejemplo: Vamos a calcular el área bajo la cur5va normal. La variable cuantitativa es la presión arterial cuya distribución es N(132; 19,2). Queremos calcular la probabilidad de una presión entre 140 y 160 mmHg. Primero estandarizamos estas dos cifras, para calcular sus valores z:

(de 140 ) =

x μ

z^1 ,^458 19 , 2

160 132 (de 160 ) =

σ

x μ z

Distribuciones de probabilidad

Necesitamos calcular el área azul oscura (Figura siguiente), comprendida entre z = 1,458 y z = 0,

0,416 1,

Z = 1,458; p ≈ 0,

Z ≈ 0,416; p ≈ 0,

0,9222-0,6628≈ 0,

0,

0

Mirando en las tablas de la curva normal estandarizada: Para z = 1,458, el área a su izquierda sería p ≈ 0,9222. En la tabla no viene un z = 1,458. Podemos encontrar o bien z = 1,45 o bien 1,46. El que más cerca está de 1,458 es 1,46, así que tomamos su valor de p = 0,9222. Para z = 0,416, el área a su izquierda sería p ≈ 0,6628. En la tabla no viene un z = 1,416. Podemos encontrar o bien z = 0,41 o bien 0,42. El que más cerca está de 0,416 es 0,42, así que tomamos su valor de p = 0,6628.

La solución por tanto, sería la diferencia entre estas dos áreas: P (entre z = 1,458 y z = 0,416) = 0,9222 – 0,6628 = 0,2594 ≈ 0,26 o en porcentaje 26%. Interpretación: La probabilidad de encontrar personas con presión arterial entre 140 y 160 en la muestra estudiada es p = 0,26 o en porcentaje 26%.

Como vemos, combinando las áreas se puede resolver cualquier tipo de problema.

Caso en que z sea negativo

Cuando los valores de la variable que hay que estandarizar están por encima de la media, los valores z son positivos. Pero cuando están por debajo de la media, son negativos. En la tabla solo encontramos con valores positivos. ¿Cómo proceder?. Para esto habrá que jugar con una de las propiedades de la curva Normal que es su simetría.

Distribuciones de probabilidad

Veamos otro ejemplo en que tenemos que calcular el área entre dos valores, cuando ambos son menores que la media.

Ejemplo : Con el mismo caso anterior N(130; 15), calcular la probabilidad de valores de colesterol entre 100 y 115 mg/dl. Solución: Lo primero es estandarizar ambos valores:

de 100 =−

σ

x μ

Z

de 115 =−

σ

x μ

Z

En la Figura siguiente vemos la solución al problema:

Z= - 2 (^) Z= - 1

Nos piden esta área A

A B

Trabajaremos con la parte simétrica Es decir, con z de + 1 y + 2

Z=2; p=0,

Z=1; p=0,

Z= + 1 Z= + 2

0,

B = A = 0,

Seguiremos los siguientes pasos: La solución del problema es el área A. a)Daremos “la vuelta a la curva” , obteniendo la situación de la derecha, en la que los dos valores z

Distribuciones de probabilidad

ya son positivos. b)El área B es igual al área A, así que procederemos a calcular B. Para ello procederemos igual que en el ejemplo resuelto anteriormente. Es decir, Calcular el área a la izquierda de z = 2. Mirando en las tablas, para z = 2 p = 0,9772. Calcular el área a la izquierda de z = 1. Mirando en las tablas, para z = 2 p = 0,8413. B es igual a la diferencia entre esas áreas B = 0,9772 – 0,8413 = 0,

La solución por tanto es

A = B = 0,1359. El 13,6 % de los sujetos de la muestra tienen un colesterol entre 100 y 115 mg/dl.

Con estas técnicas podemos resolver cualquier tipo de problema en que a partir de valores de Z debamos calcular el área bajo la curva.

También puede ocurrir que uno de los valores esté por encima y otro por debajo:

Ejemplo: Con el mismo caso anterior N(130; 15), calcular la probabilidad de valores de colesterol entre 100 y 140 mg/dl. Solución: Lo primero es estandarizar ambos valores:

de 100 =−

σ

x μ

Z

de 140 = =

σ

x μ

Z

En el siguiente esquema están explicados los pasos a seguir para resolverlo:

Z = - 2 Z = 0,

0,

?

A

Este es el problema Primero calculamos el área a la izquierda de z = 0, que es p = 0,

Z = 0,

0,

Distribuciones de probabilidad

64%

Z?

Para p = 0,64 , Z = + 0,

Y ¿cuál es el valor de z por debajo del cual están el 24 % de los sujetos?. Aquí tenemos que trabajar también con la simetría de la curva.

24%

Z?

24%

Z?

76%

Para p = 0,76 , Z = 0, La solución es z = – 0,

Solución: 24% es lo mismo que p = 0,24. No podemos buscar en la tabla una probabilidad menor de 0,5. Por eso hay que trabajar de nuevo con la simetría de la curva, y “dar la vuelta”. De esta forma (ver

Distribuciones de probabilidad

gráfico de la derecha), podemos buscar el valor de z correspondiente a p = 1 – 0,24 = 0,76. El valor z es = 0,71. Bastaría ahora con volver a “dar la vuelta a la curva” con lo que el valor de z sería el mismo, pero negativo. La respuesta, por tanto, es z = – 0,71.

¿Cómo podríamos calcular el valor de la variable original que corresponde a un determinado valor de z? Ejemplo: ¿Qué valor de colesterol corresponde a un z = 0,5. Dicho de otra forma, ¿qué valor de colesterol corresponde a 0,5 desviaciones estándar?. Para resolver el problema nos tienen que dar las características de la distribución del colesterol, por ejemplo, N(200; 15). Entonces, partiendo de la fórmula de z

σ

− μ

x z (^) , tenemos que despejar X

X =( z × σ)+ μ=( 0 , 5 × 15 )+ 200 = 7 , 5 + 200 = 207 , 5

¿Y qué valor corresponde a z = – 1?. De otra forma, ¿qué valor de colesterol corresponde a menos una desviación estándar en la N(200; 15)?

X =( z × σ)+ μ=(− 1 × 15 )+ 200 =− 15 + 200 = 185

¿Cómo saber si una distribución cumple las condiciones de “normalidad”?

En los próximos capítulos, cuando abordemos la estadística inferencial y el contraste de hipótesis, veremos que para poder utilizar ciertas pruebas o procedimientos estadísticos es necesario que las variables sigan distribuciones aproximadamente Normales. Por eso es necesario disponer de procedimientos para comprobar la normalidad de las variables cuantitativas. Estos procedimientos los podemos dividir en a) procedimientos descriptivos y b) pruebas estadísticas para contrastar la hipótesis de normalidad.

Procedimientos descriptivos para comprobar la normalidad de una variable

Utilizaremos el histograma y las medidas de tendencia central y de forma de la distribución. En la Figura siguiente se muestran los histogramas y medidas de resumen de dos variables del estudio TALARISK.