Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


T5 Variables aleatorias continuas, Apuntes de Bioestadística

Asignatura: Bioestadística i Anàlisi de Dades, Profesor: José Ríos, Carrera: Ciències Biomèdiques, Universidad: UAB

Tipo: Apuntes

2012/2013

Subido el 25/07/2013

judithng2
judithng2 🇪🇸

4.5

(42)

13 documentos

1 / 7

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
TEMA 5. VARIABLES ALEATORIAS CONTINUAS
5.1. Características de las v.a. continuas
Es una variable que puede tomar innitos valores dentro de un intervalo, todo
depende de la precisión de las medidas. El rango que tengo está jado pero los posibles
valores son innitos.
Ej: peso en gramos de ambos riñones, dosis de un fármaco, temperatura, presión,
altura…
La probabilidad de que una variable continua tenga un valor exacto es siempre 0
porque hay innitas posibilidades de obtener ese resultado.
Para discretizar la variable y poder trabajar con ella haremos una agrupación por
clases.
Se representa con histogramas. El área de cada columna es la frecuencia relativa de
ese intervalo. Ej: para calcular la probabilidad de que los riñones puedan pesar entre
300- 400 gramos sumaremos las áreas (sus frecuencias relativas).
Polígono de frecuencias: une la zona central de cada una de las barras. El área
también será igual a 1. Cuando la muestra es muy grande, este trazo acaba siendo
una curva. La altura de las barras es la probabilidad.
A partir de la función densidad de probabilidad podremos calcular las
probabilidades entre intervalos mediante el área bajo la curva.
Tendremos un patrón aleatorio en forma de campana. La función de distribución va a
explicar el azar. Si mis datos no dieren de los del patrón, tengo un estudio, puede
explicarse por el azar. Ej: unos cuantos en la clase tienen talla M aunque no tengan
exactamente las mismas medidas de torso, esto se debe al azar.
5.2. Distribución normal
5.2.1. Breve introducción
Primero fue Galileo quién vio en las medidas de error astronómicas una representación
de campana (s. XVII). Después, se le atribuye a Moivre el hecho de observar formas
acampanadas en temas de probabilidad (s. XVIII). Finalmente, Adrian y Gauss hallaron
la ecuación de este gráco.
Ej: Cientícos vieron que no merecería la pena estudiar la tensión arterial en jóvenes
porque todos los resultados se podían explicar por el azar (campana de Gauss,
modelo). En cambio, sí en adultos porque algunos valores no se podrán explicar al azar,
había variabilidad atribuible, en este caso, a los individuos con hipertensión arterial.
5.2.2. Características de la distribución normal
La distribución normal se caracteriza, como la binomial, por dos parámetros: media
y desviación típica. Conociendo éstos ya se pudo saber cómo sería la campana de
Gauss que explicaría el azar.
Numerosos fenómenos biológicos siguen una curva en forma de campana (la propia
de la normal).
pf3
pf4
pf5

Vista previa parcial del texto

¡Descarga T5 Variables aleatorias continuas y más Apuntes en PDF de Bioestadística solo en Docsity!

TEMA 5. VARIABLES ALEATORIAS CONTINUAS

5.1. Características de las v.a. continuas

Es una variable que puede tomar infinitos valores dentro de un intervalo , todo depende de la precisión de las medidas. El rango que tengo está fijado pero los posibles valores son infinitos.

Ej: peso en gramos de ambos riñones , dosis de un fármaco, temperatura, presión, altura…

La probabilidad de que una variable continua tenga un valor exacto es siempre 0 porque hay infinitas posibilidades de obtener ese resultado.

Para discretizar la variable y poder trabajar con ella haremos una agrupación por clases.

Se representa con histogramas. El área de cada columna es la frecuencia relativa de ese intervalo. Ej: para calcular la probabilidad de que los riñones puedan pesar entre 300- 400 gramos sumaremos las áreas (sus frecuencias relativas).

Polígono de frecuencias : une la zona central de cada una de las barras. El área también será igual a 1. Cuando la muestra es muy grande, este trazo acaba siendo una curva. La altura de las barras es la probabilidad.

A partir de la función densidad de probabilidad podremos calcular las probabilidades entre intervalos mediante el área bajo la curva.

Tendremos un patrón aleatorio en forma de campana. La función de distribución va a explicar el azar. Si mis datos no difieren de los del patrón, tengo un estudio, puede explicarse por el azar. Ej: unos cuantos en la clase tienen talla M aunque no tengan exactamente las mismas medidas de torso, esto se debe al azar.

5.2. Distribución normal

5.2.1. Breve introducción

Primero fue Galileo quién vio en las medidas de error astronómicas una representación de campana (s. XVII). Después, se le atribuye a Moivre el hecho de observar formas acampanadas en temas de probabilidad (s. XVIII). Finalmente, Adrian y Gauss hallaron la ecuación de este gráfico.

Ej: Científicos vieron que no merecería la pena estudiar la tensión arterial en jóvenes porque todos los resultados se podían explicar por el azar (campana de Gauss, modelo). En cambio, sí en adultos porque algunos valores no se podrán explicar al azar, había variabilidad atribuible, en este caso, a los individuos con hipertensión arterial.

5.2.2. Características de la distribución normal

La distribución normal se caracteriza, como la binomial, por dos parámetros: media y desviación típica. Conociendo éstos ya se pudo saber cómo sería la campana de Gauss que explicaría el azar.

Numerosos fenómenos biológicos siguen una curva en forma de campana (la propia de la normal).

5.2.5. Distribución normal como límite de la distribución binomial.

Teorema de Moivre.

Sea X una binomial de parámetros n y p: X = B (n, p) E(X)= np y Var (X) = npq Cuando n tiende a infinito: X~ N ( np, √ npq ) Fijémonos que lo que dice el teorema es que a medida que n aumenta, la binomial se parece cada vez más a una normal con μ=np y σ 2 =npq. Si tipificamos X por el teorema del límite central obtenemos una variable Z (0,1). Ej: dos distribuciones binomiales, con el mismo valor de probabilidad de p (0.3) pero diferente n (6 y 20 respectivamente)

  • Al aumentar la n de 6 a 20 podemos ver que la forma de la distribución se asemeja a la distribución normal (simetría entorno a la esperanza).
  • (^) Al aumentar la n de 6 a 20 podemos ver que la forma de la distribución se asemeja a la distribución normal tipificada Z=N(0,1). Los valores de probabilidad se distribuyen en torno a Z=0, que tiene el valor más alto de la función densidad de probabilidad.

Parecidos razonables de una binomial: comparación entre valores de p no muy extremos y una normal de misma media y desviación típica, para tamaños de n grandes (n>30).

A partir de la distribución normal se pueden obtener otros tipos de distribuciones, que estudiaremos a continuación.

5.3. Distribución χ 2 de Pearson Permite hacer cálculos de intervalos para la varianza (marcador de la heterogeneidad ¿ha aumentado o disminuido?). Imaginamos que tenemos varias variables Z , todas ellas son normale s con media 0 y varianza 1. Consideramos que son indepen dientes entre sí.

Definimos una variable Ji cuadrado como la suma de ν variables Z^2. Tiene una forma que va de rango n a infinito, es decir, solo tiene valor positivo. No es simétrica porque está elevada al cuadrado, es una distribución asintótica. Su forma depende de los grados de libertad : a medida que aumenta mos "n" se parece más a una campana de Gauss.

Es muy usada en cálculos de la distancia.

5.3.1. Propiedades estadísticas de χ 2

  • La esperanza son sus grados de libertad.
  • La varianza son dos veces sus grados de libertad.

Si sumo dos ji cuadrados obtengo una ji cuadrado con grados de libertad igual a la suma de sus grados de libertad de cada una. En las tablas obtendremos los áreas superiores en las diferente s columnas= α es el área que quiero ver. El cálculo para el área inferior es 1-α= área inferior. Ej : área inferior de 0,005 se busca en la columna de área superior 0,995.

5.3.2. Variables aleatorias que siguen una ji de Pearson

a) Suma de los cuadrados de los promedios respecto el valor partido por los grados

de libertad.

b) Pasamos los grados de libertad a la izquierda.

c) Divido por la varianza poblacional. Metemos en un paréntesis al cuadrado.

d) Serie de operaciones aritméticas que acaban dando: forma que relaciona la

varianza muestral, la varianza poblacional, los grados de libertad con ji cuadrado.

Ej : sea X una variable aleatoria N (100, 5). Si escogemos una muestra de 9 personas. Si la media que he obtenido es diferente a la media que en teoría tenía que ser, ¿se debe al azar? Calculamos la probabilidad de una media superior a esa mediante la tabla de la normal. La probabilidad es 0,0013, por ello no es probable que se deba al azar, ya que la posibilidad de obtener esta media debido al azar es muy baja.

A partir de la expresión (n-1)s 2 /σ 2 , despejando s 2 , se puede obtener el intervalo de probabilidad para la varianza muestral, que es otra de las utilidades de la distribución Ji-cuadrado: donde (1- α ) indica el valor para el que queremos calcular el intervalo de probabilidad ( ej : IP que incluya el 95% de los valores → 1- α =0,95α = 0,05)

5.4. Distribución de la T de Student A la curva gaussiana hay que incorporar la incertidumbre de trabajar con muestras pequeñas.

Se tiene en cuenta la información que me va a proporcionar la muestra. Cuanto más mayor sea la muestra, más se va a parecer a una campana de Gauss. Si conozco la varianza de la población aplicaré una Z pero si no conozco el valor de la variabilidad y tengo que hacer un cálculo aplicaré la distribución de la T de Student. Es decir, cuando tenga que calcular la varianza para ponerla en la ecuación. Cuando se

muestrales.

La condición de igualdad de varianzas poblacionales es necesaria para plantear una hipótesis.

5.5.2. Tabla

  • Filas: grados de libertad del denominador.
  • Columnas: grados de libertad del numerador.
  • Columna p: área del gráfico (para unos pocos valores exclusivamente).

Para obtener los cálculos con áreas inferiores tendremos que hacer el cálculo como si fuera una F de Fisher a la inversa.