Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Apuntes tema 3, Apuntes de Biología

Asignatura: Bioestadística, Profesor: el qsea, Carrera: Biología, Universidad: UAM

Tipo: Apuntes

2012/2013

Subido el 04/11/2013

wonderfulfear
wonderfulfear 🇪🇸

3.8

(132)

27 documentos

1 / 20

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Estadística Tema 3 Curso 2006/07
1
Tema 3. VARIABLES ALEATORIAS.
3.1.- Introducción.
Objetivo: Encontrar modelos matemáticos para el trabajo con probabilidad de sucesos. En
particular, se quiere trabajar con funciones reales de variable real.
Una probabilidad es una función
Ω
:PR, donde Ω es un álgebra de sucesos. Queremos
trabajar con probabilidades a partir de funciones F: RR.
3.2.- Variables aleatorias.
Idea: Asociar cada resultado del experimento con un número y así podremos ya trabajar sólo con
números reales. Una variable aleatoria (v.a.) será una función que asigne a cada suceso un
número.
Ejemplo:
1) X1: Sensación que provocan las asignaturas de matemáticas
Asociamos cada respuesta con un número, según se considere que la sensación es positiva (+1),
negativa (1) o neutra (0). Por ejemplo:
Sensa Mates X1
buena 1
miedo -1
pesadas -1
trabajo -1
mal rollo -1
no me provocan 0
desagradable -1
curiosidad 1
ninguna 0
no me gustan -1
puff -1
2) X: Número de caras al lanzar 3 monedas
Sucesos X4
{x,x,x} 0
{c,x,x} 1
{x,c,x} 1
{x,x,c} 1
{c,c,x} 2
{x,c,c} 2
{c,x,c} 2
{c,c,c} 3
Opcional:
La formalización del concepto de variable aleatoria es la siguiente:
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14

Vista previa parcial del texto

¡Descarga Apuntes tema 3 y más Apuntes en PDF de Biología solo en Docsity!

Tema 3. VARIABLES ALEATORIAS.

3.1.- Introducción.

Objetivo: Encontrar modelos matemáticos para el trabajo con probabilidad de sucesos. En

particular, se quiere trabajar con funciones reales de variable real.

Una probabilidad es una función P :Ω→R, donde Ω es un álgebra de sucesos. Queremos

trabajar con probabilidades a partir de funciones F: R → R.

3.2.- Variables aleatorias.

Idea: Asociar cada resultado del experimento con un número y así podremos ya trabajar sólo con

números reales. Una variable aleatoria (v.a.) será una función que asigne a cada suceso un

número.

Ejemplo:

  1. X1: Sensación que provocan las asignaturas de matemáticas

Asociamos cada respuesta con un número, según se considere que la sensación es positiva (+1),

negativa (−1) o neutra (0). Por ejemplo:

Sensa Mates X buena 1

miedo - pesadas -

trabajo - mal rollo -

no me provocan 0 desagradable -

curiosidad 1 ninguna 0

no me gustan - puff -

  1. X: Número de caras al lanzar 3 monedas

Sucesos X

{x,x,x} 0 {c,x,x} 1

{x,c,x} 1 {x,x,c} 1

{c,c,x} 2 {x,c,c} 2

{c,x,c} 2 {c,c,c} 3

Opcional:

La formalización del concepto de variable aleatoria es la siguiente:

Definición.

Sea E el espacio muestral asociado a un experimento aleatorio y Ω un álgebra de sucesos

asociado a E. Llamaremos variable aleatoria a una función

X : E → R ,

tal que para cualquier intervalo B = (-, b] de la recta real, el suceso (^) ( )

1 X B

− ∈ Ω siendo

( ) { }

1

X B ω E / X ( ω) B

− = ∈ ∈.

Ejemplos.

1) X1: Sensación que provocan las asignaturas de matemáticas

( ) ( )

1 1 X 1 ( , 1] X 1 1

− − −∞ − = − = {miedo, pesadas, mal rollo, puff,…}

(sucesos a los que X1 asigna el valor1)

2) X: Número de caras al lanzar 3 monedas

( ) ({ }) {{ } { } { } { }}

1 1 X ( ,1] X 0,1 x x x , , , c x x , , , x c x , , , x x c , ,

− − −∞ = =

( sucesos a los que X asigna el valor 0 ó 1)

(Fin de lo opcional)

Con el concepto de v.a. podemos definir probabilidades asociadas a números reales o a

intervalos:

1 P X ( a ) P X ( ( )) a

− = = =P(sucesos que X asocia con el valor a ) o bien 1 P X ( B ) P X ( ( B ))

− ∈ = = P(sucesos que X asocia con un valor del intervalo B )

Ejemplo:

X: Número de caras al lanzar 3 monedas

( ( { })) ({ } {^ } {^ })

P X P X P c x x x c x x x c

− = = = =

(^ { } {^ } {^ } {^ })

( 1) ( ( ,1]) ( 0 1) , , , , , , , , , , ,

P X ≤ = P X ∈ −∞ = P X = ó X = = P x x x c x x x c x x x c =

(^ { })

P X > = P X = = P c c c =

Estudiaremos dos tipos de variables aleatorias:

Discretas : el conjunto de posibles valores que toma la variable es discreto (es decir, finito o

numerable).

Continuas: el conjunto de posibles valores es uno o varios intervalos de la recta real.

Ejemplos:

Discretas:

X: Número de “caras” al lanzar 3 monedas

(puede tomar sólo los valores 0,1,2,3)

X1: Sensación que provocan las asignaturas de matemáticas

(puede tomar sólo los valores −1,0,1)

La función de masa de las variables aleatorias discretas pueden representarse gráficamente

mediante un diagrama donde, en el eje OX dibujaríamos los distintos puntos de masa de la

variable y en ordenadas las probabilidades correspondientes.

Ejemplo:

X: Número de caras al tirar 3 monedas

3.4.- Variables aleatorias continuas. Función de densidad.

Recordamos que una v.a. X es continua si el conjunto de posibles valores que puede tomar la

variable es uno o varios intervalos de la recta real.

También recordamos que las variables estadísticas continuas se representaban agrupadas en

intervalos, y que asociamos probabilidad con frecuencias relativas. Si se tiene un número

suficientemente grande de datos, y representamos el histograma de frecuencias relativas

(percentage) con las clases cada vez más finas, se obtendría el perfil de una curva que es

representativa de la distribución de las frecuencias de dicha variable. Esta curva será siempre

positiva (las frecuencias relativas lo son) y “encierra debajo de ella” la suma de todas las

frecuencias relativas (1).

Esta idea nos permite caracterizar la distribución de probabilidad de las v.a. continuas mediante

una función que denominaremos función de densidad.

Histogram

Peso

percentage

49 59 69 79 89 99 109

0

10

20

30

40

Density Trace

PESO GM

density

52 62 72 82 92 102

0

Histogram

Estatura

percentage

160 170 180 190 200

0

10

20

30

40

50

Density Trace

ESTATURA GM

density

160 165 170 175 180 185 190

0

Definición.

Llamamos función de densidad a toda función f : R → R que verifica:

  • f (^) ( x (^) ) ≥ 0,∀ ∈ x .
  • f (^) ( ) t dt 1

+∞

−∞ ∫ =.

Toda función de densidad determina la distribución de probabilidad de una v.a. continua de la

siguiente forma:

  1. ( < < ) = (^) ∫ ( ) , ∀ , ∈\

b

a

P a X b f t dt a b.

  1. ( ) ( ) 0,

x

x

P X = x = (^) ∫ f t dt = ∀ ∈ x .

  1. Entonces P a ( < X < b ) = P a ( ≤ X < b ) = P a ( ≤ Xb ) = P a ( < Xb )

Observación: Los valores exactos de las v.a. continuas tienen probabilidad 0. Sólo hay

probabilidad no nula en intervalos.

Ejemplos.

Y1: Estatura de una población

Histogram

Estatura

percentage

160 170 180 190 200

0

10

20

30

40

50

Density Trace

ESTATURA GM

density

160 165 170 175 180 185 190

0

Función de densidad y probabilidades:

Y2: error al redondear a un decimal.

La variable puede tomar valores –0.05<x<0.05.

Como la probabilidad es homogénea en todo el intervalo y fuera de él no hay probabilidad, la

densidad será una función constante f(x)=k si –0.05<x<0.05, y será nula en el resto.

Para hallar el valor de k , utilizamos la propiedad

de que f (^) ( ) t dt 1

+∞

−∞ ∫ = :

+∞

−∞

f t dt^ ∫ k dt^ k

k

Por tanto:

si x f x resto

⎧^ −^ <^ <

P(Y3>60)

P(30<Y3<60)

P(Y3<45)

Para calcular probabilidades:

0 0

05

P Y ( 2 0) f t dt ( ) 0 dt 10 dt 10 0.05 0. −∞ −∞

< = (^) ∫ = (^) ∫ + (^) ∫ = ⋅ =

( )

P Y ( 2 0.01) P ( 0.01 Y 2 0.01) 10 dt 10 0.01 ( 0.01) 0.

< = − < < = (^) ∫ = ⋅ − − =

3.5.- Función de distribución de una variable aleatoria.

Para tener una función representativa válida para todo tipo de v.a ., se define la función de

distribución.

Definición. Dada una variable aleatoria X , definimos la función de distribución asociada a X a

una función F : R → R. definida como

F (^) ( x (^) ) = P (^) ( Xx )

Observación: La función de distribución de una v.a. viene a ser como la distribución de

frecuencias relativas acumuladas de una variable estadística.

Ejemplos:

Número de llamadas diarias que se hacen por teléfono móvil

Si consideramos la v.a. X2: Número de llamadas diarias que hacen por teléfono móvil los

estudiantes del GM23 (curso 200/05), podríamos tomar como

  • Cálculo de probabilidades a partir de la función de distribución de una v.a. discreta:

Idea: hay probabilidad en aquellos puntos en los que hay “salto”, y la probabilidad es precisamente la magnitud del “salto”.

Formalmente, si denotamos (^) ( ) ( ) ( ) 0

o lim o x x

F x F x P X x

− →

= = < , entonces se cumplen las

siguientes igualdades:

  1. (^) ( ) ( ) ( )

P X = a = F aF a.

  1. P a ( < Xb ) = F b ( ) − F ( a ), ∀ a b , ∈ .
  2. P a ( X b ) F b ( ) F (^) ( a (^) ), a b ,

− ≤ ≤ = − ∀ ∈ .

  1. P a ( X b ) F b ( (^) ) F ( a ), a b ,

− < < = − ∀ ∈ .

  1. P a ( X b ) F b ( (^) ) F (^) ( a (^) ), a b ,

− − ≤ < = − ∀ ∈ .

Ejemplo:

Si X es una v.a. con función de distribución

⎧^ <

si x

si x

si x

F x si x

si x

si x

, hallar su distribución

de probabilidad y las siguientes probabilidades P(X<2), P(1X<4).

Hay probabilidad en los puntos donde hay “salto” : 0, 1, 2.5, 3 y 4. Sus probabilidades son

la magnitud del “salto”:

P(X=0)=0.3−0=0.

P(X=1)=0.7−0.3=0.

P(X=2.5)=0.8−0.7=0.

P(X=3)=0.95−0.8=0.

P(X=4)=1−0.95=0.

Para hallar P(X<2), P(1≤X<4), lo más sencillo es ver qué puntos “con probabilidad” cumplen la

condición dada:

P(X<2)=P(X=0)+P(X=1)=0.3+0.4=0.

P(1≤X<4)=P(X=1)+P(X=2.5)+P(X=3)=0.4+0.1+0.15=0.

Función de distribución de una v.a. continua.

Ejemplo: Sea Y2: error al redondear a un decimal.

La función de densidad es

si x f x resto

⎧^ −^ <^ <

.

Por definición, su función de distribución es F (^) ( x (^) ) = P (^) ( Xx (^) ). Al ser una v.a. continua, las

probabilidades se calculan a partir de la función de densidad:

( ) ( ) ( ) −∞

= ≤ = (^) ∫

x F x P X x f tdt.

Como f(x) está definida a trozos, las probabilidades serán diferentes según el intervalo en donde

se encuentre x :

( )

0.05 0.

05

x

x x

x

si x dt

F f t dt si x dt dt

si x dt d

x

t dt

−∞

−∞ −∞

−∞ −

∫ ∫ ∫

∫ ∫ ∫

⎧^ ≤ −

si x

F x x si x

si x

Observamos que F(x) es una función continua, y que es una primitiva de la función de densidad,

F ′ (^ x ) = f ( x ) (recuérdese el Teorema Fundamental del Cálculo).

Estas propiedades son generalizables para cualquier v.a. continua.

Si X es una v.a. continua con función de densidad f (x), y F(x) es la función de distribución de X ,

se verifica:

  • (^) ( ) ( ) ,

x F x f t dt x −∞

= (^) ∫ ∀ ∈\

  • F es una función continua.
  • F ′(^ x ) = f ( x ) , en aquellos puntos en donde f(x) es continua.
  • (^) ( < < (^) ) = (^) ∫ ( ) = (^) ( ) − (^) ( ), ∀ , ∈\

b

a

P a X b f x dx F b F a a b

Ejemplos:

Y3: tiempo máximo que he estado hablando por teléfono

La función de densidad es

2 0. ( ) (0.04) 0

− = ≥

x f x xe si x ; por tanto:

( ) (^) 0. (^02) 0.

0

−∞ −∞ − − −∞

⎪ ⎩−^ +^ ≥

∫ ∫

∫ ∫

t

x x

x

x

si x dt (^) si x F f t dt e x si x si x dt t

x

e dt

Es una función continua, pues es continua en ambos tramos y éstos coinciden en x=0.

Además, es fácil comprobar que F´(x)=f(x).

Ejemplo:

De las funciones representadas gráficamente a continuación, la de la derecha no es función de

distribución pues no es monótona (entre 2 y 3 es mayor que 1, y luego decrece para valer 1 del 3

en adelante).

Las otras dos sí son funciones de distribución, la de la izquierda de una v.a. continua (pues

continua) y la del centro de una v.a. discreta (escalonada).

3.6.- Transformaciones de variables aleatorias.

Dada X una v.a., nos interesa estudiar Y = g ( X ) y obtener su distribución de probabilidad en el

caso de que Y sea una v.a.

  • si X es discreta, Y es discreta.
  • si X es continua, Y puede ser discreta o continua, dependiendo de quién sea g.

El método general se basa en

( ) (^) ( )

1 ( )

P Y = y = P X = g y o bien (^) ( ) (^) ( )

1 ( )

P YB = P Xg B.

  • si Y es discreta hallaremos su distribución de probabilidad y
  • si Y es continua conviene trabajar con la función de distribución.

Ejemplos: Problemas 6 d) y 7.

3.7.- Independencia de variables aleatorias.

Dos v.a. X e Y son independientes si el conocimiento de una de ellas no aporta información

respecto de los valores de la otra.

La formalización de esta idea para v.a. se escapa de las posibilidades de este curso. Sí se utilizará

la propiedad de que, cuando hay independencia, la probabilidad de la intersección es el

producto de las probabilidades.

3.8.- Esperanza y varianza de funciones de variables aleatorias.

Las medidas de posición , dispersión y asimetría que se estudiaron para variables estadísticas

se pueden definir también de forma análoga para v.a.

Medidas de posición

Medida de posición

Variable estadística V.a. discreta V.a. continua

Media o esperanza 1

X

k j i j i I j

n x x n (^) ∈ = n

= (^) ∑ =∑ ( ) (^) i i i I

μ E X x p

= = (^) ∑ μ E (^) [ X (^) ] x f ( ) x dx

−∞

Propiedades

de la media

/ esperanza

aX + b = a X + b

a X 1 (^) 1 + … + a Xn n = a X 1 (^) 1 + …+ a Xn n

E aX [ + b ] (^) = aE X [ ]+ b

E a X [ 1 (^) 1 + … + a Xn n ]= a E X 1 [ (^) 1 ] + …+ a E Xn [ (^) n ].

( ) ( )

P X < Mey P X > Me

Conocida la función de distribución F , buscamos Me tal que: Mediana

Es un valor tal que, ordenados en magnitud los datos, el 50% es menor que él y el 50% mayor. v.a. discretas 1 1 ( ) ( ) 2 2

F Me y F Me

− ≤ ≥

v.a. continuas 1 ( ) 2

F Me = ,

P (^) ( X < x α (^) ) ≤ α y P (^) ( X > x α) ≤ 1 −α

Conocida la función de distribución F , buscamos Cuantiles^ x α tal que: de orden α

Es un valor tal que, ordenados en magnitud los datos, el 100α% es menor que él y el resto mayor. v.a. discretas

F x ( α ) α y F x ( α) α

− ≤ ≥

v.a. continuas

F x ( α)=α

Ejemplos:

Hallar media, mediana y los cuartiles de:

Y2: error al redondear a un decimal.

Recordamos que la función de densidad es f(x)=10 si –0.05<x<0.05, y su función de distribución

0 0.05,

( ) 10 ( 0.05) 0.05 0.

1 0.

⎧^ ≤ −

si x

F x x si x

si x

.

frecuencia relativa

probabilidad densidad

Interpretación de las medidas de posición de una v.a.:

Y3: Tiempo máximo que he estado hablando por teléfono

Hacemos los siguientes cálculos con DERIVE:

Si la media es 50, quiere decir que tiempo medio que, como máximo, ha estado un estudiante

hablando por teléfono es de 50 minutos.

Para los cuantiles, la interpretación se hace en términos de probabilidad :

  • si la mediana es 41.96, se puede decir que:

o la probabilidad de que el tiempo máximo de una llamada sea menor que 41.96 minutos es del 50%; o la probabilidad de que el tiempo máximo de una llamada sea mayor que 41.96 minutos es del 50%; o (redondeando) la probabilidad de que la máxima duración de una llamada sea mayor de 40 minutos es de más del 50%.

  • si el primer cuartil es 24.03, se puede decir que:

o la probabilidad de que el tiempo máximo de una llamada sea menor que 24.03 minutos es del 25%; o la probabilidad de que el tiempo máximo de una llamada sea mayor que 24.03 minutos es del 75%; o (redondeando) que la probabilidad de que el tiempo máximo de una llamada sea menor de 25 minutos es mayor del 25%.

  • si el tercer cuartil es 67.31, se puede decir que:

o la probabilidad de que el tiempo máximo de una llamada sea menor que 67.31 minutos es del 75%; o la probabilidad de que el tiempo máximo de una llamada sea mayor que 67.31 minutos es del 25%; o (redondeando) que la probabilidad de que el tiempo máximo de una llamada sea mayor que 1 hora, es de más del 25%.

Teorema Sea X una variable aleatoria cualquiera y sea Y = g( X ) una transformación de X tal que

Y es una variable aleatoria. Entonces,

[ ] 1

( ) si es discreta

( )

( ) ( ) si es continua

i i i

g x p X

E g X

g x f x dx X

= ∞

−∞

Ejemplos: Problemas 6 d) y 7.

Definiciones.

Dada una v.a. X llamamos momento respecto al origen de orden k a

k

α k = E ⎡⎣ X ⎤⎦ ∀ k =.

Dada una v.a. X con esperanza μ , llamamos momento respecto a la media de orden k a

( ) ,^ 1, 2,...

k

μ k E X μ k

= ⎡^ − ⎤∀ =

La utilidad de los momentos de una variable aleatoria se verá más adelante en el tema de

estimación puntual.

Medidas de dispersión

Medida de dispersión

Variable estadística V.a. discreta V.a. continua

( ) ( )

2 2

= σ = ⎡^ −μ ⎤

V X E X

Varianza

2 V(X) = (^) ∑( − )

i i

n x X n 2

1

=

= (^) ∑ −

k

j j j

x p ( x μ)^2 f ( ) xdx

−∞

Propiedades de la varianza

  • V (^) ( X (^) ) ≥ 0.

( ) (^) i i I

V X x X n (^) ∈

= (^) ∑ −

  • (^) ( ) ( )

2 V aX + b = a V X

  • V (^) ( X + Y (^) ) = V (^) ( X (^) ) + V Y ( ) + 2 Cov X Y ( , )
    • V ( X ) ≥ 0.
    • ( ) (^) ( [ ])

2 2 V X = E ⎡⎣^ X ⎤⎦− E X

  • ( ) ( )

2 V aX + b = a V X

  • Si X e Y son independientes :

V (^) ( X + Y (^) ) = V (^) ( X (^) ) + V Y ( )

Desviación típica

dt = V (^) ( X (^) ) σ = V (^) ( X )

Coeficiente de variación de Pearson

dt CV X [ ]

V X ( )

CV

E X

Ejemplos:

Hallar varianza, desviación típica y coeficiente de variación de:

1) X: número de caras al lanzar 3 monedas

Recordamos su distribución de probabilidad: P(X=0)=P(X=3)=1/8; P(X=1)=P(X=2)=3/8; y que

la esperanza es E(X)=1.5.

( ) ( )

2 2 2 2 2 2 2 V X ( ) = E X ( ) − E X ( ) = 0 ⋅ P X ( = 0) + 1 ⋅ P X ( = 1) + 2 ⋅ P X ( = 2) + 3 ⋅ P X ( = 3) − 1.5 =

( )

Medias iguales y distinta desviación típica

Medias distintas e igual desviación típica

Medidas de asimetría

Medida de asimetría

Variable estadística Variable aleatoria

Coeficiente de asimetría de Pearson

3( X Me ) CAP dt

(^3) ( Me ) P

Coeficiente de asimetría de Fisher

3

1 3

n

i i

x X n CAF dt

=

∑ (^ )

3

3 3 3

E X

F

Interpretación

  • CAP > 0 ó CA F > 0: asimétrica a la derecha
  • CAP < 0 ó CAF < 0: asimétrica a la izquierda
  • CAP = 0 ó CAF = 0: simétrica
    • P > 0 ó F > 0: asimétrica a la derecha
    • P < 0 ó F < 0: asimétrica a la izquierda
    • P = 0 ó F = 0: simétrica

(^1 )

-10 -6 -2 2 6 10

0

0,

0,

0,

0,

2

Ejemplos:

1) X: número de caras al lanzar 3 monedas

Gráficamente se ve que la distribución es simétrica.

También se comprueba con los coeficientes:

CAP=0 pues E(X)=Me=1.5.

Además, también CAF=0, pues:

( ) ( )

3 3 3 3 3 E ( X − 1.5) = (0 −1.5) ⋅ P X ( = 0) + (1 − 1.5) ⋅ P X ( = 1) + (2 − 1.5) ⋅ P X ( = 2) + (3 − 1.5) ⋅ P X ( = 3) =

2) Y2: error al redondear a un decimal.

Gráficamente se ve que la distribución es simétrica.

También se comprueba con los coeficientes:

CAP=0 pues E(X)=Me=0.

Además, también CAF=0, pues:

( ) ( )

4 0. 3 3 3 0.05 3

x E X E X x f x dx x dx

−∞ − −

∫ ∫

3) Y3: tiempo máximo que he estado hablando por teléfono

Observando la gráfica de la función de densidad

se observa una clara asimetría a la derecha.

Esto se corrobora calculando los coeficientes ,

que en ambos casos tienen valores positivos.

CAP= 3(50-41.95)/(35.35)= 0.68 > 0

Teniendo que la densidad es 2 0. ( ) (0.04) 0

− = >

x f x xe si x , el coeficiente de asimetría de Fisher, CAF, viene dado por: