Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


teoría variable continua, Apuntes de Estadística

Asignatura: Estadística II, Profesor: Manuel Salvador, Carrera: Derecho + ADE, Universidad: UniZar

Tipo: Apuntes

2012/2013

Subido el 19/10/2013

belengrp
belengrp 🇪🇸

2 documentos

1 / 14

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
1
TEMA 2
VARIABLE ALEATORIA CONTINUA
2.1. INTRODUCCIÓN
Como ya se comentó en el tema anterior, una variable aleatoria es Continua
cuando puede asumir una infinidad (un numero infinito no numerable) de valores, es
decir, puede tomar cualquier valor en uno o más intervalos de la recta real.
Ejemplos de variables aleatorias continuas son la Renta Nacional de cierto país,
el nivel de inflación acumulada en un mes, la cantidad de petróleo importado por
Estados Unidos en un año, la variación en el precio de las acciones de IBM en un mes,
el tiempo transcurrido desde la instalación de un nuevo componente hasta que falla o el
tiempo que dedica un alumno a hacer un examen cuya duración máxima es de dos
horas.
El estudio de la distribución de las variables continuas es más sutil que el de las
discretas. Una de las causas es que para una variable continua la probabilidad de que la
variable tome un determinado valor es cero, porque sería imposible en una suma infinita
tomar el valor 1 que es la probabilidad total del espacio. Por tanto, aquí la noción de
función de probabilidad no da resultados útiles. En su lugar utilizaremos la Función de
Densidad de probabilidad que proporciona un medio para determinar la probabilidad de
cualquier intervalo. A continuación, extenderemos el concepto de esperanza matemática
al caso continuo, cuya definición e interpretación coincide con lo visto en el caso
discreto y solo modifica su forma de calcularlo. Así tendremos las principales
características de una variable aleatoria continua.
Por último, analizaremos los modelos probabilísticos continuos notables, cuyo
interés reside en la capacidad de describir comportamientos genéricos de distintas
magnitudes aleatorias que resultan semejantes según ciertas pautas. Nos encontramos
así con grandes «familias probabilísticas» designadas con nombres propios que incluyen
como casos particulares numerosos fenómenos, incorporando sus rasgos diferenciales
mediante parámetros.
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe

Vista previa parcial del texto

¡Descarga teoría variable continua y más Apuntes en PDF de Estadística solo en Docsity!

TEMA 2

VARIABLE ALEATORIA CONTINUA

2.1. INTRODUCCIÓN

Como ya se comentó en el tema anterior, una variable aleatoria es Continua cuando puede asumir una infinidad (un numero infinito no numerable) de valores, es decir, puede tomar cualquier valor en uno o más intervalos de la recta real. Ejemplos de variables aleatorias continuas son la Renta Nacional de cierto país, el nivel de inflación acumulada en un mes, la cantidad de petróleo importado por Estados Unidos en un año, la variación en el precio de las acciones de IBM en un mes, el tiempo transcurrido desde la instalación de un nuevo componente hasta que falla o el tiempo que dedica un alumno a hacer un examen cuya duración máxima es de dos horas. El estudio de la distribución de las variables continuas es más sutil que el de las discretas. Una de las causas es que para una variable continua la probabilidad de que la variable tome un determinado valor es cero, porque sería imposible en una suma infinita tomar el valor 1 que es la probabilidad total del espacio. Por tanto, aquí la noción de función de probabilidad no da resultados útiles. En su lugar utilizaremos la Función de Densidad de probabilidad que proporciona un medio para determinar la probabilidad de cualquier intervalo. A continuación, extenderemos el concepto de esperanza matemática al caso continuo, cuya definición e interpretación coincide con lo visto en el caso discreto y solo modifica su forma de calcularlo. Así tendremos las principales características de una variable aleatoria continua. Por último, analizaremos los modelos probabilísticos continuos notables, cuyo interés reside en la capacidad de describir comportamientos genéricos de distintas magnitudes aleatorias que resultan semejantes según ciertas pautas. Nos encontramos así con grandes «familias probabilísticas» designadas con nombres propios que incluyen como casos particulares numerosos fenómenos, incorporando sus rasgos diferenciales mediante parámetros.

2.2. FUNCIÓN DE DENSIDAD

Para definir el concepto de función de densidad es conveniente visualizar la representación de una función de densidad como el límite del polígono de frecuencias relativas cuando el número de repeticiones del experimento aumenta. De esta forma utilizando el concepto frecuentista de la probabilidad, las frecuencias se estabilizan en torno a un valor que llamamos probabilidad y que mide la incertidumbre. Por otro lado, reduciremos la amplitud de las clases para conseguir una medida puntual en cada valor donde está definida la variable aleatoria. Consideramos los tiempos de espera hasta que llegar un autobús que pasa cada diez minutos. El rango de valores está comprendido entre 0 y 10 minutos y comenzaremos observando 100 tiempos y aumentaremos hasta 50.000. Por otro lado, iremos disminuyendo la amplitud de las clases desde 1 minuto hasta 0,125 minutos.

Figura 1.1: Aproximación de una función de densidad mediante histogramas

2.3. FUNCIÓN DE DISTRIBUCIÓN

Asociada a cada distribución de probabilidad, ya sea de tipo discreto o continuo, tenemos una Función de Distribución , en ocasiones también denominada, función de distribución acumulada. La función de distribución en un punto es la probabilidad de que la variable aleatoria en estudio tome un valor numérico igual o inferior a dicho punto. En distribuciones continuas la función de distribución en un punto viene medida por el área bajo la función de densidad a la izquierda del punto, y se obtiene integrando la función de densidad entre el extremo inferior del soporte de la distribución de probabilidad, y el punto.

F(x) P X x  x  f(t)dt

o equivalentemente, se tiene que:       h

Px X x h h

Fx h F x h h

      ^ 

dx lim^0 lim^0 f(x) dF(x) Se puede demostrar que la función de distribución verifica las mismas propiedades que en el caso discreto:

  1. 0  F(x)  1,  x  R
  2. (^) xlimF(x)  0 y limxF(x)  1
  3. F(x) es monótona no decreciente
  4. F(x) es continua por la derecha
  5. P(a < X  b) = F(b) – F(a) (probabilidad de un intervalo) , aunque teniendo en cuenta que en el caso continuo la probabilidad de un punto concreto es cero entonces se escribe como: P(a<Xb) = P(aX<b) = P(aXb) = P(a<X<b) = F(b) – F(a) = (^)  bf(t)dt-^ af(t)dt

Ejemplo 2.1 (continuación) En este caso la función de distribución de X viene dada por:

F(x) = 

 1 30

0 x

du x x x x

Es, por lo tanto, una función continua no decreciente y que su derivada verifica que

F   ^ x  301  f   x 0 x 30

2.4. CARACTERÍSTICAS DE UNA DISTRIBUCIÓN: ESPERANZA MATEMÁTICA Cada distribución continua de probabilidad tiene asociadas medidas similares a las medidas descriptivas de las distribuciones de frecuencias que resume su comportamiento y nos permite reconocer sus características. Estas medidas se basan en el concepto de Esperanza Matemática , cuya definición e interpretación coincide con la dada para las variables aleatorias discretas. A la esperanza matemática de una variable aleatoria se le llama también media o valor esperado de la distribución de probabilidad de la variable. Si X es una variable aleatoria continua con función de densidad f(x), viene dada por:

 E(X) (^) xf(x)dx

Ejemplo 2.1 (continuación)

En este caso se tiene que E(X) = x 301 dx 60 x^9006015

30 0

30 2 0   

Podemos generalizar la definición de la esperanza de X a variables aleatorias que se obtienen de ella, es decir, a transformaciones g(X). En el caso de que X sea una variable aleatoria continua con función de densidad f(x), entonces:

 E(g(X)) (^) g(x)f(x)dx

Ejemplo 2.1 (continuación)

En este caso se tiene que E(X^2 ) = x 301 dx 90 x^2700090300

30 0

30 3 0

Algunas propiedades interesantes de la esperanza matemática, que provienen de su definición como suma o integral, son las siguientes:

  1. La esperanza de una variable aleatoria constante es la propia constante E(a)=a.
  2. E(aX) = aE(X)
  3. E(aX + b) = aE(X) + b
  4. E(X + Y) = E(X) + E(Y)

2.5. DISTRIBUCIONES CONTINUAS NOTABLES

Cuando estudiamos variables aleatorias continuas existirán distribuciones, igual que ocurría en el caso discreto, que se repiten o son más habituales que otras y cuya diferencia reside en unos parámetros que modifican la escala o la forma de la función de densidad. Por lo tanto, en este apartado presentaremos las distribuciones notables que describen comportamientos genéricos de distintas magnitudes aleatorias que resultan semejantes según ciertas pautas. Nos encontramos así con grandes «familias probabilísticas» designadas con nombres propios que incluyen como casos particulares numerosos fenómenos, incorporando sus rasgos diferenciales mediante parámetros.

2.5.1. Distribución Uniforme Iniciamos estos modelos de distribuciones de probabilidad con la distribución Uniforme Continua , la cual es quizás la más sencilla entre las distribuciones continuas. Una variable aleatoria sigue una distribución uniforme si su masa de probabilidad está repartida uniformemente a lo largo de su soporte. En el caso de una distribución de tipo continuo, esto significa que su función de densidad es constante. Esta distribución será útil para modelar situaciones en las que no existe ninguna evidencia a favor de determinados resultados, por lo cual resulta aplicable el principio de indiferencia (el tiempo en minutos que debe esperar al autobús una persona cuando va a trabajar en un día de tráfico normal sigue una distribución uniforme en un intervalo de 0 a 15 minutos, por ejemplo). Muchas disposiciones de datos numéricos en el mundo de los negocios concuerdan con una distribución uniforme, pues proporciona una representación adecuada para redondear las diferencias que surgen al medir cantidades físicas entre los valores observados y los reales. Por ejemplo, si el peso de un determinado elemento se redondea al kilogramo más cercano, es común que el error de redondeo se encuentre distribuido uniformemente en el intervalo (-0,5; 0,5). En general, si a<b R diremos que una variable aleatoria X continua se distribuye uniformemente en (a,b) y lo pondremos como X~U(a,b) si su soporte es (a,b) y su función de densidad viene dada por:

f(x) = (^) b^1  a si x(a,b) y 0 en el resto Su gráfico es el siguiente:

Su media y su varianza vienen dadas E(X) = a^  2 b y V(X) = ^ b^12 a

^2

Un resultado notable respecto a esta distribución, que constituye la raíz de todo método de simulación estocástica es el siguiente: Si X es una variable aleatoria con función de distribución F(x) y hacemos la transformación U = F(X) entonces la nueva variable aleatoria U sigue una distribución uniforme continua en el intervalo (0,1) y la representamos por U~U(0,1).

Ejemplo 2. Un hombre acude a una estación de autobuses en la que pasa un autobús cada media hora. Sea X = tiempo de espera (en minutos) ~ U(0,30). Calcular la probabilidad de que tenga que esperar más de 10 minutos

P(X>10) = (^)  1030 301 dx 3020  32

2.5.2. Distribución Exponencial Esta distribución aparece asociada a experimentos de Poisson que se desarrollan en el tiempo. Corresponde a la distribución de probabilidad de X = tiempo transcurrido entre dos ocurrencias de un suceso o también al tiempo transcurrido hasta la primera

a (^) b

ba

1

f(x

x

La distribución de X se denomina distribución exponencial de parámetro  y lo denotaremos como X~Exp() con >0 representando número medio de éxitos por unidad de tiempo. Este tipo de distribución es recomendable cuando el planteamiento resulta habitual en el ámbito económico-empresarial, en el que frecuentemente interesa conocer el período de tiempo necesario hasta que se presenta un determinado acontecimiento: aprobación de presupuestos, salida de una empresa a bolsa, contratación de un trabajador,… Su media y su varianza vienen dados por: E(X) = (^) ^1 y V(X) = (^) ^12. Si el parámetro  expresa la intensidad de aparición del fenómeno para el que estamos registrando los tiempos de espera, es natural que el tiempo medio entre dos apariciones del suceso sea el inverso a dicha intensidad. La distribución exponencial resulta, también, muy útil para atacar problemas de filas de espera y colas. Cuando el tiempo de espera para pagar en la caja de un supermercado es aleatorio, esta incertidumbre puede representarse a menudo mediante una distribución exponencial. Así, se pueden modelar mediante la distribución exponencial las siguientes situaciones: duración de la prestación de un servicio, el tiempo entre llegadas sucesivas a una cola o punto de servicio, el tiempo de duración de algunos equipos, etc. La distribución exponencial se trata de una distribución sin memoria, esto es, la probabilidad de que no se produzca un suceso durante un intervalo es independiente de que haya tenido lugar antes. Matemáticamente: P(X>x+h|T>x) = P(X>h)  x , h  0 Supongamos, por ejemplo, la existencia de dos cabinas telefónicas, una de las cuales estaba ocupada bastante tiempo antes de llegar y la otra se había ocupado muy recientemente, entonces ambas cabinas tienen la misma probabilidad de desocuparse en cualquier momento, olvidando el tiempo T que llevaban ocupadas. En definitiva, la ley exponencial describe el tiempo de vida de cierto sistema en el que no hay envejecimiento o desgaste.

La comprobación de esta propiedad es muy sencilla, basta recordar como se calcula la probabilidad condicionada y la probabilidad de los sucesos bajo el modelo exponencial. La probabilidad condicionada se calcula como el cociente entre la probabilidad de la intersección de ambos resultados y la probabilidad del resultado que condiciona, es decir:

PXxhXx   P ^ XPxXh  xXx  PP^ XX  xxh

Ahora, utilizando la probabilidad de la distribución exponencial, sustituimos y simplificamos:

   

  P (^) PXX xxh ee x e h PX hxh  (^)           

Ejemplo 2. El tiempo que un dependiente de una tienda tarda en atender a un cliente se distribuye según una exponencial con media 10 minutos. Calcular la probabilidad de que el dependiente tarde más de media hora en atender a un cliente Sea X = tiempo de atención a un cliente (en minutos) ~ Exp(0.1) P(X>30) = (^)  30  0. 1 e.^0.^1 x^ dx  e ^0.^1 x  30 = e -3^ = 0,

2.5.3. Distribución normal Diremos que una variable aleatoria X se distribuye según una distribución

normal de media  R y desviación típica y lo pondremos como X~N() si su

soporte es R y su función de densidad es:

f(x) = ^  212 2 2

1 ^ 

e ^ x  si x(-,)

Su gráfico es el siguiente:

Esta distribución es, indudablemente, la más importante y la de mayor uso de todas las distribuciones continuas de probabilidad, motivado esto, entre otras, por las siguientes razones:

  • Es la piedra angular en la aplicación de la Inferencia Estadística en el análisis de datos, puesto que las distribuciones de muchos estadísticos muestrales tienden hacia la distribución normal conforme crece el tamaño de la muestra.
  • Muchas leyes puede aproximarse bajo ciertas condiciones por la distribución normal. Más concretamente todos aquéllos fenómenos empíricos en los que la variable analizada sea, al menos conceptualmente, la suma de muchas pequeñas cantidades como, por ejemplo, la altura o el peso de una persona.
  • En gran cantidad de fenómenos empíricos, la distribución normal se aproxima a las distribuciones de frecuencias observadas. Ejemplo 2. La rentabilidad diaria (en %) de una cotización del Banco A se distribuye según una normal de media 0 y desviación típica 10% Calcular la probabilidad de que un día se obtenga una rentabilidad superior al 20%

Sea X = rentabilidad diaria ~ N(0,10). Se tiene que Z = X 10 ^0 ~N( 0 , 1 ) Nos piden P(X>20) = P(Z>2) =0,

2.6. APROXIMACIÓN DE DISTRIBUCIONES DISCRETAS A UNA NORMAL Una de las aplicaciones más importantes de la distribución normal, es que puede aproximar, bajo condiciones límite, a la distribución de gran cantidad de distribuciones discretas y continuas. Dos de las aproximaciones más utilizadas son la aproximación binomial-normal y Poisson-normal que describimos, brevemente, a continuación. 2.6.1 Aproximación Binomial-Normal

Sea X ~ Bi(n,p) y sea Y ~ N np , npq con q = 1-p. Sean a, b  {0, 1, …, n}. Se verifica que: P(a≤X≤b)  P(a-0.5≤Y≤b+0.5)

si n. En la práctica esta aproximación funciona bien si n≥30, np>5 y nq> Ejemplo 2. Un Banco recibe un 80% de solicitudes de trabajo por parte de personas solteras. Si extraemos 200 solicitudes al azar, calcular la probabilidad de que más de 180 correspondan a personas solteras Sea X = número de solicitudes de personas solteras ~Bi(200,0,8) 

N  200 x 0 , 8 , 200 x 0 , 8 x 0 , 2  N 160 , 5 , 66 

P(X>180) = P(X≥181)  

P Z^180 ,^5160 P(Z≥3,62) = 0,

2.6.2 Aproximación Poisson-Normal

Sea X~P() y sea Y~N(,  ) Sean a,b{0, 1, …, }. Se verifica que: P(a≤X≤b)  P(a-0.5≤Y≤b+0.5) si . En la práctica está aproximación funciona bien si >5. Ejemplo 2. El número de aviones que llega a un aeropuerto en 1 hora se distribuye según una Poisson con media 20 aviones. Calcular la probabilidad de que en un día lleguen al aeropuerto más de 500 aviones Sea X = número de aviones que llegan al aeropuerto en 1 día ~P(20x24) =

P(480)  N(480, 480 )= N(480,21,91)

P(X>500) = P(X≥501)   

P Z^500 ,^5480 P(Z≥0,935) = 0,