Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Elementos de probabilidad, Apuntes de Administración de Empresas

Asignatura: Introduccion inferencia estadistica, Profesor: jose vicente paz, Carrera: Administració i Direcció d'Empreses, Universidad: UV

Tipo: Apuntes

2012/2013

Subido el 11/11/2013

anggggg_anggggg
anggggg_anggggg 🇪🇸

4

(2)

2 documentos

1 / 14

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
ELEMENTOS DE PROBABILIDAD
Dr. JoséV Paz
Economía Aplicada. UV. ADE 2011−12
2013-14
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe

Vista previa parcial del texto

¡Descarga Elementos de probabilidad y más Apuntes en PDF de Administración de Empresas solo en Docsity!

ELEMENTOS DE PROBABILIDAD

Dr. JoséV Paz

Economía Aplicada. UV. ADE 2011−122013-

’Los grandes matemáticos no son malabaristas de los números, sino de los conceptos.’ Ian Stewart.

Sistemas Aleatorios y Espacios de Probabilidad

 Sistemas Aleatorios y Espacios de Probabilidad Un sistema es un conjunto de elementos interrelacionados: la evolución de éste conducirá a un suceso que o bien puede ser conocido a priori ( sistemas deterministas ), o bien sólo será cognoscible a posteriori ( sistemas aleatorios ). Así pues, la evolución de los sistemas aleatorios es incierta y predecible sólo en términos de probabilidad.

Un espacio de probabilidad asociado a un sistema aleatorio queda definido por la terna (Ω,A,P), donde Ω es un conjunto (ω 1 ,ω 2 ,…) de sucesos elementales (resultados o casos posibles), A es un álgebra de sucesos observables Ai (una colección de subconjuntos de Ω tal que si A,B∈A entonces Ac∈A, A∪B∈A y ∅∈A) y P es una definición de probabilidad sobre A (una aplicación P: A→[0,1] tal que, P(∅)=0, P(A)=1-P(Ac) P(A∪B)= P(A)+P(B)-P(A∩B) si A⊆B entones P(A)≤P(B)

El álgebra A puede coincidir con Ω ó no (en éste caso los sucesos observables se definen por la unión de varios sucesos elementales). Dos sucesos A,B∈A son disjuntos o excluyentes si A∩B=∅, ∅ es el suceso imposible , y Ω es el suceso seguro. Un algebra A es finita si contiene un número finito de sucesos Ai.

Un espacio de probabilidad es un constructo mental que expresa la creencia individual acerca de la evolución del sistema aleatorio real, por ello siempre podemos asociar diferentes espacios de probabilidad a un mismo sistema aleatorio. ¿De ellos, cuál sería el espacio de probabilidad óptimo?

No existe único procedimiento para construir espacios de probabilidad: nosotros usamos la información del pasado (datos) y las reglas de la lógica, pero también podrían construirse sobre otras bases como la intuición, la pericia de un experto, las artes adivinatorias o cabalísticas de una pitonisa, etc. A todos nos guía la misma intención ‘adivinar o inferir’ el futuro. Los espacios de probabilidad pueden ser implícitos o explícitos.

La estructura o espacio de probabilidad asociada a un sistema aleatorio no es necesariamente estable y puede cambiar con el tiempo: tras la evolución del sistema, por nuevos conocimientos acerca del sistema, etc.

’Todo el mundo se da prisa, pero nadie va a ningún sitio. La gente no vive, sólo existe. Cada vez se aleja más de las realidades espirituales. En estos días la gente busca conocimiento, no sabiduría. El conocimiento es del pasado; la sabiduría, del futuro.’ Vernon Cooper, líder Lumbee.

Dependencia Estocástica o Aleatoria

 Probabilidad Condicionada Los sucesos de un sistema pueden estar relacionados o no (independientes). La existencia de relación supone un cierto conocimiento acerca de la ocurrencia de un suceso conocida la ocurrencia o no del otro. La fortaleza de esta relación oscila entre el absoluto determinismo (ocurrido un suceso B es segura la ocurrencia de A) y la independencia (conocer la ocurrencia de B no añade información sobre la ocurrencia de A).

Con dos sucesos A,B (de probabilidades no nulas) ∈ (Ω,A,P) podemos definir la probabilidad condicionada de A ante la ocurrencia de B como, P(A/B)=P(A∩B)/P(B)

Podemos comparar la P(A) y P(A/B) (antes y después de conocer la ocurrencia del suceso B), hay varios casos,

  1. Si conocer la ocurrencia de B no altera la P(A) entonces A y B son independientes estocásticamente , lo que expresamos como, P(A/B)=P(A) o bien P(A∩B)=P(A) P(B).

  2. Si B altera la P(A) entonces son dependientes , en sentido a) positivo P(A/B)>P(A) (si B favorece que ocurra A), b) negativo P(A/B)<P(A) (si B reduce la ocurrencia de A). c) dependencia determinista (máxima) si P(A/B)=1 ó P(A/B)=0.

Si A,B son independientes también lo son (A,Bc), (Ac,B) y (Ac,Bc). Las probabilidades condicionadas son complementarias P(A/B)+P(Ac/B)=1.

'Hay mucho que decir acerca de la excelencia del saber preguntar, seguramente no es sólo el comienzo en la travesía hacia el conocimiento sino también su fruto maduro. En cambio, los juicios son el final de la singladura [...] Y aún más debería decirse acerca de la preponderancia de la creación sobre la mera repetición o adhesión a la visión ajena de las cosas y sus relaciones; la imaginación individual es una fuente de la que poder beber, en tanto que la imitación es la comprensión de un recuerdo, de la marca producida en otros que bebieron al crear.’

Teoremas de Probabilidad: Intersección y Bayes

Teorema de la Intersección o Probabilidad Total En un espacio de probabilidad (Ω,A,P) hacemos una partición de Ω (conjunto de sucesos disjuntos Hi tal que ∪Hi=Ω y Hi ∩Hj=φ para i≠j) que nos permite evaluar la P(A) usando P(A)=i P(A/Hi) P(Hi) (Probabilidad total).

Teorema de Bayes Si conocemos que ha ocurrido el suceso A podemos evaluar la probabilidad de que proceda de la i-parte de Ω, usando P(Hi/A)=P(A/Hi) P(Hi)/P(A)=P(A/Hi) P(Hi)/i P(A/Hi) P(Hi) (Bayes).

  1. discretas (aquéllas con dominio finito o numerable): quedan definidas por su función de cuantía P(X=xi) para i=1,2…n, que establece la probabilidad asociada a cada valor del dominio (la probabilidad puntual no es nula). Su función de distribución será F(x)=xxi P(X=xi).

  2. continuas (si su F(x) no tiene discontinuidades, su dominio es no numerable). Las más fáciles son las absolutamente continuas que pueden expresarse como, F(X)= ∫ (^) -,x f(t) dt, ∀x∈R

La función de densidad de probabilidad f(x) de una v.a. X continua cumple, f(X)=F’(X); ∫ (^) -,f(X) dX=1; ∫ (^) x1,x2 f(t) dt=F(x 2 -x 1 ) f(X)0

si la v.a. X es discreta usamos la función de cuantía P(X=xi).

En una v.a. continua la probabilidad puntual es considerada cero, por ello la función de densidad f(X) no la representa. Mientras que el producto f(x) dx expresa la probabilidad de que la v.a. X tome valores en el intervalo infinitesimal [x,x+dx].

Vectores Aleatorios y Distribuciones de Probabilidad:

Conjunta, Marginales y Condicionadas

Concepto de Vector Aleatorio En un espacio de probabilidad (Ω,A,P) definimos el vector aleatorio (X,Y) o variable aleatoria 2-dimensional como una aplicación (X,Y): Ω→R^2 que asocia a cada suceso elemental ω un par de números reales (x,y)(ω)∈R^2 donde para cada (xi,yi)∈R^2 existe un suceso asociado Ai∈A de la forma Ai=[X≤xi ∩Y≤yi] donde la P(Ai)=P[X≤xi ∩Y≤yi].

El vector aleatorio (X,Y) es una generalización de la noción de variable aleatoria extendida a la intersección de sucesos, y queda caracterizado por una distribución de probabilidad conjunta bidimensional, (X,Y)∼F(X,Y).

Función de Distribución Conjunta Los vectores aleatorios tienen asociada a su dominio una distribución de probabilidad DP conjunta F(x,y)=P(XxYy) genuina que atribuye valores de probabilidad a los sucesos intersección entre X e Y (v.a. componentes del vector), y que goza de propiedades similares a las de una v.a. simple.

Sabido que un v.a. (X,Y)∼F(X,Y) podemos evaluar,

  1. la P(X≤x 0 ,Y≤y 0 )=P(A), con A(x 0 ,y 0 ∈R^2 )∈A cuyo suceso es (X≤x 0 ∩Y≤y 0 ).
  2. la probabilidad de una región [(x 1 ,x 2 )(y 1 ,y 2 )], P(x 1 ≤X≤x 2 ∩ y 1 ≤Y≤y 2 )=F(x 2 ,y 2 )+F(x 1 ,y 1 )-[F(x 1 ,y 2 )+F(x 2 ,y 1 )]

Por su continuidad los v.a. (X,Y) pueden ser,

  1. discretas : quedan definidas por su función de cuantía conjunta P(X=xi,Y=yj)=P(X=xiY=yj) para i,j=1,2…n que da la probabilidad asociada a cada valor del dominio (la probabilidad puntual no es nula). Su función de distribución será F(x,y)=xxiyyj P(X=xi,Y=yj).

  2. continuas (si su F(x,y) no tiene discontinuidades, su dominio es no- numerable). Las más fáciles son las absolutamente continuas que pueden expresarse por, F(X,Y)= ∫ (^) -,x ∫ (^) -,y f(u,v) du dv, ∀(x,y)∈R^2.

En un vector aleatorio continuo la probabilidad puntual es cero. El producto f(x,y) dx dy mide la probabilidad en el rectángulo infinitesimal [(x,y), (x+dx,y+dy)].

Las funciones más comunes para caracterizar al v.a. (X,Y) son: su densidad conjunta f(X,Y) (o cuantía), su distribución F(X,Y) , su característica ϕ (t,s) , su generatriz g(t,s) , etc.

La función de densidad de probabilidad conjunta f(X,Y) cumple, f(x,y)= δ^2 F(x,y)/ δ x δ y ; ∫∫ (^) -,f(x,y) dx dy=1; si el v.a. (X,Y) es discreto usamos la función de cuantía P(xi,yj).

Operaciones y Operadores sobre Variable Aleatoria

Operaciones Resumen de una v.a.: Momentos Mn[X] A veces conviene reducir la información contenida en la distribución de probabilidad DP de una variable aleatoria X∼F(X) a un conjunto limitado de medidas representativas de dicha DP. Las medidas u operaciones resumen más comunes son los momentos de la distribución Mn(X): ordinarios y centrados.

Para el cálculo de los momentos definimos el operador Mn[ ] 'momento de orden n de una variable aleatoria' como, Mn[X]=-,(x-c)n^ f(x)dx (en v.a. absolutamente continuas), y Mn[X]= ∑∀ i (xi-c)n^ P(xi) (en v.a. discretas) donde si c=0 (momentos ordinarios), y si c=E[X] (momentos centrados).

También puede decirse que los momentos son 'la esperanza de orden n de una v.a.' Mn[X]= En[(X-c) n].

La esperanza, varianza, asimetría, etc. de una variable aleatoria son momentos particulares.

Esperanza de una v.a. E[X] Esta operación es una generalizacion del concepto de media aritmética, y representa el centro de gravedad CDG de la distribución de la v.a. Para su cálculo defino el operador Esperanza E[ ] , E[X]=-,x f(x)dx (en v.a. absolutamente continuas), y E[X]= ∑∀ i xi P(xi) (en v.a. discretas).

El operador E[ ] es lineal, esto es,

  1. E[aX+bY]=aE[X]+bE[Y]
  2. Si X e Y son independientes E[XY]=E[X]E[Y]
  3. Si Y=g(X) entonces E[Y]=E[g(x)]=∫ -,g(x) f(x)dx

Varianza de una v.a. var[x] Representa la dispersión de la v.a. Para su cálculo defino el operador varianza var[ ] , var[X]=-,(x-E[x])^2 f(x)dx (en v.a. absolutamente continuas), y var[X]= ∑∀ i (xi-E[x])^2 P(xi) (en v.a. discretas).

El operador varianza verifica que,

  1. var[aX]=a^2 var[X]
  2. Si X e Y son independientes var[X+Y]=var[X]+var[Y]

Teorema de Tchebychev Si conocemos la E[X] y var[X] podemos acotar la dispersión de una v.a. Xdesconocida usando el teorema de Tchebychev , Pr( | x-E[x] | >h)var[x]/h^2

Función Característica de una Variable Aleatoria

 Función característica FC de una v.a. X Por una transformación de la v.a. X creamos una nueva v.a. Z=eitx^ con dominio en R^2 (números complejos) donde t∈R. Y definimos la función característica ϕ x de la v.a. X como ϕ x(t)=E[eitx] expresable con el operador FC[ ],

  1. FC[X]=E[eitx]
  2. Si X e Y son independientes FC[X+Y]=FC[X] FC[Y]
  3. La k-derivada de FC y los momentos ordinarios cumplen FCk^ [X]t=0 = ik^ E[xk]
  4. FC[X]=TFourier[f(x)]. Si conocemos la FC[X] podemos conocer la f(x) usando el Teorema de reciprocidad de Fourier , f(x)=(1/2 π )-,FC[x]t e-itx^ dt integral en el plano complejo que resolvemos por el método de los residuos.

La FC caracteriza la v.a. X (dos v.a. con igual FC tienen igual distribución). Algunas FC importantes, X≈B(p), ϕX(t)=q+p eit^ X≈B(n,p), ϕX(t)=(q+p eit)n^ X≈P(λ), ϕX(t)=eλ(eit-1) X≈N(μ,σ), ϕX(t)=eμit-(1/2)(tσ)2^ X≈Cauchy, ϕX(t)= e-⏐t⏐

Distribución Poisson (discreta) La v.a. se define en un sistema de de n-observaciones (elevado) con dos resultados posibles, uno de los cuales tiene una probabilidad asociada muy baja (sucesos raros). X ≈P(λ); P(X=k)= e-λ^ λk^ /k!

Propiedades:

  1. E (X)=λ Var(X)=λ
  2. Y=X 1 +X 2 ≈ P(λ 1 +λ 2 ); si X 1 ≈P(λ 1 ); X 2 ≈P(λ 2 ); y X 1 ,X 2 independientes.
  3. la v.a. binomial Xn≈B(n,p) converge a Xn≈P(λ=np) para n→∞, p→0.

Distribución Geométrica (discreta) La v.a. se define como el número de observaciones necesario para ocurra por primera vez un resultado de dos posibles. X ≈G(n,p); P(X=k)= p (1-p)k

Propiedades:

  1. E (X)=(1-p)/p Var(X)=(1-p)/p^2

Distribución Uniforme (continua) La v.a. se define como el resultado observado al elegir un número al azar dentro del intervalo (a,b). X ≈U(a,b); f(X)=1/(b-a) si x∈(a,b), y f(X)=0 si x∉(a,b)

Propiedades:

  1. E (X)=(a+b)/2 Var(X)=(b-a)^2 /

Distribución Cauchy (continua) La v.a. X ≈Cauchy(a,b); dominio X={-∞,∞} f(X)=a/π(a^2 +(x-b)^2 ) siendo a,b parámetros de escala y origen respectivamente.

Distribución Exponencial Negativa (continua) La v.a. X ≈EN(α); dominio X={-∞,∞}; f(X)=αe-αx^ si x>0, y f(X)=0 si x≤0.

Propiedades:

  1. E (X)=1/α Var(X)=1/α^2

Distribución Normal (continua) La v.a. X ≈N(μ,σ); f(X)=(1/σ√ 2 π) exp{-[(x-μ)/√ 2 σ)]^2 }.

Propiedades:

  1. E (X)=μ Var(X)=σ^2
  2. Y=X 1 +X 2 ≈ N(μ 1 +μ2; √σ 12 +σ 22 ); si X 1 ≈N(μ1, σ 1 ); X 2 ≈N(μ2, σ 2 ); y X 1 ,X 2 independientes.
  3. DP-Normal tipificada Y=X-μ/σ ≈N(0,1) donde f(Y)=(1/√ 2 π) exp{-Y^2 /√2}
  4. la v.a. binomial Xn≈B(n,p) converge a Xn≈N(0,1) para n>30, p>0,1.

Distribuciones Derivadas de la Normal

Distribución Normal Bivariante Dos v.a. (variables aleatorias) Xi ≈N(μi,σi), i=1,2 se distribuyen conjuntamente (X 1 ,X 2 ) ≈N-bivariante(μ,σ) donde μ=(μ 1 ,μ 2 ) vector de valores medios y σ ( matriz de covarianzas ).

Su especificación completa requiere cinco parámetros (μ 1 ,μ 2 ,σ 1 ,σ 2 ,ρ) y la función de densidad conjunta es, f(x,y)=[2πσ 1 σ 2 √(1-ρ^2 )]-1^ e-1/2 Q(x,y) donde Q(x 1 ,x 2 )= (1-ρ^2 )-1^ [((x 1 -m 1 )/σ 1 )^2 + ((x 2 -m 2 )/σ 2 )^2 -2(ρ/σ 1 σ 2 )(x 1 -m 1 )(x 2 -m 2 )] es una forma cuadrática definida positiva.

Si ρ=0 entonces (X 1 ,X 2 ) son independientes , esto es (X 1 ,X 2 ) ≈IN-bivariante(μ,σ), toda combinación lineal Z=(aX 1 +bX 2 ) ≈N(μz, σz), donde μz=aμ 1 +bμ 2 y σz^2 =(aσ 1 )^2 +(bσ 2 )^2.

Conviene estandarizar las v.a. (t 1 ,t 2 ) ≈N-bivariante(0,ρI); I (matriz identidad) Distribución Ji-cuadrado La v.a. χ^2 =∑xi^2 ≈χ^2 (n) donde i=1,...n y las Xi ≈IN(0,1), n ( grados de libertad).

Tiene varias propiedades,

  1. E (χ^2 )=n Var(χ^2 )=2n
  2. la v.a. χ^2 =χ^2 1(n)+χ^2 2(m) ≈χ^2 (nm) , si las v.a. χ^2 1(n),χ^2 2(m) son independientes.

Distribución t-student La v.a. t=Y/(√(Z/n) ≈t(n) donde Y≈N(0,1) y Z ≈χ^2 (n) independientes entre si.

Tiene varias propiedades,

  1. E (t)=0 Var(t)=n/(n-2) 2) Si n→∞ converge a una N(0,1)
  2. la v.a. t=(m-μ)/(√(s^2 /n-1) ≈t(n-1) , si Xi ≈IN(μ,σ) donde m (media muestral) y s^2 (varianza muestral). Muy útil en inferencia muestral.

Distribución F-Fischer/Snedecor La v.a. F=(χ^2 1(m)/m)/(χ^2 2(n)/n) ≈F(m,n) , donde χ^2 1(m) y χ^2 2(n) son independientes.

Tiene varias propiedades,

  1. Pr[Fm,n≤x] = 1- Pr[Fn,m≤x]. Util en manejo de tablas