








Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: Introduccion inferencia estadistica, Profesor: jose vicente paz, Carrera: Administració i Direcció d'Empreses, Universidad: UV
Tipo: Apuntes
1 / 14
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!









’Los grandes matemáticos no son malabaristas de los números, sino de los conceptos.’ Ian Stewart.
Sistemas Aleatorios y Espacios de Probabilidad Un sistema es un conjunto de elementos interrelacionados: la evolución de éste conducirá a un suceso que o bien puede ser conocido a priori ( sistemas deterministas ), o bien sólo será cognoscible a posteriori ( sistemas aleatorios ). Así pues, la evolución de los sistemas aleatorios es incierta y predecible sólo en términos de probabilidad.
Un espacio de probabilidad asociado a un sistema aleatorio queda definido por la terna (Ω,A,P), donde Ω es un conjunto (ω 1 ,ω 2 ,…) de sucesos elementales (resultados o casos posibles), A es un álgebra de sucesos observables Ai (una colección de subconjuntos de Ω tal que si A,B∈A entonces Ac∈A, A∪B∈A y ∅∈A) y P es una definición de probabilidad sobre A (una aplicación P: A→[0,1] tal que, P(∅)=0, P(A)=1-P(Ac) P(A∪B)= P(A)+P(B)-P(A∩B) si A⊆B entones P(A)≤P(B)
El álgebra A puede coincidir con Ω ó no (en éste caso los sucesos observables se definen por la unión de varios sucesos elementales). Dos sucesos A,B∈A son disjuntos o excluyentes si A∩B=∅, ∅ es el suceso imposible , y Ω es el suceso seguro. Un algebra A es finita si contiene un número finito de sucesos Ai.
Un espacio de probabilidad es un constructo mental que expresa la creencia individual acerca de la evolución del sistema aleatorio real, por ello siempre podemos asociar diferentes espacios de probabilidad a un mismo sistema aleatorio. ¿De ellos, cuál sería el espacio de probabilidad óptimo?
No existe único procedimiento para construir espacios de probabilidad: nosotros usamos la información del pasado (datos) y las reglas de la lógica, pero también podrían construirse sobre otras bases como la intuición, la pericia de un experto, las artes adivinatorias o cabalísticas de una pitonisa, etc. A todos nos guía la misma intención ‘adivinar o inferir’ el futuro. Los espacios de probabilidad pueden ser implícitos o explícitos.
La estructura o espacio de probabilidad asociada a un sistema aleatorio no es necesariamente estable y puede cambiar con el tiempo: tras la evolución del sistema, por nuevos conocimientos acerca del sistema, etc.
’Todo el mundo se da prisa, pero nadie va a ningún sitio. La gente no vive, sólo existe. Cada vez se aleja más de las realidades espirituales. En estos días la gente busca conocimiento, no sabiduría. El conocimiento es del pasado; la sabiduría, del futuro.’ Vernon Cooper, líder Lumbee.
Probabilidad Condicionada Los sucesos de un sistema pueden estar relacionados o no (independientes). La existencia de relación supone un cierto conocimiento acerca de la ocurrencia de un suceso conocida la ocurrencia o no del otro. La fortaleza de esta relación oscila entre el absoluto determinismo (ocurrido un suceso B es segura la ocurrencia de A) y la independencia (conocer la ocurrencia de B no añade información sobre la ocurrencia de A).
Con dos sucesos A,B (de probabilidades no nulas) ∈ (Ω,A,P) podemos definir la probabilidad condicionada de A ante la ocurrencia de B como, P(A/B)=P(A∩B)/P(B)
Podemos comparar la P(A) y P(A/B) (antes y después de conocer la ocurrencia del suceso B), hay varios casos,
Si conocer la ocurrencia de B no altera la P(A) entonces A y B son independientes estocásticamente , lo que expresamos como, P(A/B)=P(A) o bien P(A∩B)=P(A) P(B).
Si B altera la P(A) entonces son dependientes , en sentido a) positivo P(A/B)>P(A) (si B favorece que ocurra A), b) negativo P(A/B)<P(A) (si B reduce la ocurrencia de A). c) dependencia determinista (máxima) si P(A/B)=1 ó P(A/B)=0.
Si A,B son independientes también lo son (A,Bc), (Ac,B) y (Ac,Bc). Las probabilidades condicionadas son complementarias P(A/B)+P(Ac/B)=1.
'Hay mucho que decir acerca de la excelencia del saber preguntar, seguramente no es sólo el comienzo en la travesía hacia el conocimiento sino también su fruto maduro. En cambio, los juicios son el final de la singladura [...] Y aún más debería decirse acerca de la preponderancia de la creación sobre la mera repetición o adhesión a la visión ajena de las cosas y sus relaciones; la imaginación individual es una fuente de la que poder beber, en tanto que la imitación es la comprensión de un recuerdo, de la marca producida en otros que bebieron al crear.’
Teorema de la Intersección o Probabilidad Total En un espacio de probabilidad (Ω,A,P) hacemos una partición de Ω (conjunto de sucesos disjuntos Hi tal que ∪Hi=Ω y Hi ∩Hj=φ para i≠j) que nos permite evaluar la P(A) usando P(A)= ∑ i P(A/Hi) P(Hi) (Probabilidad total).
Teorema de Bayes Si conocemos que ha ocurrido el suceso A podemos evaluar la probabilidad de que proceda de la i-parte de Ω, usando P(Hi/A)=P(A/Hi) P(Hi)/P(A)=P(A/Hi) P(Hi)/ ∑ i P(A/Hi) P(Hi) (Bayes).
discretas (aquéllas con dominio finito o numerable): quedan definidas por su función de cuantía P(X=xi) para i=1,2…n, que establece la probabilidad asociada a cada valor del dominio (la probabilidad puntual no es nula). Su función de distribución será F(x)= ∑ x ≤ xi P(X=xi).
continuas (si su F(x) no tiene discontinuidades, su dominio es no numerable). Las más fáciles son las absolutamente continuas que pueden expresarse como, F(X)= ∫ (^) - ∞ ,x f(t) dt, ∀x∈R
La función de densidad de probabilidad f(x) de una v.a. X continua cumple, f(X)=F’(X); ∫ (^) - ∞ , ∞ f(X) dX=1; ∫ (^) x1,x2 f(t) dt=F(x 2 -x 1 ) f(X) ≥ 0
si la v.a. X es discreta usamos la función de cuantía P(X=xi).
En una v.a. continua la probabilidad puntual es considerada cero, por ello la función de densidad f(X) no la representa. Mientras que el producto f(x) dx expresa la probabilidad de que la v.a. X tome valores en el intervalo infinitesimal [x,x+dx].
Concepto de Vector Aleatorio En un espacio de probabilidad (Ω,A,P) definimos el vector aleatorio (X,Y) o variable aleatoria 2-dimensional como una aplicación (X,Y): Ω→R^2 que asocia a cada suceso elemental ω un par de números reales (x,y)(ω)∈R^2 donde para cada (xi,yi)∈R^2 existe un suceso asociado Ai∈A de la forma Ai=[X≤xi ∩Y≤yi] donde la P(Ai)=P[X≤xi ∩Y≤yi].
El vector aleatorio (X,Y) es una generalización de la noción de variable aleatoria extendida a la intersección de sucesos, y queda caracterizado por una distribución de probabilidad conjunta bidimensional, (X,Y)∼F(X,Y).
Función de Distribución Conjunta Los vectores aleatorios tienen asociada a su dominio una distribución de probabilidad DP conjunta F(x,y)=P(X ≤ x ∩ Y ≤ y) genuina que atribuye valores de probabilidad a los sucesos intersección entre X e Y (v.a. componentes del vector), y que goza de propiedades similares a las de una v.a. simple.
Sabido que un v.a. (X,Y)∼F(X,Y) podemos evaluar,
Por su continuidad los v.a. (X,Y) pueden ser,
discretas : quedan definidas por su función de cuantía conjunta P(X=xi,Y=yj)=P(X=xi ∩ Y=yj) para i,j=1,2…n que da la probabilidad asociada a cada valor del dominio (la probabilidad puntual no es nula). Su función de distribución será F(x,y)= ∑ x ≤ xi ∑ y ≤ yj P(X=xi,Y=yj).
continuas (si su F(x,y) no tiene discontinuidades, su dominio es no- numerable). Las más fáciles son las absolutamente continuas que pueden expresarse por, F(X,Y)= ∫ (^) - ∞ ,x ∫ (^) - ∞ ,y f(u,v) du dv, ∀(x,y)∈R^2.
En un vector aleatorio continuo la probabilidad puntual es cero. El producto f(x,y) dx dy mide la probabilidad en el rectángulo infinitesimal [(x,y), (x+dx,y+dy)].
Las funciones más comunes para caracterizar al v.a. (X,Y) son: su densidad conjunta f(X,Y) (o cuantía), su distribución F(X,Y) , su característica ϕ (t,s) , su generatriz g(t,s) , etc.
La función de densidad de probabilidad conjunta f(X,Y) cumple, f(x,y)= δ^2 F(x,y)/ δ x δ y ; ∫∫ (^) - ∞ , ∞ f(x,y) dx dy=1; si el v.a. (X,Y) es discreto usamos la función de cuantía P(xi,yj).
Operaciones Resumen de una v.a.: Momentos Mn[X] A veces conviene reducir la información contenida en la distribución de probabilidad DP de una variable aleatoria X∼F(X) a un conjunto limitado de medidas representativas de dicha DP. Las medidas u operaciones resumen más comunes son los momentos de la distribución Mn(X): ordinarios y centrados.
Para el cálculo de los momentos definimos el operador Mn[ ] 'momento de orden n de una variable aleatoria' como, Mn[X]= ∫ - ∞ , ∞ (x-c)n^ f(x)dx (en v.a. absolutamente continuas), y Mn[X]= ∑∀ i (xi-c)n^ P(xi) (en v.a. discretas) donde si c=0 (momentos ordinarios), y si c=E[X] (momentos centrados).
También puede decirse que los momentos son 'la esperanza de orden n de una v.a.' Mn[X]= En[(X-c) n].
La esperanza, varianza, asimetría, etc. de una variable aleatoria son momentos particulares.
Esperanza de una v.a. E[X] Esta operación es una generalizacion del concepto de media aritmética, y representa el centro de gravedad CDG de la distribución de la v.a. Para su cálculo defino el operador Esperanza E[ ] , E[X]= ∫ - ∞ , ∞ x f(x)dx (en v.a. absolutamente continuas), y E[X]= ∑∀ i xi P(xi) (en v.a. discretas).
El operador E[ ] es lineal, esto es,
Varianza de una v.a. var[x] Representa la dispersión de la v.a. Para su cálculo defino el operador varianza var[ ] , var[X]= ∫ - ∞ , ∞ (x-E[x])^2 f(x)dx (en v.a. absolutamente continuas), y var[X]= ∑∀ i (xi-E[x])^2 P(xi) (en v.a. discretas).
El operador varianza verifica que,
Teorema de Tchebychev Si conocemos la E[X] y var[X] podemos acotar la dispersión de una v.a. X ∼ desconocida usando el teorema de Tchebychev , Pr( | x-E[x] | >h) ≤ var[x]/h^2
Función característica FC de una v.a. X Por una transformación de la v.a. X creamos una nueva v.a. Z=eitx^ con dominio en R^2 (números complejos) donde t∈R. Y definimos la función característica ϕ x de la v.a. X como ϕ x(t)=E[eitx] expresable con el operador FC[ ],
La FC caracteriza la v.a. X (dos v.a. con igual FC tienen igual distribución). Algunas FC importantes, X≈B(p), ϕX(t)=q+p eit^ X≈B(n,p), ϕX(t)=(q+p eit)n^ X≈P(λ), ϕX(t)=eλ(eit-1) X≈N(μ,σ), ϕX(t)=eμit-(1/2)(tσ)2^ X≈Cauchy, ϕX(t)= e-⏐t⏐
Distribución Poisson (discreta) La v.a. se define en un sistema de de n-observaciones (elevado) con dos resultados posibles, uno de los cuales tiene una probabilidad asociada muy baja (sucesos raros). X ≈P(λ); P(X=k)= e-λ^ λk^ /k!
Propiedades:
Distribución Geométrica (discreta) La v.a. se define como el número de observaciones necesario para ocurra por primera vez un resultado de dos posibles. X ≈G(n,p); P(X=k)= p (1-p)k
Propiedades:
Distribución Uniforme (continua) La v.a. se define como el resultado observado al elegir un número al azar dentro del intervalo (a,b). X ≈U(a,b); f(X)=1/(b-a) si x∈(a,b), y f(X)=0 si x∉(a,b)
Propiedades:
Distribución Cauchy (continua) La v.a. X ≈Cauchy(a,b); dominio X={-∞,∞} f(X)=a/π(a^2 +(x-b)^2 ) siendo a,b parámetros de escala y origen respectivamente.
Distribución Exponencial Negativa (continua) La v.a. X ≈EN(α); dominio X={-∞,∞}; f(X)=αe-αx^ si x>0, y f(X)=0 si x≤0.
Propiedades:
Distribución Normal (continua) La v.a. X ≈N(μ,σ); f(X)=(1/σ√ 2 π) exp{-[(x-μ)/√ 2 σ)]^2 }.
Propiedades:
Distribución Normal Bivariante Dos v.a. (variables aleatorias) Xi ≈N(μi,σi), i=1,2 se distribuyen conjuntamente (X 1 ,X 2 ) ≈N-bivariante(μ,σ) donde μ=(μ 1 ,μ 2 ) vector de valores medios y σ ( matriz de covarianzas ).
Su especificación completa requiere cinco parámetros (μ 1 ,μ 2 ,σ 1 ,σ 2 ,ρ) y la función de densidad conjunta es, f(x,y)=[2πσ 1 σ 2 √(1-ρ^2 )]-1^ e-1/2 Q(x,y) donde Q(x 1 ,x 2 )= (1-ρ^2 )-1^ [((x 1 -m 1 )/σ 1 )^2 + ((x 2 -m 2 )/σ 2 )^2 -2(ρ/σ 1 σ 2 )(x 1 -m 1 )(x 2 -m 2 )] es una forma cuadrática definida positiva.
Si ρ=0 entonces (X 1 ,X 2 ) son independientes , esto es (X 1 ,X 2 ) ≈IN-bivariante(μ,σ), toda combinación lineal Z=(aX 1 +bX 2 ) ≈N(μz, σz), donde μz=aμ 1 +bμ 2 y σz^2 =(aσ 1 )^2 +(bσ 2 )^2.
Conviene estandarizar las v.a. (t 1 ,t 2 ) ≈N-bivariante(0,ρI); I (matriz identidad) Distribución Ji-cuadrado La v.a. χ^2 =∑xi^2 ≈χ^2 (n) donde i=1,...n y las Xi ≈IN(0,1), n ( grados de libertad).
Tiene varias propiedades,
Distribución t-student La v.a. t=Y/(√(Z/n) ≈t(n) donde Y≈N(0,1) y Z ≈χ^2 (n) independientes entre si.
Tiene varias propiedades,
Distribución F-Fischer/Snedecor La v.a. F=(χ^2 1(m)/m)/(χ^2 2(n)/n) ≈F(m,n) , donde χ^2 1(m) y χ^2 2(n) son independientes.
Tiene varias propiedades,