








Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Encontra documentos específicos para os exames da tua universidade
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
probabilidade
Tipologia: Notas de estudo
1 / 14
Esta página não é visível na pré-visualização
Não perca as partes importantes!









Universidade do Estado do Rio de Janeiro – UERJ Curso: Engenharia Disciplina: Probabilidade e Estatística III Professor: Marcelo Rubens
INTRODUÇÃO À PROBABILIDADE E ALGUNS RESULTADOS IMPORTANTES
1 - PROBABILIDADE E VARIÁVEIS ALEATÓRIAS
Experimento aleatório e suas características:
a) É um tipo de experimento no qual não é possível prever um resultado particular com certeza absoluta, portanto, sujeito às leis do acaso; b) Pode-se descrever ou definir a lista de todos os seus resultados possíveis; c) Pode ser repetido indefinidamente sob condições inalteradas.
População ou espaço amostral - Conjunto ou lista de todos os resultados possíveis de um experimento aleatório. O espaço amostral é usualmente denotado por Ω. Exemplos: Lançamento de uma moeda: Ω={cara, coroa} Lançamento de um dado: Ω={1, 2, 3, 4, 5, 6} Renda média familiar anual: Ω=ℜ+ (conjunto dos números reais positivos) Tempo que um trabalhador leva da sua casa para o trabalho.
Ponto amostral - Cada membro ou elemento indivisível pertencente a população ou espaço amostral.
Evento - Qualquer subconjunto do espaço amostral.
Eventos mutuamente exclusivos - Eventos são mutuamente exclusivos quando a ocorrência de um desses eventos exclui a possibilidade de ocorrência dos outros.
Eventos exaustivos - Eventos são (coletivamente) exaustivos quando a união desses eventos eqüivale à população ou espaço amostral.
O conceito preliminar de probabilidade que iremos adotar refere-se a um número atribuído a um evento com valor no intervalo entre zero e um (∈ [0,1]), de tal forma que se tivermos um conjunto de eventos mutuamente exclusivos e exaustivos, então a soma da probabilidade desses eventos deve ter o valor de um. Se A é um evento de um espaço amostral Ω, denotamos probabilidade desse evento por P(A).
Nesta definição devemos observar que P(A) é uma função de valor real com as seguintes propriedades:
Seja Ω={a 1 , a 2 , ..., an }, onde ai , i=1, 2, ..., n são pontos amostrais. Ω é um espaço equiprovável se P(a 1 )=P(a 2 )=...=P(an )=p, ou seja, se todos os pontos amostrais de Ω tiverem mesma probabilidade. Como a soma das probabilidades deve ser um, então:
P(a 1 ) + P(a 2 ) + ... + P(a (^) n ) = p + p + ... + p = np = 1 ⇒ p = P(ai ) = 1 / n.
Se tivermos um total de N(Ω) resultados possíveis igualmente prováveis (não tendenciosos) de um experimento aleatório, e se N(A) dentre eles forem os resultados favoráveis à ocorrência do evento A, então a probabilidade de um evento num espaço equiprovável sera:
P(A) = N(A) / N(Ω) = (# casos favoráveis ao evento A) / (# casos possíveis do experimento)
Exemplo: Considere o experimento que consiste de lançar um dado numerado de 1 a 6. O espaço amostral consiste nos resultados 1, 2, 3, 4, 5 e 6. Estes seis pontos amostrais, portanto, esgotam todo o espaço amostral. A probabilidade de ocorrer qualquer um desses números é de 1/6 (supondo que cada ponto seja igualmente provável de ocorrer, ou seja, que o dado não seja viciado), já que, para cada evento existe somente um caso favorável dentre seis possíveis. Como 1, 2, 3, 4, 5 e 6 formam um conjunto mutuamente exclusivo e exaustivo de eventos, então:
P(1 ou 2 ou 3 ou 4 ou 5 ou 6)=P(1)+P(2)+...+P(6)=1/6+1/6+1/6+1/6+1/6+1/6=
Seja A={números primos de 1 a 6}={1, 2, 3, 5} ⇒ P(A)=4/
Seja A um evento de um espaço amostral. A probabilidade do evento A, P(A), é a proporção de vezes que o evento A ocorrerá se o experimento for repetido infinitas vezes. Se realizarmos uma amostra de tamanho n do experimento, e nesta amostra for observada n (^) A (nA ≤ n) ocorrências do evento A, então a freqüência relativa do evento A será a razão nA / n. Para valores grandes de n, essa freqüência relativa fornecerá uma aproximação boa da probabilidade de A:
n
n P( A) lim A n →∞
Uma variável cujo valor seja determinado pelo resultado de um experimento aleatório chama- se variável aleatória (va). As variáveis aleatórias são geralmente indicadas pelas letras maiúsculas X, Y, Z, etc..., e os valores assumidos por elas são indicados por letras minúsculas x, y, z, etc. Uma variável aleatória pode ser discreta ou contínua. Uma va discreta assume um conjunto de valores enumeráveis podendo ser finito ou infinito. Por exemplo, no experimento de lançamento de dois dados, cada um numerado de 1 a 6, se definirmos a variável aleatória X como a soma dos números que aparecem no lado superior dos dados, então X poderá assumir um dos seguintes valores: 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, ou 12. Portanto X é uma variável aleatória discreta. Uma va continua, por outro lado, é a que pode assumir qualquer valor em algum intervalo de valores. Assim, a altura de uma pessoa é uma variável aleatória contínua, já que na faixa de, digamos, 1,60m a 2,00m ela pode assumir qualquer valor dependendo da precisão da medida, p.ex.: 1,876m. Definindo matematicamente: uma V.A. é uma função que atribui um valor real a cada ponto pertencente ao espaço amostral (ou estados da natureza). Por exemplo:
A função
1 n
n
é uma V. A. n-dimensional se o evento ( Χ 1 ≤x 1 ;...;Χn≤xn)tiver probabilidade definida n
FX ( x) = Ρ( Χ 1 ≤x 1 ;...;Χn≤xn), que pela definição de V.A. está definida n
Dentre as propriedades de FX ( )x destaca-se (em geral decorrentes da definição de
probabilidade):
1.6.1.1 - FUNÇÃO DE PROBABILIDADE UNIVARIADA
Assuma que o conjunto de valores que define o espaço amostral de uma variável aleatória discreta X, seja R (^) x={x 1 , x 2 , ...}. Então a função de probabilidade de X será a função Px(x) que satisfaz as condições:
P (^) x(x)=P(X=x), se x ∈ R (^) x P (^) x(x)=0 se x ∉ R (^) x;
0 ≤ P (^) x(x) ≤ 1;
Px x x Rx
∈
≤
x a
FX (a) Px(x)
Suponha que o experimento que define a va discreta X ocorra em conjunto com o experimento que define a va discreta Y cujo espaço amostral seja R (^) y={y 1 , y 2 , ...}, de maneira análoga definimos a função de probabilidade conjunta P (^) xy(X=x e Y=y):
P (^) xy(x,y)=P(X=x e Y=y), se x ∈ R (^) x e y ∈ R (^) y P (^) xy(x,y)=0 se x ∉ R (^) x ou y ∉ R (^) y;
0 ≤ P (^) xy(x,y) ≤ 1;
P (^) xy x y x Rxy Ry
∈ ∈
≤ ≤
x ay b
FXY (a,b) Pxy(x,y)
De posse de uma distribuição de probabilidade conjunta em X e Y (v.a.s discretas) podemos calcular a funções de probabilidade marginais , respectivamente:
∈
yR y
∈
x R x
A tabela a seguir fornece um exemplos de função de probabilidade conjunta e marginal de X e Y
∈ ∈ ∈
1 x 1 2 x 2 n xn
1 2 n x R x R x R
≤ ≤ ≤
1 1 2 2 n n
1 2 n x a x a x a
FX (a 1 ,a 2 ,...,an) Pxx ...x (x 1 ,x 2 ,...,xn)
1.6.2 - FUNÇÃO DE DENSIDADE DE PROBABILIDADE (va contínua)
Seja X uma va contínua. Então f(x) é a função de densidade de probabilidade (fdp) se satisfizer as seguintes condições:
b
f(x) ≥ 0;
f x dx( ) = −∞
∞
−∞
a FX (a) f(x)dx
Quando o experimento que define a va contínua X ocorre conjuntamente com o experimento que define a va contínua Y, então f(x,y) é a função de densidade de probabilidade conjunta que satisfaz:
d
a
b
∞
−∞
∞
− ∞ −∞
a b FXY (a,b) f(x,y)dxdy
De posse de uma função de densidade de probabilidade conjunta em X e Y (v.a.s contínuas) podemos calcular a funções de densidade de probabilidade marginais , respectivamente:
∞
−∞
∞
−∞
As funções de densidade de probabilidade condicionais em X e Y (contínuas) são respectivamente:
Propriedades:
+∞
−∞
+∞
−∞
+∞
−∞
− ∞ − ∞ −∞
x 1 x 2 xn
1 2 n
n X
Generalizando a definição para o caso multivariado aplicado à função
n
∈ ∈ ∈
x 1 Rx 1 x 2 Rx 2 xn Rxn
+∞
−∞
+∞
−∞
+∞
−∞
Se a for uma constante numérica , então: E(a)=a;
Se a for uma constante numérica e X uma variável aleatória: E(aX)=aE(X);
Se a 1 , a 2 , ..., an forem constantes numéricas e X 1 , X 2 , ..., Xn variáveis aleatórias: E(a 1 X 1 +a 2 X 2 +...+an Xn )=a 1 E(X 1 )+a 2 E(X 2 )+...+an E(Xn );
Se X 1 , X 2 , ..., Xn variáveis aleatórias independentes ⇒ E(X 1 X 2 ... Xn )= E(X 1 )E(X 2 )...E(Xn ) OBS.: A volta não é necessariamente verdadeira. Há exemplos onde E(X 1 X 2 )=E(X 1 )E(X 2 ) ⇒/ X 1 , X 2 VAs indep
Seja X uma variável aleatória e E(X)=μ. A variância é uma medida que indica a dispersão dos valores da va X em torno da média, definida como:
VAR(X)=σx^2 =E[(X-μ)^2 ]
A raiz quadrada positiva de σx^2 , σx é definida como o desvio-padrão de X
Se a for uma constante numérica , então: VAR(a)=0;
Se a for uma constante numérica e X uma variável aleatória: VAR(aX)=a^2 VAR(X) VAR(a+X)=VAR(X);
Se a 1 , a 2 , ..., an forem constantes numéricas e X 1 , X 2 , ..., Xn variáveis aleatórias independentes: VAR(a 1 X 1 +a 2 X 2 +...+an Xn )=a 12 VAR(X 1 )+a 22 VAR(X 2 )+...+an^2 VAR(Xn )
A covariância entre duas variáveis aleatórias X e Y com médias μx e μy indica o tipo de relacionamento entre essas variáveis pelo seu sinal, é definida como a seguir:
COV(X,Y)=E[(X-μx)(Y-μy)]
Quando seu sinal e positivo podemos afirmar que, na média, existe uma tendência para que quando os valores de X estiverem acima da sua média (μx) - valores grandes -, Y também estará acima da sua média (μy) e quando valores de X estiverem abaixo da sua média - valores pequenos -, Y também estará abaixo da sua média. Quando seu sinal é negativo, a conclusão será invertida, ou seja, valores grandes de X acontecem quando Y tende a ser pequeno e vice versa. Quando seu valor é nulo, se X é grande ou pequeno, nada podemos concluir com relação a Y.
COV(X,Y)=COV(Y,X)=E(XY)-μxμy;
COV(aW+bX,dY)=adCOV(W,Y)+bdCOV(X,Y), onde a,b,d constantes numéricas;
COV(a+bX,c+dY)=bdCOV(X,Y), onde a,b,c,d constantes numéricas;
COV(a,X)=0, onde a é uma constante;
Se X e Y são independentes: COV(X,Y)=0;
VAR(X+Y)=VAR(X)+VAR(Y)+2COV(X,Y);
VAR(X-Y)=VAR(X)+VAR(Y)-2COV(X,Y);
Se a 1 , a 2 , ..., an forem constantes numéricas e X 1 , X 2 , ..., Xn variáveis aleatórias, então:
−
= = = =+
n 1
i 1
n
ji 1
i j i j
n
i 1
n
i 1
i
2 VAR( ai Xi) aiVAR(X) 2 aa COV(X,X)
Exemplos: Sejam duas populações (ou variáveis aleatórias) X e Y com N elementos cada. Se cada elemento dessas populações tiver igual probabilidade (1/N), então:
N
i 1
N i
i 1
i
N
i 1
N
1
= = =
N
i 1
i
=
É outro caso particular da fdp Gama: Gama(k/2,1/2) onde k é chamado de graus de liberdade da distribuição. Apresenta importantes aplicações na inferência estatística clássica e na inferência não paramétrica. Alguns valores dessa distribuição encontram-se tabelados em livros sobre o assunto.
Uma va X tem distribuição de probabilidades Normal com parâmetros (μ,σ^2 ) se:
f x e
x ( )
2 2 2 σ π
μ σ (^) , x é número real
Pode-se demonstrar que: E(X)=μ VAR(X)=σ^2 f(μ) é o máximo de f(x)
Trata-se de uma das distribuições mais importantes do cálculo de probabilidades e da inferência estatística. Isso porque além das observações empíricas, já foi demonstrado teoricamente que muitas das situações aleatórias do mundo real podem ser modeladas ou aproximadas por essa distribuição de probabilidades. No gráfico abaixo podemos perceber a importante propriedade de simetria desta fdp.
(^01734516885) 102119136153170187204221238255272289 X
fdp
Devido a sua grande importância, esta distribuição de probabilidades encontra-se tabelada em praticamente todos os livros que abordam este assunto. Para tanto deve-se proceder a uma transformação linear que padroniza essa distribuição como uma Normal(0,1). Toda Normal(μ,σ^2 ) pode ser convertida para a Normal(0,1).
2 g
n
i 1
g 1 i
n
i 1
= =
(combinação linear de
v.as. Normais também tem distribuição Normal)
− μ σ
~ Normal(0,1) (padronização)
1.9 - TEOREMA DO LIMITE CENTRAL (uma de suas versões)
Se X 1 , X 2 , ..., Xn são variáveis aleatórias independentes com médias μ 1 , μ 2 , ...,μn e
variâncias σ 12 , σ 22 , ..., σn^2 respectivamente, então a distribuição de Y X (^) i i
=
1
tende a uma
distribuição Normal com média E Y (^) i i
n ( ) = =
1
e variância VAR Y (^) i i
n ( ) = =
2 1
quando n→∞.
Trata-se de um dos resultados mais importantes do cálculo de probabilidades, já que, toda vez que pudermos supor que a componente aleatória de um modelo seja provocado por uma grande quantidade de fatores causais independentes com distribuições desconhecidas, podemos modelar a distribuição de probabilidades da soma desses fatores pela distribuição Normal.
quantidade Z Z (^) i i
=
2 1
tem distribuição Qui-quadrado ( χ (^) k^2 )com k graus de liberdade.
Z k
têm
distribuição t de Student (t (^) k ) com k graus de liberdade. Esta distribuição também é simétrica e converge para a distribuição Normal quando k→∞. Também a encontramos tabelada em muitos livros.
2 independentes , então a transformação F
Z k Z k
2 2
segue a
distribuição F de Fisher ( Fk 1 , k 2 ) com k 1 e k 2 graus de liberdade. É comum encontrá-la
tabelada em livros.