Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas


probabilidade - marcelo rubens, Notas de estudo de Engenharia Elétrica

probabilidade

Tipologia: Notas de estudo

Antes de 2010

Compartilhado em 28/05/2010

volnei-junior-12
volnei-junior-12 🇧🇷

4.7

(43)

293 documentos

1 / 14

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
1
Universidade do Estado do Rio de Janeiro – UERJ
Curso: Engenharia
Disciplina: Probabilidade e Estatística III
Professor: Marcelo Rubens
INTRODUÇÃO À PROBABILIDADE E ALGUNS RESULTADOS IMPORTANTES
1 - PROBABILIDADE E VARIÁVEIS ALEATÓRIAS
1.1 - CONCEITOS E DEFINIÇÕES PRELIMINARES
Experimento aleatório e suas características:
a) É um tipo de experimento no qual não é possível prever um resultado particular com
certeza absoluta, portanto, sujeito às leis do acaso;
b) Pode-se descrever ou definir a lista de todos os seus resultados possíveis;
c) Pode ser repetido indefinidamente sob condições inalteradas.
População ou espaço amostral - Conjunto ou lista de todos os resultados possíveis de um
experimento aleatório. O espaço amostral é usualmente denotado por . Exemplos:
Lançamento de uma moeda: ={cara, coroa}
Lançamento de um dado: ={1, 2, 3, 4, 5, 6}
Renda média familiar anual: =+ (conjunto dos números reais positivos)
Tempo que um trabalhador leva da sua casa para o trabalho.
Ponto amostral - Cada membro ou elemento indivisível pertencente a população ou espaço
amostral.
Evento - Qualquer subconjunto do espaço amostral.
Eventos mutuamente exclusivos - Eventos são mutuamente exclusivos quando a ocorrência
de um desses eventos exclui a possibilidade de ocorrência dos outros.
Eventos exaustivos - Eventos são (coletivamente) exaustivos quando a união desses eventos
eqüivale à população ou espaço amostral.
1.2 - PROBABILIDADE DE UM EVENTO NUM ESPAÇO EQUIPROVÁVEL
O conceito preliminar de probabilidade que iremos adotar refere-se a um número atribuído a
um evento com valor no intervalo entre zero e um ( [0,1]), de tal forma que se tivermos um
conjunto de eventos mutuamente exclusivos e exaustivos, então a soma da probabilidade
desses eventos deve ter o valor de um. Se A é um evento de um espaço amostral , denotamos
probabilidade desse evento por P(A).
Nesta definição devemos observar que P(A) é uma função de valor real com as seguintes
propriedades:
0 P(A) 1 para todo A∈Ω;
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe

Pré-visualização parcial do texto

Baixe probabilidade - marcelo rubens e outras Notas de estudo em PDF para Engenharia Elétrica, somente na Docsity!

Universidade do Estado do Rio de Janeiro – UERJ Curso: Engenharia Disciplina: Probabilidade e Estatística III Professor: Marcelo Rubens

INTRODUÇÃO À PROBABILIDADE E ALGUNS RESULTADOS IMPORTANTES

1 - PROBABILIDADE E VARIÁVEIS ALEATÓRIAS

1.1 - CONCEITOS E DEFINIÇÕES PRELIMINARES

Experimento aleatório e suas características:

a) É um tipo de experimento no qual não é possível prever um resultado particular com certeza absoluta, portanto, sujeito às leis do acaso; b) Pode-se descrever ou definir a lista de todos os seus resultados possíveis; c) Pode ser repetido indefinidamente sob condições inalteradas.

População ou espaço amostral - Conjunto ou lista de todos os resultados possíveis de um experimento aleatório. O espaço amostral é usualmente denotado por Ω. Exemplos: Lançamento de uma moeda: Ω={cara, coroa} Lançamento de um dado: Ω={1, 2, 3, 4, 5, 6} Renda média familiar anual: Ω=ℜ+ (conjunto dos números reais positivos) Tempo que um trabalhador leva da sua casa para o trabalho.

Ponto amostral - Cada membro ou elemento indivisível pertencente a população ou espaço amostral.

Evento - Qualquer subconjunto do espaço amostral.

Eventos mutuamente exclusivos - Eventos são mutuamente exclusivos quando a ocorrência de um desses eventos exclui a possibilidade de ocorrência dos outros.

Eventos exaustivos - Eventos são (coletivamente) exaustivos quando a união desses eventos eqüivale à população ou espaço amostral.

1.2 - PROBABILIDADE DE UM EVENTO NUM ESPAÇO EQUIPROVÁVEL

O conceito preliminar de probabilidade que iremos adotar refere-se a um número atribuído a um evento com valor no intervalo entre zero e um (∈ [0,1]), de tal forma que se tivermos um conjunto de eventos mutuamente exclusivos e exaustivos, então a soma da probabilidade desses eventos deve ter o valor de um. Se A é um evento de um espaço amostral Ω, denotamos probabilidade desse evento por P(A).

Nesta definição devemos observar que P(A) é uma função de valor real com as seguintes propriedades:

  • 0 ≤ P(A) ≤ 1 para todo A∈Ω;
  • Se A, B, C, ... constituem uma coleção exaustiva de eventos, ou seja, Ω={A, B, C, ...} então: P(A ou B ou C ou ...)=1;
  • Se A, B, C, ... são eventos mutuamente exclusivos, então: P(A ou B ou C ou ...)=P(A)+P(B)+P(C)+...;
  • Se A, B, C, ... são eventos mutuamente exclusivos e exaustivos, então: P(A ou B ou C ou ...)=P(A)+P(B)+P(C)+...=

Seja Ω={a 1 , a 2 , ..., an }, onde ai , i=1, 2, ..., n são pontos amostrais. Ω é um espaço equiprovável se P(a 1 )=P(a 2 )=...=P(an )=p, ou seja, se todos os pontos amostrais de Ω tiverem mesma probabilidade. Como a soma das probabilidades deve ser um, então:

P(a 1 ) + P(a 2 ) + ... + P(a (^) n ) = p + p + ... + p = np = 1 ⇒ p = P(ai ) = 1 / n.

Se tivermos um total de N(Ω) resultados possíveis igualmente prováveis (não tendenciosos) de um experimento aleatório, e se N(A) dentre eles forem os resultados favoráveis à ocorrência do evento A, então a probabilidade de um evento num espaço equiprovável sera:

P(A) = N(A) / N(Ω) = (# casos favoráveis ao evento A) / (# casos possíveis do experimento)

Exemplo: Considere o experimento que consiste de lançar um dado numerado de 1 a 6. O espaço amostral consiste nos resultados 1, 2, 3, 4, 5 e 6. Estes seis pontos amostrais, portanto, esgotam todo o espaço amostral. A probabilidade de ocorrer qualquer um desses números é de 1/6 (supondo que cada ponto seja igualmente provável de ocorrer, ou seja, que o dado não seja viciado), já que, para cada evento existe somente um caso favorável dentre seis possíveis. Como 1, 2, 3, 4, 5 e 6 formam um conjunto mutuamente exclusivo e exaustivo de eventos, então:

P(1 ou 2 ou 3 ou 4 ou 5 ou 6)=P(1)+P(2)+...+P(6)=1/6+1/6+1/6+1/6+1/6+1/6=

Seja A={números primos de 1 a 6}={1, 2, 3, 5} ⇒ P(A)=4/

1.3 - DEFINIÇÃO FREQUENTISTA OU CLÁSSICA DE PROBABILIDADE

Seja A um evento de um espaço amostral. A probabilidade do evento A, P(A), é a proporção de vezes que o evento A ocorrerá se o experimento for repetido infinitas vezes. Se realizarmos uma amostra de tamanho n do experimento, e nesta amostra for observada n (^) A (nA ≤ n) ocorrências do evento A, então a freqüência relativa do evento A será a razão nA / n. Para valores grandes de n, essa freqüência relativa fornecerá uma aproximação boa da probabilidade de A:

n

n P( A) lim A n →∞

1.6 - VARIÁVEIS ALEATÓRIAS

Uma variável cujo valor seja determinado pelo resultado de um experimento aleatório chama- se variável aleatória (va). As variáveis aleatórias são geralmente indicadas pelas letras maiúsculas X, Y, Z, etc..., e os valores assumidos por elas são indicados por letras minúsculas x, y, z, etc. Uma variável aleatória pode ser discreta ou contínua. Uma va discreta assume um conjunto de valores enumeráveis podendo ser finito ou infinito. Por exemplo, no experimento de lançamento de dois dados, cada um numerado de 1 a 6, se definirmos a variável aleatória X como a soma dos números que aparecem no lado superior dos dados, então X poderá assumir um dos seguintes valores: 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, ou 12. Portanto X é uma variável aleatória discreta. Uma va continua, por outro lado, é a que pode assumir qualquer valor em algum intervalo de valores. Assim, a altura de uma pessoa é uma variável aleatória contínua, já que na faixa de, digamos, 1,60m a 2,00m ela pode assumir qualquer valor dependendo da precisão da medida, p.ex.: 1,876m. Definindo matematicamente: uma V.A. é uma função que atribui um valor real a cada ponto pertencente ao espaço amostral (ou estados da natureza). Por exemplo:

A função

x

X : é V.A. se o evento (X ≤ x) tiver probabilidade definida ∀x ∈ℜ.

Dado o espaço amostral Ω , a função

X =(X 1 ,X 2 ,...,Xn):

ω x (x ,...,x )

1 n

n

é uma V. A. n-dimensional se o evento ( Χ 1 ≤x 1 ;...;Χn≤xn)tiver probabilidade definida n

∀ x ∈ℜ.

Mostra-se que cada Xi ∈ X é uma V.A. unidimensional e qualquer subconjunto de m

< n variáveis ∈ X é uma V.A. m-dimensional (Meyer, pg.110).

Define-se função de distribuição de uma V.A. n-dimensional X à função:

FX ( x) = Ρ( Χ 1 ≤x 1 ;...;Χn≤xn), que pela definição de V.A. está definida n

∀x ∈ℜ.

Dentre as propriedades de FX ( )x destaca-se (em geral decorrentes da definição de

probabilidade):

  1. FX ( )x ∈[0 ,1]

2. FX (+ ∞; + ∞; ...; + ∞) = 1

  1. FX ( )x é não decrescente
  2. A função de distribuição de cada subconjunto de m (1≤m 1.6.1 - FUNÇÃO DE PROBABILIDADE (va discreta)

1.6.1.1 - FUNÇÃO DE PROBABILIDADE UNIVARIADA

Assuma que o conjunto de valores que define o espaço amostral de uma variável aleatória discreta X, seja R (^) x={x 1 , x 2 , ...}. Então a função de probabilidade de X será a função Px(x) que satisfaz as condições:

  1. P (^) x(x)=P(X=x), se x ∈ R (^) x P (^) x(x)=0 se x ∉ R (^) x;

  2. 0 ≤ P (^) x(x) ≤ 1;

  3. Px x x Rx

∑ =^1

x a

FX (a) Px(x)

1.6.1.2 - FUNÇÃO DE PROBABILIDADE CONJUNTA (BIVARIADA)

Suponha que o experimento que define a va discreta X ocorra em conjunto com o experimento que define a va discreta Y cujo espaço amostral seja R (^) y={y 1 , y 2 , ...}, de maneira análoga definimos a função de probabilidade conjunta P (^) xy(X=x e Y=y):

  1. P (^) xy(x,y)=P(X=x e Y=y), se x ∈ R (^) x e y ∈ R (^) y P (^) xy(x,y)=0 se x ∉ R (^) x ou y ∉ R (^) y;

  2. 0 ≤ P (^) xy(x,y) ≤ 1;

  3. P (^) xy x y x Rxy Ry

∈ ∈

∑ ∑^1

≤ ≤

x ay b

FXY (a,b) Pxy(x,y)

1.6.1.3 - FUNÇÃO DE PROBABILIDADE MARGINAL (BIVARIADA)

De posse de uma distribuição de probabilidade conjunta em X e Y (v.a.s discretas) podemos calcular a funções de probabilidade marginais , respectivamente:

yR y

Px (x) Pxy(x,y) e ∑

x R x

Py (y) Pxy(x,y)

A tabela a seguir fornece um exemplos de função de probabilidade conjunta e marginal de X e Y

  1. 0 ≤ P (^) x 1 x 2 ... xn (x 1 , x 2 , ..., x (^) n ) ≤ 1;

∈ ∈ ∈

1 x 1 2 x 2 n xn

1 2 n x R x R x R

 Px x...x (x 1 ,x 2 ,...,xn) 1

≤ ≤ ≤

1 1 2 2 n n

1 2 n x a x a x a

FX (a 1 ,a 2 ,...,an)  Pxx ...x (x 1 ,x 2 ,...,xn)

1.6.2 - FUNÇÃO DE DENSIDADE DE PROBABILIDADE (va contínua)

1.6.2.1 - FUNÇÃO DE DENSIDADE DE PROBABILIDADE UNIVARIADA

Seja X uma va contínua. Então f(x) é a função de densidade de probabilidade (fdp) se satisfizer as seguintes condições:

  1. f x dx P a x b a

b

∫ ( )^ =^ (^ ≤^ ≤ );

  1. f(x) ≥ 0;

  2. f x dx( ) = −∞

−∞

a FX (a) f(x)dx

  1. P( a≤x≤b)=FX (b)−FX(a)

Obs.: F (x)

dx

d

f (x)= X

1.6.2.2 - FUNÇÃO DE DENSIDADE DE PROBABILIDADE CONJUNTA

(BIVARIADA)

Quando o experimento que define a va contínua X ocorre conjuntamente com o experimento que define a va contínua Y, então f(x,y) é a função de densidade de probabilidade conjunta que satisfaz:

  1. f x y dxdy P a x b e c y d c

d

a

b

∫ ∫ ( ,^ )^ =^ (^ ≤^ ≤^ ≤^ ≤ );

  1. f(x,y) ≥ 0;
  1. f x y dxdy( , ) = −∞

−∞

∫ ∫^1

− ∞ −∞

a b FXY (a,b) f(x,y)dxdy

1.6.2.3 - FUNÇÃO DE DENSIDADE DE PROBABILIDADE MARGINAL

(BIVARIADA)

De posse de uma função de densidade de probabilidade conjunta em X e Y (v.a.s contínuas) podemos calcular a funções de densidade de probabilidade marginais , respectivamente:

−∞

f (x)= f(x,y)dy e ∫

−∞

f(y)= f(x,y)dx

1.6.2.4 - FUNÇÃO DE DENSIDADE DE PROBABILIDADE CONDICIONAL

(BIVARIADA)

As funções de densidade de probabilidade condicionais em X e Y (contínuas) são respectivamente:

f(y)

f(x,y)

f (x|y)≡ e

f(x)

f(x,y)

f (y|x)≡

1.6.2.5 - FUNÇÃO DE DENSIDADE DE PROBABILIDADE CONJUNTA

(MULTIVARIADA)

Seja o vetor de variáveis aleatórias (contínuas) X =(X 1 , X 2 , ..., Xn )

A função de densidade de probabilidade conjunta f X ( )x satisfaz as seguintes condições:

Propriedades:

1. f X ( x) ≥ 0

+∞

−∞

+∞

−∞

+∞

−∞

... fX xdx 1 dx 2 ...dxn = 1

− ∞ − ∞ −∞

x 1 x 2 xn

FX x ... fX 1 , 2 ,... n d 1 d 2 ...d n

Obs.: ( ) F ( )x

x x ... x

f x X

1 2 n

n X

Generalizando a definição para o caso multivariado aplicado à função

x g(x )

g(X):

n

∈ ∈ ∈

x 1 Rx 1 x 2 Rx 2 xn Rxn

E[ g(X)]  g(x)PX (x) para o caso discreto

∫ ∫ ∫^ ( )

+∞

−∞

+∞

−∞

+∞

−∞

E[ g(X)]= ... g(x)fX xdx 1 dx 2 ...dxn para o caso contínuo

1.7.2.1 – ALGUMAS PROPRIEDADES DO VALOR ESPERADO

  1. Se a for uma constante numérica , então: E(a)=a;

  2. Se a for uma constante numérica e X uma variável aleatória: E(aX)=aE(X);

  3. Se a 1 , a 2 , ..., an forem constantes numéricas e X 1 , X 2 , ..., Xn variáveis aleatórias: E(a 1 X 1 +a 2 X 2 +...+an Xn )=a 1 E(X 1 )+a 2 E(X 2 )+...+an E(Xn );

  4. Se X 1 , X 2 , ..., Xn variáveis aleatórias independentes ⇒ E(X 1 X 2 ... Xn )= E(X 1 )E(X 2 )...E(Xn ) OBS.: A volta não é necessariamente verdadeira. Há exemplos onde E(X 1 X 2 )=E(X 1 )E(X 2 ) ⇒/ X 1 , X 2 VAs indep

1.7.3 - VARIÂNCIA E DESVIO-PADRÃO

Seja X uma variável aleatória e E(X)=μ. A variância é uma medida que indica a dispersão dos valores da va X em torno da média, definida como:

VAR(X)=σx^2 =E[(X-μ)^2 ]

A raiz quadrada positiva de σx^2 , σx é definida como o desvio-padrão de X

1.7.3.1 – ALGUMAS PROPRIEDADES DA VARIÂNCIA

1) VAR(X)=E(X^2 )-E(X)^2 ≥0;

  1. Se a for uma constante numérica , então: VAR(a)=0;

  2. Se a for uma constante numérica e X uma variável aleatória: VAR(aX)=a^2 VAR(X) VAR(a+X)=VAR(X);

  3. Se a 1 , a 2 , ..., an forem constantes numéricas e X 1 , X 2 , ..., Xn variáveis aleatórias independentes: VAR(a 1 X 1 +a 2 X 2 +...+an Xn )=a 12 VAR(X 1 )+a 22 VAR(X 2 )+...+an^2 VAR(Xn )

1.7.4 - COVARIÂNCIA

A covariância entre duas variáveis aleatórias X e Y com médias μx e μy indica o tipo de relacionamento entre essas variáveis pelo seu sinal, é definida como a seguir:

COV(X,Y)=E[(X-μx)(Y-μy)]

Quando seu sinal e positivo podemos afirmar que, na média, existe uma tendência para que quando os valores de X estiverem acima da sua média (μx) - valores grandes -, Y também estará acima da sua média (μy) e quando valores de X estiverem abaixo da sua média - valores pequenos -, Y também estará abaixo da sua média. Quando seu sinal é negativo, a conclusão será invertida, ou seja, valores grandes de X acontecem quando Y tende a ser pequeno e vice versa. Quando seu valor é nulo, se X é grande ou pequeno, nada podemos concluir com relação a Y.

1.7.4.1 – ALGUMAS PROPRIEDADES DA COVARIÂNCIA

  1. COV(X,Y)=COV(Y,X)=E(XY)-μxμy;

  2. COV(aW+bX,dY)=adCOV(W,Y)+bdCOV(X,Y), onde a,b,d constantes numéricas;

  3. COV(a+bX,c+dY)=bdCOV(X,Y), onde a,b,c,d constantes numéricas;

  4. COV(a,X)=0, onde a é uma constante;

  5. Se X e Y são independentes: COV(X,Y)=0;

  6. VAR(X+Y)=VAR(X)+VAR(Y)+2COV(X,Y);

  7. VAR(X-Y)=VAR(X)+VAR(Y)-2COV(X,Y);

  8. Se a 1 , a 2 , ..., an forem constantes numéricas e X 1 , X 2 , ..., Xn variáveis aleatórias, então:

= = = =+

n 1

i 1

n

ji 1

i j i j

n

i 1

n

i 1

i

2 VAR( ai Xi) aiVAR(X) 2 aa COV(X,X)

Exemplos: Sejam duas populações (ou variáveis aleatórias) X e Y com N elementos cada. Se cada elemento dessas populações tiver igual probabilidade (1/N), então:

X

N

X

X

N

E(X) (X )

N

i 1

N i

i 1

i

N

i 1

N

1

=μx = i⋅ = = =

= = =

Y

N

Y

E(Y)

N

i 1

i

=μy = =

=

1.8.2 - DISTRIBUIÇÃO QUI-QUADRADO

É outro caso particular da fdp Gama: Gama(k/2,1/2) onde k é chamado de graus de liberdade da distribuição. Apresenta importantes aplicações na inferência estatística clássica e na inferência não paramétrica. Alguns valores dessa distribuição encontram-se tabelados em livros sobre o assunto.

1.8.3 - DISTRIBUIÇÃO NORMAL (DE GAUSS OU GAUSSIANA)

Uma va X tem distribuição de probabilidades Normal com parâmetros (μ,σ^2 ) se:

f x e

x ( )

( )

1 −^ −

2 2 2 σ π

μ σ (^) , x é número real

Pode-se demonstrar que: E(X)=μ VAR(X)=σ^2 f(μ) é o máximo de f(x)

Trata-se de uma das distribuições mais importantes do cálculo de probabilidades e da inferência estatística. Isso porque além das observações empíricas, já foi demonstrado teoricamente que muitas das situações aleatórias do mundo real podem ser modeladas ou aproximadas por essa distribuição de probabilidades. No gráfico abaixo podemos perceber a importante propriedade de simetria desta fdp.

Distribuicão Normal(150,30) - f(x)

(^01734516885) 102119136153170187204221238255272289 X

fdp

Devido a sua grande importância, esta distribuição de probabilidades encontra-se tabelada em praticamente todos os livros que abordam este assunto. Para tanto deve-se proceder a uma transformação linear que padroniza essa distribuição como uma Normal(0,1). Toda Normal(μ,σ^2 ) pode ser convertida para a Normal(0,1).

Propriedades da distribuição normal:

  1. Sejam X 1 ~Normal(μ 1 ,σ 12 ), X 2 ~Normal(μ 2 ,σ 22 ), ..., Xn ~Normal(μn ,σn^2 ), e a 1 , a 2 , ..., an

constantes, então: G a X ~Normal( a , )

2 g

n

i 1

g 1 i

n

i 1

= ∑ i i μ =∑ μ σ

= =

(combinação linear de

v.as. Normais também tem distribuição Normal)

  1. Se X ~ Normal(μ,σ^2 ) então Z

x

− μ σ

~ Normal(0,1) (padronização)

  1. P(0a)=P(Z<-a), onde a é constante. (simetria)

1.9 - TEOREMA DO LIMITE CENTRAL (uma de suas versões)

Se X 1 , X 2 , ..., Xn são variáveis aleatórias independentes com médias μ 1 , μ 2 , ...,μn e

variâncias σ 12 , σ 22 , ..., σn^2 respectivamente, então a distribuição de Y X (^) i i

n

=

1

tende a uma

distribuição Normal com média E Y (^) i i

n ( ) = =

1

e variância VAR Y (^) i i

n ( ) = =

∑ σ^

2 1

quando n→∞.

Trata-se de um dos resultados mais importantes do cálculo de probabilidades, já que, toda vez que pudermos supor que a componente aleatória de um modelo seja provocado por uma grande quantidade de fatores causais independentes com distribuições desconhecidas, podemos modelar a distribuição de probabilidades da soma desses fatores pela distribuição Normal.

1.10 - OUTROS TEOREMAS

  1. Sejam Z 1 , Z 2 , ..., Zk variáveis normais padronizadas (Normal(0,1)) independentes. Então, a

quantidade Z Z (^) i i

k

=

2 1

tem distribuição Qui-quadrado ( χ (^) k^2 )com k graus de liberdade.

  1. Sejam Z 1 ~ Normal(0,1) e Z 2 ~ χ (^2) k^ independentes, então a transformação t

Z

Z k

2 /^

têm

distribuição t de Student (t (^) k ) com k graus de liberdade. Esta distribuição também é simétrica e converge para a distribuição Normal quando k→∞. Também a encontramos tabelada em muitos livros.

3) Sejam Z 1 ~ χ k1^2 e Z 2 ~ χk 2

2 independentes , então a transformação F

Z k Z k

2 2

segue a

distribuição F de Fisher ( Fk 1 , k 2 ) com k 1 e k 2 graus de liberdade. É comum encontrá-la

tabelada em livros.