Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas


Distribuições Amostrais e Teorema do Limite Central, Notas de aula de Engenharia Mecânica

Texto contento as notas de aula dos assuntos Distribuições Amostrais e Teorema do Limite Central do curso de Probabilidade e Estatística (MOQ-13) do Instituto Tecnológico de Aeronáutica.

Tipologia: Notas de aula

2014

Compartilhado em 16/05/2014

filipe-moreira-17
filipe-moreira-17 🇧🇷

5

(1)

4 documentos

1 / 14

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
CEEAA - 2013
AA-807: Pesquisa Operacional Aplicada em Defesa
Filipe RODRIGUES de Souza Moreira
AULA 06
PRINCÍPIOS DE ESTATÍSTICA,
DISTRIBUIÇÕES AMOSTRAIS E TEOREMA DO LIMITE CENTRAL
As quatro primeiras aulas serviram de base para que se entendam os principais conceitos e
distribuições de probabilidades, bem como para que se saiba calcular e avaliar parâmetros como média e
variância de cada distribuição. Esse conhecimento será a partir dessa aula, sairá da esfera, de estudo puro,
para o contexto de estudo aplicado.
I. Princípios da Estatística
A Estatística é uma parte fundamental da Matemática que ajuda a se fazer estudos de um grupo
como um todo, chamado população, a partir do conhecimento pleno de um subconjunto desse grupo de
interesse. Esse subconjunto é chamado de amostra.
Figura 1. Diferença entre Estatística e Probabilidade. Fonte: [SCARPEL, 2011]
Para que fique claro como a Estatística faz parte do dia a dia de um pesquisador, desde sua etapa
de formação principal, tome como exemplo os laboratórios de Física. As experiências levavam o aluno ao
levantamento de dados que posteriormente seriam extrapolados para alguma curva, ou uma reta, sendo
que ao se conhecer a equação desse lugar geométrico, algum parâmetro de interesse poderia ser estimado.
Isso é um exemplo de como conhecendo apenas parte da realidade, é possível estimar um todo. O fato de
um conjunto de dados se ajustarem bem em um modelo, a princípio não garantem que todos os dados
futuros também vão se ajustar, mas tendo em vista que os dados são obtidos por um processo semelhante
a todos os futuros, ou reais, então passa a ser uma hipótese razoável aceitar que o modelo explica com um
determinado nível de confiança toda a realidade. Recapitulando: “Em probabilidade assume-se que a
população em estudo é conhecida” [SCARPEL, 2011], já “em Estatística, amostras são analisadas para se
chegar a conclusões sobre a população” [SCARPEL, 2011].
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe

Pré-visualização parcial do texto

Baixe Distribuições Amostrais e Teorema do Limite Central e outras Notas de aula em PDF para Engenharia Mecânica, somente na Docsity!

CEEAA - 2013

AA-807: Pesquisa Operacional Aplicada em Defesa

Filipe RODRIGUES de Souza Moreira

AULA 06

PRINCÍPIOS DE ESTATÍSTICA,
DISTRIBUIÇÕES AMOSTRAIS E TEOREMA DO LIMITE CENTRAL

As quatro primeiras aulas serviram de base para que se entendam os principais conceitos e distribuições de probabilidades, bem como para que se saiba calcular e avaliar parâmetros como média e variância de cada distribuição. Esse conhecimento será a partir dessa aula, sairá da esfera, de estudo puro, para o contexto de estudo aplicado.

I. Princípios da Estatística

A Estatística é uma parte fundamental da Matemática que ajuda a se fazer estudos de um grupo como um todo, chamado população , a partir do conhecimento pleno de um subconjunto desse grupo de interesse. Esse subconjunto é chamado de amostra.

Figura 1. Diferença entre Estatística e Probabilidade. Fonte: [SCARPEL, 2011]

Para que fique claro como a Estatística faz parte do dia a dia de um pesquisador, desde sua etapa de formação principal, tome como exemplo os laboratórios de Física. As experiências levavam o aluno ao levantamento de dados que posteriormente seriam extrapolados para alguma curva, ou uma reta, sendo que ao se conhecer a equação desse lugar geométrico, algum parâmetro de interesse poderia ser estimado. Isso é um exemplo de como conhecendo apenas parte da realidade, é possível estimar um todo. O fato de um conjunto de dados se ajustarem bem em um modelo, a princípio não garantem que todos os dados futuros também vão se ajustar, mas tendo em vista que os dados são obtidos por um processo semelhante a todos os futuros, ou reais, então passa a ser uma hipótese razoável aceitar que o modelo explica com um determinado nível de confiança toda a realidade. Recapitulando: “Em probabilidade assume-se que a população em estudo é conhecida” [SCARPEL, 2011], já “em Estatística, amostras são analisadas para se chegar a conclusões sobre a população” [SCARPEL, 2011].

O processo de criação de um modelo (equação, simulação, etc) para explicar a realidade depende de alguns passos fundamentais. Primeiramente é importante que se conheça amplamente a natureza da realidade ou da população, pois assim, é possível que se estabeleçam algumas hipóteses, que não podem ser absurdas, para se determinar um modelo explicativo. Uma vez que hipóteses foram feitas, monta-se o modelo, com base na experiência do pesquisador, ou em referências que já estudaram a aplicabilidade de uma gama de modelos a vários problemas reais. O passo seguinte seria estimar os parâmetros (em geral constantes matemáticas associadas ao modelo levantado). Essa estimação depende diretamente das hipóteses que foram assumidas para a existência do modelo, daí mais uma vez, faz-se necessário que as hipóteses sejam bem representativas. Tendo em vista que o modelo está pronto e com seus parâmetros devidamente ajustados, então inferências sobre a realidade podem ser feitas através dele, no entanto, um último passo precisa ser feito que é testar a aderência do modelo na realidade. Há técnicas para a realização desse passo. A Figura 2 ilustra a sequência de passos para que se obtenha um modelo que explique a realidade.

Figura 2. Processo para a tradução da realidade através de um modelo. Fonte: [SCARPEL, 2011]

Na Figura 2, realidade pode ser encarada como a população, que é o grupo que contém todas as possíveis observações de interesse. Nem sempre se conhece tudo sobre todas as observações, por isso que é necessário extrair amostras dessa população e conhecendo-se amplamente as amostras inferências podem ser feitas sobre a população como um todo. A Figura 3 mostra uma ilustração que leva o processo ilustrado pelo esquema da Figura 2, mas para um contexto de população e amostra.

Figura 3. Processo para a explicação da População através de uma Amostra. Fonte: [SCARPEL, 2011]

No contexto de população e amostra, a etapa das hipóteses pode ser entendida como a suposição de que cada observação corresponde a uma variável aleatória X de distribuição de probabilidades expressa

[ 1 2 1 2 ] 1 2 [ 1 2 ]

1 1

ln ( , , , ; , , , ) ln ( ; , , , ) ln ( ; , , , )

n n n m k m k m k k

f x x x θ θ θ f x θ θ θ f x θ θ θ

=^ =

  (^) ∏  (^) ∑  (3)

Finalizando, para obter cada estimador, basta resolver o sistema:

( [^ ])

( [^ ])

( [ ])

1 2 1 2 1

1 2 1 2 2

1 2 1 2

ln ( , , , ; , , , ) 0

ln ( , , , ; , , , ) 0

ln ( , , , ; , , , ) 0

n m

n m

n m m

f x x x

f x x x

f x x x

Observe o exemplo para aplicação do método, considerando que X (^) i é uma variável aleatória

exponencial negativa de parâmetro λ.

1 2 (^ )^1 1 1

n k k k

n n x x n n k k k

f x x x f x e e

λ

− − = =

 = (^) ∏ = (^) ∏ = ⇒

1 2 (^ [^1 2 ]) 1 1

ln( ( , , , ; )) ln( ) ln ( , , , ; ) 0

n n n k n k k k

n

f x x x λ n λ λ x f x x x λ x

∑ (^) ∂ ∑

1

n k k

n

x

=

II.2 Método dos Momentos

A ideia básica sobre o método dos momentos é igualar características fundamentais da amostra com o respectivo valor esperado da população. Por exemplo, a média: O método dos momentos prevê que a média retirada da amostra seja igualada ao valor esperado da média da população. Dessa maneira, calculam-se os parâmetros da distribuição.

O valor de E X [ k ]é chamado de o k-ésimo momento da população de distribuição f ( ) x. No caso

da amostra a expressão para o k-ésimo momento é dada por 1

n k i i

n x

∑.

Sejam X 1 , X 2 , , Xn , variáveis aleatórias com distribuição conjunta f ( x 1 , x 2 , , xn ; θ 1 , θ 2 , , θ m ),

então os m parâmetros θ 1 , θ 2 ,  , θ m podem ser obtidos se os primeiros m momentos da população forem

igualados aos primeiros m momentos de uma amostra dessa população.

1 2 2 1

1

[ ] (1/ )
[ ] (1/ )
[ ] (1/ )

n i i n i i n

m m i i

E X n x

E X n x

E X n x

=

=

=

Conforme pode ser observado na equação (6), o primeiro momento já gera um estimador para a

média da população μˆ. O segundo momento, por sua vez, pode ser utilizado para calcular a variância,

tendo em vista que ela pode ser escrita da forma ( )

2 2 Var X ( ) = E X [ ] − E X [ ] , logo:

2 2 2 1 1

n n i i i i

σ n x n x

= =

∑ ∑ (7)

Observe o mesmo exemplo que foi resolvido acima, pelo método da Máxima Verossimilhança, agora sendo feito pelo método dos momentos. Considere que X (^) i seja uma variável aleatória exponencial

negativa de parâmetro λ. Como nessa variável há apenas um parâmetro a ser estimado, então será utilizado apenas o primeiro momento.

1 1 1

[ ] (1/ )^ ˆ

n i (^) n i i i

n E X n x x

=

= = (^) ∑ ⇔ = ∑

Como resultado de (8) podemos concluir que o estimador para λˆ tem o mesmo resultado com

ambos os métodos apresentados. Há outros métodos, como o dos mínimos quadrados, mas vamos deixar a cargo do leitor, uma pesquisa de outros métodos caso ele tenha necessidade. Segue abaixo a Tabela 1, contendo um resumo dos resultados de média e variância das principais variáveis aleatórias contínuas e discretas.

Tabela 1. Resumo das principais distribuições Distribuição E X [^^ ] Var X (^^ ) Nº de Parâmetros

Uniforme: XU a b ( , ) 2

a + b ( )^2 12

ba 2

Exponencial Negativa:

X ∼ Exp ( λ)

Normal: X ∼ N ( μ σ, 2 )^ μ^ σ 2 2

Gamma: X ∼ Gamma ( α β, )^ αβ^ αβ 2 2

Bernoulli: XBernoulli p ( ) p^ p (1 − p ) 1 Binomial: XBin n p ( ; ) np^ np (1 − p ) 1

Poisson: X ∼ Poi ( λ) λ λ 1

[ ]
[ ˆ]

X E X np E p E p n n n

De acordo com o resultado da equação (10), o estimador p ˆ^ = X / n , para a proporção é um

estimador não viesado. Como exercício para o leitor, demonstre que para uma população com média μ e

variância σ 2 ,

( )

2 (^2 ) 1

n i i

X X

s n

=

∑ é um estimador não tendencioso para a variância.

III. Distribuições Amostrais

Conforme foi falado nos capítulos anteriores o objetivo de se identificar média e variância de uma amostra se dão para que, através desses parâmetros pontuais, inferências possam ser feitas, considerando a população como um todo. Em geral, se desconhecem média e variância reais da população. Podemos definir “Estatística, como sendo qualquer quantidade fujo valor pode ser calculado a partir de uma amostra” [SCARPEL, 2011]. Esses valores são incertos, por isso, as estatísticas são consideradas variáveis aleatórias, e aqui já vem a hipótese de que elas sejam iid (independentes e igualmente distribuídas). Nesse capítulo vamos estudar as distribuições dessas estatísticas que são chamadas de distribuições amostrais. Como as amostras são retiradas de uma população, então “as distribuições amostrais, dependem da distribuição da população, do tamanho da amostra e do método de amostragem” [SCARPEL, 2011].

III.1 Distribuição da Média Amostral

Sejam X 1 , X 2 ,  , Xn , variáveis aleatórias, retiradas de uma população normal com média μ e

variância σ 2. Dessa forma:

1 2 1

[ ]

n n i i

X X X n E X E E X n n n

=

 +^ +^ +^   

E X [ ]= μ (11)

Sob a hipótese de que as observações da amostra são variáveis aleatórias iid , então a variância da média amostral é dada por:

2 2 Var X [ ] E X^^1 X^^2 X^ n^ E X^^1 X^^2 Xn n n

 ^ ^  ^ ^ 

1 2 1 2 2 2 1 1 1 1 1 1

2 [ ] 2 [ ] [ ]

n n n n n n i j i i i j i i j i i i j i

E X X X E X E X E X

n n

− −

= = = + = = = +

  ^ ^  ^  ^ 

∑ ∑ ∑ ∑ ∑ ∑

( (^ ))

2 1 1 2 2 1 1 1 1 1

[ ] [ ] 2 [ ] [ ] [ ]

n n n n n i i j i i j i i j i i j i

E X E X E X X E X E X

n

− −

= = = + = = +

 ^ ^ ^ 

1 2 2 2 2 1 1 1 1

[ ] 2 [ , ] [ ]

n n n n i j i i i i j i i

n Var X COV X X Var X n n n

= = = + =

  ^ ^  ^ 

2 Var X [ ] n

Os resultados (11) e (12) mostram que não importa qual seja a amostra colhida, se as condições de iid forem satisfeitas, a amostra estará centrada na média da população e quanto maior for o tamanho da amostra, menos dispersa da média essa distribuição será. Dessa forma, podemos dizer que se a amostra é

retirada de uma população normal com média μ e variância σ 2 , então, para qualquer valor de n menor

ou igual ao tamanho da população:

2 ,

X
X N Z

n n

  ⇔^ = 

Se caso o interesse for, a distribuição da somatória das observações da amostra, então o resultado acima se torna:

2 2 2 1

n o o i i

T n T X N n n N n n Z n (^) n

 ^ ^ ^ 

∑ ∼^ (14)

Considere agora uma combinação linear das variáveis aleatórias X 1 (^) , X (^) 2 ,  , Xn , todas iid, retiradas

de uma populações normais de médias μ i e variâncias σ i^2. Sendo Y = a X 1 1 + a X 2 2 +  + a Xn n então:

E Y [ ] = a 1 μ 1 +  + an μ n (15)

2 2 2 2

Var Y [ ] = a 1 σ 1 +  + an σ n (16)

Um resultado muito útil, que é um corolário dos resultados expressos em (15) e (16) é a distribuição da diferença das médias amostrais, retiradas de populações normais. Suponha que A e B

sejam duas populações normais tais que A ∼ N ( μ A , σ A^2 ) e B ∼ N ( μ B , σ^2 B ). Assim, considerando duas

u G Y P Y y P Z y P Z y P Z y F y F y F u F u

= = ≤ = ≤ = ≤ − ≤ − = − − = − − ⇔

( ) ( ) [ ( ) ( )] 1 2 ( )

dG Y dG Y du d F u F u du f u g y f u f u dy du dy du dy (^) y y

2 1 2 2 1 ( ). ; , 2

  1. 2 2

u y e e g y Gamma x y y

    ^ 

O comentário mais importante para o resultado expresso por (19) é que esse caso particular da

variável aleatória

Gamma^ ^ x α = β= 

é chamado de distribuição chi-quadrado. Observe que o

domínio da fdp normal padrão é em todos os Reais, no entanto, dessa variável aletória chi-quadrado, o domínio é y ∈[0, +∞). Dessa forma, com o resultado de (19), se pode dizer que o quadrado de uma

variável aleatória normal padrão possui uma distribuição chi-quadrado. É possível provar que essa

variável aleatória na verdade está associada a outro parâmetro ν que significa a quantidade de graus de

liberdade, que está diretamente ligado à somatória de variáveis aleatórias normais padrão. Uma chi- quadrado de n graus de liberdade é obtida somando-se os quadrados de n variáveis aleatórias normais padrão. Como na equação (18) há um parâmetro que foi já estimado, um grau de liberdade foi perdido, então chega-se que o resultado da equação (18) está diretamente ligado a uma distribuição chi-quadrado de n -1 graus de liberdade. Sem mais demonstrações, prova-se que a variável aleatória:

( )

2 2 1 2 2 2 1

n i i n

X X

n s

Y χ

= −

∑ ∼ (20)

Observe as Figuras 4 e 5. Elas trazem os valores tabelados da FDA de uma chi-quadrado com ν

graus de liberdade. Observe pela Figura 4, que α é a probabilidade associada à área sob a cauda do

gráfico da fdp.

Figura 4. Gráfico da chi-quadrado. Fonte: [DEVORE, 2010]

Figura 5. Tabela de distribuição acumulada da chi-quadrado. Fonte: [DEVORE, 2010]

Como exemplo, se quisermos saber qual é o ponto do domínio da chi-quadrado tal que a partir do qual, a probabilidade é 0,05, para 8 graus de liberdade, então basta ler diretamente a tabela na linha 8 e

coluna correspondente a α = 0, 05.

Figura 6. Ilustração de leitura da tabela da chi-quadrado

de “ t- crítico ”. O t-crítico, ou t α ν, representa a probabilidade associada à área da cauda da fdp, cauda essa

definida para valores do domínio a partir do t-crítico. A Figura 8 ilustra a definição do t-crítico.

Figura 8. Posição do t-crítico na fdp da t-student. Fonte: [DEVORE, 2010]

Figura 9. Tabela de distribuição acumulada da t-student. Fonte: [DEVORE, 2010]

BIBLIOGRAFIA

SCARPEL, R. A. Notas da Aula 9 do curso de MOQ-13 – Probabilidade e Estatística. 2011.

MEYER, P. L. Probabilidade: Aplicações à Estatística. 1º Edição. Rio de janeiro: LIVROS TÉCNICOS E CIENTÍFICOS EDITORA S.A., 1976. 405 p.

DEVORE, J. L. Probability & Statistics for Engineering and the Sciences. 8th^ edition. California: BROOKS/COLE CENGAGE Learning, 2010. 687 p.

SPIEGEL, M. Y. R. Estatística. 2º Edição, 2º Reimpressão. Rio de Janeiro: McGRAW HILL DO BRASIL, LTDA, 1971. 571 p.