








Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Encontra documentos específicos para os exames da tua universidade
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Texto contento as notas de aula dos assuntos Distribuições Amostrais e Teorema do Limite Central do curso de Probabilidade e Estatística (MOQ-13) do Instituto Tecnológico de Aeronáutica.
Tipologia: Notas de aula
1 / 14
Esta página não é visível na pré-visualização
Não perca as partes importantes!









As quatro primeiras aulas serviram de base para que se entendam os principais conceitos e distribuições de probabilidades, bem como para que se saiba calcular e avaliar parâmetros como média e variância de cada distribuição. Esse conhecimento será a partir dessa aula, sairá da esfera, de estudo puro, para o contexto de estudo aplicado.
A Estatística é uma parte fundamental da Matemática que ajuda a se fazer estudos de um grupo como um todo, chamado população , a partir do conhecimento pleno de um subconjunto desse grupo de interesse. Esse subconjunto é chamado de amostra.
Figura 1. Diferença entre Estatística e Probabilidade. Fonte: [SCARPEL, 2011]
Para que fique claro como a Estatística faz parte do dia a dia de um pesquisador, desde sua etapa de formação principal, tome como exemplo os laboratórios de Física. As experiências levavam o aluno ao levantamento de dados que posteriormente seriam extrapolados para alguma curva, ou uma reta, sendo que ao se conhecer a equação desse lugar geométrico, algum parâmetro de interesse poderia ser estimado. Isso é um exemplo de como conhecendo apenas parte da realidade, é possível estimar um todo. O fato de um conjunto de dados se ajustarem bem em um modelo, a princípio não garantem que todos os dados futuros também vão se ajustar, mas tendo em vista que os dados são obtidos por um processo semelhante a todos os futuros, ou reais, então passa a ser uma hipótese razoável aceitar que o modelo explica com um determinado nível de confiança toda a realidade. Recapitulando: “Em probabilidade assume-se que a população em estudo é conhecida” [SCARPEL, 2011], já “em Estatística, amostras são analisadas para se chegar a conclusões sobre a população” [SCARPEL, 2011].
O processo de criação de um modelo (equação, simulação, etc) para explicar a realidade depende de alguns passos fundamentais. Primeiramente é importante que se conheça amplamente a natureza da realidade ou da população, pois assim, é possível que se estabeleçam algumas hipóteses, que não podem ser absurdas, para se determinar um modelo explicativo. Uma vez que hipóteses foram feitas, monta-se o modelo, com base na experiência do pesquisador, ou em referências que já estudaram a aplicabilidade de uma gama de modelos a vários problemas reais. O passo seguinte seria estimar os parâmetros (em geral constantes matemáticas associadas ao modelo levantado). Essa estimação depende diretamente das hipóteses que foram assumidas para a existência do modelo, daí mais uma vez, faz-se necessário que as hipóteses sejam bem representativas. Tendo em vista que o modelo está pronto e com seus parâmetros devidamente ajustados, então inferências sobre a realidade podem ser feitas através dele, no entanto, um último passo precisa ser feito que é testar a aderência do modelo na realidade. Há técnicas para a realização desse passo. A Figura 2 ilustra a sequência de passos para que se obtenha um modelo que explique a realidade.
Figura 2. Processo para a tradução da realidade através de um modelo. Fonte: [SCARPEL, 2011]
Na Figura 2, realidade pode ser encarada como a população, que é o grupo que contém todas as possíveis observações de interesse. Nem sempre se conhece tudo sobre todas as observações, por isso que é necessário extrair amostras dessa população e conhecendo-se amplamente as amostras inferências podem ser feitas sobre a população como um todo. A Figura 3 mostra uma ilustração que leva o processo ilustrado pelo esquema da Figura 2, mas para um contexto de população e amostra.
Figura 3. Processo para a explicação da População através de uma Amostra. Fonte: [SCARPEL, 2011]
No contexto de população e amostra, a etapa das hipóteses pode ser entendida como a suposição de que cada observação corresponde a uma variável aleatória X de distribuição de probabilidades expressa
1 1
ln ( , , , ; , , , ) ln ( ; , , , ) ln ( ; , , , )
n n n m k m k m k k
=^ =
(^) ∏ (^) ∑ (3)
Finalizando, para obter cada estimador, basta resolver o sistema:
( [^ ])
( [^ ])
( [ ])
1 2 1 2 1
1 2 1 2 2
1 2 1 2
ln ( , , , ; , , , ) 0
ln ( , , , ; , , , ) 0
ln ( , , , ; , , , ) 0
n m
n m
n m m
f x x x
f x x x
f x x x
Observe o exemplo para aplicação do método, considerando que X (^) i é uma variável aleatória
exponencial negativa de parâmetro λ.
1 2 (^ )^1 1 1
n k k k
n n x x n n k k k
f x x x f x e e
λ
− − = =
= (^) ∏ = (^) ∏ = ⇒
1 2 (^ [^1 2 ]) 1 1
ln( ( , , , ; )) ln( ) ln ( , , , ; ) 0
n n n k n k k k
n
∑ (^) ∂ ∑
1
n k k
n
x
=
∑
II.2 Método dos Momentos
A ideia básica sobre o método dos momentos é igualar características fundamentais da amostra com o respectivo valor esperado da população. Por exemplo, a média: O método dos momentos prevê que a média retirada da amostra seja igualada ao valor esperado da média da população. Dessa maneira, calculam-se os parâmetros da distribuição.
O valor de E X [ k ]é chamado de o k-ésimo momento da população de distribuição f ( ) x. No caso
da amostra a expressão para o k-ésimo momento é dada por 1
n k i i
∑.
igualados aos primeiros m momentos de uma amostra dessa população.
1 2 2 1
1
n i i n i i n
m m i i
E X n x
E X n x
E X n x
=
=
=
∑
∑
∑
Conforme pode ser observado na equação (6), o primeiro momento já gera um estimador para a
2 2 Var X ( ) = E X [ ] − E X [ ] , logo:
2 2 2 1 1
n n i i i i
= =
∑ ∑ (7)
Observe o mesmo exemplo que foi resolvido acima, pelo método da Máxima Verossimilhança, agora sendo feito pelo método dos momentos. Considere que X (^) i seja uma variável aleatória exponencial
negativa de parâmetro λ. Como nessa variável há apenas um parâmetro a ser estimado, então será utilizado apenas o primeiro momento.
1 1 1
n i (^) n i i i
n E X n x x
= = (^) ∑ ⇔ = ∑
ambos os métodos apresentados. Há outros métodos, como o dos mínimos quadrados, mas vamos deixar a cargo do leitor, uma pesquisa de outros métodos caso ele tenha necessidade. Segue abaixo a Tabela 1, contendo um resumo dos resultados de média e variância das principais variáveis aleatórias contínuas e discretas.
Tabela 1. Resumo das principais distribuições Distribuição E X [^^ ] Var X (^^ ) Nº de Parâmetros
Uniforme: X ∼ U a b ( , ) 2
a + b ( )^2 12
b − a 2
Exponencial Negativa:
Bernoulli: X ∼ Bernoulli p ( ) p^ p (1 − p ) 1 Binomial: X ∼ Bin n p ( ; ) np^ np (1 − p ) 1
X E X np E p E p n n n
De acordo com o resultado da equação (10), o estimador p ˆ^ = X / n , para a proporção é um
( )
2 (^2 ) 1
n i i
s n
=
∑ é um estimador não tendencioso para a variância.
Conforme foi falado nos capítulos anteriores o objetivo de se identificar média e variância de uma amostra se dão para que, através desses parâmetros pontuais, inferências possam ser feitas, considerando a população como um todo. Em geral, se desconhecem média e variância reais da população. Podemos definir “Estatística, como sendo qualquer quantidade fujo valor pode ser calculado a partir de uma amostra” [SCARPEL, 2011]. Esses valores são incertos, por isso, as estatísticas são consideradas variáveis aleatórias, e aqui já vem a hipótese de que elas sejam iid (independentes e igualmente distribuídas). Nesse capítulo vamos estudar as distribuições dessas estatísticas que são chamadas de distribuições amostrais. Como as amostras são retiradas de uma população, então “as distribuições amostrais, dependem da distribuição da população, do tamanho da amostra e do método de amostragem” [SCARPEL, 2011].
III.1 Distribuição da Média Amostral
1 2 1
n n i i
X X X n E X E E X n n n
=
∑
Sob a hipótese de que as observações da amostra são variáveis aleatórias iid , então a variância da média amostral é dada por:
2 2 Var X [ ] E X^^1 X^^2 X^ n^ E X^^1 X^^2 Xn n n
1 2 1 2 2 2 1 1 1 1 1 1
n n n n n n i j i i i j i i j i i i j i
n n
− −
= = = + = = = +
∑ ∑ ∑ ∑ ∑ ∑
2 1 1 2 2 1 1 1 1 1
n n n n n i i j i i j i i j i i j i
n
− −
= = = + = = +
1 2 2 2 2 1 1 1 1
n n n n i j i i i i j i i
n Var X COV X X Var X n n n
= = = + =
2 Var X [ ] n
Os resultados (11) e (12) mostram que não importa qual seja a amostra colhida, se as condições de iid forem satisfeitas, a amostra estará centrada na média da população e quanto maior for o tamanho da amostra, menos dispersa da média essa distribuição será. Dessa forma, podemos dizer que se a amostra é
ou igual ao tamanho da população:
2 ,
n n
Se caso o interesse for, a distribuição da somatória das observações da amostra, então o resultado acima se torna:
2 2 2 1
n o o i i
T n T X N n n N n n Z n (^) n
Considere agora uma combinação linear das variáveis aleatórias X 1 (^) , X (^) 2 , , Xn , todas iid, retiradas
2 2 2 2
Um resultado muito útil, que é um corolário dos resultados expressos em (15) e (16) é a distribuição da diferença das médias amostrais, retiradas de populações normais. Suponha que A e B
u G Y P Y y P Z y P Z y P Z y F y F y F u F u
= = ≤ = ≤ = ≤ − ≤ − = − − = − − ⇔
dG Y dG Y du d F u F u du f u g y f u f u dy du dy du dy (^) y y
2 1 2 2 1 ( ). ; , 2
u y e e g y Gamma x y y
O comentário mais importante para o resultado expresso por (19) é que esse caso particular da
variável aleatória
é chamado de distribuição chi-quadrado. Observe que o
domínio da fdp normal padrão é em todos os Reais, no entanto, dessa variável aletória chi-quadrado, o domínio é y ∈[0, +∞). Dessa forma, com o resultado de (19), se pode dizer que o quadrado de uma
variável aleatória normal padrão possui uma distribuição chi-quadrado. É possível provar que essa
liberdade, que está diretamente ligado à somatória de variáveis aleatórias normais padrão. Uma chi- quadrado de n graus de liberdade é obtida somando-se os quadrados de n variáveis aleatórias normais padrão. Como na equação (18) há um parâmetro que foi já estimado, um grau de liberdade foi perdido, então chega-se que o resultado da equação (18) está diretamente ligado a uma distribuição chi-quadrado de n -1 graus de liberdade. Sem mais demonstrações, prova-se que a variável aleatória:
( )
2 2 1 2 2 2 1
n i i n
n s
= −
∑ ∼ (20)
gráfico da fdp.
Figura 4. Gráfico da chi-quadrado. Fonte: [DEVORE, 2010]
Figura 5. Tabela de distribuição acumulada da chi-quadrado. Fonte: [DEVORE, 2010]
Como exemplo, se quisermos saber qual é o ponto do domínio da chi-quadrado tal que a partir do qual, a probabilidade é 0,05, para 8 graus de liberdade, então basta ler diretamente a tabela na linha 8 e
Figura 6. Ilustração de leitura da tabela da chi-quadrado
de “ t- crítico ”. O t-crítico, ou t α ν, representa a probabilidade associada à área da cauda da fdp, cauda essa
definida para valores do domínio a partir do t-crítico. A Figura 8 ilustra a definição do t-crítico.
Figura 8. Posição do t-crítico na fdp da t-student. Fonte: [DEVORE, 2010]
Figura 9. Tabela de distribuição acumulada da t-student. Fonte: [DEVORE, 2010]
SCARPEL, R. A. Notas da Aula 9 do curso de MOQ-13 – Probabilidade e Estatística. 2011.
MEYER, P. L. Probabilidade: Aplicações à Estatística. 1º Edição. Rio de janeiro: LIVROS TÉCNICOS E CIENTÍFICOS EDITORA S.A., 1976. 405 p.
DEVORE, J. L. Probability & Statistics for Engineering and the Sciences. 8th^ edition. California: BROOKS/COLE CENGAGE Learning, 2010. 687 p.
SPIEGEL, M. Y. R. Estatística. 2º Edição, 2º Reimpressão. Rio de Janeiro: McGRAW HILL DO BRASIL, LTDA, 1971. 571 p.