Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas


Aula 07 Estatística, Notas de aula de Estatística

Aula 07 Estatística

Tipologia: Notas de aula

2015

Compartilhado em 04/02/2015

fabiana-silva-41
fabiana-silva-41 🇧🇷

4.8

(69)

370 documentos

1 / 47

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
Estatística p/ AFRFB
Teoria e exercícios comentados
Prof. Jeronymo Marcondes - Aula 07
AULA 07 - Inferência e Estimação
SUMÁRIO PÁG IN A
Introdução à inferência estatística 2
Amostragem e estimador 2
Variância de estimadores 9
Consistência e distribuição amostral 1 3
Estimador de Máxima Verossimilhaa 1 5
Lista de Exercícios resolvidos em aula 3 8
Gabarito 4 7
Bem vindos de volta!
O que vamos estudar nesta aula é saber se nossa amostra traz evidência de que
uma determinada hipótese seja verdadeira. Complicado? Não é não! Você vai ter
que se lembrar de alguns conceitos de nossa aula 00 e estudar um pouquinho sobre
inferência primeiro.
D ica de um concurseiro
O que fazer alguns d i a s antes da prova? Essa pergunta
aflige todo concurseiro! Minha opinião? Revisão! Não adianta
ficar enfiando u m monte de coisa nova na cabeça, é melhor
consolidar o q u e você já sabe. D e v i d o à tensão, ser á muito
difícil estudar maria nova.
Prof. Jeronymo Marcondes WWW.estrategiaconcursoS.COm.br 1 d e 4 7
ATENÇÃO! ESSE MATERIAL PERTENCE AO SITE: WWW.MATERIALPARACONCURSOS.COM
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f

Pré-visualização parcial do texto

Baixe Aula 07 Estatística e outras Notas de aula em PDF para Estatística, somente na Docsity!

Teoria e exercícios comentados Prof. Jeronymo Marcondes - Aula 07

AULA 07 - Inferência e Estimação

SUMÁRIO PÁGINA

Introdução à inferência estatística 2 Amostragem e estimador 2 Variância de estimadores 9 Consistência e distribuição amostral 13 Estimador de Máxima Verossimilhança 15 Lista de Exercícios resolvidos em aula 38 Gabarito 47

Bem vindos de volta!

O que vamos estudar nesta aula é saber se nossa amostra traz evidência de que uma determinada hipótese seja verdadeira. Complicado? Não é não! Você só vai ter que se lembrar de alguns conceitos de nossa aula 00 e estudar um pouquinho sobre inferência primeiro.

Dica de um concurseiro O que fazer alguns dias antes da prova? Essa pergunta aflige todo concurseiro! Minha opinião? Revisão! Não adianta ficar enfiando um monte de coisa nova na cabeça, é melhor consolidar o que você já sabe. Devido à tensão, será muito difícil estudar matéria nova.

Prof. Jeronymo Marcondes WWW.estrategiaconcursoS.COm.br 1 de 47

Teoria e exercícios comentados Prof. Jeronymo Marcondes - Aula 07

1. Introdução à inferência estatística

1.1 Amostragem e estimador

Inferência é o processo através do qual uma pessoa tira conclusões sobre a população com base em uma amostra. Só para lembrar:

População = conjunto de todos os elementos que possuem determinada característica. Amostra = parte não nula da população, mas menor do que esta última.

O exemplo mais clássico é o da cozinheira que prova uma colher do seu preparo a fim de determinar se o mesmo está muito salgado. Ora, a colher que ela experimentou é só uma parte de seu cozido, mas, com base nesta amostra , ela irá inferir como está toda a panela.

Entendeu? Ela não precisa provar a panela toda para tirar suas conclusões, ela irá se basear somente em parte dela, isso é inferência! Na estatística é a mesma coisa, muitas vezes não temos dados sobre toda uma população, mas precisamos tirar conclusões a respeito da mesma, assim necessitaremos de inferência estatística. Isso é comum no dia a dia de um pesquisador!

A primeira pergunta que um pesquisador faria é: como obter uma determinada amostra? Ou seja, como realizar uma amostragem. Quando se realiza uma pesquisa com todos os elementos de uma população, chama-se a tal pesquisa de Censo.

A amostragem pode ser realizada de duas formas diferentes:

Prof. Jeronymo Marcondes WWW.estrategiaconcursoS.COm.br 2 de 47

Teoria e exercícios comentados Prof. Jeronymo Marcondes - Aula 07

Amostragem Aleatória Estratificada (AAE)

Neste caso, a população seria dividida em estratos, seguindo-se a aplicação de uma AAS em cada um destes. Estes "estratos” seriam subconjuntos da população bastante semelhantes entre si.

Quer um exemplo? Suponha que tenhamos uma população com a renda de diversos indivíduos em uma economia. Podemos dividir a população em "classe baixa”, "classe média” e "classe alta”. A partir daí, aplicaríamos uma AAS em cada um destes estratos para obtermos nossa amostra. A ideia deste procedimento é diminuir a variância dentro das amostras para cada estrato. Perceba que qualquer estatística a ser aplicada à amostra deve ser ponderada pelo tamanho do estrato.

Atenção, a amostra de cada estrato será proporcional ao tamanho de cada uma de suas populações no caso de uma AAE proporcional. Porém, este não é o único tipo de AAE, pois poderíamos ter o caso de uma AAE uniforme, na qual as amostra de cada estrato tenham o mesmo tamanho.

Amostragem Aleatória por Conglomerado

Agora, vamos tratar de um caso muito parecido com o anterior. Neste caso, a AAS será aplicada sobre os subgrupos e não mais sobre os indivíduos da população.

Por exemplo, suponha que há diversos bairros em uma cidade com variabilidade interna significativa, mas bastante semelhantes entre si. Neste caso, "sortearíamos” alguns destes bairros como "amostras” da população total. Você está realizando a amostragem sobre conglomerados, entende? Segue-se, então, uma análise de todos os indivíduos nos conglomerados escolhidos.

Prof. Jeronymo Marcondes WWW.estrategiaconcursoS.COm.br 4 de 47

Teoria e exercícios comentados Prof. Jeronymo Marcondes - Aula 07

Amostragem Sistemática

Nessa técnica supõe-se que temos uma listagem das unidades populacionais. Para um valor k fixado, sorteamos um elemento entre os k primeiros da listagem. Depois observamos, sistematicamente, indivíduos separados por k unidades. Por exemplo, se k = 10 e sorteamos o oitavo elemento, observamos depois o décimo oitavo, o vigésimo oitavo, etc.

Amostragem por Conveniência

Neste caso, o pesquisador só realiza amostragem com os casos que ele tem a sua disposição. Assim, acaba-se por realizar uma pesquisa com somente uma parcela da população, o que pode, inclusive, gerar vieses em sua conclusão. Não é possível generalizar os resultados encontrados para a população, contudo este tipo de amostragem pode ser útil no início de uma pesquisa, testar questionários, por exemplo.

Amostragem por quotas

A participação de uma determinada característica na população é utilizada para fins de geração da amostra. Por exemplo, suponha que esteja sendo feita uma pesquisa com os usuários de drogas e sabe-se que, na população, 60% dos indivíduos do que usam drogas são homens e 40% são mulheres. Assim, em uma amostra de 1000 indivíduos, a amostra será feita de tal forma que 60% dela (600) sejam homens e 40% (400) sejam mulheres.

Amostragem Intencional

O pesquisador seleciona intencionalmente os elementos que irão compor sua amostra por acreditar que estes são os que melhor representam o fenômeno que se quer estudar. Por exemplo, qual a aprovação de um partido entre os seus afiliados, isso pode ser feito em bairros ou domicílios eleitorais ligados ao mesmo.

Prof. Jeronymo Marcondes WWW.estrategiaconcursoS.COm.br 5 de 47

Estratégia r n N r i i R « ; r > < ;C O N C U R S O S^ Estatística p/ AFRFB

Teoria e exercícios comentados Prof. Jeronymo Marcondes - Aula 07 Isso está aproximadamente correto, mas nem sempre a mesma “fórmula” que utilizamos para o cálculo de uma estatística na população é a que devemos usar na amostra. Isso deriva do fato de que o estimador que iremos utilizar na amostra deve ser não viesado.

Se eu digo para vocês que um estimador não é viesado, eu estou dizendo que, na média, ele “acerta” , ou seja, dá o valor “real” do parâmetro. Ou seja:

Esperança matemática é um conceito intimamente relacionado com a média aritmética. No caso, para um dado conjunto de valores (X) que vai de X1 a Xn, sua esperança é dada por:

Percebeu? A aplicação do operador “esperança” a uma série de dados nos diz, em termos bem simples, a média do que pode acontecer com esta variável.

Entendeu? A esperança do estimador de um parâmetro populacional é igual ao seu valor “real”. O que você quer é que sua estimativa esteja certa, na média!

Prof. Jeronymo Marcondes WWW.estrategiaconcursoS.COm.br 7 de 47

E(estimador) = parâmetro

Sendo E{ ■) o operador esperança.

INDO

mais fundo

E {X )= X 1 - f 1 + X 2 - f 2 ...Xn -fn Sendo f t a frequência relativa de X t.

Teoria e exercícios comentados Prof. Jeronymo Marcondes - Aula 07

Vou ressaltar uma coisa que confunde muita gente. Você consegue perceber que se você realizar o experimento de cálculo da média amostrai para diferentes amostras dentro de uma população, você terá estimativas diferentes? Olhe, os valores que estarão contidos em sua amostra provavelmente serão diferentes para cada vez que você realizar uma amostragem diferente, mesmo sabendo que estes valores pertencem à mesma população. Então, com certeza, sua média amostral será diferente. O que você quer é que, na média destas estatísticas calculadas, você acerte o valor populacional. Ou seja, a média amostrai pode ser considerada como uma variável aleatória. Esta variável, como é um estimador não viesado da média populacional, significa que a média das médias amostrais é igual à média populacional.

Pode-se provar que:

E(0) = 0

Ou seja, a esperança do estimador da média amostral é igual à média populacional. (vamos mostrar isso no exercício 18)

Portanto, se um exercício de concurso te pedir a média de uma determinada amostra, basta calcu lar a média como sempre fizemos para a população ( ^ ) , pois este é um estimador não viesado para a média populacional.

Outra estatística que é comumente cobrada em concursos é a variância (por consequência, o desvio padrão também).

Só que agora o buraco é mais embaixo! A estatística que aprendemos para calcular a variância de uma população é dada por:

Prof. Jeronymo Marcondes WWW.estrategiaconcursoS.COm.br 8 de 47

Teoria e exercícios comentados Prof. Jeronymo Marcondes - Aula 07

Vari ãncia = S2 n —1 - x ) 2

Desvio Padrão = S =

-“A única diferença é que o denominador deixa de ser (n) e passa a ser ( n - 1)”?

Exato!

I(Xj - x ) 2

n —

Portanto, se um exercício de concurso te pedir a variância ou desvio padrão de uma determinada amostra, calcule o numerador como sempre, mas divida este valor por ( n - 1)!

Apesar de estas não serem as únicas estatísticas que podem ser avaliadas em termos da comparação parâmetro\estimador, para fins de concurso, estas são as mais cobradas.

1.2 Variância de estimadores

-"Como assim, variância de um estimado r”?

Pense comigo, não basta que um estimador acerte na média, mas também é desejável que os seus resultados apresentem baixa variância ao redor do valor populacional que se esta tentando estimar.

Veja um exemplo gráfico:

Prof. Jeronymo Marcondes WWW.estrategiaconcursoS.COm.br 10 de 47

Teoria e exercícios comentados

Os pontinhos vermelhos seriam estimativas do valor populacional, pontinho preto, para dois estimadores diferentes.

Perceba que o segundo gráfico tem alguns valores que praticamente "acertam” o valor populacional, mas o mesmo apresenta grande variabilidade. Ou seja, o segundo estimador tem maior variância.

O ideal seria que nosso estimador não viesado tivesse a menor variância dentre todos os estimadores não viesados. Este é o conceito de estimador absolutamente eficiente.

FIQUE

atento!

Estimador absolutamente eficiente é aquele que é não viesado e que apresenta a menor variância dentre todos os estimadores não viesados possíveis para um determinado parâmetro populacional.

Prof. Jeronymo Marcondes WWW.estrategiaconcursoS.COm.br 11 de 47

Teoria e exercícios comentados Prof. Jeronymo Marcondes - Aula 07

Então, você consegue perceber que, conforme a amostra aumenta ( n aumenta de valor), o valor da variância da média amostral tende para zero! Claro, pois, neste caso, a média amostral irá coincidir com a média populacional.

Bom, a pergunta natural seria: então o estimador Ô é um estimador eficiente?

Não é possível responder isso a não ser se comparamos a variância deste último com a variância de todos os estimadores não viesados possíveis da média populacional. Pode-se demonstrar, entretanto, que, quando a variável para a qual está sendo calculada a média seguir uma distribuição normal, a média amostral é um estimador eficiente da média populacional.

Porém, se quisermos comparar este estimador com qualquer outro estimador possível, viesado ou não, podemos fazê-lo por meio do conceito de erro quadrático médio (EQM). Para o caso do estimador 0 , o seu erro quadrático médio seria dado por:

EQM{0) = Var(Ô) + [E(§) - O]2 = Var(Ô) + [Vi és(0)]

Perceba que o primeiro membro é a variância do estimador e o segundo é a diferença entre seu valor esperado e o seu valor populacional, que é conhecida como o valor do viés do estimador (o valor do viés é considerado ao quadrado, pois o viés pode ser negativo, assim, com este ajuste, seria possível comparar o viés de estimadores com tendência “para cima” e “para baixo”).

Isso é intuitivo, pois quanto menor o valor combinado da variância e do viés de um estimador, "mais eficiente ele será”.

Prof. Jeronymo Marcondes WWW.estrategiaconcursoS.COm.br 13 de 47

Teoria e exercícios comentados Prof. Jeronymo Marcondes - Aula 07

1.3 Consistência e distribuição amostrai

Muitas vezes não conseguiremos encontrar estimadores que tenham propriedades desejáveis, tais como eficiência e inexistência de viés. Porém, muitos deles apresentam propriedades assintóticas desejáveis.

-“O que é isso”?

Em termos bem simples, trata-se do comportamento do estimador conforme a amostra tende para o infinito.

Um estimador assintoticamente não viesado é aquele que, conforme a amostra tende ao infinito, o viés tende a zero. Este tipo de estimador é dito com propriedades desejáveis em grandes amostras!

Veja, em termos bem simples, conforme a sua amostra aproxima-se do tamanho da população, o estimador teria o seu viés diminuído até chegar a zero.

É fácil perceber que o nosso estimador 0 é assintoticamente não viesado, pois ele não é viesado! Entretanto, a recíproca não é verdadeira, pois há vários estimadores que são viesados e assintoticamente não viesados. Assim:

lim n^ mE{0 ) = 0

Para quem não é da área de exatas, o que esta simbologia está dizendo é que, no limite, quando a amostra tende ao infinito (n ^ o ), a esperança da média amostral é igual à média populacional.

O mesmo raciocínio pode ser estendido para o caso da variância do estimador. Podemos avaliar como seria o comportamento assintótico da variância de um estimador, isso é, como se dá sua variância conforme sua amostra cresce.

Prof. Jeronymo Marcondes WWW.estrategiaconcursoS.COm.br 14 de 47

Teoria e exercícios comentados Prof. Jeronymo Marcondes - Aula 07

0 que isso está dizendo é que, conforme a amostra aumenta, a distribuição da média amostral converge para uma distribuição normal! Percebe a importância disso? A distribuição normal é uma antiga conhecida nossa e nós sabemos muita coisa sobre ela (já aprendemos algumas em aulas anteriores e iremos aprender ainda mais em aulas futuras). Isso é muito útil em várias ocasiões, pois como sabemos do TLC, podemos nos basear nisso para entendermos o comportamento assintótico da média amostral de qualquer variável!

Bom, chega de um papo tão teórico, vamos estudar alguns estimadores importantes! O principal é o Estimador de Mínimos Quadrados Ordinários (MQO), mas ele é tão importante que teremos uma aula inteiramente dedicada a ele - “Correlação e Regressão”. A estimação por intervalo será dada na aula de “Intervalo de Confiança e Testes de Hipóteses”. Nesta aula, vamos conhecer o estimador de Máxima Verossimilhança.

2. Estimador de Máxima Verossimilhança

Este é um assunto muito pouco cobrado em provas, exceto no caso do concurso do IPEA, que é mais específico. Além disso, é bem difícil! Porém, vai saber, se cair você estará pronto.

Antes de começarmos, preciso ensinar mais uma coisinha sobre cálculo diferencial.

OBS. Conceito de derivada - ponto extremo

Bom, o porquê de tudo isso é ensinar a vocês como encontrar o ponto máximo ou mínimo de uma função, isso é, um ponto extremo. 1

Como você encontra um ponto extremo de uma função? Simples! Derive a função (você já aprendeu) e iguale a zero. Por exemplo, suponha a função: / ( x ) = x 2 + x 1 Para quem entende de matemática, saiba que estamos tratando de pontos extremos locais e não globais. É só uma introdução mesmo.

Prof. Jeronymo Marcondes WWW.estrategiaconcursoS.COm.br 16 de 47

Teoria e exercícios comentados Prof. Jeronymo Marcondes - Aula 07

Neste caso, é fácil chegar à derivada ( é só derivar cada membro separadamente ):

d f(x ) = 2 x + 1

Agora, é só igualar a zero e resolver em função de x:

d f(x ) = 0 ^ 2 x + 1 = 0 ^ x = — 21

Assim, este ponto é o extremo local da função, ou seja, um ponto de mínimo ou máximo. Pode-se provar que se trata de um ponto de mínimo, mas não precisam se preocupar, pois, na prova de Estatística, o ponto extremo sempre será o que o enunciado pede. Daqui a pouco vocês vão entender.

Além disso, há outras formas mais complexas de derivada, mas a única necessária, isso se for necessária, será esta. Chega disso, vamos voltar ao estimador de máxima verossimilhança!

Retornando.

Gente, o estimador de Máxima Verossimilhança (MLE) é aquele que maximiza a probabilidade de que os valores obtidos de uma amostra sigam, de fato, uma determinada distribuição de probabilidade.

Hora de lembrar-se das aulas de Estatística! Lembrem-se das funções densidade de probabilidade, tais como a distribuição normal, a binomial, etc.

Então, como funciona? Você tem uma amostra de valores obtidos de uma população que, por hipótese, você conhece a distribuição de probabilidade (ou pelo menos supõe que seja desta forma). Com base nestas informações, o estimador MLE irá lhe fornecer os parâmetros desta distribuição de probabilidade que maximizam a chance de que esta amostra realmente siga esta distribuição!

Prof. Jeronymo Marcondes WWW.estrategiaconcursoS.COm.br 17 de 47

Estratégia r n N r i i R « ; r > < ;C O N C U R S O S^ Estatística p/ AFRFB

Teoria e exercícios comentados Prof. Jeronymo Marcondes - Aula 07

É assim, lembram-se do conceito de derivada? E de como este instrumento permite que você encontre um ponto máximo, ou seja, que maximize uma função?

É isso aí! Você tem uma amostra e uma função de distribuição, no nosso exemplo a Normal. O que nós vamos fazer é, para dados valores de xu vamos encontrar os valores de média e variância que maximizam a probabilidade que tal amostra siga esta distribuição! Como se faz isso? Derive em função dos parâmetros e iguale o resultado a zero! Não se preocupe, você não precisa saber se o ponto é de máximo ou mínimo, a banca fará a questão de forma a sempre ser um ponto extremo de máximo local!

Esta derivação é um pouco mais complicada, pois exige um conhecimento de derivada maior do que o já ensinado. Porém, isso não será cobrado, portanto, não mostrado! Mas, pode-se demonstrar que, ao maximizar a função nos parâmetros média e variância, encontraremos:

O conceito de média amostral Ou seja, o estimador da média de uma distribuição normal é a própria média amostral.

E a variância?

Opa! Mas, este não é o estimador de variância amostral já conhecido por vocês da aula de Estatística. O denominador deve ser n - 1, caso contrário o mesmo será viesado! Portanto, o estimador MLE para a variância é viesado!

Viram? O estimador MLE nem sempre é não viesado! Mas, o mesmo tem propriedades úteis, como:

Prof. Jeronymo Marcondes WWW.estrategiaconcursoS.COm.br 19 de 47

IXi

Estratégia r n N r i i R « ; r > < ;C O N C U R S O S^ Estatística p/ AFRFB

Teoria e exercícios comentados Prof. Jeronymo Marcondes - Aula 07

**1) É consistente

  1. Sua distribuição converge para a normal conforme a amostra tende ao infinito (assintoticamente normal)
  2. O estimador tende a ser eficiente conforme a amostra tende ao infinito (assintoticamente eficiente)**

-"Professor, mas porque você ensinou os conceitos básicos de derivada se não é tão simples aplicá-los no caso do exemplo que você mostrou?

Boa! Pelo seguinte, vai saber o que dá na cabeça da banca! É praticamente impossível que eles peçam que vocês derivem uma função normal convencional. Mas, de repente, eles já te dão uma versão simplificada, que permite o cálculo dos parâmetros maximizadores da função de forma simples. Foi só para prevenir mesmo. Não precisa se preocupar muito com isso!

Só para finalizarmos, como seria o estimador MLE para a probabilidade de sucesso de um evento em uma distribuição binomial.

Lembram-se da distribuição binomial? É aquela em que há dois eventos possíveis, um considerado "sucesso”, com probabilidade p , e outro, mutuamente exclusivo, considerado "fracasso”, com probabilidade 1 - p.

Então suponha que em uma amostra com n elementos, x apresentam o atributo sucesso. Você consegue adivinhar qual o estimador MLE para p?

Ou seja, é a própria proporção deste elemento na amostra como um todo, tal como no caso da média!

Simples não? É claro que não! Esta aula é muito complexa. Faça um favor a você, releia o conteúdo mais de uma vez! Vamos aos exercícios.

Prof. Jeronymo Marcondes WWW.estrategiaconcursoS.COm.br 20 de 47