






Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Encontra documentos específicos para os exames da tua universidade
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
intervalos assintóticos e amostragem estratificada
Tipologia: Trabalhos
1 / 11
Esta página não é visível na pré-visualização
Não perca as partes importantes!







Disciplina : Técnicas de amostragem Período : 2020. Aluno : Rickson Livio de Souza Gaspar
Como σ^2 h é desconhecido em ambas as expressões, pode ser substituído por seu estimador não vicíado s^2 h. Sendo assim, pode-se construir um intervalo de confiança para μ com coeficiente de confiança aproximadamente igual a 1 − α :
√√ √∑ H
h
s^2 h nh
Como Q segue uma distribuição normal padrão,que por sua vez não depende dos pa- rametros, temos uma quantidade pivotal e portanto podemos contruir seu intervalo de confiança para μ :
( q 1 ≤ Q ≤ q 2 )
( q 1 ≤
√ ∑ H h =1 W^ h^2
s^2 h nh ≤^ q^2 )
( zα 2
√ ∑ H h =1 W^ h^2
s^2 h nh ≤^ y ¯ es^ −^ μ^ ≤^ zα 2
√ ∑ H h =1 W^ h^2
s^2 h nh )
(¯ yes − zα 2
√ ∑ H h =1 W^ h^2
s^2 h nh ≤^ μ^ ≤^ y ¯ es^ +^ zα 2
√ ∑ H h =1 W^ h^2
s^2 h nh )
Obs: q 1 = − zα 2 , q 2 = zα 2
Agora construindo uma intervalo para τ de forma análoga:
√√ √∑ N
h
s^2 h nh
temos então :
( q 1 ≤ √∑ τ ˆ es − τ N h =1 N^^2^ h
s^2 h nh
≤ q 2 )
( zα 2
√ ∑ N h =1 N^ h^2
s^2 h nh ≤^ τ ˆ es^ −^ τ^ ≤^ zα 2
√ ∑ N h =1 N^ h^2
s^2 h nh )
(ˆ τes − zα 2
√ ∑ N h =1 N^ h^2
s^2 h nh ≤^ τ^ ≤^ ˆ τes^ +^ zα 2
√ ∑ N h =1 N^ h^2
s^2 h nh )
Com isso obtemos nossos intervalos de confiança para a média populacional e o total populacional.
Utilizando do resultado Q, pode-se determinar n de modo que:
P(| y ¯ es − μ | ≤ B ) ≈ 1 − α
onde,
B = zα 2
√ ∑ H h =1 W^ h^2 s^2 h nh
Dado que B depende de nh e não de n , consideramos que:
nh = nwh ,
Onde wh é conhecido, h = 1 , 2 , ..., H. Particularmente podemos considerar wh = Wh = N Nh , resultando em:
n = (^) D^1
∑ H h =
Whσ^2 h =
σ^2 d D
onde D = B
2 z^2 α 2.
Agora levaremos em consideração o interesse de estudar a ocorrência de determinada característica na população. Tal característica pode ser a preferência por uma marca de produto, por um candidato em uma eleição, etc....Nestas situações, a característica de interesse associada ao i-ésimo elemento no h-ésimo estrato pode ser representada por:
Yhi = 1, se o elemento ( h, i ) possui a característica
Yhi = 0, caso contrário
Sendo τh =
∑^ Nh i =
Yhi , o número de elementos que possuem a característica no estrato h ,
tem-se que :
∑^ H h =
WhPh ,
√ P ˆ es − P √√ √ ∑ H h =
W (^) h^2
P^ ˆ h Q ˆ h nh − 1
Desenvolvendo, analogamente à forma feita para a média e o toal, temos :
( P ˆ es − zα 2
√√ √√ ∑ H h =
W (^) h^2
P^ ˆ h Q ˆ h nh − 1
≤ P ≤ P ˆ es + zα 2
√√ √√ ∑ H h =
W (^) h^2
P^ ˆ h Q ˆ h nh − 1
Usando a função de custo linear C = c 0 +
∑^ H h =
chnh , a alocação ótima segue o seguinte
teorema :
Teorema: Na AE com a função de custo linear, temos que Ves é mínimo para C ′^ fi- xado ou C ′^ é mínimo para Ves fixado se :
nh = n
W √ hσh ∑ H ch h =
W √ hσh ch
, h = 1 , 2 , ..., H
Portanto como resultado direto temos que:
nh = n Nh
∑ PhQh/ch H h =1 Nh
PhQh/ch
Qunado o custo é constante, podemos obter que a alocação ótima de neyman passa a ser:
nh = n Nh
√ PhQh ∑ H h =1 Nh
√ PhQh
Não dispondo de informação preliminar sobre Ph , como uma amostra piloto ou pesqui- sas anteriores, substitui-se PhQh por 14 na expressão acima, por ser um limite superior, levando a alocação proporcional.
A seguir será apresentado um exemplo de aplicação adptado do livro: Estrategias de muestreo Dise no de encuestas y estimacion de parâmetros(Hugo Andrés e Gutiérrez Rojas), Vamos utilizar o banco de dados BigLucy, que corresponde a algumas variáveis financeiras de 85396 empresas industriais de uma cidade em um determinado ano fiscal, para aplicarmos algumas técnicas apresentadas, primeiramente, vamos perceber a divisão dos dados baseado na variável Level que representa seu tamanho de acordo com o imposto declarado:
Figura 1: Gráfico box-plot.
Com isso temos uma ideia de que uma amostragem estratificada nos trará benefícios, dito isso, iremos trabalhar com os estratos baseados na variável Level, portanto vamos iniciar uma análise com auxilio do software R, alguns autores apresentam um limie assin- tótico para ganho significativo com o tamanho amostral em que n se aproxima de 2000, sendo assim, foi decidido o tamanho amostral de n = 3000.
data ( BigLucy ) dados < - BigLucy library ( ggplot 2 ) library ( ggpubr ) library ( tidyverse )
n < - 3 0 0 0 # definindo tamanho da amostra suficientemente grande dados N 1 <- nrow ( dados % >% filter ( dados $ Level == " Big " ) % >% select ( Level )) N 2 <- nrow ( dados % >% filter ( dados $ Level == " Medium " ) % >% select ( Level ))
Tabela 2: Tabela Estimação Income
Income Big Medium Small População Estimação 3552217 17156320 15994325 36702862 Erro padrão 52582.67 105508 153776.9 193763. CVE 1.480277 0.6149803 0.9614463 0. DEFF 1 1 1 0.
Vamos focar na Variável Income que representa o valor total dos ganhos (ou lucros) de uma empresa no ano fiscal anterior.
Dado os dados acima iremos gerar o intervalo de confiança com 90% de confiança de forma usual com o pacote:
lim _ inf < - wp [ 1 ,4 ,2 ] - qnorm ( 1 -0. 1 / 2 )* wp [ 2 ,4 ,2 ] lim _ sup < - wp [ 1 ,4 ,2 ]+ qnorm ( 1 -0. 1 / 2 )* wp [ 2 ,4 ,2 ] lim _ inf ; lim _ sup
Assim geramos o seguinte IC para o total populacional da variável Income:
IC [90%; τ ] = [36384150; 37021574]
Agora usaremos o que foi desenvolvido no tópico 3, assim produzimos o IC assintótico com aproximadamente 90% de confiança para o total populacional da variável Income:
sh 1 <- var ( amostra % >% filter ( amostra $ Level == " Big " ) % >% select ( Income )) sh 2 <- var ( dados % >% filter ( dados $ Level == " Medium " ) % >% select ( Income )) sh 3 <- var ( dados % >% filter ( dados $ Level == " Small " ) % >% select ( Income ))
sh _ 2 <-c ( sh 1 , sh 2 , sh 3 ) # variancia ds estratos
sqrt ( sum (( N ^ 2 )*( sh _ 2 / n ))) # desvio p a d r o
lim _ inf < - wp [ 1 ,4 ,2 ] - qnorm ( 1 -0. 1 / 2 )* sqrt ( sum (( N ^ 2 )( sh _ 2 / n ))) lim _ sup < - wp [ 1 ,4 ,2 ]+ qnorm ( 1 -0. 1 / 2 ) sqrt ( sum (( N ^ 2 )*( sh _ 2 / n ))) lim _ inf ; lim _ sup
Assim geramos o seguinte IC assintótico para o total populacional da variável Income:
IC [90%; τ ] = [36377966; 37027758]
De forma análoga produzimos um IC assintótico para a média populacional da variável Income:
sh 1 <- var ( amostra % >% filter ( amostra $ Level == " Big " ) % >% select ( Income )) sh 2 <- var ( dados % >% filter ( dados $ Level == " Medium " ) % >% select ( Income )) sh 3 <- var ( dados % >% filter ( dados $ Level == " Small " ) % >% select ( Income ))
sh _ 2 <-c ( sh 1 , sh 2 , sh 3 ) # variancia ds estratos
sqrt ( sum (( N ^ 2 )*( sh _ 2 / n ))) # desvio p a d r o
W < - N / sum ( N ) W ^ 2
lim _ inf < -( wp [ 1 ,4 ,2 ]/ sum ( N )) - qnorm ( 1 -0. 1 / 2 )* sqrt ( sum (( W ^ 2 )( sh _ 2 / n ))) lim _ sup < -( wp [ 1 ,4 ,2 ]/ sum ( N ))+ qnorm ( 1 -0. 1 / 2 ) sqrt ( sum (( W ^ 2 )*( sh _ 2 / n ))) lim _ inf ; lim _ sup
IC [90%; μ ] = [426_._ 4909; 434_._ 109]