Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas


Amostragem estratíficada, Trabalhos de Técnicas de Amostragem de Levantamento

intervalos assintóticos e amostragem estratificada

Tipologia: Trabalhos

2020

Compartilhado em 16/10/2020

rickson-livio
rickson-livio 🇧🇷

1 documento

1 / 11

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
Universidade Federal Do Ceará
Técnicas de amostragem
UFC-CC-DEPARTAMENTO DE ESTATÍSTICA E MATEMÁTICA
APLICADA
Disciplina : Técnicas de amostragem
Período : 2020.1
Aluno : Rickson Livio de Souza Gaspar
FORTALEZA/CE-2020
1
pf3
pf4
pf5
pf8
pf9
pfa

Pré-visualização parcial do texto

Baixe Amostragem estratíficada e outras Trabalhos em PDF para Técnicas de Amostragem de Levantamento, somente na Docsity!

Universidade Federal Do Ceará

Técnicas de amostragem

UFC-CC-DEPARTAMENTO DE ESTATÍSTICA E MATEMÁTICA

APLICADA

Disciplina : Técnicas de amostragem Período : 2020. Aluno : Rickson Livio de Souza Gaspar

FORTALEZA/CE-

Sumário

  • 1 Introdução
  • 2 Amostragem Estratificada
  • 3 Normalidade Assintótica e intervalos de confiança
  • 4 Determinação do tamanho da amostra
  • 5 Estimação de proporção
  • 6 Aplicação BigLucy

Como σ^2 h é desconhecido em ambas as expressões, pode ser substituído por seu estimador não vicíado s^2 h. Sendo assim, pode-se construir um intervalo de confiança para μ com coeficiente de confiança aproximadamente igual a 1 − α :

√ y^ ¯ es − μ

√√ √∑ H

h =1 W^

h

s^2 h nh

∼ N (0 , 1) (Q)

Como Q segue uma distribuição normal padrão,que por sua vez não depende dos pa- rametros, temos uma quantidade pivotal e portanto podemos contruir seu intervalo de confiança para μ :

( q 1 ≤ Qq 2 )

( q 1 ≤

√ ∑ H h =1 W^ h^2

s^2 h nh ≤^ q^2 )

( 2

√ ∑ H h =1 W^ h^2

s^2 h nh ≤^ y ¯ es^ −^ μ^ ≤^ 2

√ ∑ H h =1 W^ h^2

s^2 h nh )

yes 2

√ ∑ H h =1 W^ h^2

s^2 h nh ≤^ μ^ ≤^ y ¯ es^ +^ 2

√ ∑ H h =1 W^ h^2

s^2 h nh )

Obs: q 1 = − 2 , q 2 = 2

Agora construindo uma intervalo para τ de forma análoga:

√^ ˆ τes − τ

√√ √∑ N

h =1 N^

h

s^2 h nh

∼ N (0 , 1)

temos então :

( q 1 ≤ √∑ τ ˆ esτ N h =1 N^^2^ h

s^2 h nh

q 2 )

( 2

√ ∑ N h =1 N^ h^2

s^2 h nh ≤^ τ ˆ es^ −^ τ^ ≤^ 2

√ ∑ N h =1 N^ h^2

s^2 h nh )

τes 2

√ ∑ N h =1 N^ h^2

s^2 h nh ≤^ τ^ ≤^ ˆ τes^ +^ 2

√ ∑ N h =1 N^ h^2

s^2 h nh )

Com isso obtemos nossos intervalos de confiança para a média populacional e o total populacional.

4 Determinação do tamanho da amostra

Utilizando do resultado Q, pode-se determinar n de modo que:

P(| y ¯ esμ | ≤ B ) ≈ 1 − α

onde,

B = 2

√ ∑ H h =1 W^ h^2 s^2 h nh

Dado que B depende de nh e não de n , consideramos que:

nh = nwh ,

Onde wh é conhecido, h = 1 , 2 , ..., H. Particularmente podemos considerar wh = Wh = N Nh , resultando em:

n = (^) D^1

H h =

Whσ^2 h =

σ^2 d D

onde D = B

2 z^2 α 2.

5 Estimação de proporção

Agora levaremos em consideração o interesse de estudar a ocorrência de determinada característica na população. Tal característica pode ser a preferência por uma marca de produto, por um candidato em uma eleição, etc....Nestas situações, a característica de interesse associada ao i-ésimo elemento no h-ésimo estrato pode ser representada por:

Yhi = 1, se o elemento ( h, i ) possui a característica

Yhi = 0, caso contrário

Sendo τh =

∑^ Nh i =

Yhi , o número de elementos que possuem a característica no estrato h ,

tem-se que :

P =

∑^ H h =

WhPh ,

P ˆ esP √√ √ ∑ H h =

W (^) h^2

P^ ˆ h Q ˆ h nh − 1

∼ N (0 , 1)

Desenvolvendo, analogamente à forma feita para a média e o toal, temos :

( P ˆ es 2

√√ √√ ∑ H h =

W (^) h^2

P^ ˆ h Q ˆ h nh − 1

PP ˆ es + 2

√√ √√ ∑ H h =

W (^) h^2

P^ ˆ h Q ˆ h nh − 1

Usando a função de custo linear C = c 0 +

∑^ H h =

chnh , a alocação ótima segue o seguinte

teorema :

Teorema: Na AE com a função de custo linear, temos que Ves é mínimo para C ′^ fi- xado ou C ′^ é mínimo para Ves fixado se :

nh = n

WhσhH ch h =

Whσh ch

, h = 1 , 2 , ..., H

Portanto como resultado direto temos que:

nh = n Nh

PhQh/ch H h =1 Nh

PhQh/ch

Qunado o custo é constante, podemos obter que a alocação ótima de neyman passa a ser:

nh = n Nh

PhQhH h =1 Nh

PhQh

Não dispondo de informação preliminar sobre Ph , como uma amostra piloto ou pesqui- sas anteriores, substitui-se PhQh por 14 na expressão acima, por ser um limite superior, levando a alocação proporcional.

6 Aplicação BigLucy

A seguir será apresentado um exemplo de aplicação adptado do livro: Estrategias de muestreo Dise no de encuestas y estimacion de parâmetros(Hugo Andrés e Gutiérrez Rojas), Vamos utilizar o banco de dados BigLucy, que corresponde a algumas variáveis financeiras de 85396 empresas industriais de uma cidade em um determinado ano fiscal, para aplicarmos algumas técnicas apresentadas, primeiramente, vamos perceber a divisão dos dados baseado na variável Level que representa seu tamanho de acordo com o imposto declarado:

Figura 1: Gráfico box-plot.

Com isso temos uma ideia de que uma amostragem estratificada nos trará benefícios, dito isso, iremos trabalhar com os estratos baseados na variável Level, portanto vamos iniciar uma análise com auxilio do software R, alguns autores apresentam um limie assin- tótico para ganho significativo com o tamanho amostral em que n se aproxima de 2000, sendo assim, foi decidido o tamanho amostral de n = 3000.

# ## # ##

data ( BigLucy ) dados < - BigLucy library ( ggplot 2 ) library ( ggpubr ) library ( tidyverse )

calculando o tamanho dos estratos

n < - 3 0 0 0 # definindo tamanho da amostra suficientemente grande dados N 1 <- nrow ( dados % >% filter ( dados $ Level == " Big " ) % >% select ( Level )) N 2 <- nrow ( dados % >% filter ( dados $ Level == " Medium " ) % >% select ( Level ))

Tabela 2: Tabela Estimação Income

Income Big Medium Small População Estimação 3552217 17156320 15994325 36702862 Erro padrão 52582.67 105508 153776.9 193763. CVE 1.480277 0.6149803 0.9614463 0. DEFF 1 1 1 0.

Vamos focar na Variável Income que representa o valor total dos ganhos (ou lucros) de uma empresa no ano fiscal anterior.

Dado os dados acima iremos gerar o intervalo de confiança com 90% de confiança de forma usual com o pacote:

IC 9 0 % conf v a r i v e l Income

lim _ inf < - wp [ 1 ,4 ,2 ] - qnorm ( 1 -0. 1 / 2 )* wp [ 2 ,4 ,2 ] lim _ sup < - wp [ 1 ,4 ,2 ]+ qnorm ( 1 -0. 1 / 2 )* wp [ 2 ,4 ,2 ] lim _ inf ; lim _ sup

Assim geramos o seguinte IC para o total populacional da variável Income:

IC [90%; τ ] = [36384150; 37021574]

Agora usaremos o que foi desenvolvido no tópico 3, assim produzimos o IC assintótico com aproximadamente 90% de confiança para o total populacional da variável Income:

IC a s s i n t t i c o v a r i v e l Income

sh 1 <- var ( amostra % >% filter ( amostra $ Level == " Big " ) % >% select ( Income )) sh 2 <- var ( dados % >% filter ( dados $ Level == " Medium " ) % >% select ( Income )) sh 3 <- var ( dados % >% filter ( dados $ Level == " Small " ) % >% select ( Income ))

sh _ 2 <-c ( sh 1 , sh 2 , sh 3 ) # variancia ds estratos

sqrt ( sum (( N ^ 2 )*( sh _ 2 / n ))) # desvio p a d r o

lim _ inf < - wp [ 1 ,4 ,2 ] - qnorm ( 1 -0. 1 / 2 )* sqrt ( sum (( N ^ 2 )( sh _ 2 / n ))) lim _ sup < - wp [ 1 ,4 ,2 ]+ qnorm ( 1 -0. 1 / 2 ) sqrt ( sum (( N ^ 2 )*( sh _ 2 / n ))) lim _ inf ; lim _ sup

Assim geramos o seguinte IC assintótico para o total populacional da variável Income:

IC [90%; τ ] = [36377966; 37027758]

De forma análoga produzimos um IC assintótico para a média populacional da variável Income:

IC a s s i n t t i c o para m d i a v a r i v e l Income

sh 1 <- var ( amostra % >% filter ( amostra $ Level == " Big " ) % >% select ( Income )) sh 2 <- var ( dados % >% filter ( dados $ Level == " Medium " ) % >% select ( Income )) sh 3 <- var ( dados % >% filter ( dados $ Level == " Small " ) % >% select ( Income ))

sh _ 2 <-c ( sh 1 , sh 2 , sh 3 ) # variancia ds estratos

sqrt ( sum (( N ^ 2 )*( sh _ 2 / n ))) # desvio p a d r o

W < - N / sum ( N ) W ^ 2

lim _ inf < -( wp [ 1 ,4 ,2 ]/ sum ( N )) - qnorm ( 1 -0. 1 / 2 )* sqrt ( sum (( W ^ 2 )( sh _ 2 / n ))) lim _ sup < -( wp [ 1 ,4 ,2 ]/ sum ( N ))+ qnorm ( 1 -0. 1 / 2 ) sqrt ( sum (( W ^ 2 )*( sh _ 2 / n ))) lim _ inf ; lim _ sup

IC [90%; μ ] = [426_._ 4909; 434_._ 109]