Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas


Métodos de amostragem probabilística, Slides de Estatística

coleta e/ou amostragem. Figura . Amostragem estratificada. Prof. Wagner Hugo Bonat. Métodos de amostragem probabilística ...

Tipologia: Slides

2023

Compartilhado em 17/01/2023

Jandiara62
Jandiara62 🇵🇹

4.9

(37)

3.2K documentos

1 / 22

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
Métodos de amostragem probabilística
Prof. Wagner Hugo Bonat
Departamento de Estatística
Universidade Federal do Paraná
Prof. Wagner Hugo Bonat Métodos de amostragem probabilística 1
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16

Pré-visualização parcial do texto

Baixe Métodos de amostragem probabilística e outras Slides em PDF para Estatística, somente na Docsity!

Métodos de amostragem probabilística

Prof. Wagner Hugo Bonat

Departamento de Estatística Universidade Federal do Paraná

Motivação

I Vivemos em uma era na qual a

disponibilidade e o acesso a dados

não têm precedentes na história.

Figura 1. Extraído de smart insights.

Planejamento da coleta de dados

I Coleta de dados observacionais.

I (^) Presença de seres vivos num ambiente. I (^) Fenômenos climáticos. I (^) Fluxo de usuários em um website. I (^) Transações bancárias.

I Definição do experimento.

I (^) Variáveis respostas/interesse. I (^) Variáveis de controle (o que afeta a resposta?). I (^) Desenho do experimento e randomização.

Figura 3. Foto de Vitaly Vlasov do Pexels.

Figura 4. Foto de martin Lopez do Pexels.

Dados experimentais

I Comum em ciências agrárias,

biológicas, da saúde e da terra, etc.

I Coleta é feita por meio de

experimentos.

I Características típicas:

I (^) Intervenção na realidade. I (^) Condições controladas. I (^) Observação dos efeitos das intervenções. I (^) Aleatorização usada para alocar unidades em grupos: tratamento(s) × controle(s). I (^) Custo de coleta elevado amostras pequenas.

Figura 5. Photo by Chokniti Khongchum from Pexels.

Dados, dados...

I Fonte de dados típicas:

I (^) Censo. I (^) Pesquisas amostrais. I (^) Registros administrativos.

I Característica comum → dados

planejados.

I Novas fontes de dados (Big Data):

I (^) Transações (nota fiscal eletrônica). I (^) Comunicações e mensagens. I (^) Imagens. I (^) Buscas, web-scraping, etc.

I Características comuns:

I (^) Grande volume , variedade e velocidade. I (^) Dados não planejados (dados orgânicos).

Conceitos importantes

I Pesquisa : Coleta de informações sobre uma característica de interesse de unidades

de uma população, usando métodos e procedimentos bem definidos. Acompanhado

da compilação dessas informações em uma forma resumida útil.

I Amostragem : Consiste em selecionar parte de uma população para observar, de

modo que seja possível estimar alguma coisa sobre toda a população (Thompson,

I Características desejáveis da amostra:

I (^) Capacidade de generalização. I (^) Imparcialidade e representatividade. I (^) Capacidade de medir a precisão das estimativas.

I Como podemos obter amostras adequadas? → Métodos de amostragem.

Amostragem aleatória simples (com ou sem reposição)

I Procedimento do método:

  1. Selecione uma unidade de U (população) com probabilidade 1 /N.
  2. Repita o passo (1) n − 1 vezes, sendo cada seleção independente das anteriores.

Figura 8. Amostragem aleatória simples.

Amostragem aleatória simples

I Vantagens

I (^) Simplicidade. I (^) Permite medir a precisão das estimativas. I (^) Propriedades conhecidas e testadas.

I Desvantagens

I (^) Precisa de cadastro da população. I (^) Custo elevado (amostra espalhada). I (^) Não usa informações auxiliares.

Amostragem sistemática

I Procedimento do método:

  1. Selecione uma unidade de partida r ao acaso entre 1 e K , com probabilidade 1 /K.
  2. Selecione cada K -ésima unidade do cadastro a partir da primeira selecionada, isto é, r + K , r + 2 K , etc.

Figura 10. Amostragem sistemática.

Amostragem sistemática

I Vantagens

I (^) Simplicidade. I (^) Cadastro pode ser construído junto com a amostra. I (^) Fácil de estimar quantidades populacionais (exceto variância).

I Desvantagens

I (^) Difícil para estimar a precisão da estimação. I (^) Custo elevado (amostra espalhada). I (^) Periodicidade no cadastro pode impactar nas estimativas.

Amostragem estratificada

I Procedimento do método:

  1. Particione a população U em H grupos disjuntos e homogêneos, chamados de estratos.
  2. Selecione uma amostra dentro de cada um dos estratos, independentemente.
  3. A amostra a ser pesquisada é a união das amostras selecionadas nos estratos.

I Dentro de cada estrato pode ser

necessário usar diferentes métodos de

coleta e/ou amostragem.

Figura 12. Amostragem estratificada.

Amostragem estratificada

I Vantagens

I (^) Plano intuitivo. I (^) Estratos são divisões naturais da população. Ex. regiões geográficas, gênero, etc. I (^) Melhora a eficiência amostral (reduz a variância). I (^) Permite medir a precisão das estimativas.

I Desvantagens

I (^) Precisa de informação prévia sobre os estratos (tamanho). I (^) Pode ser necessário usar métodos de coleta diferentes em cada estrato. I (^) Pelo menos duas etapas para coleta de dados.

Amostragem por conglomerados

I Procedimento do método:

  1. Particione a população U em M grupos disjuntos, chamados de conglomerados.
  2. Selecione uma amostra de m conglomerados.
  3. Se amostragem em apenas 1 etapa , inclua todas as unidades da população U encontradas nos m conglomerados na amostra.
  4. Se amostragem em 2 etapas , selecione uma amostra de unidades elementares em cada um dos conglemerados selecionados no item
  5. (^) Figura 15. Amostragem por conglomerado.

Amostragem por conglomerados

I Vantagens

I (^) Pode facilitar a coleta dos dados. I (^) Conglomerados são grupos naturais dentro da população (família, departamentos, etc). I (^) Permite medir a precisão das estimativas. I (^) Mais barato (menos deslocamento).

I Desvantagens

I (^) Precisa de informação prévia sobre os conglomerados. I (^) Pode ser necessário usar métodos de coleta diferentes em cada conglomerado. I (^) Pelo menos duas etapas para coleta de dados. I (^) Mais complicado para estimar parâmetros de interesse.