Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas


Intervalos de Confiança para Proporções: Amostras Grandes, Exercícios de Bioestatística

Intervalos de confianças para proporções

Tipologia: Exercícios

2019

Compartilhado em 22/11/2021

evillin-almeida
evillin-almeida 🇧🇷

2 documentos

1 / 8

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
Página 1 de 8
Aula 8 Intervalos de confiança para proporções amostras grandes
Objetivos
Na aula anterior, foram apresentadas as idéias básicas da estimação por intervalos de confiança. Para ilustrar
o princípio utilizado na construção de tais intervalos, consideramos a situação especial de estimação da média de
uma população normal com variância conhecida. Neste caso, a distribuição amostral da média amostral é normal e
foi com base nessa distribuição amostral normal que obtivemos o intervalo de confiança.
Nesta aula, usaremos o resultado que garante que a distribuição amostral da proporção amostral pode ser
aproximada por uma distribuição normal, desde que utilizemos amostras grandes.
Estimação de uma proporção populacional
O contexto de interesse é o seguinte: temos uma população em que cada elemento é classificado de acordo
com a presença ou ausência de determinada característica. Em termos de variável aleatória, essa população é
representada por uma v.a. de Bernoulli, isto é: X = 1 se elemento possui a característica de interesse ou X=0 se
elemento não possui a característica de interesse. Então, Pr(X = 1) = p, E(X) = p e V ar(X) = p(1 p).
O parâmetro p é, também, a proporção de elementos da população que possuem a característica de
interesse. Em geral, esse parâmetro é desconhecido e precisamos estimá-lo a partir de uma amostra. Suponha,
então, que dessa população seja extraída uma amostra aleatória simples X1,X2, . . . ,Xn com reposição. Vimos que a
proporção b P de elementos na amostra que possuem a característica de interesse, definida por
é um estimador não-viesado para p com variância p(1−p)/n . Mais precisamente,
Como a proporção amostral é uma média de uma amostra aleatória simples de uma população com
distribuição de Bernoulli com parâmetro p, o Teorema Central do Limite nos diz, então, que a distribuição de
ˆ
P
se
aproxima de uma normal com média p e variância p(1−p)/n . Como visto, a aproximação deve ser feita se np 5 e
n(1p) 5 e, em geral, essas condições são satisfeitas se n 30. Note que, com n = 30, np 5 sempre que p 0,1667;
logo, essa indicação n 30, em geral, funciona, desde que a característica de interesse não seja extremamente
rarefeita na população (em estatística, usa-se o termo populações raras nos casos em que p é muito pequeno). Caso
haja suspeitas de que p seja muito pequeno, deve-se aumentar o tamanho da amostra.
Resumindo, temos o seguinte resultado:
Usando as propriedades da distribuição normal, temos que
ou equivalentemente
Vamos ver, agora, como usar esse resultado para obter um intervalo de confiança para a verdadeira
proporção populacional p.
pf3
pf4
pf5
pf8

Pré-visualização parcial do texto

Baixe Intervalos de Confiança para Proporções: Amostras Grandes e outras Exercícios em PDF para Bioestatística, somente na Docsity!

Aula 8 – Intervalos de confiança para proporções – amostras grandes

Objetivos Na aula anterior, foram apresentadas as idéias básicas da estimação por intervalos de confiança. Para ilustrar o princípio utilizado na construção de tais intervalos, consideramos a situação especial de estimação da média de uma população normal com variância conhecida. Neste caso, a distribuição amostral da média amostral é normal e foi com base nessa distribuição amostral normal que obtivemos o intervalo de confiança.

Nesta aula, usaremos o resultado que garante que a distribuição amostral da proporção amostral pode ser aproximada por uma distribuição normal, desde que utilizemos amostras grandes.

Estimação de uma proporção populacional O contexto de interesse é o seguinte: temos uma população em que cada elemento é classificado de acordo com a presença ou ausência de determinada característica. Em termos de variável aleatória, essa população é representada por uma v.a. de Bernoulli, isto é: X = 1 se elemento possui a característica de interesse ou X=0 se elemento não possui a característica de interesse. Então, Pr(X = 1) = p, E(X) = p e V ar(X) = p(1 − p). O parâmetro p é, também, a proporção de elementos da população que possuem a característica de interesse. Em geral, esse parâmetro é desconhecido e precisamos estimá-lo a partir de uma amostra. Suponha, então, que dessa população seja extraída uma amostra aleatória simples X1,X2,... ,Xn com reposição. Vimos que a proporção b P de elementos na amostra que possuem a característica de interesse, definida por

é um estimador não-viesado para p com variância p(1−p)/n. Mais precisamente,

Como a proporção amostral é uma média de uma amostra aleatória simples de uma população com

distribuição de Bernoulli com parâmetro p, o Teorema Central do Limite nos diz, então, que a distribuição de Pˆse

aproxima de uma normal com média p e variância p(1−p)/n. Como visto, a aproximação deve ser feita se np ≥ 5 e n(1−p) ≥ 5 e, em geral, essas condições são satisfeitas se n ≥ 30. Note que, com n = 30, np ≥ 5 sempre que p ≥ 0,1667; logo, essa indicação n ≥ 30, em geral, funciona, desde que a característica de interesse não seja extremamente rarefeita na população (em estatística, usa-se o termo populações raras nos casos em que p é muito pequeno). Caso haja suspeitas de que p seja muito pequeno, deve-se aumentar o tamanho da amostra. Resumindo, temos o seguinte resultado:

Usando as propriedades da distribuição normal, temos que

ou equivalentemente

Vamos ver, agora, como usar esse resultado para obter um intervalo de confiança para a verdadeira proporção populacional p.

Intervalo de confiança para a proporção populacional O procedimento de construção do intervalo de confiança para a proporção populacional é totalmente análogo ao do intervalo de confiança para a média de uma população normal com variância conhecida, visto na aula anterior. Assim, iremos usar a mesma notação, a saber: vamos representar por zα a abscissa da curva normal padrão que deixa probabilidade (área) α acima dela. Como visto, temos o seguinte resultado, onde Z ∼ N(0; 1) :

Figura 8.1: Definição do valor crítico zα/2 da N(0; 1). Como o resultado vale para qualquer variável aleatória N(0; 1), podemos

usar para obter e, portanto

Como no caso da média, chegamos a uma expressão do seguinte tipo:

que é a expressão de um intervalo de confiança de nível de confiança 1− α para a proporção populacional.

Intervalo de confiança para uma proporção populacional Seja X1,X2,... ,Xn uma amostra aleatória simples de uma população representada pela variável X de Bernoulli com Pr(X = 1) = p Pr(X = 0) = 1 − p Se o tamanho n da amostra é suficientemente grande [em geral, deve-se ter np ≥ 5 e n(1 − p) ≥ 5, então o intervalo de confiança aproximado para p de nível de confiança 1 − α é dado por

onde zα/2 é abscissa da curva normal padrão que deixa área α/2 acima dela. Tanto no caso da média de uma população normal com variância conhecida, quanto no caso da proporção, a margem de erro tem a forma

Vemos, então, que n é diretamente proporcional a p(1 − p), ou seja, quanto maior p(1 − p), maior será o tamanho da amostra n. Na prática, não conhecemos p (na verdade, estamos querendo estimar esse parâmetro). Então, para determinar o tamanho de amostra necessário para uma margem de erro e um nível de confiança dados, podemos considerar o pior caso, ou seja, podemos tomar o maior valor possível de p(1−p) e calcular o tamanho da amostra com base nesse pior caso. é claro que essa é uma escolha conservadora, que em alguns casos pode levar a um tamanho de amostra desnecessariamente grande. Mas na falta de informação melhor, essa escolha nos garante que, para um nível de confiança dado, a margem de erro será, no máximo, igual à margem de erro desejada. Na Figura 8.2, temos o gráfico da função p(1 − p) para valores de p no intervalo de interesse [0, 1]. Vemos que o máximo dessa função ocorre quando p = 0, 5. Logo, na falta de uma estimativa melhor para p, podemos tomar p = 0, 5 e esse valor nos garantirá que a margem de erro será menor ou igual à margem de erro desejada, para o nível de confiança escolhido.

Figura 8.2: Gráfico da função p(1 − p) para 0 ≤ p ≤ 1. Exemplo Para estudar a viabilidade de lançamento de um novo produto no mercado, o gerente de uma grande empresa contrata uma firma de consultoria estatística para estudar a aceitação do produto entre os clientes potenciais. O gerente deseja obter uma estimativa com erro máximo de 1% com probabilidade de 80% e pede ao consultor estatístico que forneça o tamanho de amostra necessário.

  1. De posse das informações dadas, o consultor calcula o tamanho da amostra necessário no pior cenário. O que significa “pior cenário” nesse caso? Qual o tamanho de amostra obtido pelo consultor?
  2. O gerente acha que o custo de tal amostra seria muito alto e autoriza o consultor a realizar um estudo piloto com uma amostra de 100 pessoas para obter uma estimativa da verdadeira proporção. O resultado desse estudo piloto é

uma estimativa p ˆ= 0, 76 de aceitação do novo produto. Com base nessa estimativa, o consultor recalcula o

tamanho da amostra necessário. Qual é esse tamanho?

  1. Selecionada a amostra com o tamanho obtido no item anterior, obteve-se uma proporção de 72% de clientes favoráveis ao produto. Construa um intervalo de confiança para a verdadeira proporção com nível de confiança de 90%.

Solução

  1. O pior cenário é quando a população está dividida meio-a-meio em suas preferências, ou seja, quando p = 0,5. Com nível de confiança de 80%, obtemos z0,10 = 1, 28. Nesse caso,

2. Vamos agora utilizar p ˆ= 0, 76 :

ou seja, n = 2989

  1. 1 − α = 0, 90 =⇒ z0,05 = 1, 64

e o intervalo de confiança é [0, 72 − 0, 0135; 0, 72 + 0, 0135] = [0, 7065; 0, 7335]

Exemplo Uma associação de estudantes universitários de uma grande universidade deseja saber a opinião dos alunos sobre a proposta da reitoria a respeito do preço do bandejão. Para isso, seleciona aleatoriamente uma amostra de 200 estudantes, dos quais 120 são favoráveis à proposta da reitoria.

  1. Construa um intervalo de confiança para a verdadeira proporção de alunos favoráveis à política da reitoria, ao nível de significância de 2%.
  2. Qual é a margem de erro em (1)?
  3. Qual deverá ser o tamanho da amostra para se ter um erro de, no máximo, 5% com nível de confiança de 98%?

Solução

  1. Com nível de significância de 2%, o nível de confiança é 98%, o que resulta em z0,01 = 2, 33. Com 120 estudantes

favoráveis dentre 200, temos que p ˆ= 120/200 = 0, 6. Logo

e o intervalo de confiança é [0, 6 − 0, 0807; 0, 6 + 0, 0807] = [0, 5193; 0, 6807]

2. A margem de erro é  = 0, 0807.

  1. Queremos, agora, reduzir a margem de erro para 5%, mantendo o mesmo nível de confiança. Certamente teremos que aumentar o tamanho da amostra:

Se usássemos o pior cenário, isto é, p = 0, 5 teríamos de ter

  1. Em uma pesquisa de mercado, 57 das 150 pessoas entrevistadas afirmaram que comprariam determinado produto sendo lançado por uma empresa. Essa amostra é suficiente para se estimar a verdadeira proporção de futuros compradores, com uma precisão de 0,08 e uma confiança de 90%? Em caso negativo, calcule o tamanho de amostra necessário.
  2. Uma amostra aleatória simples de 400 itens forneceu 100 itens correspondentes ao evento “sucesso”.

(a) Qual é a estimativa pontual p ˆpara a verdadeira proporção de “sucessos” na população?

(b) Qual é o erro padrão estimado de p ˆ?

(c) Calcule o intervalo de confiança para a verdadeira proporção de “sucessos” na população ao nível de confiança de 80%.

  1. Em uma sondagem, uma estimativa preliminar de “sucessos” em uma população é de 0,35. Que tamanho deve ter uma amostra para fornecer um intervalo de confiança de 95% com uma margem de erro de 0,05?

Solução dos Exercícios

e o intervalo de confiança é [0, 2133 − 0, 03897; 0, 2133 + 0, 03897] = [0, 17433; 0, 25227]

e o intervalo de confiança é [0, 59167 − 0, 02355; 0, 59167 + 0, 02355] = [0, 56812; 0, 61522]

2. O problema pede a estimativa para a proporção dos que não querem a fluoração; logo, p ˆ = 120/300 = 0, 4

e o intervalo de confiança é [0, 4 − 0, 05544; 0, 4 + 0, 05544] = [0, 34456; 0, 045544]

e o intervalo de confiança é [0, 4 − 0 , 05798; 0, 4 + 0, 05798] = [0, 34202; 0, 045798]

3. é dado que n = 100, p ˆ = 0, 32 e EP( p ˆ) = 0, 03.

α = 3% ⇒ z0,015 = 2, 17

 = 2, 17 × 0, 03 = 0, 0651

[0, 32 − 0, 0651; 0, 32 + 0, 0651] = [0, 2549; 0, 3851]

4. p ˆ= 57/150 = 0, 38. Para uma margem de erro de 0,08 e um nível de confiança de 90%, o tamanho da amostra

teria de ser

Como o tamanho da amostra é 150, essa amostra é suficiente.

5. (a) p ˆ= 100/400 = 0, 25

(b) (c) 1 − α = 0, 80 ⇒ z0,1 = 1, 28 [0, 25 − 1, 28 × 0, 021651; 0, 25 + 1, 28 × 0, 021651] = [0, 22229; 0, 27771]

6. p ˆ 0 = 0, 35

Logo, n ≥ 350

Bibliografia [1] ANDERSON, David R.; SWEENEY, Dennis J.; WILLIAMS, Thomas A. Estatística Aplicada à Administração e à Economia. São Paulo: Pioneira Thomson Learning, 2002 [2] MOORE, David S.; McCabe, George P.; DUCKWORTH, William M.; SCLOVE, Stanley L. A Prática da Estatística Empresarial – Como Usar Dados para Tomar Decisões. Rio de Janeiro: LTC Editora, 2006 [3] MORETTIN, Pedro Alberto; BUSSAB, Wilton de Oliveira. Estatística Básica, 5a Edição. São Paulo: Saraiva, 2006 [4] TRIOLA, Mario F. Introdução à Estatística, 9a. Edição. Rio de Janeiro: LTC Editora, 2005 [5] FARIAS, Ana M.; Métodos Estatísticos I. Rio de Janeiro. Fundação CECIERJ, 2009.