Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas


Testes não paramétricos, Resumos de Estatística

Testes não paramétricos Testes não paramétricos Testes não paramétricos Testes não paramétricos Testes não paramétricos Testes não paramétricos

Tipologia: Resumos

2021

Compartilhado em 19/03/2021

talessiqueira
talessiqueira 🇧🇷

1 documento

1 / 45

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
Onde estamos
Até este ponto no livro, você estudou dezenas de fór-
mulas e testes estatísticos diferentes que podem ajudar
em um processo de tomada de decisão. Condições es-
pecíficas tinham de ser satisfeitas a fim de usar essas
fórmulas e testes.
Suponha que se acredite que, conforme o número de
reclamações de fraude em um estado aumenta, o núme-
ro de vítimas de roubo de identidade também aumen-
ta. Essa crença pode ser confirmada por dados reais?
A Tabela 11.1 mostra os números de reclamações de
fraude e vítimas de roubo de identidade para 25 estados
selecionados aleatoriamente em um ano recente. (Fonte:
Federal Trade Commission.)
Tabela 11.1
Reclamações de fraude 19.470 33.434 28.285 15.906 5.165 58.543 5.973 6.693
Vítimas de roubo de identidade 5.060 7.032 4.864 2.915 902 19.232 658 905
Reclamações de fraude 10.644 5.224 33.199 49.501 3.729 15.446 6.600 82.289
Vítimas de roubo de identidade 2.077 666 6.178 12.075 501 3.032 782 21.538
Reclamações de fraude 50.128 13.173 18.399 4.549 2.427 28.091 9.907 33.720 6.204
Vítimas de roubo de identidade 8.891 2.586 2.467 963 330 5.690 1.586 5.373 1.002
Para onde vamos
Neste capítulo você estudará testes estatísticos adi-
cionais que não necessitam que a distribuição da popula-
ção satisfaça quaisquer condições específicas. Cada um
desses testes pode ser útil em aplicações da vida real.
Com os dados acima, o número de reclamações de
fraude F e o número de vítimas de roubo de identidade V
podem ser relacionados pela equação de regressão V =
0,264F – 1.080,306. O coeficiente de correlação é aproxi-
Em um ano
recente, a forma
mais comum de
roubo de identidade
relatada foi fraude
de documentos/
benefícios do
governo, que
representou 46%
dos casos. A
segunda forma
mais comum foi
fraude de cartão
de crédito, que
respondeu por
13% dos casos.
11.1 Teste dos sinais
11. 2 Testes de Wilcoxon
Estudo de caso
11. 3 Teste de Kruskal-Wallis
11.4 Correlação de postos
11. 5 Teste de corridas
Usos e abusos
Estatística real – Decisões reais
Tecnologia
Testes não
paramétricos11
Guy Shapira/Shutterstock
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d

Pré-visualização parcial do texto

Baixe Testes não paramétricos e outras Resumos em PDF para Estatística, somente na Docsity!

Onde estamos

Até este ponto no livro, você estudou dezenas de fór- mulas e testes estatísticos diferentes que podem ajudar em um processo de tomada de decisão. Condições es- pecíficas tinham de ser satisfeitas a fim de usar essas fórmulas e testes. Suponha que se acredite que, conforme o número de reclamações de fraude em um estado aumenta, o núme-

ro de vítimas de roubo de identidade também aumen- ta. Essa crença pode ser confirmada por dados reais? A Tabela 11.1 mostra os números de reclamações de fraude e vítimas de roubo de identidade para 25 estados selecionados aleatoriamente em um ano recente. (Fonte: Federal Trade Commission.)

Tabela 11. Reclamações de fraude 19.470 33.434 28.285 15.906 5.165 58.543 5.973 6. Vítimas de roubo de identidade 5.060 7 .032 4.864 2.915 902 19.232 658 905

Reclamações de fraude 10.644 5.224 33.199 49.501 3.729 15.446 6.600 82. Vítimas de roubo de identidade 2.077 666 6.178 12.075 501 3.032 782 21.

Reclamações de fraude 50.128 13.173 18.399 4.549 2.427 28.091 9.907 33.720 6. Vítimas de roubo de identidade 8.891 2.586 2.467 963 330 5.690 1.586 5.373 1.

Para onde vamos

Neste capítulo você estudará testes estatísticos adi- cionais que não necessitam que a distribuição da popula- ção satisfaça quaisquer condições específicas. Cada um desses testes pode ser útil em aplicações da vida real.

Com os dados acima, o número de reclamações de fraude F e o número de vítimas de roubo de identidade V podem ser relacionados pela equação de regressão V = 0,264F – 1.080,306. O coeficiente de correlação é aproxi-

Em um ano recente, a forma mais comum de roubo de identidade relatada foi fraude de documentos/ benefícios do governo, que representou 46% dos casos. A segunda forma mais comum foi fraude de cartão de crédito, que respondeu por 13% dos casos.

11.1 Teste dos sinais

11.2 Testes de Wilcoxon

  • Estudo de caso

11.3 Teste de Kruskal-Wallis

11.4 Correlação de postos

11.5 Teste de corridas

  • Usos e abusos
  • Estatística real – Decisões reais
  • Tecnologia

Testes não

11 paramétricos

Guy Shapira/Shutterstock

11.1 Teste dos sinais

O teste dos sinais para uma mediana populacional • O teste dos sinais usando

amostras pareadas

O teste dos sinais para uma mediana

populacional

Muitos dos testes de hipótese estudados até aqui impuseram um ou

mais requisitos para uma distribuição populacional. Por exemplo, alguns

testes requerem que uma população tenha uma distribuição normal e ou-

tros testes requerem que as variâncias populacionais sejam iguais. O que

você deve fazer quando tais requisitos não podem ser satisfeitos? Para esses

casos, os estatísticos desenvolveram testes de hipóteses usados para dados

com “distribuição livre”. Tais testes são chamados testes não paramétricos.

Definição

Um teste não paramétrico é um teste de hipótese que não requer quaisquer condições específicas acerca das formas das distribuições populacionais ou dos valores de parâmetros populacionais.

Testes não paramétricos geralmente são mais fáceis de realizar do que

os testes paramétricos correspondentes. No entanto, eles são, em geral, me-

nos eficientes que testes paramétricos. Evidências mais fortes são necessá-

rias para rejeitar uma hipótese nula usando os resultados de um teste não

madamente 0,965, então há uma correlação positiva for- te. Você pode determinar que a correlação é significativa usando a Tabela B.11 no Apêndice B. Uma análise mais profunda dos dados, contudo, pode mostrar que as vari- áveis não parecem ter uma distribuição normal bivariada, o que é um dos requisitos para usar o coeficiente de cor- relação de Pearson. Assim, embora um simples teste de correlação pos- sa indicar uma relação entre o número de reclamações de fraude e o número de vítimas de roubo de identidade,

podem-se questionar os resultados porque os dados não se encaixam nos requisitos para o teste. Você estudará testes similares neste capítulo, como o teste de correla- ção de postos de Spearman, que lhe darão informações adicionais. O coeficiente de correlação de postos de Spearman para esses dados é aproximadamente 0,965. Com a = 0,01, há de fato uma correlação significativa entre o número de reclamações de fraude e o número de vítimas de roubo de identidade para cada estado (veja a Figura 11.1).

Figura 11.1 Número de reclamações de fraude e vítimas de roubo de identidade para 25 estados.

Reclamações de fraude

Vítimas de roubo de identidade x

y

20.000 40.000 60.000 80.000 100.

O que você deve aprender

  • Como usar o teste dos sinais para testar uma mediana populacional.
  • Como aplicar o teste dos sinais usando amostras pareadas para testar a diferença entre duas medianas populacionais (amostras dependentes).

2 Estatística aplicada

Instruções

Realizando um teste dos sinais para uma mediana populacional

EM PALAVRAS EM SÍMBOLOS

1. Verifique se a amostra é aleatória. 2. Identifique a afirmação. Declare as hipóteses nula e alternativa.

Formule H 0 e Ha.

3. Especifique o nível de significância.

Identifique a.

4. Determine o tamanho da amostra n, atribuindo sinais +, sinais – e zeros aos dados da amostra.

n = número total de sinais + e –

5. Determine o valor crítico. Quando n ≤ 25, use a Tabela B. no Apêndice B. Quando n > 25, use a Tabela B.4 no Apêndice B. 6. Encontre a estatística de teste. Quando n ≤ 25, use x = o menor número dos sinais + ou –. Quando n > 25, use z =

1 x + 0,5 2 - 0,5n 1 n 2

7. Tome uma decisão para rejeitar ou não rejeitar a hipótese nula.

Se a estatística de teste é menor ou igual ao valor crítico, então rejeite H 0. Caso contrário, não rejeite H 0.

8. Interprete a decisão no contexto da afirmação original.

Exemplo 1

Usando o teste dos sinais

O administrador do site de uma empresa afirma que o número me-

diano de visitantes, por dia, do site da empresa é de não mais de 1.500.

Um funcionário duvida da precisão dessa afirmação. Os números de

visitantes por dia, para 20 dias selecionados aleatoriamente, estão lis-

tados a seguir. Com a = 0,05, o funcionário pode rejeitar a afirmação

do administrador?

Solução

A afirmação é “o número mediano de visitantes, por dia, do site da

empresa é de não mais de 1.500”. Então, as hipóteses nula e alternativa são:

H 0 : mediana ≤ 1.500 (Afirmação) e Ha : mediana > 1.500.

Os resultados da comparação de cada dado com a mediana hipotéti-

ca 1.500 são mostrados a seguir:

  • – + + 0
  • – + + –

4 Estatística aplicada

Você pode perceber que há 7 sinais – e 12 sinais +. Então, n = 12 +

7 = 19. Como n ≤ 25, use a Tabela B.8 no Apêndice B para encontrar o

valor crítico. O teste é unilateral com a = 0,05 e n = 19. Logo, o valor

crítico é 5. Como n ≤ 25, a estatística de teste x é o menor número dos

sinais + ou –. Assim, x = 7. Uma vez que x = 7 é maior que o valor crítico,

o funcionário não deve rejeitar a hipótese nula.

Interpretação Não há evidência suficiente, ao nível de significância

de 5%, para o funcionário rejeitar a afirmação do administrador do site

de que o número mediano de visitantes por dia do site da empresa é de

não mais de 1.500.

Tente você mesmo 1

Uma agência imobiliária afirma que o número mediano de dias que

uma casa fica no mercado, em sua cidade, é superior a 120. Um proprietá-

rio quer verificar a exatidão dessa afirmação. Os números de dias no mer-

cado para 24 casas selecionadas aleatoriamente são mostrados a seguir.

Com a = 0,025, o proprietário pode confirmar a afirmação da agência?

a. Identifique a afirmação e declare H 0 e Ha.

b. Identifique o nível de significância a.

c. Determine o tamanho da amostra n.

d. Encontre o valor crítico.

e. Encontre a estatística de teste x.

f. Decida se rejeita a hipótese nula.

g. Interprete a decisão no contexto da afirmação original.

Exemplo 2

Usando o teste dos sinais

Uma organização afirma que a frequência mediana anual dos

museus dos Estados Unidos é de pelo menos 39.000 visitantes. Uma

amostra aleatória de 125 museus revela que as frequências anuais de

79 museus foram inferiores a 39.000, as frequências anuais de 42 mu-

seus foram superiores a 39.000 e, as frequências anuais de 4 museus

foram de 39.000 visitantes. Com a = 0,01, há evidência suficiente para

rejeitar a afirmação da organização? (Adaptado de American Associa-

tion of Museums.)

Solução

A afirmação é “a frequência mediana anual dos museus dos Estados

Unidos é de pelo menos 39.000 visitantes”. Então, as hipóteses nula e

alternativa são:

H 0 : mediana ≥ 39.000 (Afirmação) e Ha : mediana < 39.000.

Como n > 25, use a Tabela B.4 no Apêndice B, a Tabela Normal Pa-

drão, para encontrar o valor crítico. Uma vez que o teste é unilateral à

esquerda com a = 0,01, o valor crítico é z 0 = –2,33. Dos 125 museus, há

79 com sinal – e 42 com sinal +. Uma vez que os zeros são ignorados, o

tamanho da amostra é:

n = 79 + 42 = 121 e x = 42.

Capítulo 11 Testes não paramétricos 5

populações fossem normalmente distribuídas. Quando a condição para-

métrica de normalidade não pode ser satisfeita, você pode usar o teste dos

sinais para amostras pareadas para testar a diferença entre duas medianas

populacionais. Para realizar o teste dos sinais usando amostras pareadas

para a diferença entre duas medianas populacionais, as condições a seguir

devem ser atendidas:

1. Uma amostra de cada população deve ser aleatoriamente selecionada.

2. As amostras devem ser dependentes (pareadas).

O teste dos sinais usando amostras pareadas pode ser unilateral à

esquerda, unilateral à direita ou bilateral. Esse teste é similar ao teste

dos sinais para uma mediana populacional única. No entanto, em vez de

comparar cada valor com uma mediana hipotética e registrar +, – ou 0,

você encontra a diferença entre valores correspondentes e registra o seu

sinal. Geralmente, para encontrar a diferença, subtraia o valor repre-

sentando a segunda variável do valor representando a primeira variá-

vel. Então, compare o número de sinais + e – (os zeros são ignorados).

Quando o número de sinais + é aproximadamente igual ao número de

sinais –, provavelmente, em função do teste você não rejeitará a hipó-

tese nula. Quando há uma “grande “diferença entre o número de sinais

+ e o número de sinais –, provavelmente você rejeitará a hipótese nula.

Instruções

Realizando um teste dos sinais para amostras pareadas

EM PALAVRAS EM SÍMBOLOS

1. Verifique se as amostras são aleató- rias e dependentes. 2. Identifique a afirmação. Declare as hipóteses nula e alternativa.

Formule H 0 e Ha.

3. Especifique o nível de significância. Identifique a. 4. Determine o tamanho da amostra n encontrando a diferença para cada par de dados. Atribua um sinal + a uma diferença positiva, um sinal – a uma diferença negativa e 0 a nenhu- ma diferença.

n = número total de sinais + e –

5. Determine o valor crítico. Use a Tabela B.8 no Apêndice B. 6. Encontre a estatística de teste. x = o menor número dos sinais + ou – 7. Decida se rejeita ou não rejeita a hi- pótese nula.

Se a estatística de teste é menor ou igual ao valor crítico, então rejeite H 0. Caso contrário, não rejeite H 0.

8. Interprete a decisão no contexto da afirmação original.

Exemplo 3

Usando o teste dos sinais com amostras pareadas

Um psicólogo afirma que o número de infratores reincidentes dimi-

nuirá quando infratores primários completarem um curso especial de rea-

bilitação. Você seleciona aleatoriamente 10 presídios e registra o número

Capítulo 11 Testes não paramétricos 7

de infratores reincidentes durante um período de dois anos. Então, depois

de infratores primários completarem o curso, você registra o número de

infratores reincidentes em cada presídio por um outro período de dois

anos. Os resultados são mostrados na Tabela 11.2. Para o nível de sign-

ficância a = 0,025, você pode concordar com a afirmação do psicólogo?

Tabela 11.2 Distribuição dos números de infratores antes e depois do curso.

Presídio^1 2 3 4 5 6 7 8 9 Antes^21 34 9 45 30 54 37 36 33 Depois^19 22 16 31 21 30 22 18 17

Solução

Para testar a afirmação do psicólogo, use as hipóteses nula e alter-

nativa a seguir:

H 0 : O número de infratores reincidentes não diminuirá.

Ha : O número de infratores reincidentes diminuirá. (Afirmação)

A Tabela 11.3 mostra o sinal das diferenças entre os dados “antes”

e “depois”.

Tabela 11.3 Distribuição dos sinais relativos aos pares.

Presídio^1 2 3 4 5 6 7 8 9 Antes^21 34 9 45 30 54 37 36 33 Depois^19 22 16 31 21 30 22 18 17 Sinal +^ +^ –^ +^ +^ +^ +^ +^ +^ +

Você pode ver que há 1 sinal – e 9 sinais +. Então, n = 1 + 9 = 10.

Como o teste é unilateral com a = 0,025 e n = 10, o valor crítico é 1. A

estatística de teste x é o menor número de sinais + ou –. Logo, x = 1. Já

que x é igual ao valor crítico, você rejeita a hipótese nula.

Interpretação Há evidência suficiente, ao nível de significância

2,5%, para concordar com a afirmação do psicólogo de que o número

de infratores reincidentes diminuirá após o curso.

Tente você mesmo 3

Um pesquisador da área médica afirma que uma nova vacina di-

minuirá o número de resfriados em adultos. Você seleciona aleatoria-

mente 14 adultos e registra o número de resfriados que cada um teve

durante um ano. Após dar a vacina a cada adulto, você registra nova-

mente o número de resfriados que cada um teve no período de um ano.

Os resultados são mostrados na Tabela 11.4. Com a = 0,05, você pode

concordar com a afirmação do pesquisador?

a. Identifique a afirmação e declare H 0 e Ha.

b. Identifique o nível de significância a.

c. Determine o tamanho da amostra n.

d. Encontre o valor crítico.

e. Encontre a estatística de teste x.

f. Decida se rejeita a hipótese nula.

g. Interprete a decisão no contexto da afirmação original.

Tabela 11.

Adulto Antes da vacina

Depois da vacina 1 3 2 2 4 1 3 2 0 4 1 1 5 3 1 6 6 3 7 4 3 8 5 2 9 2 2 10 0 2 11 2 3 12 5 4 13 3 3 14 3 2

8 Estatística aplicada

15. Tamanho da unidade Uma organização de locatários afirma que o número mediano de cômodos em unidades alugadas é quatro. Você seleciona aleatoriamente 120 unidades alugadas e obtém os resultados mostrados a seguir. Para o nível de significância a = 0,05, você pode rejeitar a afirmação da organização? (Adaptado de U.S. Census Bureau.)

Tamanho da unidade Número de unidades Menos de 4 cômodos 29 4 cômodos 38 Mais de 4 cômodos 53

16. Área quadrada Uma organização de locatários afirma que a área mediana quadrada de unidades alugadas é de 1.300 pés quadrados. Você seleciona aleatoriamente 22 unidades alugadas e obtém os resultados mostrados a seguir. Com a = 0,10, você pode rejeitar a afirmação da organização? (Adaptado de U.S. Census Bureau.)

Área quadrada Número de unidades Menos de 1.300 8 1.300 2 Mais de 1.300 12

17. Salário por hora Uma organização trabalhista afirma que o salário mediano por hora de analistas de sistemas de computador é de US$ 38,31. Em uma amostra alea- tória de 45 analistas de sistemas, 18 ganham menos de US$ 38,31 por hora, 25 ganham mais de US$ 38,31 por hora e 2 ganham US$ 38,31 por hora. Com um nível de significância a = 0,01, você pode rejeitar a afirmação da organização trabalhista? (Adaptado de U.S. Bureau of Labor Statistics.) 18. Salário por hora Uma organização trabalhista afirma que o salário mediano por hora de pedicuros é de US$ 55,98. Em uma amostra aleatória de 23 pedicuros, 17 ga- nham menos de US$ 55,98 por hora, 5 ganham mais de US$ 55,98 por hora e 1 ganha US$ 55,98 por hora. Com a = 0,05, você pode rejeitar a afirmação da organização trabalhista? (Adaptado de U.S. Bureau of Labor Statistics.) 19. Dor nas costas Um médico afirma que as pontuações da intensidade de dor nas costas diminuirão após um tratamento de acupuntura. A tabela a seguir mostra as pontuações da intensidade de dor nas costas para oito pacientes antes e depois de receberem acupuntura por oito semanas. Com a = 0,05, há evidência suficiente para concordar com a afirmação do médico? (Adaptado de Archives of Internal Medicine.) Paciente 1 2 3 4 5 6 7 8 Pontuação da intensidade (antes)

Pontuação da intensidade (depois)

20. Dor nas costas Um médico afirma que as pontua- ções da intensidade de dor nas costas diminuirão após tomar medicamentos anti-inflamatórios. A tabela a seguir mostra as pontuações da intensidade de dor nas costas para 12 pacientes antes e depois de tomarem medicamentos anti-inflamatórios por 8 semanas. Com a = 0,05, há evidência suficiente para concordar com a afirmação do médico? (Adaptado de Archives of Inter- nal Medicine.)

Paciente 1 2 3 4 5 6 Pontuação da intensidade (antes)

Pontuação da intensidade (depois)

Paciente 7 8 9 10 11 12 Pontuação da intensidade (antes)

Pontuação da intensidade (depois)

21. Melhorando as notas no SAT Uma agência de pro- fessores particulares afirma que, completando um cur- so especial, os estudantes melhorarão suas notas de compreensão de texto no SAT. Em parte de um estudo, 12 estudantes fazem a parte de compreensão de texto do SAT, completam o curso especial e, então, fazem a parte de compreensão de texto do SAT novamente. As notas dos estudantes são mostradas na tabela a seguir. Com nível de significância a = 0,05, há evidência sufi- ciente para aceitar a afirmação da agência?

Estudante 1 2 3 4 5 6 Nota no primeiro SAT^300 450 350 430 300 Nota no segundo SAT 300 520 400 410 300 480

Estudante 7 8 9 10 11 12 Nota no primeiro SAT^530 200 200 350 360 Nota no segundo SAT 700 250 390 350 480 300

22. Notas no SAT Um conselheiro de orientação educacional afirma que os estudantes que fazem o SAT duas vezes melhoram suas notas no segundo exame. A tabela a seguir mostra as notas de com- preensão de texto no SAT para 12 estudantes que fizeram o exame duas vezes. Com nível de signifi- cância a = 0,01, você pode aceitar a afirmação do conselheiro de orientação educacional?

Estudante 1 2 3 4 5 6 Nota no primeiro SAT^440 510 420 450 620 Nota no segundo SAT 440 570 510 470 610 450

Estudante 7 8 9 10 11 12 Nota no primeiro SAT 350 470 320 510 630 570 Nota no segundo SAT 370 530 290 500 640 600

10 Estatística aplicada

23. Sentindo sua idade Uma empresa de pesquisa conduz um levantamento selecionando aleatoriamente adultos e perguntando a cada um: “Como você se sente em re- lação à sua idade?” Os resultados são apresentados na figura a seguir: (Adaptado de Pew Research Center.)

Mais novo^ Minha idade

Mais velho

(a) Use um teste dos sinais para testar a hipótese nula de que a proporção de adultos que se sentem mais velhos é igual à proporção de adultos que se sen- tem mais novos. Atribua um sinal + a cada adulto que respondeu “mais velho”, atribua um sinal – a cada adulto que respondeu “mais novo” e atribua um 0 a cada adulto que respondeu “minha idade”. Use a = 0,05. (b) O que você pode concluir?

24. Contatando os pais Uma empresa de pesquisa conduz uma pesquisa selecionando aleatoriamente adultos e perguntando a cada um: “com que frequência você en- tra em contato com seus pais por telefone?” Os resulta- dos são mostrados na figura a seguir. (Adaptado de Pew Research Center.)

Semanalmente

Diariamente

Outro

(a) Use um teste dos sinais para testar a hipótese nula de que a proporção de adultos que entram em contato com seus pais por telefone semanal- mente é igual à proporção de adultos o fazem dia- riamente. Atribua um sinal + a cada adulto que respondeu “semanalmente”, atribua um sinal – a cada adulto que respondeu “diariamente” e atri- bua um 0 a cada adulto que respondeu “outro”. Use a = 0,05. (b) O que você pode concluir?

Expandindo conceitos

Mais sobre testes dos sinais Quando você está

aplicando um teste dos sinais para n > 25 e o teste é

unilateral à esquerda, você sabe que pode rejeitar a hi-

pótese nula quando a estatística de teste

z =

1 x + 0,5 2 - 0,5n

1 n

é menor ou igual ao valor crítico da lateral à esquerda ,

em que x é o menor número de sinais + ou –. Para um

teste unilateral à direita, você pode rejeitar a hipótese

nula quando a estatística de teste

z =

1 x - 0,5 2 - 0,5n

1 n

é maior ou igual ao valor crítico da lateral à direita ,

em que x é o maior número de sinais + ou –.

Nos exercícios 25 a 28, use um teste unilateral à direita e

(a) identifique a afirmação e declare H 0 e Ha, (b) encon-

tre o valor crítico, (c) encontre a estatística de teste, (d)

decida se rejeita ou não a hipótese nula e (e) interprete

a decisão no contexto da afirmação original.

25. Salário semanal Uma organização trabalhista afirma que o salário mediano semanal de trabalhadores do sexo feminino é inferior ou igual a US$ 704. Para testar essa afirmação, você seleciona aleatoriamente 50 trabalhado- ras e pede que cada uma forneça seu salário semanal. A tabela a seguir mostra os resultados. Com nível de signi- ficância a = 0,01, você pode rejeitar a afirmação da orga- nização? (Adaptado de U.S. Bureau of Labor Statistics.)

Salário semanal Número de trabalhadoras Menos de US$ 704 18 US$ 704 3 Mais de US$ 704 29

26. Salário semanal Uma organização trabalhista afirma que o salário mediano semanal de trabalhadores do sexo masculino é de mais de US$ 867. Para testar essa afirma- ção, você seleciona aleatoriamente 70 trabalhadores e pede que cada um forneça seu salário semanal. A tabela a seguir mostra os resultados. Com a = 0,01, você pode suportar a afirmação da organização? (Adaptado de U.S. Bureau of Labor Statistics.)

Salário semanal Número de trabalhadores Menos de US$ 867 23 US$ 867 2 Mais de US$ 867 45

27. Idade das noivas Um conselheiro matrimonial afir- ma que a idade mediana das noivas na época do seu primeiro casamento é inferior ou igual a 27 anos. Em uma amostra aleatória de 65 noivas, 24 têm menos de 27 anos, 35 têm mais de 27 anos e 6 têm 27 anos. Com a = 0,05, você pode rejeitar a afirmação do conselheiro? (Adaptado de U.S. Census Bureau.) 28. Idade dos noivos Um conselheiro matrimonial afirma que a idade mediana dos noivos na época do seu primeiro ca- samento é superior a 28 anos. Em uma amostra aleatória de 56 noivos, 33 têm menos de 28 anos e 23 têm mais de 28 anos. Com a = 0,05, você pode concordar com a afirmação do conselheiro? (Adaptado de U.S. Census Bureau.)

Capítulo 11 Testes não paramétricos 11

Exemplo 1

Realizando um teste dos postos sinalizados de Wilcoxon

Um fabricante de tacos de golfe afirma que os jogadores podem di-

minuir suas pontuações (números de tacadas) usando seus tacos de gol-

fe recém-projetados. A Tabela 11.5 mostra as pontuações de 10 golfistas

enquanto usam o modelo antigo e o modelo novo no mesmo campo de

golfe. Com a = 0,05, você aceita a afirmação do fabricante?

Tabela 11.5 Distribuição das pontuações dos golfistas. Golfista 1 2 3 4 5 6 7 8 9 10 Pontuação (modelo antigo) 89 84 96 74 91 85 95 82 92 81 Pontuação (modelo novo) 83 83 92 76 91 80 87 85 90 77

Solução

A afirmação é “os jogadores podem diminuir suas pontuações”. Para

testar essa afirmação, use as seguintes hipóteses nula e alternativa:

H 0 : O novo modelo não diminui as pontuações.

Ha : O novo modelo diminui as pontuações. (Afirmação)

Esse teste dos postos sinalizados de Wilcoxon é um teste unilateral

com a = 0,05 e, como um par de dados tem uma diferença 0, n = 9 em vez

de 10. Da Tabela B.9 no Apêndice B, o valor crítico é 8. Para encontrar a

estatística de teste ws , complete conforme mostra a Tabela 11.6.

Tabela 11.6 Operações para o cálculo da estatística de teste. Pontuação (modelo antigo)

Pontuação (modelo novo)

Diferença Valor absoluto Posto Posto sinalizado

89 83 6 6 8 8 84 83 1 1 1 1 96 92 4 4 5,5 5, 74 76 –2 2 2,5 – 2, 91 91 0 0 — — 85 80 5 5 7 7 95 87 8 8 9 9 82 85 –3 3 4 – 4 92 90 2 2 2,5 2, 81 77 4 4 5,5 5,

A soma dos postos negativos é

A soma dos postos positivos é

A estatística de teste é o menor valor absoluto dessas duas somas.

Como |−6,5| < |38,5|, a estatística de teste é ws = 6,5. Uma vez que a es-

tatística de teste é menor que o valor crítico, isto é, 6,5 < 8, você rejeita

a hipótese nula.

Interpretação Há evidência suficiente, ao nível de significância de

5%, para concordar com a afirmação de que os golfistas podem diminuir

suas pontuações (números de tacadas) usando os tacos recém-projetados.

Dica de estudo Não atribua um posto para qualquer diferença 0. No caso de um empate entre os valores dos dados, use a média dos postos correspondentes. Por exemplo, quando dois valores de dados estão empatados para o 5º posto, use a média de 5 e 6, que é 5,5, como o posto para ambos os valores. Ao próximo valor será atribuído um posto de 7, e não 6. Quando três valores estão empatados para o 5º posto, use a média de 5, 6 e 7, que é 6, como o posto para os três valores. Ao próximo valor será atribuído um posto de 8.

Capítulo 11 Testes não paramétricos 13

Tente você mesmo 1

Um inspetor de controle de qualidade quer testar a afirmação de

que um impermeabilizante em spray é eficaz. Para testar essa afirmação,

ele seleciona 12 pedaços de tecido, borrifa água em cada um e mede a

quantidade de água repelida (em mililitros). Ele, então, aplica o imper-

meabilizante e repete o experimento. A Tabela 11.7 mostra os resulta-

dos. Com a = 0,01, ele pode concluir que o impermeabilizante é eficaz?

Tabela 11.7 Quantidade de água repelida. Tecido 1 2 3 4 5 6 7 8 9 10 11 12 Sem impermeabilizante 8 7 7 4 6 10 9 5 9 11 8 4 Com impermeabilizante 15 12 11 6 6 8 8 6 12 8 14 8

a. Identifique a afirmação e declare H 0 e Ha.

b. Identifique o nível de significância a.

c. Determine o tamanho da amostra n.

d. Encontre o valor crítico.

e. Encontre a estatística de teste ws montando uma tabela, encontran-

do a soma dos postos positivos e negativos e o valor absoluto de

cada soma.

f. Decida se rejeita a hipótese nula.

g. Interprete a decisão no contexto da afirmação original.

O teste da soma dos postos de Wilcoxon

Nas Seções 8.1 e 8.2 você usou um teste z (s 1 e s 2 conhecidos) ou um

teste t (s 1 e s 2 desconhecidos) junto de amostras independentes para de-

terminar se havia uma diferença entre duas populações. Para usar um teste

z ou um teste t para confirmar tal diferença, você deve supor (ou saber) que

as amostras são aleatórias e independentes e/ou as populações são normal-

mente distribuídas ou cada tamanho de amostra é pelo menos 30. Mas o

que você dever fazer quando as suposições de normalidade e tamanho da

amostra não puderem ser feitas? Você ainda pode comparar as populações

usando o teste da soma dos postos de Wilcoxon.

Definição

O teste da soma dos postos de Wilcoxon é um teste não paramétrico que pode ser usado para determinar se duas amostras independentes foram sele- cionadas de uma mesma população.

Um requisito para o teste da soma dos postos de Wilcoxon é que o ta-

manho de ambas as amostras deve ser pelo menos 10 (aproximar pela dis-

tribuição normal). Ao calcular a estatística de teste para o teste da soma

dos postos de Wilcoxon, faça n 1 representar o tamanho da amostra menor

e n 2 representar o tamanho da maior amostra. Quando as duas amostras

tiverem o mesmo tamanho, não importa qual é n 1 ou n 2.

Para calcular a soma dos postos R , combinar ambas as amostras e clas-

sificar os dados combinados. Então, somar os postos para a menor das duas

amostras. Quando as duas amostras têm o mesmo tamanho, você pode usar

os postos de qualquer uma, mas deve usar os postos da amostra que você

associa com n 1.

Retratando o mundo

Para ajudar a determinar quando pacientes com artroscopia no joelho podem voltar a dirigir após a cirurgia, os tempos de reação na direção (em milissegundos) de 10 pacientes com artroscopia no joelho direito foram medidos antes da cirurgia e 4 semanas após a cirurgia, usando um simulador de carro ligado a um computador. A tabela a seguir mostra os resultados. (Adaptado de Knee Surgery, Sports Traumatology, Arthroscopy Journal.)

Paciente Tempo de reação antes da cirurgia

Tempo de reação 4 semanas após a cirurgia 1 720 730 2 750 645 3 735 745 4 730 640 5 755 660 6 745 670 7 730 650 8 725 730 9 770 675 10 700 705

Com a = 0,05, você pode concluir

que os tempos de reação

mudaram significativamente

quatro semanas após a cirurgia?

14 Estatística aplicada

Tabela 11.8 Salários. Salários homens 78 93 114 101 98 94 86 95 117 99 Salários mulheres 86 77 101 93 85 98 91 87 84 97 100 90

Solução

A afirmação é “há diferença entre o salário dos homens e das mulhe-

res”. Para testar essa afirmação, use as hipóteses nula e alternativa a seguir:

H 0 : Não há diferença entre o salário de homens e mulheres.

Ha : Há diferença entre o salário de homens e mulheres. (Afirmação)

Como o teste é bilateral com a = 0,10, os valores críticos são – z 0 =

–1,645 e z 0 = 1,645. As regiões de rejeição são z < –1,645 e z > 1,645.

O tamanho da amostra para os homens é 10 e para as mulheres é 12.

Uma vez que 10 < 12, n 1 = 10 e n 2 = 12. Antes de calcular a estatística de

teste, você deve encontrar os valores de R , m R e s R. A Tabela 11.9 mostra

os dados combinados em ordem crescente e os postos correspondentes.

Tabela 11.9 Ordenando e classificando os valores. Dados ordenados Amostra Posto Dados ordenados Amostra Posto

77 F 1 94 M 12 78 M 2 95 M 13 84 F 3 97 F 14 85 F 4 98 M 15, 86 M 5,5 98 F 15, 86 F 5,5 99 M 17 87 F 7 100 F 18 90 F 8 101 M 19, 91 F 9 101 F 19, 93 M 10,5 114 M 21 93 F 10,5 117 M 22

Como a menor amostra é a dos homens, R é a soma de seus postos.

R = 2 + 5,5 + 10,5 + 12 + 13 + 15,5 + 17 + 19,5 + 21 + 22 = 138

Usando n 1 = 10 e n 2 = 12, você pode encontrar m R e s R , conforme a

seguir.

m R =

n 1 1 n 1 + n 2 + 12

s R =

B

n 1 n 2 1 n 1 + n 2 + 12

B

A

Dica de estudo Lembre-se, no caso de um empate entre os valores dos dados, use a média dos postos correspondentes.

16 Estatística aplicada

Se R = 138, m R = 115 e s R ≈ 15,17, a estatística de teste é

z =

R - m R

s R

A Figura 11.3 mostra a localização das regiões de rejeição e a estatís-

tica de teste z. Como z não está na região de rejeição, você não rejeita

a hipótese nula.

Figura 11.3 Distribuição normal, regiões de rejeição e estatística de teste.

z ≈ 1,

1 − a = 0,

(^1) a = 0, 2

(^1) a = 0, 2

z

  • 3 - 1 0 1 2 3
  • z 0 = -1,645 z 0 = 1,

Interpretação Não há evidência suficiente, ao nível de significân-

cia de 10%, para concluir que há diferença entre o salário de homens e

mulheres.

Tente você mesmo 2

Você está investigando as indenizações de seguro de automóvel pa-

gas (em milhares de dólares) por duas companhias de seguros. A Tabela

11.10 apresenta uma amostra aleatória de 12 indenizações pagas pelas

duas companhias seguradoras. Com a = 0,05, você pode concluir que há

uma diferença nas indenizações pagas pelas companhias?

Tabela 11.10 Indenizações de seguro.

Companhia A 6,2 10,6 2,5 4,5 6,5 7 , Companhia B 7 ,3 5,6 3,4 1,8 2,2 4, Companhia A 9,9 3,0 5,8 3,9 6,0 6, Companhia B 10,8 4,1 1,7 3,0 4,4 5,

a. Identifique a afirmação e declare H 0 e Ha.

b. Identifique o nível de significância a.

c. Encontre o(s) valor(es) crítico(s) e identifique a(s) região(ões) de

rejeição.

d. Determine o tamanho das amostras n 1 e n 2.

e. Liste os dados combinados em ordem crescente, classifique os dados

e encontre a soma dos postos da menor amostra.

f. Encontre a estatística de teste z. Esboce um gráfico.

g. Decida se rejeita a hipótese nula.

h. Interprete a decisão no contexto da afirmação original.

Capítulo 11 Testes não paramétricos 17

Wisconsin 55 59 49 56 51 61 Michigan 64 68 58 65 60 70

Wisconsin 55 61 53 47 52 Michigan 64 70 62 56 61 79

8. Frequência cardíaca Um médico quer determinar se uma medicação experimental afeta a frequência cardí- aca de um indivíduo. O médico seleciona aleatoriamen- te 15 pacientes e mede a frequência cardíaca de cada um. Os indivíduos tomam, então, o medicamento e têm suas frequências cardíacas medidas novamente após uma hora. A tabela a seguir mostra os resultados. Para um nível de significância a = 0,05, o médico pode con- cluir que a medicação experimental afeta a frequência cardíaca de um indivíduo?

Paciente 1 2 3 4 5 Frequência cardíaca (antes) 72 81 75 76 79 Frequência cardíaca (depois) 73 80 75 79 74

Paciente 6 7 8 9 10 Frequência cardíaca (antes) 74 65 67 76 83 Frequência cardíaca (depois) 76 73 67 74 77

Paciente 11 12 13 14 15 Frequência cardíaca (antes) 66 75 76 78 68 Frequência cardíaca (depois) 70 77 76 75 74

Expandindo conceitos

Teste dos postos sinalizados de Wilcoxon para

n > 30 Quando você está realizando um teste dos pos-

tos sinalizados de Wilcoxon e o tamanho da amostra n é

maior que 30, você pode usar a Tabela Normal Padrão

e a fórmula a seguir para encontrar a estatística de teste.

z =

ws -

n 1 n + 12

B

n 1 n + 1 2 1 2 n + 12

Nos exercícios 9 e 10, realize o teste dos postos sinaliza-

dos de Wilcoxon indicado usando a estatística de teste

para n > 30.

9. Aditivo de combustível Um engenheiro de petróleo quer saber se certo aditivo de combustível melhora o desempenho de um carro. Para decidir, o engenheiro registra o desempenho (em milhas por galão) de 33 carros selecionados aleatoriamente com e sem o aditi-

vo de combustível. A tabela a seguir mostra os resulta- dos. Com a = 0,10, o engenheiro pode concluir que o desempenho melhorou?

Carro 1 2 3 4 5 6 Sem aditivo 36,4 36,4 36,6 36,6 36,8 36, Com aditivo 36,7 36,9 37 ,0 37 ,5 38,0 38,

Carro 7 8 9 10 11 12 Sem aditivo 37 ,0 37 ,1 37 ,2 37 ,2 36,7 37, Com aditivo 38,4 38,7 38,8 38,9 36,3 38,

Carro 13 14 15 16 17 18 Sem aditivo 37 ,6 37 ,8 37 ,9 37 ,9 38,1 38, Com aditivo 39,0 39,1 39,4 39,4 39,5 39,

Carro 19 20 21 22 23 24 Sem aditivo 40,2 40,5 40,9 35,0 32,7 33, Com aditivo 40,0 40,0 40,1 36,3 32,8 34,

Carro 25 26 27 28 29 30 Sem aditivo 34,2 35,1 35,2 35,3 35,5 35, Com aditivo 34,7 34,9 34,9 35,3 35,9 36,

Carro 31 32 33 Sem aditivo 36,0 36,1 37 , Com aditivo 36,6 36,6 38,

10. Aditivo de combustível Um engenheiro de petróleo afirma que um aditivo de combustível melhora o de- sempenho. A tabela a seguir mostra o desempenho (em milhas por galão) de 32 carros selecionados aleatoria- mente, medido com e sem o aditivo de combustível. Tes- te a afirmação do engenheiro de petróleo com a = 0,05.

Carro 1 2 3 4 5 6 7 8 Sem aditivo 34,0 34,2 34,4 34,4 34,6 34,8 35,6 35, Com aditivo 36,6 36,7 37 ,2 37 ,2 37 ,3 37 ,4 37 ,6 37,

Carro 9 10 11 12 13 14 15 16 Sem aditivo 30,2 31,6 32,3 33,0 33,1 33,7 33,7 33, Com aditivo 34,2 34,9 34,9 34,9 35,7 36,0 36,2 36,

Carro 17 18 19 20 21 22 23 24 Sem aditivo 35,7 36,1 36,1 36,6 36,6 36,8 37 ,1 37, Com aditivo 37 ,8 38,1 38,2 38,3 38,3 38,7 38,8 38,

Carro 25 26 27 28 29 30 31 32 Sem aditivo 37 ,2 37 ,9 37 ,9 38,0 38,0 38,4 38,8 42, Com aditivo 39,1 39,1 39,2 39,4 39,8 40,3 40,8 43,

Capítulo 11 Testes não paramétricos 19

11.3 Teste de Kruskal-Wallis

O teste de Kruskal-Wallis

O teste de Kruskal-Wallis

Na Seção 10.4 você aprendeu como usar técnicas da ANOVA com um fa-

tor para comparar as médias de três ou mais populações. Ao usar a ANOVA

com um fator, você deve verificar se cada amostra independente é sele-

Classificação das faculdades

A cada ano, a Forbes e o Center for College Affordability and Productivi-

ty lançam uma lista das melhores instituições de ensino superior nos Estados

Unidos. Seiscentas e cinquenta instituições de ensino superior são classificadas

de acordo com a qualidade da educação, proporção de graduação em 4 anos,

resultados da pós-graduação, dívida média do estudante após 4 anos e número

de estudantes que ganharam prêmios competitivos, tais como bolsas de estudos.

A tabela a seguir mostra o total de estudantes de instituições de ensino supe-

rior selecionadas aleatoriamente, por região, na lista de 2012.

Total de estudantes em cada uma das 40 instituições

Nordeste Centro-Oeste Sul Oeste 1.778 14.399 6.224 1. 14.754 14.697 13.893 1. 8.768 3.547 29.617 30. 2.632 2.231 16.198 72. 21.067 5.324 2.454 18. 1.619 12.554 27 .386 33. 4.991 11.528 811 1. 822 23.863 4.188 1. 15.128 3.082 24.753 12. 18.055 1.407 44.616 7.

Estudo de caso

Exercícios

1. Construa um boxplot lado a lado para as quatro

regiões. Apenas observando o gráfico, é possível

perceber duas ou mais medianas “próximas”? Al-

guma parece ser diferente?

Nos exercícios 2 a 5, use o teste dos sinais para testar

a afirmação. O que você pode concluir? Use a = 0,05.

2. A população total mediana de estudantes em ins-

tituições no Nordeste é menor ou igual a 7.000.

3. A população total mediana de estudantes em insti-

tuições no Centro-Oeste é maior ou igual a 8.000.

4. A população total mediana de estudantes em ins-

tituições no Sul é 10.000.

5. A população total mediana de estudantes em ins-

tituições no Oeste é diferente de 8.000.

Nos exercícios 6 e 7, use o teste da soma dos postos

de Wilcoxon para testar a afirmação. Use a = 0,01.

6. Não há diferença entre a população total de estudan-

tes para as instituições no Centro-Oeste e no Oeste.

7. Há diferença entre a população total de estudan-

tes para as instituições no Nordeste e no Sul.

O que você deve aprender

  • Como usar o teste de Kruskal-Wallis para determinar se três ou mais amostras foram selecionadas de populações que apresentam a mesma distribuição.

20 Estatística aplicada