



Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Encontra documentos específicos para os exames da tua universidade
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Documento contém a solução de um exame de estatística sobre bioestatística, incluindo cálculos de média, mediana, moda, desvio-padrão, variância, assimetria e análise de outliers para diferentes conjuntos de dados.
Tipologia: Provas
1 / 6
Esta página não é visível na pré-visualização
Não perca as partes importantes!




Exame de Bioestatística - Farmácia Instituto de Matemática - UFRJ - Prof. Nei Rocha
08 de junho de 2016 Duração: 3 horas Leia atentamente os enunciados antes de responder. Boa Prova!
1a. Questão (4,0): Uma pesquisa estatística com a finalidade de se estudar a idade em que o câncer de mama é diagnosticado foi conduzida com 150 mulheres do Hospital do Câncer no Rio de Janeiro. Os dados obtidos foram agrupados em classe segundo a tabela abaixo:
Idade de Início Frequência 30 ⊢ 40 30 40 ⊢ 50 51 50 ⊢ 60 42 60 ⊢ 70 18 70 ⊢ 80 9 Total 150
(a) Obtenha a média, a mediana e a moda da distribuição.
(b) Obtenha o desvio-padrão e analise os dados quanto à homogeneidade/heterogeneidade.
(c) Analise os dados quanto à possível presença de outliers.
(d) Analise os dados quanto à assimetria e discuta qual a melhor medida de posição para os dados.
Solução:
Idade fi f ac xi xifi
xi − X¯ 150
fi 30 ⊢ 40 30 30 35 1050 6750 40 ⊢ 50 51 81 45 2295 1275 50 ⊢ 60 42 123 55 2310 1050 60 ⊢ 70 18 141 65 1170 4050 70 ⊢ 80 9 150 75 675 5625 Total 150 7500 18750
(a.1) Cálculo da média:
i=1 xi.fi 150
(a.2) Cálculo da mediana: A mediana se situa na segunda classe, pois é lá que se encontra o valor que ocupa a posição 75. Assim
Me = 40 +
(a.3) Cálculo da moda: A classe modal é a segunda, pois é esta que possui a maior frequência. Assim, como ∆ 1 = 51 − 30 = 21 e ∆ 2 = 51 − 42 = 9, temos
Mo = 40 +
(b) A variância dos dados é dada por
i=
xi − X¯ 150
.fi 149
e o desvio-padrão é S =
Para avaliar a homogeneidade/heterogeneidade dos dados necessitamos do coeficiente de variação de Pearson. Assim
CV =
Assim os dados podem ser considerados homogêneos.
(c) Para avaliar a presença de outliers necessitamos do primeiro e terceiro quartis. A classe do primeiro quartil é 40 ⊢ 50 pois é nela que se situam os elementos que ocupa a posição 150 4 = 37,^5. Assim
A classe do terceiro quartil é 50 ⊢ 60 pois é nela que se situam os elementos que ocupa a posição 3 × 1504 = 112, 5. Assim
O intervalo de confiabilidade, tendo em mente que IQ = Q 3 − Q 1 = 16, 03 , é Q 1 −
Criança 1 2 3 4 5 6 7 Total X 1 , 5 5 , 0 3 , 5 2 , 5 4 , 0 1 , 0 0 , 5
i=1 xi^ = 18 Y 79 105 96 83 99 78 68
i=1 yi^ = 608 XY 118 , 5 525 336 207 , 5 396 78 34
i=1 xi.yi^ = 1695 X^2 2 , 25 25 12 , 25 6 , 25 16 1 0 , 25
i=1 x
2 i = 63 Y 2 6241 11025 9216 6889 9801 6084 4624
i=1 y
2 i = 53880
Desejamos inicialmente o coeficiente de correlação r:
r =
i=1 xi.yi^ −^
i=1 xi
i=1 yi
i=1 x
2 i −^
i=1 xi
i=1 y
2 i −^
i=1 yi
Como r^2 = (0, 9834)^2 = 0, 967 , segue-se que o peso é explicado pelo tempo em 96 , 7%. Logo há razões para se acreditar que o tempo passado diante da televisão induz a um aumento de peso.
(c) Devemos estimar a reta de regressão. Assim
a =
i=1 xi.yi^ −^
i=1 xi
i=1 yi
i=1 x
2 i −^
i=1 xi
a ∼= 7 , 87
e
b = Y¯ 7 − a. X¯ 7
=
b ∼= 66 , 62.
Assim a reta de regressão é dada por
y ˆi = axi + b
ˆyi = 7, 87 xi + 66, 62
Quando xi = 3, temos ˆyi = 7, 87 × 3 + 66, 62 = 90, 23.
3a. Questão (1,5 pts): O gráfico box-plot abaixo representa a distribuição da pressão arterial de pessoas divididas em três faixas etárias, a saber, 30 − 45 anos, 46 − 59 anos e 60 anos ou mais.
(a) Analise o gráfico no que tange à assimetria da distribuição da pressão arterial nos três grupos.
(b) Analise os outliers presentes no grupo de 30 a 45 anos, quanto a estes serem ou não considerados extremos, bem como sobre seu possível impacto na média, mediana ou moda.
(c) Analise o gráfico quanto às possíveis diferenças entre os grupos.
Solução:
(a) Vemos que os 50% centrais das três distribuições são relativamente simétricos. No entanto o grupo 2 da faixa de 46 a 59 apresenta uma leve assimetria positiva ou à direira, pois ter cauda mais prominente em valores maiores de pressão arterial. Os grupos 1 e 2 se mostram mais equilibrados e simétricos.