










Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Encontra documentos específicos para os exames da tua universidade
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Queríamos calcular P(X >. 180). Vamos normalizar a variável X (ou seja, transformá-la em Z) e utilizar a tabela para obter a probabilidade desejada.
Tipologia: Provas
1 / 18
Esta página não é visível na pré-visualização
Não perca as partes importantes!











Curso: Logística e Transportes Disciplina: Estatística Profa. Eliane Cabariti
“O mundo é normal!” Acredite se quiser! Muitos dos fenômenos aleatórios que encontramos na prática apresentam uma distribuição muito peculiar, chamada Normal.
Um modelo probabilístico é aquele que nos diz, ou melhor, nos traduz na forma de números o comportamento de uma variável. Por exemplo, já fizemos algumas análises das variáveis altura e peso. Considerando o caso de grandes amostras aleatórias ou mesmo da população, tanto o peso como a altura tem um comportamento muito parecido. Vejamos, por exemplo, a variável altura, considerando-se o sexo masculino e sendo a população os habitantes do Brasil. Essa variável é dita Normal, conforme discutiremos mais adiante.
Essa distribuição de freqüência denominada curva normal, considerada um modelo teórico ou ideal que resulta muito mais de uma equação matemática do que de um real delineamento de pesquisa com coleta de dados. A curva normal é um tipo de curva simétrica, suave, cuja forma lembra um sino. Ela é unimodal, sendo seu ponto de freqüência máxima situado no meio da distribuição, em que a média, a mediana e a moda coincidem.
Para exemplificarmos, suponhamos 2000 lançamentos de 200 moedas honestas. Utilizando um software de simulação, obtivemos os seguintes resultados:
[80 ... 81] 5 [82 ... 83] 6 [84 ... 85] 16 [86 ... 87] 19 [88 ... 89] 39 [90 ... 91] 60 [92 ... 93] 91 [94 ... 95] 111 [96 ... 97] 165 [98 ... 99] 194 [100 ... 101] 227 [102 ... 103] 220 [104 ... 105] 206 [106 ... 107] 174 [108 ... 109] 155 [110 ... 111] 123 [112 ... 113] 84 [114 ... 115] 49 [116 ... 117] 21 [118 ... 119] 18 [120 ... 121] 6 [122 ... 123] 8 [124 ... 125] 2 [126 ... 127] 1
sample mean = 102. sample st dev = 7.
A partir desses dados, construímos o histograma:
79.50 127.
0
227
Freq
heads
Observando tal histograma e a tabela anterior, notamos que a média está entre as duas classes com maior freqüências. Além disso, considerando-se a média, percebemos que o histograma parece ser simétrico ao redor dela. A freqüência é menor quanto mais nos afastamos da média, tanto para mais quanto para menos, sendo que as menores freqüências ocorrem nas pontas do gráfico.
Se aumentarmos a quantidade de classes, por exemplo, elevando para 40, obtemos o seguinte histograma:
79.50 127.
0
227
Freq
heads
Note que quanto mais classes usamos, mais fácil fica identificarmos um formato criado pelas colunas do histograma. Esse formato faz lembrar um sino, conforme a figura seguinte:
Note que conforme o caso, poderemos ter curvas com formatos diferentes, ou seja, mais para a direita, mais para a esquerda, mais ou menos achatadas... enfim, cada caso poderá gerar uma curva diferente. Vejamos mais um caso.
Consideremos o lançamento de dois dados não viciados. Estamos interessados em analisar a soma dos resultados obtidos em cada jogada. Realizando uma simulação e construindo o histograma dos resultados, obtemos:
1.50 12.
0
173
Freq
sum
No caso simulado, obtivemos:
sample mean = 7. sample st dev = 2.
Ou seja, μ = 7,07 e s = 2,34, onde μ indica a média e s o desvio padrão da amostra. Isolando a curva da normal temos:
−1.0 1.0 2.0 3.0 4.0 5.0 6.0 7.0 8.0 9.0 10.011.012.013.014.015.016.
−1.0 1.0 2.0 3.0 4.0 5.0 6.0 7.0 8.0 9.0 10.011.012.013.014.015.016.
Assim, conforme havíamos dito, existem diferentes curvas, que variam conforme os valores da média e do desvio-padrão.
Lembramos que a área abaixo desse gráfico vale 1. Ou seja, a área corresponde a uma probabilidade.
É aquela região do plano compreendida entre a curva e o eixo das abscissas, que corresponde em qualquer distribuição normal a 100% dos dados considerados. A natureza simétrica da curva normal vai levar a concluir que qualquer distância medida em “sigmas” (desvio padrão), acima ou abaixo da média, contém a mesma porção da área sob a curva. Temos então:
34,13% da área total situam-se entre a média e 1 DP abaixo ou acima da média; 47,72% da área total situam-se entre a média e 2 DP abaixo ou acima da média; 49,87% da área total situam-se entre a média e 3 DP abaixo ou acima da média;
Exemplo 1: consideremos uma população de uma cidade A e de uma outra cidade B. Suponhamos que todas as pessoas tenham informado as respectivas alturas (em centímetros). E deseja-se fazer uma comparação entre tais populações. As principais estatísticas obtidas por essa pesquisa foram:
População A
População B Média ( μ )^174 Variância ( σ^2 )
Um pesquisador deseja sortear aleatoriamente pessoas para fazer um teste sobre DNA e crescimento e, para isso, gostaria de coletar (aleatoriamente!) pessoas com mais de 1,80m. Em qual das duas populações será mais fácil achar pessoas com tais características?
Para isso, podemos dizer que estamos trabalhando com duas variáveis:
XA: altura de 1 pessoa selecionada ao acaso na população A XB: altura de 1 pessoa selecionada ao acaso na população B
Nosso objetivo é calcular as seguintes probabilidades:
P(XA > 180) e P(XB > 180).
Mas antes, calculemos o valor do desvio-padrão (σ) de cada uma das populações. Lembrando que o desvio-padrão nada mais é do que a raiz quadrada da variância. Logo:
σA = 64 = 8 σB = 1 = 1
Utilizando um software é possível calcularmos tais probabilidades. Esse software calcula, na verdade, a área abaixo da curva:
P(XA > 180) = 0,2266 ou 22,66%
P(XB > 180) = 0,0228 ou 2,28%
A grande vantagem de usarmos tal distribuição é o fato de trabalharmos apenas com uma distribuição e, portanto, com uma única tabela. Tudo é mais fácil!
Porém, como fazer para obtermos tal variável Z (padronizada) a partir de uma variável aleatória qualquer X tal que X ~ N(μ, σ^2 )?
Basta padronizarmos ou normalizarmos a variável X através da fórmula:
onde: μ = média de X
σ = desvio-padrão de X
Existem algumas variações de apresentação da tabela. No nosso caso, utilizaremos uma tabela tal que:
P(0 ≤ Z ≤ zc) = p, ou seja, a probabilidade fornecida pela tabela (p) corresponde ao intervalo que vai de 0 até um certo número zc no eixo x. Esquematicamente, a tabela da normal nos fornece a probabilidade correspondente à área a seguir:
σ Z = X−^ μ
Usando a tabela da Normal Padrão
0 zc
p
Veja, esquematicamente, como deve ser a leitura da tabela:
Exemplo 3 – Padronização
Voltemos ao caso do Exemplo 3 onde tínhamos μ = 174 e σ = 8. Queríamos calcular P(X > 180). Vamos normalizar a variável X (ou seja, transformá-la em Z) e utilizar a tabela para obter a probabilidade desejada.
P( X 180 ) P X^1808174 =P ( Z> 0 , 75 ) ^
(^) > − σ
= −^ μ
Para obtermos a probabilidade desejada, devemos lembrar que a nossa tabela nos fornece a probabilidade de 0 até um certo valor.
Leitura da Tabela
2ª casa decimal de Z
Parte inteira e 1ª casa decimal de Z Probabilidade
−3.0 −2.0 −1.0 1.0 2.0 3.
−3.0 −2.0 −1.0 1.0 2.0 3.
Como fazer para calcular o valor desejado a partir do valor da tabela?
Bem, é preciso relembrar as propriedades da curva da normal, em especial duas delas:
Logo, concluímos, que a área correspondente à metade da curva é igual a 0,5:
−3.0 −2.0 −1.0 1.0 2.0 3.
−3.0 −2.0 −1.0 1.0 2.0 3.
Então, podemos observar que:
P(0 ≤ Z ≤ 0,75) + P(Z > 0,75) = 0,5 ⇒
Logo, a probabilidade procurada é de 0,2266 que corresponde ao mesmo valor obtido utilizando-se o software (exemplo 1).
0,
Em laranja, temos a área (probabilidade) que desejamos obter.
p = 0,
Exemplo 4 – Padronização
Consideremos a mesma situação do Exemplo 4. Ou seja, μ = 178, σ = 1 e queríamos calcular a probabilidade P(175 < X < 180).
Normalizando a variável X temos:
P( 3 Z 2 ) 1
X 180 178 1 P( 175 X 180 ) P^175178 = − < < ^
(^) < − σ < < =^ − < −^ μ
Graficamente:
−3.0 −2.0 −1.0 1.0 2.0 3.
−3.0 −2.0 −1.0 1.0 2.0 3.
Porém, a nossa tabela só nos fornece os valores:
−3.0 −2.0 −1.0 1.0 2.0 3.
−3.0 −2.0 −1.0 1.0 2.0 3.
E, também, fornece o valor de:
Em vermelho, temos a área (probabilidade) que desejamos obter.
−3.0 −2.0 −1.0 1.0 2.0 3.0 4.
−3.0 −2.0 −1.0 1.0 2.0 3.0 4.
−3.0 −2.0 −1.0 1.0 2.0 3.0 4.
−3.0 −2.0 −1.0 1.0 2.0 3.0 4.
= 0,6279 ou 62,79%
Como 0,6279. 50 = 31,39, temos que o número de pessoas aproximado que contenham tais característica é de 32 pessoas. Então, nesse teste a empresa já exclui 32 candidatos, restando apenas 18 para continuarem no processo de seleção.
Observação: uma outra notação para os Escores Padronizados é:
X = escore X (^) = média DP = desvio padrão z = escore padronizado
1ª) A variável aleatória X pode assumir todo e qualquer valor real.
2ª) A representação gráfica da distribuição normal é uma curva em forma de sino, simétrica em torno da média, que recebe o nome de curva normal ou de Gauss.
3ª) A área total limitada pela curva e pelo eixo das abscissas é igual a 1, já que essa área corresponde à probabilidade de a variável aleatória X assumir qualquer valor real.
4ª) A curva normal é assintótica em relação ao eixo das abscissas, isto é, aproxima-se indefinidamente do eixo das abscissas sem, contudo, alcançá-lo.
5ª) Como a curva é simétrica em torno da média, a probabilidade de ocorrer valor maior que a média é igual à probabilidade de ocorrer valor menor do que a média, isto é, ambas as probabilidades são iguais a 0,5 ou 50%. Cada metade da curva representa 50% de probabilidade.
Quando temos em mãos uma variável aleatória com distribuição normal, nosso principal interesse é obter a probabilidade de essa variável aleatória assumir um valor em um determinado intervalo. Vejamos com proceder, por meio de um exemplo concreto.
Exemplo 6: Qual a probabilidade de escolher-se de forma aleatória, numa só tentativa, uma pessoa que tenha renda anual entre US$ 5.000 e US$ 7.000, morador de uma cidade. Sendo a renda média desta cidade US$ 5.000 e o desvio padrão de US$ 1.500?
Exemplo 7: Os pesos de 600 estudantes são normalmente distribuídos com média 65, kg e desvio padrão 5,5 kg. Determine o número de estudantes que pesam: a) entre 60 kg e 70 kg
b) mais que 63,2 kg c) menos que 68 kg
Exemplo 8: Calcule as seguintes probabilidades: a) P (0 < z < 1,44) b) P (–1,48< z < 2,05) c) P (0,72 < z < 1,89) d) P (z > – 2,03)
a) inferior a 306 ml b) Superior a 305 ml c) entre 302 e 304 ml
a) superior a 18 mil reais b) inferior a 8 mil reais c) entre 10 e 15 mil reais
Durante o mês de dezembro aumenta a procura por concessão de crédito para pessoa física. De acordo com dados históricos é possível verificar que a procura segue uma distribuição aproximadamente normal com média de 12,8 milhões e desvio padrão de 15 milhões. Se as instituições de crédito reservarem 25 milhões para concessão de crédito, qual a probabilidade de faltar dinheiro para emprestar?
Suponha que a renda média anual de uma grande comunidade tenha distribuição normal com média de 15 mil reais e com um desvio-padrão de 3 mil reais. Qual a probabilidade de que um indivíduo aleatoriamente selecionado deste grupo apresente uma média salarial anual superior a 18 mil reais?
O escore de um estudante no vestibular é uma variável com distribuição normal com média de 550 pontos e desvio padrão de 30 pontos. Se a admissão em certa faculdade exige um escore mínimo de 575 pontos, qual é a probabilidade de um aluno ser admitido nesta faculdade?
As vendas de determinado produto têm apresentado distribuição normal com média de 600 unidades e desvio padrão de 40 unidades. Se a empresa decide fabricar 700 unidades naquele mesmo mês, qual é a probabilidade dela não poder atender a todos os pedidos desse mês por estar com o estoque esgotado?
O volume de enchimento de uma máquina automática usada para encher latas de bebidas gasosas é distribuído normalmente com uma média de 12,4 onças e um desvio padrão de 0,1 onça. Qual a probabilidade do volume de enchimento ser:
a) inferior a 12 onças b) entre 12,1 e 12,6 onças c) superior a 12,3 onças
a) mais de 0,5 segundos b) entre 0,4 e 0,5 segundos
a) entre 50 e 80 horas b) superior a 90 horas c) inferior a 60 horas
X é N(10; 100). Calcular P (12 ≤ X ≤ 20).
X é N(30; 16). Calcular P (X ≤ 19).
X é N(20; 25). Calcular P (X ≤ 30).
X é N(50; 81). Calcular P (40 ≤ X ≤ 60).
X é N(10; 16). Calcular P (X ≥ 5).
Respostas
1. 0, 2. a) 0,9998 b) 0,8665 c) 0, 3. 0, 4. a) 0,9987 b) 0,0062 c) 0, 5. a) 0,1151 b) 0,2119 c) 0, 6. 0,2090 7. 0,1587 8. 0, 9. 0, 10. a) 0,0001 b) 0,9759 c) 0, 11. a) 0,0228 b) 0, 12. a) 0,1525 b) 0,6915 c) 0, 13. 26,2% 14. 0,3% 15. 97,72% 16. 73,3% 17. 89,44%