Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas


Introdução à Distribuição Normal: Conceitos e Aplicações em Estatística, Provas de Probabilidade

Queríamos calcular P(X >. 180). Vamos normalizar a variável X (ou seja, transformá-la em Z) e utilizar a tabela para obter a probabilidade desejada.

Tipologia: Provas

2022

Compartilhado em 07/11/2022

Michelle87
Michelle87 🇧🇷

4.7

(23)

221 documentos

1 / 18

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
Curso: Logística e Transportes
Disciplina: Estatística
Profa. Eliane Cabariti
Distribuição Normal
1. Introdução
“O mundo é normal!” Acredite se quiser! Muitos dos fenômenos aleatórios que
encontramos na prática apresentam uma distribuição muito peculiar, chamada Normal.
Um modelo probabilístico é aquele que nos diz, ou melhor, nos traduz na forma de
números o comportamento de uma variável. Por exemplo, já fizemos algumas análises das
variáveis altura e peso. Considerando o caso de grandes amostras aleatórias ou mesmo da
população, tanto o peso como a altura tem um comportamento muito parecido. Vejamos, por
exemplo, a variável altura, considerando-se o sexo masculino e sendo a população os
habitantes do Brasil. Essa variável é dita Normal, conforme discutiremos mais adiante.
Essa distribuição de freqüência denominada curva normal, considerada um modelo
teórico ou ideal que resulta muito mais de uma equação matemática do que de um real
delineamento de pesquisa com coleta de dados.
A curva normal é um tipo de curva simétrica, suave, cuja forma lembra um sino. Ela é
unimodal, sendo seu ponto de freqüência máxima situado no meio da distribuição, em que a
média, a mediana e a moda coincidem.
Para exemplificarmos, suponhamos 2000 lançamentos de 200 moedas honestas.
Utilizando um software de simulação, obtivemos os seguintes resultados:
[80 ... 81] 5
[82 ... 83] 6
[84 ... 85] 16
[86 ... 87] 19
[88 ... 89] 39
[90 ... 91] 60
[92 ... 93] 91
[94 ... 95] 111
[96 ... 97] 165
[98 ... 99] 194
[100 ... 101] 227
[102 ... 103] 220
[104 ... 105] 206
[106 ... 107] 174
[108 ... 109] 155
[110 ... 111] 123
[112 ... 113] 84
[114 ... 115] 49
[116 ... 117] 21
[118 ... 119] 18
[120 ... 121] 6
[122 ... 123] 8
[124 ... 125] 2
[126 ... 127] 1
sample mean = 102.132
sample st dev = 7.238
A partir desses dados, construímos o histograma:
74
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12

Pré-visualização parcial do texto

Baixe Introdução à Distribuição Normal: Conceitos e Aplicações em Estatística e outras Provas em PDF para Probabilidade, somente na Docsity!

Curso: Logística e Transportes Disciplina: Estatística Profa. Eliane Cabariti

Distribuição Normal

1. Introdução

“O mundo é normal!” Acredite se quiser! Muitos dos fenômenos aleatórios que encontramos na prática apresentam uma distribuição muito peculiar, chamada Normal.

Um modelo probabilístico é aquele que nos diz, ou melhor, nos traduz na forma de números o comportamento de uma variável. Por exemplo, já fizemos algumas análises das variáveis altura e peso. Considerando o caso de grandes amostras aleatórias ou mesmo da população, tanto o peso como a altura tem um comportamento muito parecido. Vejamos, por exemplo, a variável altura, considerando-se o sexo masculino e sendo a população os habitantes do Brasil. Essa variável é dita Normal, conforme discutiremos mais adiante.

Essa distribuição de freqüência denominada curva normal, considerada um modelo teórico ou ideal que resulta muito mais de uma equação matemática do que de um real delineamento de pesquisa com coleta de dados. A curva normal é um tipo de curva simétrica, suave, cuja forma lembra um sino. Ela é unimodal, sendo seu ponto de freqüência máxima situado no meio da distribuição, em que a média, a mediana e a moda coincidem.

Para exemplificarmos, suponhamos 2000 lançamentos de 200 moedas honestas. Utilizando um software de simulação, obtivemos os seguintes resultados:

[80 ... 81] 5 [82 ... 83] 6 [84 ... 85] 16 [86 ... 87] 19 [88 ... 89] 39 [90 ... 91] 60 [92 ... 93] 91 [94 ... 95] 111 [96 ... 97] 165 [98 ... 99] 194 [100 ... 101] 227 [102 ... 103] 220 [104 ... 105] 206 [106 ... 107] 174 [108 ... 109] 155 [110 ... 111] 123 [112 ... 113] 84 [114 ... 115] 49 [116 ... 117] 21 [118 ... 119] 18 [120 ... 121] 6 [122 ... 123] 8 [124 ... 125] 2 [126 ... 127] 1

sample mean = 102. sample st dev = 7.

A partir desses dados, construímos o histograma:

79.50 127.

0

227

Freq

heads

Observando tal histograma e a tabela anterior, notamos que a média está entre as duas classes com maior freqüências. Além disso, considerando-se a média, percebemos que o histograma parece ser simétrico ao redor dela. A freqüência é menor quanto mais nos afastamos da média, tanto para mais quanto para menos, sendo que as menores freqüências ocorrem nas pontas do gráfico.

Se aumentarmos a quantidade de classes, por exemplo, elevando para 40, obtemos o seguinte histograma:

79.50 127.

0

227

Freq

heads

Note que quanto mais classes usamos, mais fácil fica identificarmos um formato criado pelas colunas do histograma. Esse formato faz lembrar um sino, conforme a figura seguinte:

Note que conforme o caso, poderemos ter curvas com formatos diferentes, ou seja, mais para a direita, mais para a esquerda, mais ou menos achatadas... enfim, cada caso poderá gerar uma curva diferente. Vejamos mais um caso.

Consideremos o lançamento de dois dados não viciados. Estamos interessados em analisar a soma dos resultados obtidos em cada jogada. Realizando uma simulação e construindo o histograma dos resultados, obtemos:

1.50 12.

0

173

Freq

sum

No caso simulado, obtivemos:

sample mean = 7. sample st dev = 2.

Ou seja, μ = 7,07 e s = 2,34, onde μ indica a média e s o desvio padrão da amostra. Isolando a curva da normal temos:

−1.0 1.0 2.0 3.0 4.0 5.0 6.0 7.0 8.0 9.0 10.011.012.013.014.015.016.

−1.0 1.0 2.0 3.0 4.0 5.0 6.0 7.0 8.0 9.0 10.011.012.013.014.015.016.

Assim, conforme havíamos dito, existem diferentes curvas, que variam conforme os valores da média e do desvio-padrão.

Lembramos que a área abaixo desse gráfico vale 1. Ou seja, a área corresponde a uma probabilidade.

2. Área sob a Curva Normal

É aquela região do plano compreendida entre a curva e o eixo das abscissas, que corresponde em qualquer distribuição normal a 100% dos dados considerados. A natureza simétrica da curva normal vai levar a concluir que qualquer distância medida em “sigmas” (desvio padrão), acima ou abaixo da média, contém a mesma porção da área sob a curva. Temos então:

34,13% da área total situam-se entre a média e 1 DP abaixo ou acima da média; 47,72% da área total situam-se entre a média e 2 DP abaixo ou acima da média; 49,87% da área total situam-se entre a média e 3 DP abaixo ou acima da média;

Exemplo 1: consideremos uma população de uma cidade A e de uma outra cidade B. Suponhamos que todas as pessoas tenham informado as respectivas alturas (em centímetros). E deseja-se fazer uma comparação entre tais populações. As principais estatísticas obtidas por essa pesquisa foram:

População A

População B Média ( μ )^174 Variância ( σ^2 )

Um pesquisador deseja sortear aleatoriamente pessoas para fazer um teste sobre DNA e crescimento e, para isso, gostaria de coletar (aleatoriamente!) pessoas com mais de 1,80m. Em qual das duas populações será mais fácil achar pessoas com tais características?

Para isso, podemos dizer que estamos trabalhando com duas variáveis:

XA: altura de 1 pessoa selecionada ao acaso na população A XB: altura de 1 pessoa selecionada ao acaso na população B

Nosso objetivo é calcular as seguintes probabilidades:

P(XA > 180) e P(XB > 180).

Mas antes, calculemos o valor do desvio-padrão (σ) de cada uma das populações. Lembrando que o desvio-padrão nada mais é do que a raiz quadrada da variância. Logo:

σA = 64 = 8 σB = 1 = 1

Utilizando um software é possível calcularmos tais probabilidades. Esse software calcula, na verdade, a área abaixo da curva:

P(XA > 180) = 0,2266 ou 22,66%

P(XB > 180) = 0,0228 ou 2,28%

A grande vantagem de usarmos tal distribuição é o fato de trabalharmos apenas com uma distribuição e, portanto, com uma única tabela. Tudo é mais fácil!

Porém, como fazer para obtermos tal variável Z (padronizada) a partir de uma variável aleatória qualquer X tal que X ~ N(μ, σ^2 )?

Basta padronizarmos ou normalizarmos a variável X através da fórmula:

onde: μ = média de X

σ = desvio-padrão de X

Existem algumas variações de apresentação da tabela. No nosso caso, utilizaremos uma tabela tal que:

P(0 ≤ Z ≤ zc) = p, ou seja, a probabilidade fornecida pela tabela (p) corresponde ao intervalo que vai de 0 até um certo número zc no eixo x. Esquematicamente, a tabela da normal nos fornece a probabilidade correspondente à área a seguir:

σ Z = X−^ μ

Usando a tabela da Normal Padrão

0 zc

p

Veja, esquematicamente, como deve ser a leitura da tabela:

Exemplo 3 – Padronização

Voltemos ao caso do Exemplo 3 onde tínhamos μ = 174 e σ = 8. Queríamos calcular P(X > 180). Vamos normalizar a variável X (ou seja, transformá-la em Z) e utilizar a tabela para obter a probabilidade desejada.

P( X 180 ) P X^1808174 =P ( Z> 0 , 75 )  ^  

 (^) > − σ

= −^ μ

Para obtermos a probabilidade desejada, devemos lembrar que a nossa tabela nos fornece a probabilidade de 0 até um certo valor.

Leitura da Tabela

2ª casa decimal de Z

Parte inteira e 1ª casa decimal de Z Probabilidade

−3.0 −2.0 −1.0 1.0 2.0 3.

−3.0 −2.0 −1.0 1.0 2.0 3.

Como fazer para calcular o valor desejado a partir do valor da tabela?

Bem, é preciso relembrar as propriedades da curva da normal, em especial duas delas:

  1. a área abaixo da curva é igual a 1;
  2. a curva é simétrica em torno da média (no caso da normal padrão, em torno do zero).

Logo, concluímos, que a área correspondente à metade da curva é igual a 0,5:

−3.0 −2.0 −1.0 1.0 2.0 3.

−3.0 −2.0 −1.0 1.0 2.0 3.

Então, podemos observar que:

P(0 ≤ Z ≤ 0,75) + P(Z > 0,75) = 0,5 ⇒

P(Z > 0,75) = 0,5 – P(0 ≤ Z ≤ 0,75) ⇒

P(Z > 0,75) = 0,5 – 0,2734 ⇒

P(Z > 0,75) = 0,

Logo, a probabilidade procurada é de 0,2266 que corresponde ao mesmo valor obtido utilizando-se o software (exemplo 1).

0,

Em laranja, temos a área (probabilidade) que desejamos obter.

p = 0,

Exemplo 4 – Padronização

Consideremos a mesma situação do Exemplo 4. Ou seja, μ = 178, σ = 1 e queríamos calcular a probabilidade P(175 < X < 180).

Normalizando a variável X temos:

P( 3 Z 2 ) 1

X 180 178 1 P( 175 X 180 ) P^175178 = − < <  ^  

 (^) < − σ < < =^ − < −^ μ

Graficamente:

−3.0 −2.0 −1.0 1.0 2.0 3.

−3.0 −2.0 −1.0 1.0 2.0 3.

Porém, a nossa tabela só nos fornece os valores:

−3.0 −2.0 −1.0 1.0 2.0 3.

−3.0 −2.0 −1.0 1.0 2.0 3.

E, também, fornece o valor de:

Em vermelho, temos a área (probabilidade) que desejamos obter.

−3.0 −2.0 −1.0 1.0 2.0 3.0 4.

−3.0 −2.0 −1.0 1.0 2.0 3.0 4.

−3.0 −2.0 −1.0 1.0 2.0 3.0 4.

−3.0 −2.0 −1.0 1.0 2.0 3.0 4.

= 0,6279 ou 62,79%

Como 0,6279. 50 = 31,39, temos que o número de pessoas aproximado que contenham tais característica é de 32 pessoas. Então, nesse teste a empresa já exclui 32 candidatos, restando apenas 18 para continuarem no processo de seleção.

Observação: uma outra notação para os Escores Padronizados é:

X - X

z =

DP

X = escore X (^) = média DP = desvio padrão z = escore padronizado

4. Resumo das Propriedades da Distribuição Normal

1ª) A variável aleatória X pode assumir todo e qualquer valor real.

2ª) A representação gráfica da distribuição normal é uma curva em forma de sino, simétrica em torno da média, que recebe o nome de curva normal ou de Gauss.

3ª) A área total limitada pela curva e pelo eixo das abscissas é igual a 1, já que essa área corresponde à probabilidade de a variável aleatória X assumir qualquer valor real.

4ª) A curva normal é assintótica em relação ao eixo das abscissas, isto é, aproxima-se indefinidamente do eixo das abscissas sem, contudo, alcançá-lo.

5ª) Como a curva é simétrica em torno da média, a probabilidade de ocorrer valor maior que a média é igual à probabilidade de ocorrer valor menor do que a média, isto é, ambas as probabilidades são iguais a 0,5 ou 50%. Cada metade da curva representa 50% de probabilidade.

Quando temos em mãos uma variável aleatória com distribuição normal, nosso principal interesse é obter a probabilidade de essa variável aleatória assumir um valor em um determinado intervalo. Vejamos com proceder, por meio de um exemplo concreto.

Exemplo 6: Qual a probabilidade de escolher-se de forma aleatória, numa só tentativa, uma pessoa que tenha renda anual entre US$ 5.000 e US$ 7.000, morador de uma cidade. Sendo a renda média desta cidade US$ 5.000 e o desvio padrão de US$ 1.500?

Exemplo 7: Os pesos de 600 estudantes são normalmente distribuídos com média 65, kg e desvio padrão 5,5 kg. Determine o número de estudantes que pesam: a) entre 60 kg e 70 kg

b) mais que 63,2 kg c) menos que 68 kg

Exemplo 8: Calcule as seguintes probabilidades: a) P (0 < z < 1,44) b) P (–1,48< z < 2,05) c) P (0,72 < z < 1,89) d) P (z > – 2,03)

a) inferior a 306 ml b) Superior a 305 ml c) entre 302 e 304 ml

  1. O lucro mensal obtido com ações de determinada empresa tem distribuição normal com média de 12 mil reais e desvio padrão de 5 mil reais. Qual a probabilidade de que em determinado mês o lucro desta empresa seja:

a) superior a 18 mil reais b) inferior a 8 mil reais c) entre 10 e 15 mil reais

  1. Durante o mês de dezembro aumenta a procura por concessão de crédito para pessoa física. De acordo com dados históricos é possível verificar que a procura segue uma distribuição aproximadamente normal com média de 12,8 milhões e desvio padrão de 15 milhões. Se as instituições de crédito reservarem 25 milhões para concessão de crédito, qual a probabilidade de faltar dinheiro para emprestar?

  2. Suponha que a renda média anual de uma grande comunidade tenha distribuição normal com média de 15 mil reais e com um desvio-padrão de 3 mil reais. Qual a probabilidade de que um indivíduo aleatoriamente selecionado deste grupo apresente uma média salarial anual superior a 18 mil reais?

  3. O escore de um estudante no vestibular é uma variável com distribuição normal com média de 550 pontos e desvio padrão de 30 pontos. Se a admissão em certa faculdade exige um escore mínimo de 575 pontos, qual é a probabilidade de um aluno ser admitido nesta faculdade?

  4. As vendas de determinado produto têm apresentado distribuição normal com média de 600 unidades e desvio padrão de 40 unidades. Se a empresa decide fabricar 700 unidades naquele mesmo mês, qual é a probabilidade dela não poder atender a todos os pedidos desse mês por estar com o estoque esgotado?

  5. O volume de enchimento de uma máquina automática usada para encher latas de bebidas gasosas é distribuído normalmente com uma média de 12,4 onças e um desvio padrão de 0,1 onça. Qual a probabilidade do volume de enchimento ser:

a) inferior a 12 onças b) entre 12,1 e 12,6 onças c) superior a 12,3 onças

  1. O tempo de reação de um motorista para o estímulo visual é normalmente distribuído com uma média de 0,4 segundos com um desvio-padrão de 0,05 segundos. Qual a probabilidade de que uma reação de um motorista requeira:

a) mais de 0,5 segundos b) entre 0,4 e 0,5 segundos

  1. O período de falta de trabalho em um mês por causa de doenças dos empregados é normalmente distribuído com uma média de 100 horas e desvio padrão de 20 horas. Qual a probabilidade desse período no próximo mês estar:

a) entre 50 e 80 horas b) superior a 90 horas c) inferior a 60 horas

  1. X é N(10; 100). Calcular P (12 ≤ X ≤ 20).

  2. X é N(30; 16). Calcular P (X ≤ 19).

  3. X é N(20; 25). Calcular P (X ≤ 30).

  4. X é N(50; 81). Calcular P (40 ≤ X ≤ 60).

  5. X é N(10; 16). Calcular P (X ≥ 5).

Respostas

1. 0, 2. a) 0,9998 b) 0,8665 c) 0, 3. 0, 4. a) 0,9987 b) 0,0062 c) 0, 5. a) 0,1151 b) 0,2119 c) 0, 6. 0,2090 7. 0,1587 8. 0, 9. 0, 10. a) 0,0001 b) 0,9759 c) 0, 11. a) 0,0228 b) 0, 12. a) 0,1525 b) 0,6915 c) 0, 13. 26,2% 14. 0,3% 15. 97,72% 16. 73,3% 17. 89,44%