














Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Encontra documentos específicos para os exames da tua universidade
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Apostilas de Matemática sobre o studo da Estatística, distribuição normal ou Gauss, propriedades da Distribuição Normal.
Tipologia: Notas de estudo
1 / 22
Esta página não é visível na pré-visualização
Não perca as partes importantes!















Professora: Janaina Pereira
Professora: Janaina Pereira
Professora: Janaina Pereira
Professora: Janaina Pereira
(2) DISTRIBUIÇÃO NORMAL OU GAUSS (contínua)
Se X é uma variável aleatória contínua, então X assume todos os valores em um intervalo de números reais ().
2 2
1
x
Π (Pi): (≈ 3,14159) e: (≈ 2,71828).
Média da Distribuição Normal : E(X) =
Variância da Distribuição Normal : VAR(X) = ^2 Algumas propriedades da Distribuição Normal : P(X=x) = f(X) = 0 (pois não existe a probabilidade no ponto e sim na área) f(X) é simétrica ao redor da média, ou seja, a probabilidade de ocorrer valor menor do que a média é igual a probabilidade de ocorrer valor menor do que a média. A curva normal depende de duas constantes, e ^2 :
Professora: Janaina Pereira
EXERCÍCIO DE FIXAÇÃO
Determinar o valor, ou valores, de z em cada um dos casos, nos quais as áreas referem-se às limitadas pela curva normal: Resposta: a) a área entre 0 e z é 0,3770 (z= 1,16) b) a área a esquerda de z é 0,8621 (z=1,09)
O peso médio de 500 estudantes do sexo masculino de uma determinada universidade é 75,5kg e o desvio padrão é de 7,5 kg. Admitindo-se que os pesos estão distribuídos normalmente, determinar quantos estudantes pesam: Resposta a) entre 60 e 77,5kg (P(-2,06<z<0,266)=0,6 => 300 estudantes) b) mais do que 92,5kg (P(z>2,26)=0,0119 = > 6 estudantes)
A média dos diâmetros internos de uma amostra de 200 arruelas produzidas por certa máquina é 0,502 polegadas e o desvio padrão é 0,005 polegadas. A finalidade para a qual essas arruelas são fabricadas permite a tolerância máxima, para o diâmetro, de 0,496 a 0,508 polegadas; se isso não se verifica, as arruelas serão consideradas defeituosas. Determinar a porcentagem de arruelas defeituosas produzidas pela máquina, admitindo-se que os diâmetros são distribuídos normalmente. Resposta: 23,02%
Se z é normalmente distribuída, com média zero e variância 1, determinar: Resposta: a) P(z>-1,64) = (0,9495) b) P(-1,96<z<1,96) = (0,95) c) P(0<z<1,44) = (0,4251) d) P(-0,85<z<0) = (0,3023) e) P(-1,48<z<2,05) = (0,9104) f) P(0,72<z<1,86) = (0,2044)
Professora: Janaina Pereira
Por exemplo: Um dos objetivos dos pesquisadores neste estudo é encontrar uma maneira de conhecer o peso do urso através de uma medida mais fácil de se obter do que a direta (carregar uma balança para o meio da selva e colocar os ursos em cima dela) como, por exemplo, uma medida de comprimento (altura, perímetro do tórax, etc.).
O problema estatístico aqui é encontrar uma variável que tenha uma relação forte com o peso, de modo que, a partir de seu valor medido, possa ser calculado (estimado) o valor peso indiretamente, através de uma equação matemática.
O primeiro passo para encontrar esta variável é fazer o diagrama de dispersão das variáveis candidatas (eixo horizontal) versus o peso (eixo vertical), usando os pares de informações de todos os ursos. Você pode tentar as variáveis: idade, altura, comprimento da cabeça, largura da cabeça, perímetro do pescoço e perímetro do tórax. A Figura mostra a relação entre peso e altura e entre peso e perímetro do tórax.
Analisando o gráfico:
Professora: Janaina Pereira
Observação: A correlação entre duas variáveis pode ser POSITIVA, NULA ou NEGATIVA.
‐^ ‐ 3025
‐^ ‐ 2015
‐ 10 ‐^5
05
10
0 5 10 15 20 25 30 Gráfico 1 (+) Gráfico 2 (-)
‐ 10
‐ 5
0
5
10
15
0 5 10 15 20 25 30 Gráfico 3 (nula)
Cálculo do Coeficiente de Correlação Linear de Pearson
Definição: Dado n pares de valores (x1, y1), (x2, y2), ..., (xn, yn), o coeficiente entre as duas variáveis X e Y é dado pela média dos valores dos produtos padronizados das variáveis.
(^2) 2 2 2 i i i i
i i i i n x x n y y
n xy x y r
Indica o grau de intensidade entre duas variáveis e ainda o sentido dessa correlação (positivo ou negativo). Só deve ser utilizado com variáveis contínuas. A partir dos valores de r, podemos verificar o tipo da correlação existente entre as variáveis estudadas, conforme tabela seguinte:
‐ 10 ‐^5
05
1015
2025
30
0 5 10 15 20 25 30
Valor de r Correlação 0,0 Nula 0,0 ----| 0,3 Fraca 0,3 ----| 0,6 Media 0,6 ----| 0,9 Forte 0,9 ----| 0,99 Fortíssima 1,0 Perfeita
Professora: Janaina Pereira
N o^ Dormitórios 1 2 3 4 Volume de lixo 0,15 0,29 0,45 0, a) Calcular o coeficiente de correlação de Pearson. (0,9986)
Preço (R$) 56,00 60,00 63,00 68,00 74, Demanda (un.) 100 93 87 81 75 a) Calcular o coeficiente de correlação de Pearson. (-0,983)
a) Calcular o coeficiente de correlação de Pearson. (0,9969)
Gastos com propaganda (em milhares de R$)
Volume de vendas (em milhares de R$)
Professora: Janaina Pereira
Objetivo : A regressão linear simples constitui uma tentativa de estabelecer uma equação matemática linear (linha reta) que descreva o relacionamento entre duas variáveis.
Para obter uma reta de regressão, n pares de observações das variáveis são utilizados. Considerando Y como a variável dependente ou variável resposta e, X como a variável independente ou preditora, a reta de regressão é dada por:
Y = + X + u é o coeficiente linear (intercepto), ou seja, é o ponto onde a reta corta o eixo Y; é o coeficiente angular, ou seja, determina a inclinação da reta.
Graficamente:
u representa o incremento em Y quando X aumenta em uma unidade;
ESTIMADORES DE E PARA O MODELO DE REGRESSÃO LINEAR
Os valores de a e b serão determinados, através do Método dos Mínimos Quadrados (MMQ). O objetivo é encontrar a e b tal que a soma dos erros quadráticos médios seja o menor possível.
+ X + u
+ X
Professora: Janaina Pereira
Então, precisamos calcular os valores dos parâmetros da equação Y â b ˆ X
que é uma estimativa da verdadeira equação da reta de regressão, onde
Y é o estimado.
Identificação das variáveis:
Variável dependente: Potência do antibiótico Variável independente: Temperatura
Estimadores da reta de regressão:
ˆ 2 16.^32046. 655 (^1010 )(^64 ( 64 ,^9 ,)( 9 )^272 ,^6 ) 45341592 , 9 ,^40 , 35114 1
2
(^1)
x n x
x y nxy b (^) n i i
n i i i
(Coef. Linear)
a ˆ y b ˆ x 27 , 6 ( 0 , 35114 ) 64 , 9 50 , (^389) (Coef. Angular ou Intercepto)
Logo,
Y 50 , 389 0 , 35114 X
Interpretação da reta de regressão: cada ponto da reta de regressão fornece uma estimativa do valor médio ou esperado de Y correspondente ao valor X escolhido; O valor b ˆ =-0,35114, que mede a declividade da reta, mostra que, dento da escala da amostra de X entre 30ºC e 95ºC, quando X aumenta em , digamos 1ºC, a potência
reta, indica o nível médio da potência do antibiótico quando a temperatura é zero.
Determinar a potência do antibiótico quando a exposição for de 65o^ C.
50 , 389 0 , 35114 ( 65 ) 50 , 389 22 , 8141 27 , 5749
Y
Exemplo 2 : Um funcionário de uma pista de corrida local gostaria de desenvolver um modelo para prever a quantia apostada (em mil dólares) com base na freqüência do público (por 100 apostadores). Após realizar a reta de regressão, o funcionário obteve os resultados abaixo. Escreve a equação da reta e interprete-a:
Coeficiente Intercepto 4, Coef. Linear 0,
Professora: Janaina Pereira
Resposta: Y = variável dependente = quantidade apostada X = variável independente = freqüência do público
Assim, o valor apostado quando a freqüência é zero (0) é de 4,3424 mil dólares. Além disso, para cada 100 pessoas a mais na pista o total apostado subirá em 0,0465.
Uma importante função de determinar a reta de regressão para duas variáveis é a possibilidade de realizar previsões, ou seja, uma vez que obtemos a reta de regressão, podemos escolher um valor de interesse para a variável independente (X) e determinar o valor esperado para a variável dependente (Y).
Professora: Janaina Pereira
r^2 : COEFICIENTE DE DETERMINAÇÃO Uma das formas de determinar se o modelo encontrado é satisfatório para explicar os dados é calculando o COEFICIENTE DE DETERMINAÇÃO do modelo. Esse coeficiente compara a variabilidade do modelo com a variabilidade total dos dados.
CÁLCULO DO r^2 :
SQT
SQE y y
y y r (^) n
i i
n i i
1
2
1
2 2 ( )
(ˆ )
A variabilidade do modelo (variabilidade explicada ou soma dos quadrados
explicada) pode ser calculada como:
2 1
(ˆ )
n
i
A variabilidade total (soma dos quadrados total) pode ser calculada como:
n i
yi y 1
( )^2 .
0 X
Y
y
yi
Y ˆ^ a ˆ b ˆ X
SQE
SQR y ˆ i
Mostra a variação total nos valores de Y observados em relação a média.
Variação devido ao resíduo, pois nem todas s observações efetivas de Y ficam sobre a reta ajustada.
Variação devido à regressão.
0 X
Y
y
yi
Y ˆ^ a ˆ b ˆ X
SQE
SQR y ˆ i
Mostra a variação total nos valores de Y observados em relação a média.
Variação devido ao resíduo, pois nem todas s observações efetivas de Y ficam sobre a reta ajustada.
Variação devido à regressão.
Professora: Janaina Pereira
Observação:
Exemplo 1 : Calcular e interpretar o coeficiente de determinação R 2 para os dados do primeiro exercício.
Temperatura (X)
Potência (Y)
Valores preditos ( y ˆ^ ) ( y (^) i y )^2 ( y ˆ (^) i y )^2 30 38 39.86 108.16 150. 36 43 37.75 237.16 103. 50 32 32.83 19.36 27. 54 26 31.43 2.56 14. (^60 33) 29.32 29.16 2. (^73 19) 24.76 73.96 8. (^78 27) 23.00 0.36 21. 82 23 21.60 21.16 36. 91 14 18.44 184.96 83. 95 21 17.03 43.56 111. y (^) 27,
n i i^
y y 1
n i i^
y y 1
de Y. Em outras palavras, a variabilidade da potência do antibiótico é 77,59% explicada pela sua temperatura de armazenamento.