Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas


Estatística Parte3, Notas de estudo de Estatística

Apostilas de Matemática sobre o studo da Estatística, distribuição normal ou Gauss, propriedades da Distribuição Normal.

Tipologia: Notas de estudo

2013

Compartilhado em 11/04/2013

jacare84
jacare84 🇧🇷

4.5

(454)

221 documentos

1 / 22

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
IFRJ – Instituto Federal de Educação, Ciência e Tecnologia – Rio de Janeiro
Professora: Janaina Pereira
45
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16

Pré-visualização parcial do texto

Baixe Estatística Parte3 e outras Notas de estudo em PDF para Estatística, somente na Docsity!

Professora: Janaina Pereira

Professora: Janaina Pereira

Professora: Janaina Pereira

Professora: Janaina Pereira

(2) DISTRIBUIÇÃO NORMAL OU GAUSS (contínua)

Se X é uma variável aleatória contínua, então X assume todos os valores em um intervalo de números reais ().

  • A distribuição de probabilidade de X é descrita por uma curva de densidade, ou função de densidade.

2 2

1

^1  ^ 

 

x

f x e

 Π (Pi): (≈ 3,14159)  e: (≈ 2,71828).

  • A probabilidade de qualquer evento é a área sob a curva de densidade entre os valores de X que compõe o evento.
  • A área total sob qualquer curva de densidade é 1, de modo que a probabilidade de um evento varia entre 0 e 1.
    • Parâmetros da Distribuição Normal X ~ N (, ^2 )

Média da Distribuição Normal : E(X) = 

Variância da Distribuição Normal : VAR(X) = ^2 Algumas propriedades da Distribuição Normal :  P(X=x) = f(X) = 0 (pois não existe a probabilidade no ponto e sim na área)  f(X) é simétrica ao redor da média, ou seja, a probabilidade de ocorrer valor menor do que a média é igual a probabilidade de ocorrer valor menor do que a média.  A curva normal depende de duas constantes,  e ^2 :

  •  corresponde ao centro da simetria da curva e 2 graficamente, fornece a distância do centro da simetria aos pontos onde a curva muda de sentido.

Professora: Janaina Pereira

  • Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0, Tabela: Probabilidades da Distribuição Normal
  • 0,0 0,000000 0,003989 0,007978 0,011966 0,015953 0,019939 0,023922 0,027903 0,031881 0,
  • 0,1 0,039828 0,043795 0,047758 0,051717 0,055670 0,059618 0,063559 0,067495 0,071424 0,
  • 0,2 0,079260 0,083166 0,087064 0,090954 0,094835 0,098706 0,102568 0,106420 0,110261 0,
  • 0,3 0,117911 0,121720 0,125516 0,129300 0,133072 0,136831 0,140576 0,144309 0,148027 0,
  • 0,4 0,155422 0,159097 0,162757 0,166402 0,170031 0,173645 0,177242 0,180822 0,184386 0,
  • 0,5 0,191462 0,194974 0,198468 0,201944 0,205401 0,208840 0,212260 0,215661 0,219043 0,
  • 0,6 0,225747 0,229069 0,232371 0,235653 0,238914 0,242154 0,245373 0,248571 0,251748 0,
  • 0,7 0,258036 0,261148 0,264238 0,267305 0,270350 0,273373 0,276373 0,279350 0,282305 0,
  • 0,8 0,288145 0,291030 0,293892 0,296731 0,299546 0,302337 0,305105 0,307850 0,310570 0,
  • 0,9 0,315940 0,318589 0,321214 0,323814 0,326391 0,328944 0,331472 0,333977 0,336457 0,
  • 1,0 0,341345 0,343752 0,346136 0,348495 0,350830 0,353141 0,355428 0,357690 0,359929 0,
  • 1,1 0,364334 0,366500 0,368643 0,370762 0,372857 0,374928 0,376976 0,379000 0,381000 0,
  • 1,2 0,384930 0,386861 0,388768 0,390651 0,392512 0,394350 0,396165 0,397958 0,399727 0,
  • 1,3 0,403200 0,404902 0,406582 0,408241 0,409877 0,411492 0,413085 0,414657 0,416207 0,
  • 1,4 0,419243 0,420730 0,422196 0,423641 0,425066 0,426471 0,427855 0,429219 0,430563 0,
  • 1,5 0,433193 0,434478 0,435745 0,436992 0,438220 0,439429 0,440620 0,441792 0,442947 0,
  • 1,6 0,445201 0,446301 0,447384 0,448449 0,449497 0,450529 0,451543 0,452540 0,453521 0,
  • 1,7 0,455435 0,456367 0,457284 0,458185 0,459070 0,459941 0,460796 0,461636 0,462462 0,
  • 1,8 0,464070 0,464852 0,465620 0,466375 0,467116 0,467843 0,468557 0,469258 0,469946 0,
  • 1,9 0,471283 0,471933 0,472571 0,473197 0,473810 0,474412 0,475002 0,475581 0,476148 0,
  • 2,0 0,477250 0,477784 0,478308 0,478822 0,479325 0,479818 0,480301 0,480774 0,481237 0,
  • 2,1 0,482136 0,482571 0,482997 0,483414 0,483823 0,484222 0,484614 0,484997 0,485371 0,
  • 2,2 0,486097 0,486447 0,486791 0,487126 0,487455 0,487776 0,488089 0,488396 0,488696 0,
  • 2,3 0,489276 0,489556 0,489830 0,490097 0,490358 0,490613 0,490863 0,491106 0,491344 0,
  • 2,4 0,491802 0,492024 0,492240 0,492451 0,492656 0,492857 0,493053 0,493244 0,493431 0,
  • 2,5 0,493790 0,493963 0,494132 0,494297 0,494457 0,494614 0,494766 0,494915 0,495060 0,
  • 2,6 0,495339 0,495473 0,495604 0,495731 0,495855 0,495975 0,496093 0,496207 0,496319 0,
  • 2,7 0,496533 0,496636 0,496736 0,496833 0,496928 0,497020 0,497110 0,497197 0,497282 0,
  • 2,8 0,497445 0,497523 0,497599 0,497673 0,497744 0,497814 0,497882 0,497948 0,498012 0,
  • 2,9 0,498134 0,498193 0,498250 0,498305 0,498359 0,498411 0,498462 0,498511 0,498559 0,
  • 3,0 0,498650 0,498694 0,498736 0,498777 0,498817 0,498856 0,498893 0,498930 0,498965 0,
  • 3,1 0,499032 0,499065 0,499096 0,499126 0,499155 0,499184 0,499211 0,499238 0,499264 0,
  • 3,2 0,499313 0,499336 0,499359 0,499381 0,499402 0,499423 0,499443 0,499462 0,499481 0,
  • 3,3 0,499517 0,499534 0,499550 0,499566 0,499581 0,499596 0,499610 0,499624 0,499638 0,
  • 3,4 0,499663 0,499675 0,499687 0,499698 0,499709 0,499720 0,499730 0,499740 0,499749 0,
  • 3,5 0,499767 0,499776 0,499784 0,499792 0,499800 0,499807 0,499815 0,499822 0,499828 0,
  • 3,6 0,499841 0,499847 0,499853 0,499858 0,499864 0,499869 0,499874 0,499879 0,499883 0,
  • 3,7 0,499892 0,499896 0,499900 0,499904 0,499908 0,499912 0,499915 0,499918 0,499922 0,
  • 3,8 0,499928 0,499931 0,499933 0,499936 0,499938 0,499941 0,499943 0,499946 0,499948 0,
  • 3,9 0,499952 0,499954 0,499956 0,499958 0,499959 0,499961 0,499963 0,499964 0,499966 0,
  • 4,0 0,499968 0,499970 0,499971 0,499972 0,499973 0,499974 0,499975 0,499976 0,499977 0,

Professora: Janaina Pereira

EXERCÍCIO DE FIXAÇÃO

  1. Determinar o valor, ou valores, de z em cada um dos casos, nos quais as áreas referem-se às limitadas pela curva normal: Resposta: a) a área entre 0 e z é 0,3770 (z= 1,16) b) a área a esquerda de z é 0,8621 (z=1,09)

  2. O peso médio de 500 estudantes do sexo masculino de uma determinada universidade é 75,5kg e o desvio padrão é de 7,5 kg. Admitindo-se que os pesos estão distribuídos normalmente, determinar quantos estudantes pesam: Resposta a) entre 60 e 77,5kg (P(-2,06<z<0,266)=0,6 => 300 estudantes) b) mais do que 92,5kg (P(z>2,26)=0,0119 = > 6 estudantes)

  3. A média dos diâmetros internos de uma amostra de 200 arruelas produzidas por certa máquina é 0,502 polegadas e o desvio padrão é 0,005 polegadas. A finalidade para a qual essas arruelas são fabricadas permite a tolerância máxima, para o diâmetro, de 0,496 a 0,508 polegadas; se isso não se verifica, as arruelas serão consideradas defeituosas. Determinar a porcentagem de arruelas defeituosas produzidas pela máquina, admitindo-se que os diâmetros são distribuídos normalmente. Resposta: 23,02%

  4. Se z é normalmente distribuída, com média zero e variância 1, determinar: Resposta: a) P(z>-1,64) = (0,9495) b) P(-1,96<z<1,96) = (0,95) c) P(0<z<1,44) = (0,4251) d) P(-0,85<z<0) = (0,3023) e) P(-1,48<z<2,05) = (0,9104) f) P(0,72<z<1,86) = (0,2044)

Professora: Janaina Pereira

Por exemplo: Um dos objetivos dos pesquisadores neste estudo é encontrar uma maneira de conhecer o peso do urso através de uma medida mais fácil de se obter do que a direta (carregar uma balança para o meio da selva e colocar os ursos em cima dela) como, por exemplo, uma medida de comprimento (altura, perímetro do tórax, etc.).

O problema estatístico aqui é encontrar uma variável que tenha uma relação forte com o peso, de modo que, a partir de seu valor medido, possa ser calculado (estimado) o valor peso indiretamente, através de uma equação matemática.

O primeiro passo para encontrar esta variável é fazer o diagrama de dispersão das variáveis candidatas (eixo horizontal) versus o peso (eixo vertical), usando os pares de informações de todos os ursos. Você pode tentar as variáveis: idade, altura, comprimento da cabeça, largura da cabeça, perímetro do pescoço e perímetro do tórax. A Figura mostra a relação entre peso e altura e entre peso e perímetro do tórax.

Analisando o gráfico:

  1. Podemos ver que, tanto a altura quanto o perímetro do tórax são fortemente associados ao peso do urso, no sentido de que quanto mais alto o urso ou quanto maior a medida de seu tórax, mais pesado ele será.
  2. Note que este crescimento é linear para o perímetro do tórax e não-linear para a altura.
  3. Os pontos estão mais dispersos no gráfico da altura, a variável mais adequada para estimar o peso é o perímetro do tórax.

Professora: Janaina Pereira

Observação: A correlação entre duas variáveis pode ser POSITIVA, NULA ou NEGATIVA.

‐^ ‐ 3025

‐^ ‐ 2015

‐ 10 ‐^5

05

10

0 5 10 15 20 25 30 Gráfico 1 (+) Gráfico 2 (-)

‐ 10

‐ 5

0

5

10

15

0 5 10 15 20 25 30 Gráfico 3 (nula)

Cálculo do Coeficiente de Correlação Linear de Pearson

Definição: Dado n pares de valores (x1, y1), (x2, y2), ..., (xn, yn), o coeficiente entre as duas variáveis X e Y é dado pela média dos valores dos produtos padronizados das variáveis.

 

  (^2) 2 2 2 i i i i

i i i i n x x n y y

n xy x y r

Indica o grau de intensidade entre duas variáveis e ainda o sentido dessa correlação (positivo ou negativo). Só deve ser utilizado com variáveis contínuas. A partir dos valores de r, podemos verificar o tipo da correlação existente entre as variáveis estudadas, conforme tabela seguinte:

‐ 10 ‐^5

05

1015

2025

30

0 5 10 15 20 25 30

Valor de r Correlação 0,0 Nula 0,0 ----| 0,3 Fraca 0,3 ----| 0,6 Media 0,6 ----| 0,9 Forte 0,9 ----| 0,99 Fortíssima 1,0 Perfeita

Professora: Janaina Pereira

EXERCÍCIO DE FIXAÇÃO

  1. Observou-se que o volume mensal de lixo gerado em uma cidade, em função do número de dormitórios das residências, é o seguinte (em m^3 ):

N o^ Dormitórios 1 2 3 4 Volume de lixo 0,15 0,29 0,45 0, a) Calcular o coeficiente de correlação de Pearson. (0,9986)

  1. A função de demanda de um produto está representada na tabela abaixo:

Preço (R$) 56,00 60,00 63,00 68,00 74, Demanda (un.) 100 93 87 81 75 a) Calcular o coeficiente de correlação de Pearson. (-0,983)

  1. Os gastos com propaganda e o respectivo volume de vendas gerado, de um certo produto, são dados abaixo:

a) Calcular o coeficiente de correlação de Pearson. (0,9969)

Gastos com propaganda (em milhares de R$)

Volume de vendas (em milhares de R$)

Professora: Janaina Pereira

(2) REGRESSÃO

Objetivo : A regressão linear simples constitui uma tentativa de estabelecer uma equação matemática linear (linha reta) que descreva o relacionamento entre duas variáveis.

Para obter uma reta de regressão, n pares de observações das variáveis são utilizados. Considerando Y como a variável dependente ou variável resposta e, X como a variável independente ou preditora, a reta de regressão é dada por:

Y =+X + u  é o coeficiente linear (intercepto), ou seja, é o ponto onde a reta corta o eixo Y;  é o coeficiente angular, ou seja, determina a inclinação da reta.

Graficamente:

u representa o incremento em Y quando X aumenta em uma unidade;

ESTIMADORES DEEPARA O MODELO DE REGRESSÃO LINEAR

Os valores de a e b serão determinados, através do Método dos Mínimos Quadrados (MMQ). O objetivo é encontrar a e b tal que a soma dos erros quadráticos médios seja o menor possível.

+ X + u

+ X

X X+

Y

X

Professora: Janaina Pereira

Então, precisamos calcular os valores dos parâmetros da equação Yâb ˆ X

 que é uma estimativa da verdadeira equação da reta de regressão, onde

Y é o estimado.

Identificação das variáveis:

Variável dependente: Potência do antibiótico Variável independente: Temperatura

Estimadores da reta de regressão:

ˆ 2 16.^32046. 655 (^1010 )(^64 ( 64 ,^9 ,)( 9 )^272 ,^6 ) 45341592 , 9 ,^40 , 35114 1

2

(^1)        

  

x n x

x y nxy b (^) n i i

n i i i

(Coef. Linear)

a ˆ  yb ˆ x  27 , 6 ( 0 , 35114 ) 64 , 9  50 , (^389) (Coef. Angular ou Intercepto)

Logo,

Y  50 , 389  0 , 35114 X

Interpretação da reta de regressão: cada ponto da reta de regressão fornece uma estimativa do valor médio ou esperado de Y correspondente ao valor X escolhido; O valor b ˆ =-0,35114, que mede a declividade da reta, mostra que, dento da escala da amostra de X entre 30ºC e 95ºC, quando X aumenta em , digamos 1ºC, a potência

estimada do antibiótico diminui em 0,35ºC. O valor de a ˆ^ 50,389, que é o intercepto da

reta, indica o nível médio da potência do antibiótico quando a temperatura é zero.

Determinar a potência do antibiótico quando a exposição for de 65o^ C.

 50 , 389  0 , 35114 ( 65 ) 50 , 389  22 , 8141  27 , 5749

Y

Exemplo 2 : Um funcionário de uma pista de corrida local gostaria de desenvolver um modelo para prever a quantia apostada (em mil dólares) com base na freqüência do público (por 100 apostadores). Após realizar a reta de regressão, o funcionário obteve os resultados abaixo. Escreve a equação da reta e interprete-a:

Coeficiente Intercepto 4, Coef. Linear 0,

Professora: Janaina Pereira

Resposta: Y = variável dependente = quantidade apostada X = variável independente = freqüência do público

A equação da reta será: Y ˆ^  a ˆ b ˆ X  4 , 3424  0 , 0465 X

Assim, o valor apostado quando a freqüência é zero (0) é de 4,3424 mil dólares. Além disso, para cada 100 pessoas a mais na pista o total apostado subirá em 0,0465.

Uma importante função de determinar a reta de regressão para duas variáveis é a possibilidade de realizar previsões, ou seja, uma vez que obtemos a reta de regressão, podemos escolher um valor de interesse para a variável independente (X) e determinar o valor esperado para a variável dependente (Y).

Professora: Janaina Pereira

r^2 : COEFICIENTE DE DETERMINAÇÃO Uma das formas de determinar se o modelo encontrado é satisfatório para explicar os dados é calculando o COEFICIENTE DE DETERMINAÇÃO do modelo. Esse coeficiente compara a variabilidade do modelo com a variabilidade total dos dados.

CÁLCULO DO r^2 :

SQT

SQE y y

y y r (^) n

i i

n i i  

  

1

2

1

2 2 ( )

(ˆ )

 A variabilidade do modelo (variabilidade explicada ou soma dos quadrados

explicada) pode ser calculada como:

2 1

(ˆ ) 

n

i

yi y.

 A variabilidade total (soma dos quadrados total) pode ser calculada como:

 

n i

yi y 1

( )^2 .

0 X

Y

y

yi

xi

Y ˆ^  a ˆ b ˆ X

SQT

SQE

SQR y ˆ i

Mostra a variação total nos valores de Y observados em relação a média.

Variação devido ao resíduo, pois nem todas s observações efetivas de Y ficam sobre a reta ajustada.

Variação devido à regressão.

0 X

Y

y

yi

xi

Y ˆ^  a ˆ b ˆ X

SQT

SQE

SQR y ˆ i

Mostra a variação total nos valores de Y observados em relação a média.

Variação devido ao resíduo, pois nem todas s observações efetivas de Y ficam sobre a reta ajustada.

Variação devido à regressão.

Professora: Janaina Pereira

Observação:

Exemplo 1 : Calcular e interpretar o coeficiente de determinação R 2 para os dados do primeiro exercício.

Temperatura (X)

Potência (Y)

Valores preditos ( y ˆ^ ) ( y (^) iy )^2 ( y ˆ (^) iy )^2 30 38 39.86 108.16 150. 36 43 37.75 237.16 103. 50 32 32.83 19.36 27. 54 26 31.43 2.56 14. (^60 33) 29.32 29.16 2. (^73 19) 24.76 73.96 8. (^78 27) 23.00 0.36 21. 82 23 21.60 21.16 36. 91 14 18.44 184.96 83. 95 21 17.03 43.56 111. y (^) 27,

n i i^

y y 1

( )^2 720,

n i i^

y y 1

( ˆ )^2 559,

R 2 0,

Interpretação: o modelo Y ˆ^^ ^50 ,^3892 ^0 ,^3511 X explica 77,59% da variabilidade total

de Y. Em outras palavras, a variabilidade da potência do antibiótico é 77,59% explicada pela sua temperatura de armazenamento.