Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas


apostila, Notas de estudo de Engenharia Informática

probabilidade e estatistica

Tipologia: Notas de estudo

2012

Compartilhado em 16/03/2012

victor-verissimo-5
victor-verissimo-5 🇧🇷

3 documentos

1 / 139

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
Estat´ıstica
Heyder Diniz Silva
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51
pf52
pf53
pf54
pf55
pf56
pf57
pf58
pf59
pf5a
pf5b
pf5c
pf5d
pf5e
pf5f
pf60
pf61
pf62
pf63
pf64

Pré-visualização parcial do texto

Baixe apostila e outras Notas de estudo em PDF para Engenharia Informática, somente na Docsity!

Estat´ıstica

Heyder Diniz Silva

Sum´ario

Cap´ıtulo 1

Introdu¸c˜ao

O cidad˜ao comum pensa que a estat´ıstica se resume apenas a apresentar tabelas de n´umeros em colunas esportivas e ou econˆomicas de jornais e revistas, ilustradas com gr´aficos, pilhas de moedas, etc. ou quando muito associam a estat´ıstica a previs˜ao de resultados eleitorais. Mas estat´ıstico de hoje n˜ao se limita a compilar tabelas de dados e os ilustrar graficamente. Poisa partir de 1925, com os trabalhos de Fisher, a estat´ıstica iniciou-se como m´etodo cient´ıfico, ent˜ao, o trabalho do estat´ıstico passou a ser o de ajudar a planejar experimentos, interpretar e analisar os dados experimentais e apresentar os re- sultados de maneira a facilitar a tomada de decis˜oes razo´aveis. Deste modo, podemos ent˜ao definir estat´ıstica como sendo a ciˆencia que se preocupa com a coleta, organiza¸c˜ao, apre- senta¸c˜ao, an´alise e interpreta¸c˜ao de dados. Didaticamente podemos dividir a estat´ıstica em duas partes a estat´ıstica descritiva e a inferˆencia estat´ıstica. A estat´ıstica descritiva se refere a maneira de apresentar um conjunto de dados em tabelas e gr´aficos, e ao modo de resumir as informa¸c˜oes contidas nestes dados a algumas medidas. J´a a inferˆencia es- tat´ıstica baseia-se na teoria das probabilidades para estabelecer conclus˜oes sobre todo um grupo (chamado popula¸c˜ao), quando se observou apenas uma parte (amostra) desta pop- ula¸c˜ao. E necess´´ ario ter em mente que a estat´ıstica ´e uma ferramenta para o pesquisador, nas respostas dos “por quˆes” de seus problemas. E que para ela ser bem usada ´e necess´ario conhecer os seus fundamentos e princ´ıpios, e acima de tudo que o pesquisador desenvolva um esp´ırito cr´ıtico e jamais deixe de pensar. Pois ”em ciˆencia ´e f´acil mentir usando a

estat´ıstica, o dif´ıcil ´e falar a verdade sem usar a estat´ıstica”.

certo per´ıodo, etc.

  • CONT´INUAS: S˜ao aquelas origin´arias de medi¸c˜oes, deste modo, podem assumir qualquer valor real entre dois extremos. Ex: Peso corporal, altura, resistˆencia a ruptura, volume, etc.

Os dados coletados no campo e trazidos para o laborat´orio (escrit´orio), na forma em que se encontram, como os apresentados na Tabela 2.1, s˜ao denominados dados brutos. Normalmente este tipo de dados tr´as pouca ou nenhuma informa¸c˜ao ao leitor, sendo necess´ario uma elabora¸c˜ao (organiza¸c˜ao) destes dados, afim de aumentar sua ca- pacidade de informa¸c˜ao.

Tabela 2.1: Diˆametro `a altura do peito (DAP), em mm de 40 p´es de Eucalyptus citriodora aos 6 anos de idade em Lavras - MG

104 122 129 144 183 108 142 138 151 138 138 106 122 146 115 101 201 161 82 179 163 169 167 137 142 141 120 189 132 111 90 210 132 172 140 154 98 127 87 136

A mais simples organiza¸c˜ao num´erica ´e ordena¸c˜ao dados em ordem crescente ou decrescente (ROL). Como pode-se observar na Tabela 2, a simples organiza¸c˜ao dos dados em um Rol, aumenta muito a capacidade de informa¸c˜ao destes. Pois enquanto a Tabela 2.1 nos informava apenas que t´ınhamos 40 p´es de Eucalipto, e alguns D.A.P., na Tabela 2.2, verificamos que o menor diˆametro observado foi 82 mm e o maior 210 mm, o que nos fornece uma amplitude total de varia¸c˜ao da ordem de 128 mm. Amplitude total

A = maior valor observado − menor valor observado (2.1) A = 210mm − 82 mm = 128mm Pode-se observar ainda que alguns diˆametros como 122 mm, 132 mm 138 mm e 142 mm s˜ao mais comuns.

Tabela 2.2: Tabela 2. Diˆametro `a altura do peito (DAP), em mm de 40 p´es de Eucalyptus citriodora aos 6 anos de idade em Lavras - MG

82 111 132 142 167 87 115 136 142 169 90 120 137 144 172 98 122 138 146 179 101 122 138 151 183 104 127 138 154 189 106 129 140 161 201 108 132 141 163 210

2.1.1 Apresenta¸c˜ao tabular

2.1.1.1 Distribui¸c˜oes de freq¨uˆencias

Ap´os esta primeira organiza¸c˜ao dos dados, podemos ainda agrupa-los em classes de menor tamanho, afim de aumentar sua a capacidade de informa¸c˜ao. Distribuindo-se os dados observados em classes e contando-se o numero de in- div´ıduos contidos em cada classe, obt´em-se a freq¨uˆencia de classe. A disposi¸c˜ao tabular dos dados agrupados em classes, juntamente com as freq¨uˆencias correspondentes denomina-se distribui¸c˜ao de freq¨uˆencia. Para identificar uma classe, deve-se conhecer os valores dos limites inferior e superior da classe, que delimitam o intervalo de classe. Por exemplo, para o caso dos

  1. n > 100 k = 5log(n). (2.3)
  2. Crit´erio de SCOTT (1979), baseado na normalidade dos dados: k = An

(^13)

  1. 49 s (2.4) em que: A ´e a amplitude total; s ´e o desvio padr˜ao; n ´e o n´umero de observa¸c˜oes. Ap´os determinado o n´umero de classes (k) em que os dados ser˜ao agrupados, deve-se ent˜ao determinar o intervalo de classe (c ), que ´e dado pela seguinte express˜ao:

c = (^) k A− 1 (2.5)

em que: c ´e amplitude de classe; A ´e a amplitude total; k ´e o n´umero de classes. Conhecida a amplitude de classes, determina-se ent˜ao os intervalos de classe. Os limites inferior e superior das classes devem ser escolhidos de modo que o menor valor observado esteja localizado no ponto m´edio da primeira classe, que ´e dado por:

P M = Linf^ − 2 Lsup (2.6)

em que: Linf ´e o limite inferior da classe; Lsup ´e o limite superior da classe; Assim, o limite inferior da primeira classe ser´a:

Linf 1 = menorvalor − c 2 (2.7)

E os demais limites s˜ao obtidos somando-se c ao limite anterior. A t´ıtulo de ilustra¸c˜ao agruparemos os dados referentes ao DAP de eucaliptos em classes 1 o^ Amplitude total (A) A = maior valor observado - menor valor observado = 210 -82 =128 mm. 2 o^ Determinar o n´umero de classes (k) n = 40 K = √40 = 6, 32

, como o n´umero de classes ´e inteiro usaremos 6 classes. 3 o^ Determinar a amplitude de classe (c) c = (^6128) − 1 = 25, 6 mm 4 o^ Determinar o limite inferior da primeira classe (Li) Linf 1 = menorvalor − c 2 Linf 1 = 82 − 252. 6 = 69, 2 5 o^ Determinar os intervalos de classe 69 , 2 94 , 8 94 , 8 120 , 4 120 , 4 146 , 0 146 , 0 171 , 6 171 , 6 197 , 2 197 , 2 222 , 8 6 o^ Montar a distribui¸c˜ao de freq¨uˆencia. Para montar a distribui¸c˜ao de freq¨uˆencia, basta apresentar as classes obtidas na forma tabular e contar quantos indiv´ıduos existem em classe. Apresentando os dados na forma de distribui¸c˜ao de freq¨uˆencia, sintetiza-se a informa¸c˜ao contida nos mesmos, al´em de facilitar sua visualiza¸c˜ao. Pois pode-se verificar claramente na Tabela 2.3 que os DAP dos 40 p´es de Eucalyptus citriodora em quest˜ao est˜ao concentrados entorno dos valores centrais, decrescendo em dire¸c˜ao aos valores extremos. A apresenta¸c˜ao dos dados em forma de distribui¸c˜ao de freq¨uˆencia facilita ainda o c´alculo

Tabela 2.4: Distribui¸c˜ao de freq¨uˆencias dos DAP de 40 p´es de Eucalyptus citriodora aos 6 anos de idade em Lavras - MG.

Classes (mm) Freq¨uˆencia Absoluta Freq¨uˆencia Relativa Freq¨uˆencia Relativa (%) 69 , 2 94 , 8 3 0,075 7, 94 , 8 120 , 4 8 0,200 20, 120 , 4 146 , 0 16 0,400 40, 146 , 0 171 , 6 7 0,175 17, 171 , 6 197 , 2 4 0,100 10, 197 , 2 222 , 8 2 0,050 5, Total 40 1,000 100,

2.1.1.2 Distribui¸c˜oes de freq¨uˆencias acumuladas

Muitas vezes pode-se estar interessado n˜ao em saber a quantidade de ob- serva¸c˜oes que existe numa determinada classe, mas sim a quantidade de observa¸c˜oes acima ou abaixo de um determinado ponto na distribui¸c˜ao. Deste modo, a soma das freq¨uˆencias de todos os valores abaixo do limite superior de uma determinada classe ´e definida como freq¨uˆencia acumulada para baixo deste ponto, assim como a soma das freq¨uˆencias de todos os valores acima do limite inferior de uma classe ´e denominada freq¨uˆencia acumulada para cima. A t´ıtulo de ilustra¸c˜ao, est˜ao apresentadas nas Tabelas 2.5 e 2.6, respec- tivamente, as freq¨uˆencias acumuladas para cima e para baixo dos DAP dos 40 p´es de Eucalyptus citriodra o em quest˜ao. Aplica¸c˜oes das distribui¸c˜oes de freq¨uˆencias acumuladas Para verificar qual a porcentagem de p´es de Eucalyptus citriodra que pos- suem DAP inferior a 146 mm basta consultar diretamente a Tabela 2.5 e verificar a freq¨uˆencia acumulada abaixo deste valor (6,75%), pois o valor 146 mm ´e um dos lim- ites de classe apresentados nesta tabela. Mas como proceder para obter as freq¨uˆencias acumuladas para valores intermedi´arios aos apresentados na tabela? Como por exemplo a

Tabela 2.5: Distribui¸c˜ao de freq¨uˆencia acumulada para baixo dos DAP de 40 p´es de Eucalyptus citriodra aos 6 anos de idade em Lavras - MG.

Freq¨uˆencia Acumulada Diˆametro (mm) Absoluta Relativa Abaixo de 69,2 0 0, Abaixo de 94,8 3 0, Abaixo de 120,4 11 0, Abaixo de 146,0 27 0, Abaixo de 171,6 34 0, Abaixo de 197,2 38 0, Abaixo de 222,8 40 1,

freq¨uˆencia acumulada abaixo de 150 mm? Para este tipo de c´alculo, pressup˜oe-se que os diˆametros estejam uniforme- mente distribu´ıdos dentro das classes, e procede-se do seguinte modo: Freq. acumulada abaixo, da classe imediatamente inferior a 150 (abaixo de 146)= 0,675; Freq. acumulada abaixo, da classe imediatamente superior a 150 (abaixo de 171,6) = 0,850;

Freq. abaixo de 146,0 mm = 0, Freq. abaixo de 171,6 mm = 0, Assim, Freq. entre 146,0 e 171,6 mm =0, 850 − 0 , 675 = 0, 175 de 146,0 a 171,6 mm s˜ao 25,6 mm de 146,0 a 150,0 mm s˜ao 4,0 mm ent˜ao, para uma diferen¸ca de 25,6 mm existem 0,175 dos DAP; para uma diferen¸ca de 4,0 mm existir˜ao x dos DAP; ou seja

Tabela 2.7: Distribui¸c˜ao de Freq¨uˆencias do N´umero de Funcion´arios da Empresa Tabajara Classificado Quanto ao Sexo em 1996.

SEXO Fa Fr MASCULINO 20 0, FEMININO 30 0, TOTAL 50 1,

Tabela 2.8: N´umero de v´ıtimas fatais de acidentes de trˆansito atendidas diariamente em um grande hospital, durante um certo mˆes

Vitimas fatais (X/dia) N´umero de dias 0 9 1 5 2 7 3 5 4 2 5 2 Total 30

2.1.2 Apresenta¸c˜ao gr´afica

As mesmas informa¸c˜oes fornecidas pelas distribui¸c˜oes de freq¨uˆencias podem ser obtidas, e mais facilmente visualizadas atrav´es de gr´aficos, tais como histogramas, pol´ıgonos de freq¨uˆencia, ogivas, gr´aficos de setores, pictogramas e outros.

2.1.2.1 Histogramas

Os histogramas s˜ao constitu´ıdos por um conjunto de retˆangulos, com as bases assentadas sobre um eixo horizontal, tendo o centro da mesma no ponto m´edio da classe que representa, e cuja altura ´e proporcional `a freq¨uˆencia da classe. Se as amplitudes

de classe forem todas iguais, as alturas ser˜ao numericamente iguais as freq¨uˆencias das classes. Por´em, se os intervalos de classe n˜ao tiverem todos a mesma amplitude, as alturas dos retˆangulos dever˜ao ser convenientemente ajustadas, afim de que as ´areas dos mesmos sejam proporcionais `as freq¨uˆencias das classes.

Figura 2.1: Diˆametro `a altura do peito de 40 p´es de Eucalyptus citriodora aos 6 anos de idade em Lavras-MG.

2.1.2.2 Pol´ıgonos de freq¨uˆencia

Pol´ıgono de freq¨uˆencia ´e um gr´afico de an´alise no qual as freq¨uˆencias das classes s˜ao localizadas sobre perpendiculares levantadas nos ponto m´edios das classes. E pode ser obtido pela simples uni˜ao dos pontos m´edios dos topos dos retˆangulos de um histograma. Completa-se o pol´ıgono unindo-se as extremidades da linha que une os pontos representativos das freq¨uˆencias de classe aos pontos m´edios das classes imediatamente anterior e posterior as classes extremas, que tˆem freq¨uˆencia nula.