Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas


estatística e probabilidade, Notas de estudo de Estatística

estatística e probabilidade

Tipologia: Notas de estudo

Antes de 2010

Compartilhado em 27/01/2010

ieda-jacome-8
ieda-jacome-8 🇧🇷

1 documento

1 / 113

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
Estat´ıstica asica
Instrutor:
Dorival Le˜ao
Estatcamp Consultoria em Estat´ıstica e Qualidade
Rua: Adolpho Cattani, 682
Jardim Macarengo CEP: 13560-470 ao Carlos/SP
Fone/Fax: (16) 3376-2047
Novembro/2006
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51
pf52
pf53
pf54
pf55
pf56
pf57
pf58
pf59
pf5a
pf5b
pf5c
pf5d
pf5e
pf5f
pf60
pf61
pf62
pf63
pf64

Pré-visualização parcial do texto

Baixe estatística e probabilidade e outras Notas de estudo em PDF para Estatística, somente na Docsity!

Estat´ıstica B´asica

Instrutor: Dorival Le˜ao

Estatcamp Consultoria em Estat´ıstica e Qualidade

Rua: Adolpho Cattani, 682 Jardim Macarengo CEP: 13560-470 S˜ao Carlos/SP Fone/Fax: (16) 3376- E-mail: [email protected]

Novembro/

ii

v

vii

  • 1 Introdu¸c˜ao Sum´ario
  • 2 Coleta de Dados
    • 2.1 Dados Quantitativos
      • 2.1.1 Dados Quantitativos Discretos
      • 2.1.2 Dados Quantitativos Cont´ınuos
    • 2.2 Dados Qualitativos
      • 2.2.1 Construindo um Diagrama de Pareto
  • 3 Gr´aficos
    • 3.1 Distribui¸c˜ao de Freq¨uˆencias e Histograma
  • 4 Medidas de Posi¸c˜ao
    • 4.1 M´edia Aritm´etica
    • 4.2 Mediana
  • 5 Medidas de Dispers˜ao
    • 5.1 Amplitude
    • 5.2 Variˆancia
    • 5.3 Desvio Padr˜ao
  • 6 Estat´ısticas Descritivas
    • 6.1 Box-Plot
  • 7 Probabilidades
    • 7.1 Introdu¸c˜ao
    • 7.2 Defini¸c˜oes
    • 7.3 Distribui¸c˜ao de Probabilidade Discreta
      • 7.3.1 Fun¸c˜ao de Distribui¸c˜ao Acumulada Sum´ario iii
        • Probabilidade Discretas 7.3.2 Rela¸c˜ao entre a Fun¸c˜ao de Distribui¸c˜ao Acumulada e a Distribui¸c˜ao de
      • 7.3.3 Esperan¸ca de Vari´aveis Aleat´orias Discretas
      • 7.3.4 Variˆancia de Vari´aveis Aleat´orias Discretas
    • 7.4 Modelos Probabil´ısticos Discretos
      • 7.4.1 Distribui¸c˜ao Binomial
      • 7.4.2 Distribui¸c˜ao de Poisson
      • 7.4.3 Distribui¸c˜ao Geom´etrica
      • 7.4.4 Distribui¸c˜ao Hipergeom´etrica
    • 7.5 Exerc´ıcios
    • 7.6 Distribui¸c˜oes de Probabilidade Continua - de Probabilidade Cont´ınua 7.6.1 Rela¸c˜ao entre a Fun¸c˜ao de Distribui¸c˜ao Acumulada e a Fun¸c˜ao densidade
      • 7.6.2 Esperan¸ca de Vari´aveis Aleat´orias Cont´ınuas
      • 7.6.3 Variˆancia de Vari´aveis Aleat´orias Cont´ınuas
    • 7.7 Modelos Probabil´ısticos Cont´ınuos
      • 7.7.1 Distribui¸c˜ao Uniforme
      • 7.7.2 Distribui¸c˜ao Normal
    • 7.8 Modelos Probabil´ısticos para o Tempo de Falha
      • 7.8.1 Distribui¸c˜ao Exponencial
      • 7.8.2 Distribui¸c˜ao de Weibull
      • 7.8.3 Distribui¸c˜ao de Gumbel
      • 7.8.4 Distribui¸c˜ao Log-normal
  • 8 A Distribui¸c˜ao Normal
  • 9 Teorema do Limite Central
  • 10 Teste para Normalidade
    • 10.1 Papel de Probabilidade
    • 10.2 Teste de Kolmogorov - Smirnov
    • 10.3 Teste Anderson-Darling
  • 11 Indicadores da Qualidade Sum´ario iv
    • 11.1 Rendimento de um Produto
    • 11.2 Intervalo de confian¸ca para o rendimento
    • 11.3 Defeitos por milh˜ao de oportunidades (DPMO)
    • 11.4 Intervalo de confian¸ca para o DPMO
    • 11.5 Rendimento: An´alise da resposta do processo (Rolled Throughput Yield)
    • 11.6 Exerc´ıcios
    • 11.7 M´etrica da Qualidade: SIGMA
  • 12 Defini¸c˜oes
  • A Tabela Normal Padr˜ao - 6σ
  • Referˆencias Bibliogr´aficas
  • 2.1 Classifica¸c˜ao dos Dados Lista de Figuras
  • 2.2 Diagrama de Pareto
  • 2.3 Diagrama de Pareto - Relativo a Custos
  • 3.1 Histograma - Frequˆencia Absoluta
  • 3.2 Histograma - Porcentagens
  • 3.3 Histograma - Frequˆencia Absoluta
  • 3.4 Histograma - Porcentagens
  • 6.1 Constru¸c˜ao do Boxplot
  • 6.2 Compara¸c˜ao entre dois Boxplots
  • 7.1 Gr´afico da fun¸c˜ao densidade de probabilidade da Uniforme
  • 7.2 Gr´afico da fun¸c˜ao de confiabilidade
  • 7.3 Gr´afico da fun¸c˜ao taxa de falha da distribui¸c˜ao Weibull
  • 7.4 Gr´afico da fun¸c˜ao densidade da distribui¸c˜ao Log-Normal
  • 8.1 Distribui¸c˜ao Normal
  • 8.2 Areas sob a Curva Normal .´
  • 8.3 Distribui¸c˜ao Normal Padronizada
  • 8.4 Area sob a curva normal´
  • 8.5 Area sob a curva normal´
  • 8.6 Area sob a curva normal´
  • 8.7 Area sob a curva normal´
  • 8.8 Area sob a curva normal´
  • 8.9 Area sob a curva normal´
  • 8.10 Area sob a curva normal´
  • 8.11 Area sob a curva normal´ Lista de Figuras vi
  • 9.1 Histograma-Dados Exponenciais
  • 9.2 M´edia de Grupos de
  • 9.3 M´edias dos 5 Grupos
  • 10.1 Papel de Probabilidade para o exemplo 10.1.
  • 10.2 Papel de Probabilidade do Teste Anderson-Darling
  • 11.1 Gr´afico da Estrat´egia de Rompimento
  • 11.2 Gr´afico de Pareto
  • 11.3 Gr´afico do Rendimento Cl´assico
  • 11.4 Gr´afico do Rendimento do Processo
  • 11.5 Areas sob a Curva Normal .´
  • 11.6 Limites de Varia¸c˜ao
  • 2.1 N´umero de Pe¸cas Defeituosas em Lotes de 1.000 (Com Apura¸c˜ao) Lista de Tabelas
  • 2.2 Diˆametro do Eixo de 200 Motores
  • 2.3 Diˆametro do Eixo de 200 Motores (Com Apura¸c˜ao)
  • 2.4 Tipos de problemas Numa Ind´ustria de Computadores
  • 3.1 Diˆametro do Eixo de 200 Motores (Sem Apura¸c˜ao)
  • 3.2 Distribui¸c˜ao de Frequˆencias dos Diˆametros dos Eixos
  • 3.3 Crit´erio Para Determinar os Intervalos
  • 3.4 N´umero de Pe¸cas Defeituosas em Lotes de 1.000 (Sem Apura¸c˜ao)
  • 3.5 Distribui¸c˜ao de Frequˆencias dos Dados do exemplo 2.1
  • 7.1 Tabela do Exerc´ıcio
  • 7.2 Tabela de probabilidade da distribui¸c˜ao geom´etrica
  • 9.1 Dados Exponenciais
  • 10.1 Constru¸c˜ao do papel de probabilidade.
  • 10.2 Tabela de Valores para Dn
  • 10.3 Resumo do C´alculo de Dn
  • 10.4 Teste de Kolmogorov - Smirnov
  • 10.5 Teste de Kolmogorov - Smirnov
  • 10.6 Tabela de pontos percentis
  • 10.7 Calculando o valor de A
  • 11.1 Resumo dos Dados
  • 11.2 Colheitadeira de Cana
  • 11.3 DPMO
  • 11.4 Dados
  • 11.5 Colheitadeira de Cana Lista de Tabelas viii
  • 11.6 Resumo dos Dados
  • 11.7 Coleta de Dados
  • 11.8 Coleta de Dados
  • 11.9 Coleta de Dados
  • A.1 Tabela Normal 6σ

Cap´ıtulo 2

Coleta de Dados

Uma popula¸c˜ao ´e um agregado de elementos (finitos ou n˜ao) para o qual deseja-se obter informa¸c˜oes sobre algumas de suas caracter´ısticas. Duas popula¸c˜oes s˜ao consideradas distintas se uma delas cont´em um elemento que n˜ao est´a contido na outra popula¸c˜ao. Como exemplo de popula¸c˜ao temos a produ¸c˜ao di´aria de um empresa, o conjunto de resultados de medi¸c˜ao de uma haste de a¸co realizada com um micrˆometro, entre outras. A amostra ´e uma parcela de uma popula¸c˜ao que pode conter informa¸c˜oes sobre a popula¸c˜ao. Para estudarmos adequadamente uma popula¸c˜ao atrav´es de uma amostra devemos planejar a coleta de dados.

Planejando a Coleta de Dados

  • Qual a pergunta a ser respondida?
  • Como comunicar a resposta obtida?
  • Qual ferramenta de an´alise pretende-se usar e como ser˜ao comunicados os resultados?
  • Quais tipos de dados s˜ao necess´arios para utilizar as ferramentas desejadas e responder a pergunta?
  • Onde acessar estes dados?
  • Como coletar esses dados com o m´ınimo de esfor¸co e de erro?
  • Quais informa¸c˜oes adicionais ser˜ao necess´arias para estudos futuros, referˆencias ou reco- nhecimento? Os Dados podem ser classificados como:
  1. Coleta de Dados 3

Figura 2.1: Classifica¸c˜ao dos Dados

2.1 Dados Quantitativos

Neste caso a caracter´ıstica observada assume valores num´ericos. Este tipo de dado pode ser ainda classificado como discreto ou cont´ınuo.

2.1.1 Dados Quantitativos Discretos

Neste caso os dados observados formam um conjuto finito ou enumer´avel de n´umeros.

Exemplo 2.1. Foram observados 20 lotes de 1.000 pe¸cas cada um. O n´umero de pe¸cas de- feituosas encontradas em cada lote foi: 10, 12, 9, 11, 10, 8, 9, 10, 7, 10, 8, 9, 9, 10, 10, 11, 9, 11, 10, 10.

Podemos fazer a apura¸c˜ao atrav´es de uma tabela (Tabela 2.1). N´umero de pe¸cas Apura¸c˜ao N´umero de lotes Defeituosas 7 / 1 8 / / 2 9 / / / / / 5 10 / / / / / / / / 8 11 / / / 3 12 / 1 Tabela 2.1: N´umero de Pe¸cas Defeituosas em Lotes de 1.000 (Com Apura¸c˜ao)

Vemos ent˜ao que a vari´avel n´umero de pe¸cas defeituosas assume valores inteiros:... , 7 , 8 , 9 ,.. .. Logo, ´e uma vari´avel discreta.



2.1.2 Dados Quantitativos Cont´ınuos

S˜ao os que decorrem de mensura¸c˜oes. Os poss´ıveis valores incluem “todos” os n´umeros do intervalo de varia¸c˜ao da caracter´ıstica medida, isto ´e, todos os poss´ıveis valores pertencem a um

  1. Coleta de Dados 5

Veja que, ao se estabelecer intervalos, est´a-se admitindo que o eixo pode assumir qualquer valor entre o limite inferior, inclusive, e o limite superior, exclusive.



2.2 Dados Qualitativos

Os dados qualitativos apresentam como poss´ıveis realiza¸c˜oes uma qualidade (ou atributo) do indiv´ıduo pesquisado. Dentre os dados quantitativos podemos fazer uma distin¸c˜ao entre dois tipos: dado quali- tativo nominal, para o qual n˜ao existe nenhuma ordena¸c˜ao nas poss´ıveis realiza¸c˜oes, e dado qualitativo ordinal, para o qual existe uma ordem em seus resultados. Sexo, estado civil, s˜ao exemplos de dados qualitativos nominais. J´a grau de instru¸c˜ao ´e um exemplo de dado qua- litativo ordinal, pois ensinos fundamental, m´edio e superior correspondem a uma ordena¸c˜ao.

Exemplo 2.3. Uma ind´ustria de computador preocupada com v´arios defeitos que um de seus produtos vem apresentando, fez um levantamento e constatou os seguintes problemas que foram designados da seguinte forma:

  • A : Defeito na cobertura pl´astica.
  • B : Defeito no teclado.
  • C : Defeito na fonte de energia.
  • D : Soldas soltas.
  • E : Defeito na placa da unidade de processamento.
  • F : Defeito no visor.
  • G : Outros. Nesta situa¸c˜ao consideremos uma vari´avel T como sendo o tipo de defeito encontrado no produto. Portanto a vari´avel T pode assumir os valores T = A, T = B, · · ·. Assim, para um computador com defeito na cobertura pl´astica temos que T = A, por exemplo. Numa segunda fase tabelamos (tabela 2.4) os valores observados. Assim, podemos ver que os dados A, B, ... s˜ao dados qualitativos nominais.
  1. Coleta de Dados 6

Tipo de Problemas (T) Frequˆencia A 10 B 20 C 55 D 80 E 25 F 3 G 7 Tabela 2.4: Tipos de problemas Numa Ind´ustria de Computadores



Na figura 2.2 temos o Diagrama de Pareto referente a estes dados.

Figura 2.2: Diagrama de Pareto

2.2.1 Construindo um Diagrama de Pareto

  1. Selecione os problemas a serem comparados e estabele¸ca uma ordem atrav´es de:
  1. Coleta de Dados 8

Principais Defeitos No^ de Embalagens Custo por Unidade Custo do Defeito Defeituosas Defeituosa (R$) (R$) N´umeros Trocados 28 0,05 1, Caracteres Errados 28 0,05 1, Amassada 4 1,00 4, Perfurada 3 0,05 0, Impress˜ao Ileg´ıvel de Dados 2 0,05 0, Rasgada 2 1,00 2, Outros 1 0,05 0, TOTAL 68

Figura 2.3: Diagrama de Pareto - Relativo a Custos

A exposi¸c˜ao dos dados pode ser feita atrav´es de tabela e/ou gr´aficos. Aproveitando os exemplos anteriores poder´ıamos apresentar os dados atrav´es de suas respectivas tabelas, com a ressalva de que dever´ıamos eliminar a coluna “Apura¸c˜ao”, para uma apresenta¸c˜ao mais elegante. Tamb´em ´e l´ogico que se contarmos com um computador esta coluna n˜ao faz sentido. In´umeros gr´aficos auxiliam na apresenta¸c˜ao e interpreta¸c˜ao dos fatos, mas destacaremos os mais usuais em ind´ustrias.

Cap´ıtulo 3

Gr´aficos

3.1 Distribui¸c˜ao de Freq¨uˆencias e Histograma

Com as tabelas e/ou gr´aficos em m˜aos, tendo uma melhor visualiza¸c˜ao dos dados, muitas vezes j´a temos condi¸c˜oes de interpretar o fenˆomeno em estudo. Entretanto, para alguns casos ainda haver´a necessidade de se efetuar opera¸c˜oes num´ericas para se chegar a conclus˜oes mais s´olidas. Devido ao fato de dados quantitativos serem os mais freq¨uentemente encontrados na ind´ustria, desenvolveremos inicialmente m´etodos de an´alise para eles. Ou seja, passamos `a sua descri¸c˜ao, atrav´es do que ´e chamado de distribui¸c˜ao de frequˆencias. Dados Cont´ınuos Vejamos o exemplo 2.2, onde a Tabela 2.3 ´e agora apresentada sem a coluna APURAC¸ AO,˜ ou seja:

Diˆametro No^ de motores 4 , 2 4 , 4 12 4 , 4 4 , 6 16 4 , 6 4 , 8 32 4 , 8 5 , 0 64 5 , 0 5 , 2 36 5 , 2 5 , 4 24 5 , 4 5 , 6 12 5 , 6 5 , 8 4 Tabela 3.1: Diˆametro do Eixo de 200 Motores (Sem Apura¸c˜ao)

Note que neste exemplo a vari´avel de interesse ´e o “Diˆametro” enquanto que “N´umero de Motores” ´e a freq¨uˆencia de medidas em cada intervalo.

  1. Gr´aficos 11

Diˆametro xi fi f ri pi(%) Pi(%) 4 , 2 4 , 4 4,3 12 0,06 6 6 4 , 4 4 , 6 4,5 16 0,08 8 14 4 , 6 4 , 8 4,7 32 0,16 16 30 4 , 8 5 , 0 4,9 64 0,32 32 62 5 , 0 5 , 2 5,1 36 0,18 18 80 5 , 2 5 , 4 5,3 24 0,12 12 92 5 , 4 5 , 6 5,5 12 0,06 6 98 5 , 6 5 , 8 5,7 4 0,02 2 100 Tabela 3.2: Distribui¸c˜ao de Frequˆencias dos Diˆametros dos Eixos

Figura 3.1: Histograma - Frequˆencia Absoluta Figura 3.2: Histograma - Porcentagens Algumas indica¸c˜oes na constru¸c˜ao da distribui¸c˜ao de frequˆencias s˜ao:

  1. Na medida do poss´ıvel, as classes dever˜ao ter amplitudes iguais.
  2. Escolher os limites dos intervalos entre duas poss´ıveis observa¸c˜oes.
  3. O n´umero de intervalos n˜ao deve ultrapassar 20.
  4. Escolher limites que facilitem o agrupamento.
  5. Marcar os pontos m´edios dos intervalos.
  6. Ao construir um histograma, cada retˆangulo dever´a ter ´area proporcional a frequˆencia relativa correspondente (oua frequˆencia absoluta, o que d´a no mesmo).
  7. Um crit´erio para determinar os intervalos (classes) ´e:
  1. Gr´aficos 12 Tamanho da Amostra (n) N´umero de Classes (c) 30 a 50 5 a 7 51 a 100 6 a 10 10l a 250 7 a 12 acima de 250 10 a 20 Tabela 3.3: Crit´erio Para Determinar os Intervalos Determina¸c˜ao do tamanho da classe ou intervalo (L):

L = (^) namplitudeo (^) de classes = Rc

onde R ´e o maior valor da amostra menos o menor valor da amostra.

Como a tabela de frequˆencia, o histograma tem a caracter´ıstica de analisar as rela¸c˜oes essenciais que os dados apresentam, e ainda verificar algumas suposi¸c˜oes. Dados Discretos Consideremos agora o Exemplo 2.1, onde a Tabela 2.1 ´e apresentada sem a coluna APURAC¸ AO.˜ N´umero de Pe¸cas N´umero de lotes Defeituosas 7 1 8 2 9 5 10 8 11 3 12 1 Tabela 3.4: N´umero de Pe¸cas Defeituosas em Lotes de 1.000 (Sem Apura¸c˜ao)

A vari´avel de interesse ´e “N´umero de pe¸cas defeituosas”, enquanto que “N´umero de Lotes” ´e a frequˆencia observada para cada classe da vari´avel de interesse. Com as quantidades j´a definidas, construiremos a tabela completa para este exemplo. Note que a coluna “Ponto M´edio” n˜ao ´e necess´aria, pois se trata de dados discretos.