Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas


Anexo III - Conceitos Básicos de Estatística, Notas de estudo de Engenharia Mecânica

anexo da maetria Metrologia do Prof. Roberto do CEFET

Tipologia: Notas de estudo

2012

Compartilhado em 08/05/2012

regina-lo-re-5
regina-lo-re-5 🇧🇷

4

(4)

9 documentos

1 / 11

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
ANEXO III
CONCEITOS BÁSICOS DE ESTATÍSTICA
Existem funções cujo comportamento é perfeitamente previsível. Estas funções são denominadas
determinísticas. A função f(x) = 2x - 4 é uma função determinística uma vez que seu valor está
perfeitamente caracterizado quando x é definido. Funções determinísticas são muito empregadas em
modelos matemáticos idealizados.
O mundo real não é composto apenas por funções determinísticas. Certas propriedades, como por
exemplo a resistência mecânica de um material, a vida de uma lâmpada, a soma de dois dados
honestos jogados ao acaso ou a temperatura máxima em Curitiba no mês de janeiro, variam de
amostra para amostra. Um valor médio é obtido, porém é impossível prever exatamente qual o valor a
ser encontrado na própria amostra a ser testada.
Funções que apresentam imprevisibilidade são denominadas de aleatórias. Como são imprevisíveis,
não podem ser equacionadas através dos recursos usuais da matemática determinística.
Ferramentas estatísticas são necessárias para tal.
III.1 Distribuição de Probabilidade
A soma de dois dados honestos pode resultar em qualquer número entre 2 e 12. Embora exista
apenas uma única combinação de dados que resulte em 2 (1+1), nota-se que existem seis diferentes
combinações de dados cuja soma resulta em 7 (1+6, 2+5, 3+4, 4+3, 5+2, 6+1). As chances de que a
soma de dois dados lançados ao acaso resulte em 7 são maiores do que resultem em 2. Em outras
palavras, a probabilidade de 7 ser obtido é maior do que 2.
A figura III.1 melhor caracteriza o universo das possíveis combinações dos dados que levam a cada
soma. No eixo horizontal estão representados os valores possíveis para a soma, enquanto que no
eixo vertical representa-se o número de combinações que resultam naquela soma, ou seja, a
freqüência com que aquele evento se manifesta. No total são 36 combinações possíveis.
Para determinar a probabilidade de que uma determinada soma seja obtida, é suficiente dividir o
número de combinações que resultam naquela soma pelo número de combinações totais possíveis. A
probabilidade de que 7 seja obtido como soma é de 6/36 ou 1/6. As chances de obter 8 são de 5/36.
A probabilidade de que um valor situado dentro de uma faixa de valores seja obtido pode ser
calculado pela soma das probabilidades individuais. Assim, as chances de que a soma esteja dentro
da faixa 7 ± 1 é calculado por 5/36 + 6/36 + 5/36, que são as probabilidades de se obter 6, 7 e 8
respectivamente, o que resulta em 16/36 ou 4/9. Verifica-se que as chances de que qualquer valor
entre 2 e 12 seja obtido são de 1 (100%).
O gráfico da figura III.1 pode ter a freqüência expressa em termos relativos. Para tal, divide-se a
freqüência de cada evento pelo número total de eventos do universo possível. No caso, divide-se
cada freqüência por 36. A figura III.2 mostra o gráfico resultante. Este gráfico das freqüências
relativas recebe o nome de função densidade de probabilidade, representada por p(x), onde x
pf3
pf4
pf5
pf8
pf9
pfa

Pré-visualização parcial do texto

Baixe Anexo III - Conceitos Básicos de Estatística e outras Notas de estudo em PDF para Engenharia Mecânica, somente na Docsity!

ANEXO III

CONCEITOS BÁSICOS DE ESTATÍSTICA

Existem funções cujo comportamento é perfeitamente previsível. Estas funções são denominadas determinísticas. A função f(x) = 2x - 4 é uma função determinística uma vez que seu valor está perfeitamente caracterizado quando x é definido. Funções determinísticas são muito empregadas em modelos matemáticos idealizados.

O mundo real não é composto apenas por funções determinísticas. Certas propriedades, como por exemplo a resistência mecânica de um material, a vida de uma lâmpada, a soma de dois dados honestos jogados ao acaso ou a temperatura máxima em Curitiba no mês de janeiro, variam de amostra para amostra. Um valor médio é obtido, porém é impossível prever exatamente qual o valor a ser encontrado na própria amostra a ser testada.

Funções que apresentam imprevisibilidade são denominadas de aleatórias. Como são imprevisíveis, não podem ser equacionadas através dos recursos usuais da matemática determinística. Ferramentas estatísticas são necessárias para tal.

III.1 Distribuição de Probabilidade

A soma de dois dados honestos pode resultar em qualquer número entre 2 e 12. Embora exista apenas uma única combinação de dados que resulte em 2 (1+1), nota-se que existem seis diferentes combinações de dados cuja soma resulta em 7 (1+6, 2+5, 3+4, 4+3, 5+2, 6+1). As chances de que a soma de dois dados lançados ao acaso resulte em 7 são maiores do que resultem em 2. Em outras palavras, a probabilidade de 7 ser obtido é maior do que 2.

A figura III.1 melhor caracteriza o universo das possíveis combinações dos dados que levam a cada soma. No eixo horizontal estão representados os valores possíveis para a soma, enquanto que no eixo vertical representa-se o número de combinações que resultam naquela soma, ou seja, a freqüência com que aquele evento se manifesta. No total são 36 combinações possíveis.

Para determinar a probabilidade de que uma determinada soma seja obtida, é suficiente dividir o número de combinações que resultam naquela soma pelo número de combinações totais possíveis. A probabilidade de que 7 seja obtido como soma é de 6/36 ou 1/6. As chances de obter 8 são de 5/36.

A probabilidade de que um valor situado dentro de uma faixa de valores seja obtido pode ser calculado pela soma das probabilidades individuais. Assim, as chances de que a soma esteja dentro da faixa 7 ± 1 é calculado por 5/36 + 6/36 + 5/36, que são as probabilidades de se obter 6, 7 e 8 respectivamente, o que resulta em 16/36 ou 4/9. Verifica-se que as chances de que qualquer valor entre 2 e 12 seja obtido são de 1 (100%).

O gráfico da figura III.1 pode ter a freqüência expressa em termos relativos. Para tal, divide-se a freqüência de cada evento pelo número total de eventos do universo possível. No caso, divide-se cada freqüência por 36. A figura III.2 mostra o gráfico resultante. Este gráfico das freqüências relativas recebe o nome de função densidade de probabilidade , representada por p(x), onde x

Outro parâmetro importante que caracteriza uma função aleatória é o seu valor central, isto é, seu valor médio (μ). μ é calculado por:

→∞ (^) =

∞ lim n ∑ i

n i

x

1

(III.3)

III.2 Distribuição Normal

Uma das distribuições estatísticas mais comumente encontradas na prática é a distribuição normal ou gaussiana. O teorema do limite central demonstra que a combinação de um grande número de fatores de natureza aleatória, com qualquer distribuição, aproxima-se da distribuição normal à medida que aumenta o número dos fatores envolvidos. A forma da função densidade de probabilidade p(x) da distribuição normal assemelha-se a de um sino, como mostrada na figura III.4. Apresenta simetria em torno do valor central (médio). O desvio padrão desta distribuição corresponde à distância entre o valor central e o ponto de inflexão de p(x), isto é, o ponto onde a segunda derivada de p(x) é zero. Sua função densidade de probabilidade é:

p x e

onde

z

x

( )^ z

=^ /

(^2 )

(III.4)

e μ é o valor médio σ é o desvio padrão

A distribuição das dimensões de um lote de peças fabricadas por uma máquina, a distribuição em um alvo de tiros dados por um atirador, os erros de medição e a temperatura média do dia 21 de abril de cada ano são exemplos de distribuições normais.

O cálculo da probabilidade de que uma dada função aleatória com distribuição normal esteja dentro de uma faixa de valores é também calculada pela equação (III.1), isto é, pela integral definida de p(x) entre os limites considerados. No caso da distribuição normal não se pode exprimir a integral de p(x) como uma função simples. É comum encontrar esta integral na forma de tabelas normalizadas. Entretanto, existem alguns valores particulares que, por serem muito empregados na prática, devem ser citados.

Se tratando de uma função aleatória com distribuição normal, valor médio μ e desvio padrão σ, é possível calcular as seguintes probabilidades:

P(μ-σ < x < μ+σ) = 0. P(μ-3σ < x < μ+3σ) = 0. P(μ-1.96σ < x < μ+1.96σ) = 0. P(μ-2.58σ < x < μ+2.58σ) = 0.

P(μ-3.30σ < x < μ+3.30σ) = 0.

III.3 A Natureza Aleatória do Erro de Medição

Sabe-se que é impossível efetuar uma medição absolutamente isenta de erros. Seja em função do sistema de medição ou em função do mensurando ou do operador, o erro de medição está

sempre presente. Ao se repetir a medição de um mensurando invariável, com o mesmo sistema de medição e nas mesmas condições, como por exemplo a medição repetitiva da massa de uma peça com a mesma balança, verifica-se, com freqüência, que o valor obtido não se repete.

O erro de medição presente em cada indicação pode ser determinado pela diferença entre a indicação e o valor verdadeiro convencional, isto é, E = I - VVC. Em um SM ideal, este erro deveria ser sempre nulo. Porém, nota-se que este erro é na verdade uma função aleatória com distribuição aproximadamente normal.

O valor médio do erro de medição é o erro sistemático (Es), que só poderia ser determinado baseada em um número infinito de observações, por:

Es MI VVC onde

MI n

Ii i

n

=

1

(III.5)

e MI é a média de infinitas indicações VVC é o valor verdadeiro convencional

Se um número finito de observações é envolvido, a equação (III.5) pode ainda ser usada para estimar o erro sistemático. Neste caso, esta estimativa recebe o nome específico de tendência (Td).

A parcela aleatória do erro de medição é simplesmente chamada de erro aleatório. Tratando-se de uma função aleatória, cada valor medido possui um erro aleatório diferente, e dado por: Eai = Ii - MI.

A sua caracterização é realizada através da medida da dispersão da distribuição normal associada, isto é, do desvio padrão (σ).

Define-se a repetitividade (Re) , como sendo a faixa que, com uma probabilidade estatística definida, conterá o erro aleatório. É comum adotar a probabilidade de 95% como aceitável para a Re (^2 ). Assim, 95% dos erros aleatórios estarão dentro desta faixa. A Re é estimada por:

Re( 95%) = ± 1 , 96 σ (III.6)

Porém, como será visto no próximo item, a estimação de σ não é tão direta.

III.4 Amostra Versus População

Os conceitos de média (μ) e desvio padrão (σ) são válidos para uma função aleatória. Para caracterizá-los perfeitamente pelas equações III.2 e III.3 é necessário envolver um número infinito de valores observados desta função, isto é, toda a população.

Na prática, não se tem tempo para coletar um número infinito de valores. É comum considerar apenas uma amostra de n valores desta população. A média e o desvio padrão da população são estimados a partir da média, do desvio padrão e do tamanho da amostra. A média e o desvio padrão da amostra são calculados por:

(^2) Alguns autores adotam 99,7%, o que corresponde a ± 3σσσ

x n

xi i

n

=

1

(III.7)

e

s

x x

n

i i

n

=

∑ (^ )

2 1

(III.8)

Esta estimativa só é confiável para valores grandes de n. Se amostras pequenas são envolvidas (n <200), é necessário aplicar um coeficiente de correção (t) conhecido como coeficiente t-Student. O coeficiente t-Student é função da probabilidade de enquadramento desejada (P) e do tamanho da amostra (n). A figura III.5 apresenta valores tabelados para “t” como função de n e de P. Assim, a repetitividade associada ao erro aleatório pode ser estimada por:

Re = ± t. s (III.9)

A média verdadeira da população (μ), calculada a partir dos parâmetros da amostra, não pode ser

determinada exatamente. Alguma incerteza ainda resultará. Pode-se mostrar que a média da população estará situada dentro da seguinte faixa, determinada de intervalo de confiança da média :

x

t n

s x n

Re (III.9)

onde:

x

_ é a média da amostra s é o desvio padrão da amostra t é o coeficiente t-Student n é o tamanho da amostra

III.5 Outras Distribuições Estatísticas

Existem situações na prática onde é conveniente modelar certos efeitos ou fenômenos por meio de outras distribuições distintas da normal. Neste texto, não será discutida a aplicabilidade das diversas distribuições em problemas de metrologia.

a) Distribuição retangular

É caracterizada por apresentar a mesma densidade de probabilidade para todos os valores dentro dos limites dados por “ μ - a” e “ μ + a” , e zero fora destes (figura III.6). Seu desvio padrão é dado por:

σ = a 3

b) Distribuição triangular

É caracterizada por apresentar máxima probabilidade para o valor médio e decrescer linearmente até zero nos limites dados por “ μ - a” e “ μ + a” , e zero fora destes (figura III.7). Seu desvio padrão é dado

por: σ =

a 6

Exercícios para o Anexo III

III.1. Classifique as variáveis abaixo como determinísticas ou aleatórias:

A) A distância indicada no odômetro de automóveis que percorrem o trecho Florianópolis-Curitiba pela mesma

estrada

B) O horário do pôr-do-sol de uma mesma cidade ao longo do ano

C) A massa de “uma pitada de sal” que uma cozinheira acrescenta todo dia no feijão

D) A vida de uma lâmpada de 60W de um mesmo lote de fabricação

E) O seno do terço do quadrado de um número

III.2. Qual a probabilidade da soma de três dados honestos estar entre 5 e 7 inclusive?

III.3. Classifique as seguintes variáveis aleatórias como discretas ou conínuas:

A) A massa de uma “pitada de sal”

B) A medida da massa de uma “pitadas de sal” obtida de uma balança com resolução de 0,1g C) A vida de lâmpadas de um mesmo lote de fabricação

D) O tempo expresso em horas correspondente à vida de uma pessoa do sexo masculino residente em uma dada cidade E) As várias medidas efetuadas da massa de uma mesma peça, efetuadas pela mesma balança

III.4. Senso p(x) a função densidade de probabilidade de uma variável aleatória contínua, determine expressões para o cálculo da probabilidade desta variável:

A) Ser maior que o valor xz

B) Ser menor que o valor xb C) Sendo xa>xb, estar entre estes dois valores

D) Sendo xa>xb, ser maior que xa ou menor que x

III.5. Qual a probabilidade de uma variável aleatória com distribuição normal com média 18,00g e desvio padrão 0,12g situar-se dentro da faixa 18,00 ± 0,36g? e na faixa

18,24 ± 0,12g?

III.6. Calcule a média amostral, o desvio padrão amostral e o intervalo de confiança do erro aleatório dos dados abaixo. Calcule também o intervalo de confiança dentro do qual estará a média verrdadeira população completa (equação III.9)

12,8 12,5 13,0 13, 12,6 12,9 13,1 12, 12,3 12,8 12,6 12,

III.7. Supondo que os dados da questão anterior referem-se à calibração de juma balança

onde a mesma massa padrão de 12,500 ± 0,002g foi medida diversas vezes, o que possível

afirmar sobre o erro sistemático e sua incerteza?