Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas


Estatistica, Notas de estudo de Estatística

conteudo sobre Estatistica

Tipologia: Notas de estudo

2012

Compartilhado em 02/03/2012

pedro-coelho-14
pedro-coelho-14 🇧🇷

4.6

(37)

90 documentos

1 / 14

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
ESTATÍSTICA
I – Introdução
O termo Estatística provém da palavra Estado e foi utilizado originalmente para
denominar levantamentos de dados, cuja finalidade era orientar o Estado em
suas decisões.
Atualmente, a Estatística é definida da seguinte forma:
Estatística é um conjunto de métodos e processos quantitativos
que serve para estudar e medir fenômenos coletivos.
População é o conjunto de todos os itens que interessam ao estudo de um
fenômeno coletivo segundo alguma característica.
Amostra é qualquer subconjunto não vazio de uma população.
Parâmetro é uma característica numérica estabelecida para toda a população.
Quando vamos estudar um fenômeno coletivo podemos optar entre os
seguintes processos estatísticos: censo e estimação.
Censo é uma avaliação direta de um parâmetro utilizando-se todos os
componentes da população.
Estimação é uma avaliação indireta de um parâmetro com base em uma
característica numérica de uma amostra através do cálculo de probabilidades.
Os valores numéricos resultantes de um censo ou de uma estimação se
chamam dados estatísticos.
A Estatística utiliza métodos racionais para a obtenção de informações a
respeito de um fenômeno coletivo, além de obter conclusões válidas para o
fenômeno e permite a tomada de decisões, a partir dos dados estatísticos
observados.
Dessa forma, a Estatística pode ser dividida em duas áreas:
a. Estatística Descritiva que tem por objetivos descrever os dados
observados;
b. Estatística Indutiva que tem por objetivo obter e generalizar conclusões
para a população a partir de uma amostra.
II – Estatística Descritiva
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe

Pré-visualização parcial do texto

Baixe Estatistica e outras Notas de estudo em PDF para Estatística, somente na Docsity!

ESTATÍSTICA

I – Introdução

O termo Estatística provém da palavra Estado e foi utilizado originalmente para denominar levantamentos de dados, cuja finalidade era orientar o Estado em suas decisões.

Atualmente, a Estatística é definida da seguinte forma:

Estatística é um conjunto de métodos e processos quantitativos que serve para estudar e medir fenômenos coletivos.

População é o conjunto de todos os itens que interessam ao estudo de um fenômeno coletivo segundo alguma característica.

Amostra é qualquer subconjunto não vazio de uma população.

Parâmetro é uma característica numérica estabelecida para toda a população.

Quando vamos estudar um fenômeno coletivo podemos optar entre os seguintes processos estatísticos: censo e estimação.

Censo é uma avaliação direta de um parâmetro utilizando-se todos os componentes da população.

Estimação é uma avaliação indireta de um parâmetro com base em uma característica numérica de uma amostra através do cálculo de probabilidades.

Os valores numéricos resultantes de um censo ou de uma estimação se chamam dados estatísticos.

A Estatística utiliza métodos racionais para a obtenção de informações a respeito de um fenômeno coletivo, além de obter conclusões válidas para o fenômeno e permite a tomada de decisões, a partir dos dados estatísticos observados.

Dessa forma, a Estatística pode ser dividida em duas áreas: a. Estatística Descritiva que tem por objetivos descrever os dados observados; b. Estatística Indutiva que tem por objetivo obter e generalizar conclusões para a população a partir de uma amostra.

II – Estatística Descritiva

A Estatística Descritiva tem as seguintes etapas: a) Obtenção dos dados estatísticos b) Organização dos dados c) Redução dos dados d) Representação dos dados e) Obtenção de informações que auxiliam na descrição do fenômeno observado

Quando fazemos n observações diretas em um fenômeno coletivo ou observamos as respostas a uma pergunta em uma coleção de n questionários, obtemos uma seqüência x 1 , x 2 , ... , x (^) n de n valores numéricos, que são denominados dados brutos.

A característica X observada num fenômeno coletivo se chama a variável que está sendo estudada. Dessa forma, os dados bruto podem ser representados na forma:

X : x 1 , x 2 , ... , x (^) n

Quando ordenamos na forma crescente ou decrescente os dados brutos, essa ordenação passa a se chamar rol.

Exemplo: No final de um ano letivo, um aluno obteve as seguintes notas em Matemática: 4 ; 8 ; 7,5 ; 6,5.

A variável X representa a nota bimestral desse aluno e pode ser apresentada na forma X: 4 ; 8 ; 7,5 ; 6,5 (dados brutos)

ou X: 4 ; 6,5 ; 7,5 ; 8 (rol)

Quando o número de elementos distintos de uma série de dados brutos (também chamada série estatística ) for pequeno dizemos que a variável X é discreta. Quando o número de elementos distintos de uma série estatística for grande dizemos que a variável é contínua. Cada tipo de variável tem um tratamento diferente.

III – Variáveis discretas

enquanto a freqüência acumulada relativa é a fração Frk definida por

Frk =

normalmente dada na forma percentual.

Exemplo : Considere a variável discreta:

xi f (^) i 2 3 3 7 4 8 6 6 7 1 Total 25

Para x 1 = 2 , temos f (^) r1 = = 0,12 ou 12%

Para x 2 = 3 , temos f (^) r2 = = 0,28 ou 28%

Para x 3 = 4 , temos f (^) r3 = = 0,32 ou 32%

Para x 4 = 6 , temos f (^) r4 = = 0,24 ou 24%

Para x 5 = 7 , temos f (^) r5 = = 0,04 ou 4%

Da mesma forma,

F 1 = f 1 = 3 F 2 = f 1 + f 2 = 3 + 7 = 10 F 3 = f 1 + f 2 + f 3 = 3 + 7 + 8 = 18 F 4 = f 1 + f 2 + f 3 + f 4 = 3 + 7 + 8 + 6 = 24 F 5 = f 1 + f 2 + f 3 + f 4 + f 5 = 3 + 7 + 8 + 6 + 1 = 25

e

Fr1 = = 0,12 ou 12% Fr2 = = 0,40 ou 40% Fr3 = = 0,72 ou 72% Fr4 = = 0,96 ou 96% Fr5 = = 1 ou 100%

46

e temos a tabela completa da distribuição das freqüências:

xi f (^) i f (^) ri (%) Fi Fri (%) 2 3 12 3 12 3 7 28 10 40 4 8 32 18 72 6 6 24 24 96 7 1 4 25 100 Total 25 100 * *

Podemos representar graficamente uma distribuição de freqüências através de um histograma , que é um conjunto de hastes, representadas em um sistema de coordenadas cartesianas que tem por base os valores distintos da série estatística (x (^) i) e por altura, valores proporcionais às freqüências simples correspondentes destes elementos (fi ).

Exemplo: Considere a série estatística:

xi f (^) i 2 1 3 4 5 8 6 6 7 2 Total 20

Então o histograma dessa série é

f (^) i

Temos xi f (^) i x (^) i. f (^) i 10 1 10

Total 10 123

Então

i. M (^) a = = 12, ii. Como o maior f (^) i que aparece é 4, temos M (^) o = 11.

iii. Como n = 10 = 2. 5 , então M (^) d = = = = 12.

Exemplo : Considere a série X: 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 4, 6, 6, 6, 6, 6, 6, 7 Calcule M (^) a , M (^) o e M (^) d.

Temos

xi f (^) i xi. fi 2 3 6 3 7 21

Total 25 102

Então

i. M (^) a = = 4,

ii. Como o maior f (^) i que aparece é 8, temos M (^) o = 4.

iii. Como n = 25 = 2. 6 + 1 , então M (^) d = x 6 = 3.

Exemplo : A distribuição de freqüências para a série representativa da idade de 50 alunos do primeiro ano de uma faculdade:

X: 17 17 17 18 18 18 18 18 18 18

Construa a tabela das distribuições, calcule as médias e construa o histograma.

Temos

Idade(anos) x (^) i

Número de alunos f (^) i f (^) ri (%) Fi Fri (%) x (^) i. f (^) i

Total 50 100 * * 942

Então i. M (^) a = = 18,

ii. Como o maior f (^) i que aparece é 18, temos M (^) o = 18.

iii. Como n = 50 = 2. 25 , então M (^) d = = = = 19.

Histograma

f (^) i

18 17

8

46

Total 30

A construção da variável contínua requer o conhecimento de alguns conceitos que vamos estabelecer aproveitando a tabela acima como exemplo:

Classe Intervalo de classe

f (^) i

Total 30

Amplitude total de uma seqüência é a diferença entre o maior e o menor elemento da seqüência.

Representando por A (^) t a amplitude total, por X (^) máx o maior elemento da seqüência X e por X (^) mín o menor elemento da seqüência X, então

At = Xmáx - X (^) mín

No exemplo, temos Xmáx = 9,5 e X (^) mín = 2 e, portanto A (^) t = 9,5 – 2 = 7,.

Intervalo de classe é qualquer subdivisão da amplitude total da série estatística.

No intervalo subdividimos a amplitude total em 4 classes, obtendo os intervalos de classe 2 4 , 4 6 , 6 8 e 8 10. Observe que na realidade não trabalhamos com a At = 7,5, e sim com a amplitude ajustada para 8 por conveniência.

Cada intervalo de classe fica caracterizado por dois números reais: o menor valor que é chamado limite inferior da classe e é indicado por I, e o maior valor que é chamado limite superior da classe e é indicado por L. Estes números são os chamados limites da classe.

No exemplo, na classe 2 4 , temos I = 1 e L = 4.

A amplitude do intervalo de classe é a diferença h = L – I.

O número de classes , denotado por K , depende da situação do problema e do número n de elementos da seqüência.

Normalmente, utilizamos o critério da raiz para determinar o valor de K :

K =

ou a fórmula de Sturges :

K = 1 + 3,3 log n

Por questão de facilidade, adotaremos o critério da raiz para determinar o número de classes.

A freqüência simples de uma classe ( f (^) i ) é o número de elementos da seqüência que são maiores ou iguais ao limite inferior e menores que o limite superior dessa classe.

Exemplo :

Um teste para aferir o QI dos alunos de uma determinada turma de 70 alunos deu origem à seqüência de valores:

X:

Pelo critério da raiz, K = = 8,37. O valor inteiro mais próximo é 8. Podemos por opção construir a variável contínua com 7, 8 ou 9 classes.

O maior valor da seqüência é Xmáx = 139 e o menor valor da seqüência é X (^) mín = 60, e portanto a amplitude total da seqüência é At = 139 – 60 = 79, que não é divisível nem por 7, nem por 8 e nem por 9. Se ajustamos X (^) max para 140, obtemos At = 140 - 60 = 80, e podemos adotar como amplitude do intervalos H = = = 10.

Computando as freqüências simples de cada classe construímos a variável contínua representativa dessa série:

Classe Intervalo de classe

f (^) i

1 2 3 4 5 Classe

Também na variável contínua, nós consideramos as medidas de tendência central: a média aritmética M (^) a , a mediana M (^) d e a moda M (^) o.

Para cada classe Ci , consideramos o valor xi = , onde L (^) i é o valor máximo da classe C (^) i e I (^) i é o valor mínimo da classe C (^) i.

Dessa forma, se f 1 , f 2 , ... e f (^) m são as freqüências simples das classes C 1 , C 2 , ... , Cm , respectivamente e n = f 1 + f 2 + ... + f (^) m , então a média aritmética será

Ma = =

No exemplo anterior, ampliamos a tabela original para

Classe Salários US$ x (^) i

Nº funcionários f (^) i x (^) i. fi 1 1,000.00 1,200.00 1,100.00 2 2,200. 2 1,200.00 1,400.00 1,300.00 6 7,800. 3 1,400.00 1,600.00 1,500,00 10 15,000. 4 1,600.00 1,800.00 1,700.00 5 8,500. 5 1,800.00 2,000.00 1,900.00 2 3,800. Total 25 37,300.

e M (^) a = = 1,492.00 (salário médio).

Para calcular a mediana M (^) d , primeiro achamos a classe mediana, isto é, aquela que contém o valor mediano. No exemplo em questão, como n = 25, então o valor mediano seria o valor correspondente ao termo = 12,5. Este termo está na classe 3, e portanto é um valor entre 1,400.00 e 1,600.00.

Supondo que a distribuição se dê linearmente, lembrando que a classe 3 começa no termo 9 e que a amplitude de cada classe vale 200.00, calculamos o valor proporcional, dentro da classe

Assim M (^) d = 1,400.00 +. 200.00 = 1,400.00 +. 200.00 =

= 1,400.00 + 0,35. 200.00 =

= 1,400.00 + 70.00 = 1,470.00 (salário mediano)

Isto significa, que metade dos funcionários ganha abaixo desse valor e metade dos funcionários ganha acima desse valor (aproximadamente). A moda M (^) o se calcula pela fórmula de Pearson:

Mo = 3. M (^) d – 2. Ma

No exemplo temos:

M (^) o = 3. 1,470.00 – 2. 1,492.00 = 4,410.00 - 2,984.00 = 1,426.00 (salário modal)