








Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Encontra documentos específicos para os exames da tua universidade
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
conteudo sobre Estatistica
Tipologia: Notas de estudo
1 / 14
Esta página não é visível na pré-visualização
Não perca as partes importantes!









I – Introdução
O termo Estatística provém da palavra Estado e foi utilizado originalmente para denominar levantamentos de dados, cuja finalidade era orientar o Estado em suas decisões.
Atualmente, a Estatística é definida da seguinte forma:
Estatística é um conjunto de métodos e processos quantitativos que serve para estudar e medir fenômenos coletivos.
População é o conjunto de todos os itens que interessam ao estudo de um fenômeno coletivo segundo alguma característica.
Amostra é qualquer subconjunto não vazio de uma população.
Parâmetro é uma característica numérica estabelecida para toda a população.
Quando vamos estudar um fenômeno coletivo podemos optar entre os seguintes processos estatísticos: censo e estimação.
Censo é uma avaliação direta de um parâmetro utilizando-se todos os componentes da população.
Estimação é uma avaliação indireta de um parâmetro com base em uma característica numérica de uma amostra através do cálculo de probabilidades.
Os valores numéricos resultantes de um censo ou de uma estimação se chamam dados estatísticos.
A Estatística utiliza métodos racionais para a obtenção de informações a respeito de um fenômeno coletivo, além de obter conclusões válidas para o fenômeno e permite a tomada de decisões, a partir dos dados estatísticos observados.
Dessa forma, a Estatística pode ser dividida em duas áreas: a. Estatística Descritiva que tem por objetivos descrever os dados observados; b. Estatística Indutiva que tem por objetivo obter e generalizar conclusões para a população a partir de uma amostra.
II – Estatística Descritiva
A Estatística Descritiva tem as seguintes etapas: a) Obtenção dos dados estatísticos b) Organização dos dados c) Redução dos dados d) Representação dos dados e) Obtenção de informações que auxiliam na descrição do fenômeno observado
Quando fazemos n observações diretas em um fenômeno coletivo ou observamos as respostas a uma pergunta em uma coleção de n questionários, obtemos uma seqüência x 1 , x 2 , ... , x (^) n de n valores numéricos, que são denominados dados brutos.
A característica X observada num fenômeno coletivo se chama a variável que está sendo estudada. Dessa forma, os dados bruto podem ser representados na forma:
X : x 1 , x 2 , ... , x (^) n
Quando ordenamos na forma crescente ou decrescente os dados brutos, essa ordenação passa a se chamar rol.
Exemplo: No final de um ano letivo, um aluno obteve as seguintes notas em Matemática: 4 ; 8 ; 7,5 ; 6,5.
A variável X representa a nota bimestral desse aluno e pode ser apresentada na forma X: 4 ; 8 ; 7,5 ; 6,5 (dados brutos)
ou X: 4 ; 6,5 ; 7,5 ; 8 (rol)
Quando o número de elementos distintos de uma série de dados brutos (também chamada série estatística ) for pequeno dizemos que a variável X é discreta. Quando o número de elementos distintos de uma série estatística for grande dizemos que a variável é contínua. Cada tipo de variável tem um tratamento diferente.
III – Variáveis discretas
enquanto a freqüência acumulada relativa é a fração Frk definida por
Frk =
normalmente dada na forma percentual.
Exemplo : Considere a variável discreta:
xi f (^) i 2 3 3 7 4 8 6 6 7 1 Total 25
Para x 1 = 2 , temos f (^) r1 = = 0,12 ou 12%
Para x 2 = 3 , temos f (^) r2 = = 0,28 ou 28%
Para x 3 = 4 , temos f (^) r3 = = 0,32 ou 32%
Para x 4 = 6 , temos f (^) r4 = = 0,24 ou 24%
Para x 5 = 7 , temos f (^) r5 = = 0,04 ou 4%
Da mesma forma,
F 1 = f 1 = 3 F 2 = f 1 + f 2 = 3 + 7 = 10 F 3 = f 1 + f 2 + f 3 = 3 + 7 + 8 = 18 F 4 = f 1 + f 2 + f 3 + f 4 = 3 + 7 + 8 + 6 = 24 F 5 = f 1 + f 2 + f 3 + f 4 + f 5 = 3 + 7 + 8 + 6 + 1 = 25
e
Fr1 = = 0,12 ou 12% Fr2 = = 0,40 ou 40% Fr3 = = 0,72 ou 72% Fr4 = = 0,96 ou 96% Fr5 = = 1 ou 100%
46
e temos a tabela completa da distribuição das freqüências:
xi f (^) i f (^) ri (%) Fi Fri (%) 2 3 12 3 12 3 7 28 10 40 4 8 32 18 72 6 6 24 24 96 7 1 4 25 100 Total 25 100 * *
Podemos representar graficamente uma distribuição de freqüências através de um histograma , que é um conjunto de hastes, representadas em um sistema de coordenadas cartesianas que tem por base os valores distintos da série estatística (x (^) i) e por altura, valores proporcionais às freqüências simples correspondentes destes elementos (fi ).
Exemplo: Considere a série estatística:
xi f (^) i 2 1 3 4 5 8 6 6 7 2 Total 20
Então o histograma dessa série é
f (^) i
Temos xi f (^) i x (^) i. f (^) i 10 1 10
Total 10 123
Então
i. M (^) a = = 12, ii. Como o maior f (^) i que aparece é 4, temos M (^) o = 11.
iii. Como n = 10 = 2. 5 , então M (^) d = = = = 12.
Exemplo : Considere a série X: 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 4, 6, 6, 6, 6, 6, 6, 7 Calcule M (^) a , M (^) o e M (^) d.
Temos
xi f (^) i xi. fi 2 3 6 3 7 21
Total 25 102
Então
i. M (^) a = = 4,
ii. Como o maior f (^) i que aparece é 8, temos M (^) o = 4.
iii. Como n = 25 = 2. 6 + 1 , então M (^) d = x 6 = 3.
Exemplo : A distribuição de freqüências para a série representativa da idade de 50 alunos do primeiro ano de uma faculdade:
Construa a tabela das distribuições, calcule as médias e construa o histograma.
Temos
Idade(anos) x (^) i
Número de alunos f (^) i f (^) ri (%) Fi Fri (%) x (^) i. f (^) i
Total 50 100 * * 942
Então i. M (^) a = = 18,
ii. Como o maior f (^) i que aparece é 18, temos M (^) o = 18.
iii. Como n = 50 = 2. 25 , então M (^) d = = = = 19.
Histograma
f (^) i
18 17
8
46
Total 30
A construção da variável contínua requer o conhecimento de alguns conceitos que vamos estabelecer aproveitando a tabela acima como exemplo:
Classe Intervalo de classe
f (^) i
Total 30
Amplitude total de uma seqüência é a diferença entre o maior e o menor elemento da seqüência.
Representando por A (^) t a amplitude total, por X (^) máx o maior elemento da seqüência X e por X (^) mín o menor elemento da seqüência X, então
At = Xmáx - X (^) mín
No exemplo, temos Xmáx = 9,5 e X (^) mín = 2 e, portanto A (^) t = 9,5 – 2 = 7,.
Intervalo de classe é qualquer subdivisão da amplitude total da série estatística.
No intervalo subdividimos a amplitude total em 4 classes, obtendo os intervalos de classe 2 4 , 4 6 , 6 8 e 8 10. Observe que na realidade não trabalhamos com a At = 7,5, e sim com a amplitude ajustada para 8 por conveniência.
Cada intervalo de classe fica caracterizado por dois números reais: o menor valor que é chamado limite inferior da classe e é indicado por I, e o maior valor que é chamado limite superior da classe e é indicado por L. Estes números são os chamados limites da classe.
No exemplo, na classe 2 4 , temos I = 1 e L = 4.
A amplitude do intervalo de classe é a diferença h = L – I.
O número de classes , denotado por K , depende da situação do problema e do número n de elementos da seqüência.
Normalmente, utilizamos o critério da raiz para determinar o valor de K :
ou a fórmula de Sturges :
K = 1 + 3,3 log n
Por questão de facilidade, adotaremos o critério da raiz para determinar o número de classes.
A freqüência simples de uma classe ( f (^) i ) é o número de elementos da seqüência que são maiores ou iguais ao limite inferior e menores que o limite superior dessa classe.
Exemplo :
Um teste para aferir o QI dos alunos de uma determinada turma de 70 alunos deu origem à seqüência de valores:
X:
Pelo critério da raiz, K = = 8,37. O valor inteiro mais próximo é 8. Podemos por opção construir a variável contínua com 7, 8 ou 9 classes.
O maior valor da seqüência é Xmáx = 139 e o menor valor da seqüência é X (^) mín = 60, e portanto a amplitude total da seqüência é At = 139 – 60 = 79, que não é divisível nem por 7, nem por 8 e nem por 9. Se ajustamos X (^) max para 140, obtemos At = 140 - 60 = 80, e podemos adotar como amplitude do intervalos H = = = 10.
Computando as freqüências simples de cada classe construímos a variável contínua representativa dessa série:
Classe Intervalo de classe
f (^) i
1 2 3 4 5 Classe
Também na variável contínua, nós consideramos as medidas de tendência central: a média aritmética M (^) a , a mediana M (^) d e a moda M (^) o.
Para cada classe Ci , consideramos o valor xi = , onde L (^) i é o valor máximo da classe C (^) i e I (^) i é o valor mínimo da classe C (^) i.
Dessa forma, se f 1 , f 2 , ... e f (^) m são as freqüências simples das classes C 1 , C 2 , ... , Cm , respectivamente e n = f 1 + f 2 + ... + f (^) m , então a média aritmética será
Ma = =
No exemplo anterior, ampliamos a tabela original para
Classe Salários US$ x (^) i
Nº funcionários f (^) i x (^) i. fi 1 1,000.00 1,200.00 1,100.00 2 2,200. 2 1,200.00 1,400.00 1,300.00 6 7,800. 3 1,400.00 1,600.00 1,500,00 10 15,000. 4 1,600.00 1,800.00 1,700.00 5 8,500. 5 1,800.00 2,000.00 1,900.00 2 3,800. Total 25 37,300.
e M (^) a = = 1,492.00 (salário médio).
Para calcular a mediana M (^) d , primeiro achamos a classe mediana, isto é, aquela que contém o valor mediano. No exemplo em questão, como n = 25, então o valor mediano seria o valor correspondente ao termo = 12,5. Este termo está na classe 3, e portanto é um valor entre 1,400.00 e 1,600.00.
Supondo que a distribuição se dê linearmente, lembrando que a classe 3 começa no termo 9 e que a amplitude de cada classe vale 200.00, calculamos o valor proporcional, dentro da classe
Assim M (^) d = 1,400.00 +. 200.00 = 1,400.00 +. 200.00 =
= 1,400.00 + 0,35. 200.00 =
= 1,400.00 + 70.00 = 1,470.00 (salário mediano)
Isto significa, que metade dos funcionários ganha abaixo desse valor e metade dos funcionários ganha acima desse valor (aproximadamente). A moda M (^) o se calcula pela fórmula de Pearson:
Mo = 3. M (^) d – 2. Ma
No exemplo temos:
M (^) o = 3. 1,470.00 – 2. 1,492.00 = 4,410.00 - 2,984.00 = 1,426.00 (salário modal)