Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas


Estatística Introdução, Notas de aula de Estatística

A Estatística é a parte da Matemática que trata dos métodos científicos para coleta, organização, resumo, apresentação e análise de dados.

Tipologia: Notas de aula

2020

Compartilhado em 26/07/2020

ecila-oliveira-4
ecila-oliveira-4 🇧🇷

4.8

(4)

6 documentos

1 / 9

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
UNIP – Tatupé – Estatística - 2007
Prof. Ecila Alves de Oliveira
Estatística – 2º/3º Semestre
Gestão em Comércio Exterior e Sistemas de Informção
Introdução – Conceitos Básicos
A Estatística é a parte da Matemática que trata dos métodos científicos para coleta, organização,
resumo, apresentação e análise de dados.
Divide-se em duas:
Estatística Descritiva : que apenas descreve e analisa um conjunto de dados, sem tirar conclusões;
Estatística Indutiva ou Inferência : que trata das inferências e conclusões, isto é, a partir de dados são
tiradas conclusões.
Variáveis Contínuas : são os valores “quebrados”, medição de altura.
Variáveis Discretas : são os valores inteiros, os números dos dados.
Séries Estatísticas
Uma série estatística define-se como toda e qualquer coleção de dados estatísticos referidos a uma
mesma ordem de classificação: em geral quantitativa.
Em termos gerais, a palavra série é usada normalmente para designar um conjunto de dados dispostos
de acordo com um caráter variável.
As tabelas e gráficos servem para apresentar séries estatísticas. As três variações possíveis em séries
estatísticas são:
A Época (fator temporal ou cronológico) – a que se refere o fenômeno analisado;
O Local (fator espacial ou geográfico) – onde o fenômeno acontece;
O Fenômeno (espécie do fato ou fator especificativo) – que é descrito.
Séries Homógradas: aquelas em que a variável descrita apresenta variação discreta ou descontínua.
São séries homógradas a série temporal, a série geográfica, a série específica e as séries mistas.
Séries Heterógradas: aquelas nas quais o fenômeno ou o fato apresenta gradações ou subdivisões.
Embora fixo, o fenômeno varia em intensidade. A Distribuição de freqüências é uma série heterógrada.
Qualquer estudo científico enfrenta o dilema de estudo da população ou da amostra.
Obviamente tería-se uma precisão muito superior se fosse analisado o grupo inteiro, a população, do
que uma pequena parcela representativa, denominada amostra. Observa-se que é impraticável na grande
maioria dos casos, estudar-se a população em virtude de distâncias, custo, tempo, logística, entre outros
motivos.
A alternativa praticada nestes casos é o trabalho com uma amostra confiável. Se a amostra é confiável
e proporciona inferir sobre a população, chamamos de inferência estatística. Para que a inferência seja válida,
é necessária uma boa amostragem, livre de erros, tais como falta de determinação correta da população, falta
de aleatoriedade e erro no dimensionamento da amostra.
Quando não é possível estudar, exaustivamente, todos os elementos da população, estudam-se
alguns elementos, a que damos o nome de Amostra.
Gráficos permitem a representação de uma relação entre variáveis e facilitam a compreensão de
dados, desde que apresentados de forma clara e objetiva.
De Linha
De Barras
Pictóricos
De Setores
Dados Brutos : São aqueles valores a que se chegou pela simples coleta, sem qualquer preocupação
quanto à sua ordenação. Como se pode ser observado, as cifras estão dispostas de forma desordenada. Em
1
pf3
pf4
pf5
pf8
pf9

Pré-visualização parcial do texto

Baixe Estatística Introdução e outras Notas de aula em PDF para Estatística, somente na Docsity!

Prof. Ecila Alves de Oliveira

Estatística – 2º/3º Semestre

Gestão em Comércio Exterior e Sistemas de Informção

Introdução – Conceitos Básicos A Estatística é a parte da Matemática que trata dos métodos científicos para coleta, organização, resumo, apresentação e análise de dados. Divide-se em duas: Estatística Descritiva : que apenas descreve e analisa um conjunto de dados, sem tirar conclusões; Estatística Indutiva ou Inferência : que trata das inferências e conclusões, isto é, a partir de dados são tiradas conclusões. Variáveis Contínuas : são os valores “quebrados”, medição de altura. Variáveis Discretas : são os valores inteiros, os números dos dados. Séries Estatísticas  Uma série estatística define-se como toda e qualquer coleção de dados estatísticos referidos a uma mesma ordem de classificação: em geral quantitativa.  Em termos gerais, a palavra série é usada normalmente para designar um conjunto de dados dispostos de acordo com um caráter variável.  As tabelas e gráficos servem para apresentar séries estatísticas. As três variações possíveis em séries estatísticas são:  A Época (fator temporal ou cronológico) – a que se refere o fenômeno analisado;  O Local (fator espacial ou geográfico) – onde o fenômeno acontece;  O Fenômeno (espécie do fato ou fator especificativo) – que é descrito.  Séries Homógradas : aquelas em que a variável descrita apresenta variação discreta ou descontínua. São séries homógradas a série temporal, a série geográfica, a série específica e as séries mistas.  Séries Heterógradas : aquelas nas quais o fenômeno ou o fato apresenta gradações ou subdivisões. Embora fixo, o fenômeno varia em intensidade. A Distribuição de freqüências é uma série heterógrada. Qualquer estudo científico enfrenta o dilema de estudo da população ou da amostra. Obviamente tería-se uma precisão muito superior se fosse analisado o grupo inteiro, a população, do que uma pequena parcela representativa, denominada amostra. Observa-se que é impraticável na grande maioria dos casos, estudar-se a população em virtude de distâncias, custo, tempo, logística, entre outros motivos. A alternativa praticada nestes casos é o trabalho com uma amostra confiável. Se a amostra é confiável e proporciona inferir sobre a população, chamamos de inferência estatística. Para que a inferência seja válida, é necessária uma boa amostragem, livre de erros, tais como falta de determinação correta da população, falta de aleatoriedade e erro no dimensionamento da amostra. Quando não é possível estudar, exaustivamente, todos os elementos da população, estudam-se só alguns elementos, a que damos o nome de Amostra. Gráficos permitem a representação de uma relação entre variáveis e facilitam a compreensão de dados, desde que apresentados de forma clara e objetiva.  De Linha  De Barras  Pictóricos  De Setores Dados Brutos : São aqueles valores a que se chegou pela simples coleta, sem qualquer preocupação quanto à sua ordenação. Como se pode ser observado, as cifras estão dispostas de forma desordenada. Em

Prof. Ecila Alves de Oliveira razão disso, pouca informação se consegue obter inspecionando os dados anotados. Mesmo uma informação tão simples como a de saber os consumos máximo e mínimo requer um certo exame dos dados da tabela. Distribuição de Freqüências Dados Brutos e ROL Observe a tabela a seguir que apresenta as notas de quarenta alunos de uma classe de ensino médio. 1 8 4 9 6,5 6 9 10 2 3 8,5 4 9 6 5 5,5 6,5 9 8 7 4,5 6 6,5 7,5 5 6 5,5 8 9 8 6 7 8 9 10 3 2,5 1,5 4 7 Colocando-se esses dados em ordem crescente, obtemos uma nova tabela, denominada ROL. 1 1,5 2 2,5 3 3 4 4 4 4, 5 5 5,5 5,5 6 6 6 6 6 6, 6,5 6,5 7 7 7 7,5 8 8 8 8 8 8,5 9 9 9 9 9 9 10 10 Podemos agora estabelecer a AMPLITUDADE , que é a diferença entre o maior e o menor valor. No caso, temos 10 – 1 = 9 como amplitude. O número de vezes que determinado valor se repete é denominado FREQÜÊNCIA desse valor. Podemos então montar uma nova tabela em que a cada valor associamos a sua freqüência: Notas 1 1,5 2 2,5 3 4 4,5 5 5,5 6 6,5 7 7,5 8 8,5 9 10 Freqüência 1 1 1 1 2 3 1 2 2 5 3 3 1 5 1 6 2 A tabela continua ainda muito extensa. Vamos agrupar as notas de 0 a 2 (0 | 2; fechado em 0 e aberto em 2, que não é do intervalo), de 2 a 4 ( 2 | 4), de 4 a 6 ( 4 | 6), de 6 a 8 ( 6 | 8) e de 8 a 10 (8 | 10). Assim temos: Notas (^0) | 2 2 | 4 4 | 6 6 | 8 8 | 10 Freqüência 2 4 8 12 14 Chamamos esta tabela de DISTRIBUIÇÃO DE FREQÜÊNCIA COM INTERVALOS DE CLASSE. Nessa distribuição, temos cinco intervalos de classe (0 | 2, 2 | 4, 4 | 6, 6 | 8, 8 | 10) com amplitude 2 (2 – 0 = 4 – 2 = ... = 10 – 8). Os extremos de cada classe são chamados de LIMITES , que podem ser INFERIORES (li) e SUPERIORES (Li). Assim: 0, 2, 4, 6 e 8 são limites inferiores e 2, 4, 6, 8 e 10 são limites superiores. O PONTO MÉDIO de cada intervalo de classe é obtido pela média aritmética dos limites inferior e superior da classe. São pontos médios os valores 1, 3, 5, 7 e 9. Temos que considerar a FREQÜÊNCIA RELATIVA ou PERCENTUAL ( F r), em que se associa à freqüência de cada classe o percentual que ela representa em relação à freqüência total. Já a FREQÜÊNCIA ACUMULADA ( F i) de cada classe é dada pela soma das freqüências de todas as classes, desde a primeira até a classe considerada.

Exemplo

Tabela 1: Produção diária de um produto

Prof. Ecila Alves de Oliveira Elementos de uma distribuição de freqüência a-) Amplitude ð é a diferença entre o maior valor e o menor valor encontrado na distribuição. At = 174 – 150 ð At = 24 b-) Classes ð é cada um dos grupos de valores em que se subdivide a amplitude total do conjunto de valores observados da variável.

c-) Número de Classes ð n é o número total de elementos

K = √^40 ð K = 6,32 ð K @ 6 d-) Amplitudade das Classes ð h = 24 / 6 ð h = 4 e-) Ponto Médio de uma Classe ð Ponto médio ou valor médio de uma classe é o ponto eqüidistante dos limites de classe. Para obter o ponto médio de uma classe, ou aplica-se a fórmula acima, ou basta acrescentar ao seu limite inferior a metade da amplitude do intervalo de classe. Tipos de freqüência a) Freqüência simples absoluta (fi) ð é o número de repetições de um valor individual ou de uma classe de valores da variável. b) Freqüência simples relativa (fri) ð representa a proporção de observações de um valor individual ou de uma classe, em relação ao número total de observações. c) Freqüência Acumulada (Fi) ð é o total das freqüências de todos os valores inferiores ao Limite Superior de uma dada classe. At = Vmáx - Vmin K =n h = At K mi = li + Li 2

Prof. Ecila Alves de Oliveira Tabela 4: Distribuição de Freqüência em Intervalos de Classe Qte. fi freqüência simples absoluta

m i

ponto médio fri freqüência simples relativa Fi Freqüência Acumulada Fri Freqüência Acumulada relativa 150 ├ 154 4 152 0,100 4 0, 154 ├ 158 9 154 0,225 13 0, 158 ├ 162 11 160 0,275 24 0, 162 ├ 166 8 164 0,200 32 0, 166 ├ 170 5 168 0,125 37 0, 170 ├ 174 3 172 0,075 40 1, Total 40 1, Medidas de posição: Dentre as medidas de distribuição, a média aritmética ( x ), a mediana (Md) e a moda (Mo) têm especial importância. São medidas de tendência central, visto que ocupam posições centrais numa distribuição. a) MÉDIA ARITMÉTICA ð A Média Aritmética é o quociente da divisão da soma dos valores pelo número de elementos. Sendo x 1 , x 2 , x 3 , ... , xn os elementos, temos: X =

x 1 + x 2 + x 3 +.. .+ xn

n =

i = 1 x

xi

n

A média aritmética para dados não agrupados é a média aritmética simples dos elementos. Vejamos um exemplo: para os elementos 1, 2, 3, 5,7, 8 e 9, temos: X = 1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9 (^9) = 45 (^9) = 5 A média Aritmética para uma distribuição de freqüências apresenta duas situação: 1-) Sem intervalo de classe. Se os elementos x 1 , x 2 , x 3 , ... , xn apresentam, respectivamente, freqüências f 1 , f 2 , f 3 , ... , fn, então: X = f (^) 1. x 1 + f (^) 2. x 2 + f (^) 3. x 3 +.. .+ f (^) n. xn f (^) 1 + f (^) 2 + f (^) 3 +.. .+ f (^) n (^) = ∑ i = 1 n

f i xi

i = 1 n

f i

Ou seja, trata-se da Média Ponderada.

Prof. Ecila Alves de Oliveira Exemplo Salários fi Fi 1500 12 12 2000 10 22 2500 8 30 3000 4 34 3500 1 35

 f^ i = 35

Como ∑^

f i

= 35, temos:

∑ f^ i

Assim, a mediana é um valor ent5re o 17º e o 18º elemento. Esses valores ocorrem para o salário de 2.000. Portanto, Md = 2. 2-) Com intervalo de classe. Devemos inicialmente localizar a classe mediana, ou seja, a que contém o elemento

∑ f^ i

2. Em

seguida, calculamos seu valor usando a fórmula: Σ fi - Fant. h 2 Md = linf + fi Em que: linf Limite inferior da classe mediana Fant Soma das freqüências das classes anteriores à classe mediana h Amplitude da classe mediana fi Freqüência da classe mediana c) MODA (Mo) ð é o valor que ocorre com maior freqüência em uma série de valores. No caso de dados não agrupados, basta procurar pelo valor que mais se repete. Caso os dados estejam agrupados, basta ir à classe com maior freqüência e a MODA poderá ser calculada pela fórmula: A Mo de um cojunto de elementos é o elemento que ocorre com maior freqüência. Assim, um conjunto de elementos pode ter uma moda, mais de uma ou nenhuma. A moda do conjunto de números 2, 3, 4, 4, 5, 6, 6, 6, 7 e 8 é Mo = 6, que ocorre com freqüência 3. No conjunto 2, 3, 3, 4, 5, 5, 6, 7, 7 e 8, temos os números 3, 5 e 7 com freqüência 2. Temos, portanto, três modas:3, 5 e 7. O conjunto de números 2, 3, 4, 6, 8 e 9 não tem nenhum elemento com maior freqüência que os demais. Portanto não tem moda.

Prof. Ecila Alves de Oliveira A classe modal é a classe que apresenta maior freqüência. Consideramos como moda de uma distribuição de freqüência o valor compreendido entre os limites da classe modal. Tal valor é dado por: Mo = l^ + L 2 APLICANDO NO EXEMPLO: Qte. fi xi fri Fi Fri xifi 150 ├ 154 4 152 0,100 4 0,100 608 154 ├ 158 9 156 0,225 13 0,325 1404 158 ├ 162 11 160 0,275 24 0,600 1760 162 ├ 166 8 164 0,200 32 0,800 1312 166 ├ 170 5 168 0,125 37 0,925 840 170 ├ 174 3 172 0,075 40 1,000 516 Total 40 1,000 6440 MÉDIA  MÉDIA = 6440 ð x = 161 unidades 40 MODA (Mo)  Como a classe com maior freqüência é a terceira (158 ├ 162): MODA = 158 + 162 ð Mo = 160 unidades 2 MEDIANA (Md) Determinação da Classe Mediana ð 40 / 2 = 20 O que nos dá como Classe Mediana a Terceira Classe (158 ├ 162): Md = 158 + (20 – 13) 4 ð Md = 158 + 28 ð Md = 160,5 unidades 11 11 Medidas de dispersão a) AMPLITUDE TOTAL ð é a diferença entre o maior e o menor valor da seqüência. At = Vmáx - Vmin b) VARIÂNCIA E DESVIO PADRÃO São valores que nos mostram o quanto os dados se comportam ao redor da média. Quanto maior o valor, significa que mais os dados estão afastados da média. Quanto menor, mais perto da média estão os valores. A VARIÂNCIA é um número calculado a partir dos quadrados dos desvios, ela é um número em unidade quadrada em relação à variável em questão. Por esta razão, neste primeiro momento, ela não será utilizada. O DESVIO PADRÃO ele determina a dispersão dos valores em torno da média.