Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas


Apostila de Estatística, Notas de estudo de Cultura

Apostila de introdução a estatística ifce 2010

Tipologia: Notas de estudo

2012

Compartilhado em 20/12/2012

josyane-da-silva-sampaio-4
josyane-da-silva-sampaio-4 🇧🇷

4.5

(2)

3 documentos

1 / 125

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
ESTATÍSTICA BÁSICA
Professor: Narcelio de Araújo Pereira
2010
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51
pf52
pf53
pf54
pf55
pf56
pf57
pf58
pf59
pf5a
pf5b
pf5c
pf5d
pf5e
pf5f
pf60
pf61
pf62
pf63
pf64

Pré-visualização parcial do texto

Baixe Apostila de Estatística e outras Notas de estudo em PDF para Cultura, somente na Docsity!

ESTATÍSTICA BÁSICA

Professor: Narcelio de Araújo Pereira

[email protected]

SUMÁRIO

  • INTRODUÇÃO
  • UNIDADE 1: A NATUREZA DA ESTATÍSTICA
  • UNIDADE 2: GENERALIDADES E CONCEITOS BÁSICOS
  • UNIDADE 3: SÉRIES ESTATÍSTICAS
  • UNIDADE 4: GRÁFICOS
  • UNIDADE 5: DISTRIBUIÇÃO DE FREQUENCIA
  • UNIDADE 6: MEDIDAS DE POSIÇÃO
  • UNIDADE 7: MEDIDAS DE DISPERSÃO OU VARIABILIDADE
  • UNIDADE 8: PROBABILIDADE
  • UNIDADE 9: DISTRIBUIÇÃO BINOMIAL E NORMAL
  • REFERENCIAS
  • ANEXOS
  • EXERCÍCIOS DE FIXAÇÃO

conhecimento, os conceitos empregados, as limitações das técnicas e as conseqüências dessas interpretações são essencialmente as mesmas.

Segundo Rao (1999), a estatística é uma ciência que estuda e pesquisa sobre: o levantamento de dados com a máxima quantidade de informação possível para um dado custo; o processamento de dados para a quantificação da quantidade de incerteza existente na resposta para um determinado problema; a tomada de decisões sob condições de incerteza, sob o menor risco possível. Finalmente, a estatística tem sido utilizada na pesquisa científica, para a otimização de recursos econômicos, para o aumento da qualidade e produtividade, na otimização em análise de decisões, em questões judiciais, previsões e em muitas outras áreas.

I - A NATUREZA DA ESTATÍSTICA

MÉTODO ESTATÍSTICO

O Método Científico

Muitos dos conhecimentos que temos foram obtidos na antiguidade por acaso e, outros, por necessidades práticas, sem aplicação de um método. Atualmente, quase todo acréscimo de conhecimento resulta da observação e do estudo. Se bem que muito desse conhecimento possa ter sido observado inicialmente por acaso, a verdade é que desenvolvemos processos científicos para seu estudo e para adquirirmos tais conhecimentos. Podemos então dizer que:

 Método: é um conjunto de meios dispostos convenientemente para se chegar a um fim que se deseja, ou seja, é um meio mais eficaz para atingir determinada meta.

Dos métodos científicos, vamos destacar o Método experimental e Método estatístico. O Método Experimental - É o método preferido pela física, Química, etc.

 Método experimental: consiste em manter constantes todas as causas (fatores), menos uma, e variar esta causa de modo que o pesquisador possa descobrir seus efeitos, caso existam.

O Método Estatístico

Muitas vezes temos necessidade de descobrir fatos em um campo em que o método experimental não se aplica (nas ciências sociais), já que os vários fatores que afetam o fenômeno em estudo não podem permanecer constantes enquanto fazemos variar a causa que, naquele momento, nos interessa. Nesses casos, lançamos mão de outro método, embora mais difícil e menos preciso, denominado método estatístico.

 Método estatístico: diante da impossibilidade de manter as causas constantes, admitem todas essas causas presentes variando-as, registrando essas variações e procurando determinar, no resultado final, que influências cabem a cada uma delas.

3 – Coleta de Dados

Após cuidadoso planejamento e a devida determinação das características mensuráveis do fenômeno coletivamente típico que se quer pesquisar, damos início à coleta dos dados numéricos necessários à sua descrição. Fase operacional. É o registro sistemático de dados, com um objetivo determinado.

A coleta de dados pode ser direta ou indireta.

3.1 – Direta:

Quando é feita sobre elementos informativos de registro obrigatório (nascimentos, casamentos, óbitos, importação, exportação, etc.), elementos pertinentes aos prontuários dos alunos de uma escola ou, ainda, quando os dados são coletados pelo próprio pesquisador através de inquéritos e questionários, como é o caso das notas de verificação e de exames, do censo demográfico, etc.

A coleta direta de dados pode ser classificada relativamente ao fator tempo em:

 Contínua (registro): quando feita continuamente, tal como a de nascimento, óbitos e a freqüência dos alunos às aulas;  Periódica: quando feita em intervalos constantes de tempo, como os censos (de 10 em 10 anos) e as avaliações periódicas; recenseamento demográfico, censo industrial;  Ocasional: quando feita esporadicamente, a fim de atender a uma conjuntura ou a uma emergência, como no caso de epidemias.

3.2 – Indireta:

Quando é inferida de elementos conhecidos (coleta direta) e/ou conhecimento de outros fenômenos relacionados com o fenômeno estudado. Ex: pesquisa sobre mortalidade infantil, que é feita através de dados colhidos por uma coleta direta.

4 – Crítica dos Dados

Obtidos os dados, eles devem ser cuidadosamente criticados, à procura de possíveis falhas e imperfeições, a fim de não incorrermos em erros grosseiros ou de certo vulto, que possam influir sensivelmente nos resultados.

A crítica dos dados se divide em: externa e interna

 Crítica externa – quando visa às causas dos erros por parte do informante, por distração ou má interpretação das perguntas que lhe foram feitas.

 Crítica interna – quando visa observar os elementos originais dos dados da coleta.

5 – Apuração dos Dados

Nada mais é do que a soma e o processamento dos dados obtidos e a disposição mediante critérios de classificação. Resumo dos dados através de sua contagem e agrupamento. É a condensação e tabulação de dados.

Pode ser manual, eletromecânica ou eletrônica.

6 – Exposição ou Apresentação dos Dados

Por mais diversa que seja a finalidade que se tenha em vista, os dados devem ser apresentados sob forma de tabelas e gráficos (unidade 4), pois tornam mais fácil o exame daquilo que está sendo objeto de tratamento estatístico e ulterior obtenção de medidas de dispersão (unidade 6).

7 – Análise dos Dados

Como já dissemos, o objetivo último da estatística é tirar conclusões sobre o todo (população) a partir de informações fornecidas por parte representativa do todo (amostra). Assim, realizadas as etapas anteriores ( estatística descritiva ), fazemos uma análise dos resultados obtidos, através dos métodos da Estatística Indutiva ou Inferencial , que tem por base a indução ou inferência, e tiramos desses resultados conclusões e previsões.

II - GENERALIDADES E CONCEITOS BÁSICOS

1 – VARIÁVEL

A cada fenômeno corresponde um número de resultados possíveis. Assim, por exemplo:

  • para um fenômeno “sexo” são dois os resultados possíveis: masculino e feminino;
  • para o fenômeno “número de filhos” há um número de resultados possíveis expressos através dos números naturais: 0,1,2,3,....,n;
  • para o fenômeno “estatura” temos uma situação diferente, pois os resultados podem tomar um número infinito de valores numéricos dentro de um determinado intervalo.

 Variável: é, convencionalmente, o conjunto de resultados possíveis de um fenômeno.

Uma variável pode ser: qualitativa ou quantitativa

 Qualitativa: quando seus valores são expressos por atributos; ex: sexo, cor da pele, etc;

 Quantitativa: quando seus valores são expressos em números; ex: salários, idade, altura, etc. Divide-se em discreta e contínua

 Discreta ou descontínua: seus valores são expressos geralmente através de números inteiros não negativos. Resulta normalmente de contagens. Ex: números de alunos presentes as aulas: ontem = 20, hoje = 23; Nº de alunos presentes às aulas de introdução à estatística no 1º semestre de 1997: mar = 18, abr = 30, mai = 35, jun = 36.

 Contínua: resulta normalmente de uma mensuração, e a escala numérica de seus possíveis valores corresponde ao conjunto R dos números reais, ou seja, podem assumir, teoricamente, qualquer valor entre dois limites.

Exercício resolvido:

Classifique as variáveis em qualitativas e quantitativas (contínuas ou discretas): a) Cor dos olhos – Qualitativa b) Índice de liquidez nas Indústrias Cearenses – Quantitativa contínua c) Produção de café no Brasil – Quantitativa contínua d) Número de defeitos em aparelhos de TV – Quantitativa discreta e) Comprimento dos pregos produzidos por uma empresa – Quantitativa contínua f) O ponto obtido em cada jogada de um dado – quantitativa discreta

2 – POPULAÇÃO E AMOSTRA

Dois conceitos devem estar bem claros: o de população e o de amostra, pois é delas que são extraídos os dados que dão origem às diversas relações estatísticas, como a média, desvio-padrão, etc., e que, em última análise, possibilitam descreve-las sob os mais diversos aspectos.

População : coleção completa de todos os elementos que são objeto de um estudo; conjunto de entes portadores de, pelo menos, uma característica comum. A população estatística também é conhecida como universo estatístico. Exemplo: pessoas que possuem automóvel

Amostras : são subconjuntos finitos representativos de uma dada população. Exemplo: pessoas que possuem automóvel da marca Fiat.

Censo : exame de todos os elementos da população.

A amostra deve ser representativa da população da qual foi extraída, ser parecida com ela (quantitativa e quantitativamente), devendo obedecer a dois princípios básicos:  Deve ser suficientemente grande;  Seus constituintes devem ter sido selecionados ao acaso.

Nem sempre é possível estudar exaustivamente todos os elementos da população!

Daremos, a seguir, três das principais técnicas de amostragem.

3.1 – Amostragem casual ou aleatória simples

Esta técnica de amostragem é equivalente a um sorteio lotérico: Na prática esta amostragem pode ser realizada da seguinte maneira:

 Enumera-se a população de 1 a n;  Sorteia-se K números dessa seqüência, que representarão a amostra.

Exemplo: Vamos obter uma amostra representativa para a pesquisa de peso de 80 (oitenta) alunos de uma escola:

 Numeramos os alunos de 01 a 80 (população);  Colocamos os oitenta números, em pedaços iguais de um mesmo papel, dentro de uma caixa. Agitamos e realizamos o sorteio de 8 alunos, que representa uma amostra de 10% desta população.

Quando o número de elementos da amostra é grande, esse tipo de sorteio torna-se muito trabalhoso. A fim de facilitá-lo, foi elaborada uma tabela – Tabela de Números Aleatórios -, construída de modo que os dez algarismos (de 0 a 9) são distribuídos ao acaso nas linhas e colunas (ver anexo).

3.2 – Amostragem proporcional estratificada

Muitas vezes a população se divide em subpopulações – estratos

Como é provável, que a variável em estudo apresente, de estrato em estrato, um comportamento heterogêneo e, dentro de cada estrato, um comportamento homogêneo, convém que o sorteio dos elementos da amostra leve em consideração tais estratos.

É exatamente isso que fazemos quando empregamos a amostragem proporcional estratificada, que, além de considerar a existência de estratos, obtém elementos da amostra proporcional ao número de elementos desses estratos.

Exemplo: Vamos obter uma amostra proporcional estratificada, de 10 % do exemplo anterior, supondo que dos 80 alunos, temos 44 meninos e 36 meninas.

São, portanto dois estratos, (sexo masculino e sexo feminino). Temos:

SEXO POPULAÇÃO 10 % AMOSTRA MASCULINO 44 10 x 44 = 4, 100

FEMININO 36 10 x 36 = 3, 100

TOTAL 80 10 x 80 = 8 100

3.3 – Amostragem sistemática

Quando os elementos da população já se acham ordenados, não há necessidade de construir o sistema de referência. São exemplos os prontuários médicos de um hospital, os números de uma rua, uma linha de produção, etc. Nestes casos, a seleção dos elementos que constituirão a amostra pode ser feita por um sistema imposto pelo pesquisador. A esse tipo de amostragem denominamos sistemática.

Assim, no caso de uma linha de produção, podemos, a cada dez itens produzidos, retirar um para pertencer a uma amostra da produção diária. Neste caso, estaríamos fixando o tamanho da amostra em 10% da população.

Exemplo: Supomos uma rua com 500 casas, das quais desejamos obter uma amostra formada por 20 casas para uma pesquisa de opinião.

Neste caso, podemos usar o seguinte procedimento:

 Como 500/20 = 25, escolhemos por sorteio casual um número de 01 a 25;  Este número indicará a primeira casa da amostra, vamos supor a casa de número 6;  Os demais elementos da amostra seriam considerados de 25 em 25;  Assim, as demais casas da amostra seriam as casas de números 31 (6+25), 56 (31+25), 81 (56+25), etc.

Fonte : entidade responsável pelo levantamento dos dados ou pela elaboração da tabela;

Notas : são informações de natureza geral, destinada a conceituar ou esclarecer o conteúdo das tabelas, ou indicar a metodologia adotada;

Chamadas : informações de natureza específica sobre determinada parte da tabela, destinada a conceituar ou esclarecer dados.

De acordo com a Resolução 886 do IBGE, nas casas ou células da tabela devemos colocar:

 Um traço horizontal ( - ) quando o valor é nulo ;

 Três pontos ( ... ) quando não temos a informação;

 Zero ( 0 ) quando o valor é muito pequeno para ser expresso pela unidade utilizada. Se os valores são expressos em numerais decimais, precisamos acrescentar à parte decimal um número correspondente de zeros (0,0; 0,00; 0,000; .....);

 Um ponto de interrogação (? ) quando temos dúvida quanto à exatidão de determinado valor;

 A letra “x” quando o dado for omitido, a fim de evitar individualização das informações.

Obs: Os lados direito e esquerdo de uma tabela oficial devem ser abertos.

Ex: Levantamento Epidemiológico no Estado do Rio de Janeiro - 1970

Especificação Nº de Casos Nº de óbitos Sarampo (1) 115 15 Varíola ... 10 Cólera - - Meningite 35 5 Total 150 30 Fonte: Departamento Nacional de Endemias Rurais Nota: As atividades da campanha de vacinação abrangeram as áreas de maior incidência.

(1) inclusive a área urbana.

SÉRIES ESTATÍSTICAS:

Denominamos séries estatísticas toda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época , do local ou da espécie. Dividem-se em séries homógradas e conjugadas.

 Séries Homógradas: são aquelas em que a variável descrita apresenta variação discreta ou descontínua. Podem ser do tipo temporal, geográfica ou específica.

a) Série Temporal : Identifica-se pelo caráter variável do fator cronológico. O local e a espécie (fenômeno) são elementos fixos. Esta série também é chamada de histórica, cronológica, marcha ou evolutiva.

ABC VEÍCULOS LTDA.

Vendas no 1º bimestre de 1996

PERÍODO UNIDADES VENDIDAS (mil) JAN/96 20 FEV/96 10 TOTAL 30

b) Série Geográfica : Apresenta como elemento variável o fator geográfico. A época e o fato (espécie) são elementos fixos. Também é chamada de espacial , territorial ou de localização.

DADOS ABSOLUTOS E DADOS RELATIVOS

 Dados absolutos: são dados resultantes da coleta direta da fonte, sem outra manipulação senão a contagem ou medida.

A leitura dos dados absolutos é sempre enfadonha e inexpressiva; embora esses dados traduzam um resultado exato e fiel, não têm a virtude de ressaltar de imediato as suas conclusões numéricas. Daí o uso imprescindível que faz a Estatística dos dados relativos.

 Dados relativos: são os resultados de comparações por quocientes (razões) que se estabelecem entre dados absolutos e têm por finalidade realçar ou facilitar as comparações entre quantidades.

Traduzem-se os dados relativos, em geral, por meio de percentagens, índices, coeficientes e taxas.

1 – Percentagens

Considere a série:

MATRÍCULAS NAS ESCOLAS DA CIDADE A – 1995 CATEGORIAS Nº. DE ALUNOS 1º Grau 19286 2º Grau 1681 3º Grau 234 TOTAL 21201 Dados fictícios.

Calculemos as percentagens dos alunos da cada grau:

1º grau – 19286 x 100 = 90,96 = 91, 21201

2º grau – 1681 x 100 = 7,92 = 7, 21201

3º grau – 234 x 100 = 1,10 = 1, 21201

Com esses dados, podemos formar uma nova coluna na série em estudo:

MATRÍCULAS NAS ESCOLAS DA CIDADE A – 1995 CATEGORIAS Nº. DE ALUNOS % 1º Grau 19286 91, 2º Grau 1681 7, 3º Grau 234 1, TOTAL 21201 100 Dados fictícios.

Os valores dessa nova coluna nos dizem que, de cada 100 alunos da cidade A, 91 estão matriculados no 1º grau, 8 aproximadamente no 2º grau e 1 no 3º grau.

O emprego da porcentagem é de grande valia quando é nosso intuito destacar a participação da parte no todo.

NOTAS:

 Do mesmo modo que tomamos 100 para base de comparação, também podemos tomar outro número qualquer, entre os quais destacamos o número 1. É claro que, supondo o total igual a 1 , os dados relativos das parcelas serão todos menores que 1.  Em geral, quando usamos 100 para base, os dados são arredondados até a primeira casa decimal; e quando tomamos 1 por base, são arredondados até a terceira casa decimal.

Exercício: Complete a tabela abaixo

ESCOLAS Nº. DE ALUNOS DADOS RELATIVOS

POR 1 POR 100

A 175 0,098 9,

B 222

C 202

D 362

E 280

F 540

TOTAL 1781 1,000 100,