Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas


Apostila estatistica, Notas de estudo de Matemática

Apostila de Estatística Básica

Tipologia: Notas de estudo

2013

Compartilhado em 23/12/2013

marcio-lucio-dias-pereira-12
marcio-lucio-dias-pereira-12 🇧🇷

1 documento

1 / 85

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
Faculdades Integradas Maria Imaculada
Unidade Mogi Guaçu
Estatística Básica
Márcio Lúcio Dias Pereira
Novembro/2009
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51
pf52
pf53
pf54
pf55

Pré-visualização parcial do texto

Baixe Apostila estatistica e outras Notas de estudo em PDF para Matemática, somente na Docsity!

Faculdades Integradas Maria Imaculada

Unidade Mogi Guaçu

Estatística Básica

Márcio Lúcio Dias Pereira

Novembro/

SUMÁRIO

CAPÍTULO 1 – A NATUREZA DA ESTATÍSTICA

1.1. Métodos científicos ............................................................................................ 03 1.2. A Estatística......................................................................................................... 03 1.3. Fases do método estatístico............................................................................... 04

CAPÍTULO 2 – POPULAÇÃO E AMOSTRA 2.1. Variáveis estatísticas........................................................................................... 05 2.2. População e amostra .......................................................................................... 05 2.3. Amostragem ....................................................................................................... 06

CAPÍTULO 3 – TABELAS 3.1. Elementos de uma tabela................................................................................... 07

CAPÍTULO 4 – SÉRIES ESTATÍSTICAS 4.1. Tipos de séries estatísticas ................................................................................. 09

CAPÍTULO 5 – DISTRIBUIÇÃO DE FREQÜÊNCIAS 5.1. Tabela primitiva .................................................................................................. 5.2. Rol ....................................................................................................................... 12 5.3. Distribuição de freqüência ................................................................................. 12 5.4. Elementos de uma distribuição de freqüência................................................... 13 5.5. Tipos de freqüências........................................................................................... 17

CAPÍTULO 6 – GRÁFICOS ESTATÍSTICOS 6.1. Principais tipos de gráficos ................................................................................. 19 6.2. Diagramas ........................................................................................................... 21

CAPÍTULO 7 – MEDIDAS DE TENDÊNCIA CENTRAL 7.1. Média aritmética ................................................................................................ 25 7.2. Moda................................................................................................................... 26 7.3. Mediana..............................................................................................................

CAPÍTULO 8 – MEDIDAS DE DISPERSÃO 8.1. Amplitude total................................................................................................... 8.2. Variância ............................................................................................................. 8.3. Desvio padrão ..................................................................................................... 36 8.4. Coeficiente de Variação...................................................................................... 38

CAPÍTULO 9 – PROBABILIDADE 9.1. Conceito de probabilidade ................................................................................. 41 9.2. Probabilidade condicional .................................................................................. 45 9.3. Teorema da multiplicação .................................................................................. 48 9.4. Teorema da soma ............................................................................................... 50

CAPÍTULO 10 – DISTRIBUIÇÃO DE PROBABILIDADE 10.1. Variável aleatória................................................................................................ 53 10.2. Função de probabilidade .................................................................................... 53 10.3. Distribuição de probabilidade ............................................................................ 10.4. Binômio de Newton............................................................................................ 55 10.5. Distribuição binomial.......................................................................................... 57

Inferencial : Também chamada de indutiva, representa um conjunto de métodos estatísticos que visam caracterizar ou inferir sobre uma população a partir de uma parte dela. Permite a analise e interpretação dos dados, tomando como base as amostras estatísticas.

1.3. Fases do método estatístico

Podemos distinguir no método estatístico as seguintes fases:

Definir o Problema : Formular corretamente o problema sobre o qual deverá ser realizada uma pesquisa. Deve-se saber exatamente aquilo que se pretende pesquisar.

Planejamento : Determinar os procedimentos necessários para resolver o problema definido. Como levantar informações sobre o assunto objeto do estudo. Escolher e formular corretamente as perguntas. Definir o tipo de levantamento, as características mensuráveis, o cronograma de atividades, os custos envolvidos, etc.

Coleta de dados : É o registro sistemático dos dados pesquisados. Pode ser direta, quando é feita sobre elementos informativos de registro obrigatório (nascimento, prontuários, etc.) ou coletados pelo próprio pesquisador através de inquéritos ou questionários. Pode ser indireta, quando é inferida de elementos conhecidos (coleta direta) ou do conhecimento de fenômenos relacionados.

Apuração dos dados : Refere-se a fase de tabulação ou processamento dos dados obtidos e a disposição mediante critérios de classificação. Pode ser feita de forma manual, eletromecânica ou eletrônica.

Apresentação dos dados : Qualquer que seja a finalidade da pesquisa efetuada, os dados devem ser apresentados sob uma forma adequada (tabelas, gráficos, etc.). Esse procedimento torna mais fácil o exame daquilo que está sendo objeto de tratamento estatístico.

Análise dos resultados : O objetivo da estatística é tirar conclusões sobre o todo (população) a partir de informações fornecidas por parte representativa deste todo (amostra). Assim deve ser feita uma análise através dos métodos da Estatística Indutiva ou Inferencial.

CAPÍTULO 2

POPULAÇÃO E AMOSTRA

A Estatística está baseada na teoria das probabilidades, cujo principal objetivo é nos auxiliar a tirar conclusões, em situações de incerteza, a partir de informações numéricas de uma amostra. Portanto, entender o conceito de população e amostra se torna fundamental para a utilização de todas as técnicas estatísticas que serão apresentadas.

2.1. Variáveis estatísticas

A cada fenômeno corresponde um conjunto de resultados possíveis. Como por exemplo: sexo (masculino ou feminino), idade (10, 35, 60, ...), estatura (1,75; 1,87; 1,50, ...). Assim, uma variável pode ser:

Qualitativa : Quando seus valores são expressos por atributos: país de origem (Brasil, Itália, Espanha, etc.); cor da pele (branca, preta, amarela, etc.); grau e instrução (analfabeto, fundamental, etc.).

Quantitativa : Quando seus valores são expressos em números. Recebe o nome de “quantitativa contínua”, quando pode assumir valores entre dois intervalos (altura, peso, etc.), ou seja, valores que podem ser medidos. Recebe o nome de “quantitativa discreta” quando pode assumir valores enumeráveis (número de filhos, número de alunos, etc.), ou seja, valores que podem ser contados.

2.2. População e amostra

População : Representa o conjunto de elementos que têm, em comum, pelo menos uma determinada característica. Em qualquer estudo estatístico pretendemos pesquisar uma ou mais características dos elementos de alguma população, por exemplo: alunos que possuem algum animal de estimação, casais que possuem mais de cinco filhos, etc.

Amostra : Na maioria das vezes, por alguma impossibilidade ou inviabilidade, limitamos as observações referentes a uma determinada pesquisa a apenas uma parte da população que chamamos de amostra. Portanto, uma amostra representa um subconjunto finito de uma população.

CAPÍTULO 3

TABELAS

Um dos objetivos da Estatística é sintetizar os valores que as variáveis podem assumir. Isso pode ser feito através da apresentação dos dados na forma de tabelas. Uma tabela é um quadro que resume um conjunto de observações, fornecendo informações rápidas e seguras a respeito das variáveis em estudo.

3.1. Elementos de uma tabela

A apresentação tabular (em tabelas) é feita com a disposição dos dados em linhas e colunas de acordo com normas bem rígidas, de aplicação mundial. No caso do Brasil, as regras foram definidas pela Fundação IBGE, para orientar a exposição racional e uniforme de dados estatísticos.

Para manter esta estruturação e uma padronização de acordo com as normas, podemos definir que uma tabela compõe-se de elementos essenciais e complementares. Considerando a tabela apresentada ao lado, vamos reescrevê-la logo abaixo, detalhando cada um dos seus elementos.

Elementos essenciais:

1. Corpo : Conjunto de linhas e colunas que contém informações sobre as variáveis me estudo; 2. Cabeçalho : Parte superior da tabela que especifica o conteúdo das colunas; 3. Título : Conjunto de informações localizadas no topo da tabela, que permite responder às seguintes perguntas sobre a mesma: O que?, Quando?, Onde?; 4. Linhas : Informações dispostas horizontalmente, contendo os dados que se inscrevem nos seus cruzamentos com as colunas; 5. Coluna indicadora : Especifica os conteúdos das linhas; 6. Célula : Espaço destinado a um único dado, cuja posição é a intersecção entre uma linha com uma coluna (casa).

Elementos complementares:

7. Linha de total : Permite consultar os dados referentes às somatórias de algumas das colunas; 8. Fonte : Indicação da origem dos dados, ou seja, a entidade ou pessoa responsável pelo seu fornecimento; 9. Notas : Permite conceituar ou esclarecer o conteúdo de uma tabela ou indicar a metodologia empregada na coletas de dados. 10. Chamadas : Informações específicas sobre partes da tabela, com objetivo de esclarecer ou conceituar dos dados.

Dados das células:

De acordo com a Resolução 886 da Fundação IBGE, nas casas ou células devemos colocar:

a) Um traço horizontal (–) quando o valor é zero; b) Três pontos (...) quando não temos os dados; c) Um ponto de interrogação (?) quando temos dúvida quanto à exatidão de determinado valor; d) Zero (0) quando o valor é muito pequeno para ser expresso pela unidade utilizada.

Séries específicas ou categóricas

Descrevem os valores da variável em determinado tempo e local, discriminados, de acordo com especificações ou categorias. Veja um exemplo na tabela abaixo:

Séries conjugadas

Muitas vezes temos a necessidade de apresentar, em uma única tabela, a variação de valores de mais de uma variável, isto é, fazer uma conjugação de duas ou mais séries.

Conjugando duas séries em uma única tabela, obtemos uma tabela de dupla entrada. Em uma tabela desse tipo ficam criadas duas ordens de classificação: uma horizontal (linha) e uma vertical (coluna). Veja um exemplo na tabela abaixo:

CAPÍTULO 5

DISTRIBUIÇÃO DE FREQÜÊNCIAS

Nos capítulos anteriores, vimos que uma das tarefas do estatístico é a coleta de dados. Assim, depois de apurar e reunir os dados, devemos condensá-los e apresentá-los. Essa apresentação pode ser feita em uma de modo a dar uma visão global daquilo que será analisado.

Cada tabela tem um objetivo diferente, servindo para mostrar os dados estatísticos associados a um fato constituindo uma série estatística, apresentando elementos básicos tais como: tempo, espaço e espécie. A série chamada distribuição de freqüência apresenta dados numéricos em ambas as colunas que compõem estas tabelas.

Para conhecer um fato é preciso representar e tratar os dados, realizando cálculos de muitas medidas existentes na Estatística, somente possíveis para as distribuições de freqüências. Elas são, por isso, as séries mais importantes e merecem ser estudadas com bastante atenção.

Essa série é a mais complexa e utilizada das séries estatísticas. Nela, todos os fatores (tempo, espaço, espécie) são fixos. Os dados colhidos são medidas de alguma variável e são distribuídas de acordo com a freqüência, ou seja, o total de vezes que o dado acontece. Daí o nome distribuição de freqüência.

5.1. Tabela primitiva

Pode ser definida como uma tabela cujos elementos não foram organizados numericamente. As tabelas primitivas não dão ao leitor uma visão rápida e global do fenômeno (veja Figura 5.1).

Os dados ficam difíceis de serem averiguados, mesmo sendo conhecidos os valores das variáveis, portanto, a maneira mais fácil de organizar estes dados é através de certa ordenação (crescente ou decrescente).

Figura 5.

Dados agrupados com intervalos de classes

Nessa forma de distribuição de freqüências, se faz o agrupamento dos valores das variáveis em vários intervalos. Este tipo de organização de dados é chamado de distribuição de freqüência de dados agrupados com intervalos de classes (veja a tabela ao lado). Chamamos de classes, os intervalos de variação de uma determinada variável observada.

O que se pretende com esse tipo de tabela é realçar o que há de essencial nos dados e, também tornar possível o uso de técnicas analíticas para sua total descrição, até porque a Estatística tem por finalidade especifica analisar o conjunto de valores, e não os casos isolados.

5.4. Elementos de uma distribuição de freqüência

Para facilitar o entendimento, vamos considerar a tabela de distribuição de freqüência apresentada na tabela mostrada abaixo:

Classe

Classe de freqüência ou, simplesmente, classes são intervalos de variação de uma variável.

As classes são representadas simbolicamente por i , sendo i  1, 2, 3, ..., k (onde k é o

número total de classes da distribuição). Considerando como exemplo a tabela mostrada logo acima, podemos afirmar que:

a) O intervalo 410 |^540 , define a primeira classe ( i  1 );

b) O intervalo 540 |^670 , define a segunda classe ( i  2 );

c) Como a distribuição mostrada na tabela é formada de seis classes, podemos afirmar que

nesse caso, k  6.

Um roteiro para construir uma tabela com distribuição de freqüências com intervalos de classes

Para ilustrar como pode ser definida uma tabela de distribuição de freqüências com intervalos de classe, utilizaremos como exemplo os dados da tabela apresentada na tabela mostrada logo abaixo:

Ao construirmos a distribuição de freqüências por intervalos de classes, a partir dos dados mostrados na Figura 5.4.2, podemos dizer que os principais estágios da construção desta distribuição são os seguintes:

a) Determinar o intervalo total dos dados

Podemos definir que a amplitude total da distribuição ( AT ) é a diferença entre o limite superior da última classe (limite superior máximo) e o limite inferior da primeira classe (limite inferior mínimo).

AT  L max  l min

Considerando a tabela apresentada logo acima e, como estamos querendo montar a tabela distribuição de freqüências por intervalos de classes, devemos determinar o intervalo total dos dados dessa tabela, portanto:

─ Maior salário: 1180 ─ Menor salário: 412

AT  L max  l min  AT  1180  412  AT  768

b) Definir o número de classes a ser adotado

De um modo geral recomendamos que as tabelas tenham no mínimo 4 classes e no máximo 15. Para determinação do número de classes de uma distribuição podemos utilizar algumas regras.

Para obtermos o segundo intervalo de classe (2ª classe), consideramos o limite superior da primeira classe como sendo o limite inferior da segunda classe, então, somamos a este o valor obtido no cálculo da amplitude das classes ( h ), para obtermos o limite superior da segunda classe.

Assim, sucessivamente iremos estruturando todos os intervalos de classes da tabela. Uma observação importante, é que para definir o valor do limite mínimo da tabela, podemos adotar um valor arredondado para facilitar os cálculos dos intervalos de classe.

Por exemplo, para os dados constantes da tabela apresentada na Figura 5.4.2, poderíamos estabelecer para os intervalos preliminares de cada uma das classes, os seguintes valores:

─ 1ª classe: Limite inferior da tabela: 412 (arredondado para 410 )

Limite superior da classe: 410  h  410  130  540

Intervalo de classe: 410 540

─ 2ª classe: Limite inferior da classe: 540

Limite superior da classe: 540  h  540  130  670

Intervalo de classe: 540 670

─ 3ª classe: Limite inferior da classe: 670

Limite superior da classe: 670  h  670  130  800

Intervalo de classe: 670 800

─ 4ª classe: Limite inferior da classe: 800

Limite superior da classe: 800  h  800  130  930

Intervalo de classe: 800 930

─ 5ª classe: Limite inferior da classe: 930

Limite superior da classe: 930  h  930  130  1060

Intervalo de classe: 930 1060

─ 6ª classe: Limite inferior da classe: 1060

Limite superior da classe: 1060  h  1060  130  1190

Intervalo de classe: 1060 1190

Observações:

─ Para cada resultado obtido para uma variável observada, deverá haver uma classe na qual este valor deverá ser encaixado;

─ Cada resultado obtido para a variável observada deverá pertencer a uma, e somente uma única classe.

5.5. Tipos de freqüências

Para explicar cada um dos tipos de freqüências que serão apresentados, utilizaremos como exemplo, as informações constantes da tabela mostrada abaixo.

 Ponto médio da classe ( xi )

O ponto médio de uma classe divide o intervalo da classe em duas partes iguais. Para obtermos o ponto médio de uma classe, podemos calcular a média aritmética entre o intervalo dessa classe. Veja estas informações na tabela exemplo.

i i i

l L

x

Onde:

x i : Ponto médio do intervalo de classe

l i : Limite inferior da classe

L i : Limite superior da classe

CAPÍTULO 6

GRÁFICOS ESTATÍSTICOS

O gráfico estatístico é uma forma de apresentação dos dados estatísticos cujo objetivo é o de produzir, no investigador ou no público em geral, uma impressão mais rápida e viva do fenômeno em estudo.

Para tornarmos possível uma representação gráfica, estabelecemos uma correspondência entre os termos da série e determinada figura geométrica, de tal modo que cada elemento da série seja representado por uma figura proporcional. A representação gráfica de um fenômeno deve obedecer a certos requisitos fundamentais para ser realmente útil:

Simplicidade : O gráfico deve ser destituído de detalhes de importância secundária, assim como de traços desnecessários que possam levar o observador a uma análise morosa ou com erros.  Clareza : O gráfico deve possibilitar uma correta interpretação dos valores representativos do fenômeno em estudo.  Veracidade : O gráfico deve expressar a verdade sobre o fenômeno em estudo.

6.1. Principais tipos de gráficos

Os principais tipos de gráficos podem ser classificados em diagramas, cartogramas e pictogramas. Nesse nosso estudo, serão abordados especificamente gráficos do tipo diagramas, no entanto, a título de conhecimento, podemos citar também os outros tipos.

Diagramas : São gráficos geométricos que utilizam em geral o sistema cartesiano para representá-lo. Dentre os principais gráficos desse tipo podemos temos gráfico de linhas ou curvas, gráficos de colunas ou barras, gráficos de setores, histogramas e polígonos de freqüências.

Exemplos:

Cartogramas : São gráficos cujas representações são feitas em cartas geográficas. Este tipo de gráfico é empregado quando o objetivo é o de figurar os dados estatísticos diretamente relacionados com áreas geográficas ou políticas.

Exemplos:

Pictogramas : Os gráficos de pictogramas constituem um dos processos gráficos bem interessantes, comunica de maneira simples ao público, pela sua forma ao mesmo tempo, atraente e sugestiva. Sua representação gráfica é feita através de figuras relacionadas aos dados que estão sendo apresentados.

Exemplos: