





































Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Encontra documentos específicos para os exames da tua universidade
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
estatística básica
Tipologia: Notas de estudo
1 / 45
Esta página não é visível na pré-visualização
Não perca as partes importantes!






































A Estatística pode ser encarada como uma ciência ou como um método de estudo. Duas concepção para a palavra ESTATÍSTICA:
com a finalidade de fornecer informações acerca de uma atividade qualquer. Pôr exemplo, as estatística demográficas referem-se as dados numéricos sobre nascimentos, falecimentos, matrimônios, desquites, etc.
Apostila: Curso de Estatística Básica – por Profº João Góes
para a coleta, a classificação, a apresentação, a análise e a interpretação de dados quantitativos e a utilização desses dados para a tomada de decisões. Qualquer ciência experimental não pode prescindir das técnicas proporcionadas pela Estatística, como pôr exemplo, a Física, a Biologia, a Administração, a Economia, etc. Todos esses ramos de atividade profissional tem necessidade de um instrumental que se preocupa com o tratamento quantitativo dos fenômenos de massa ou coletivos, cuja mensuração e análise requerem um conjunto de observações de fenômeno ou particulares.
CONCEITO : é a ciência que se preocupa com a coleta, a organização, descrição (apresentação), análise e interpretação de dados experimentais e tem como objetivo fundamental o estudo de uma população. Este estudo pode ser feito de duas maneiras:
- Estatística Descritiva : é aquela que se preocupa com a coleta, organização, classificação,apresentação, interpretação e analise de dados referentes ao fenômeno através de gráficos e tabelas além de calcular medidas que permita descrever o fenômeno. - Estatística Indutiva (Amostral ou Inferêncial) : é a aquela que partindo de uma amostra, estabelece hipóteses, tira conclusões sobre a população de origem e que formula previsões fundamentando-se na teoria das probabilidades. A estatística indutiva cuida da análise e interpretação dos dados. O processo de generalização do método indutivo está associado a uma margem de incerteza. Isto se deve ao fato de que a conclusão que se pretende obter para o conjunto de todos os indivíduos analisados quanto a determinadas características comuns baseia-se em uma parcela do total de observações.
CONCEITO : é o conjunto, finito ou infinito, de indivíduos ou objetos que apresentam em comum determinadas características definidas, cujo comportamento interessa analisar. A população é estudada em termos de observações de características nos indivíduos (animados ou inanimados) que sejam relevantes para o estudo, e não em termos de pessoas ou objetos em si. O objetivo é tirar conclusões sobre o fenômeno em estudo, a partir dos dados observados. Como em qualquer estudo estatístico temos em mente estudar uma ou mais características dos elementos de uma população, é importante definir bem essas características de interesse para que seja delimitado os elementos que pertencem à população e quais os que não pertencem. Exemplos:
Apostila: Curso de Estatística Básica – por Profº João Góes
As razões de se recorrer a amostras são: menor custo e tempo para levantar dados; melhor investigação dos elementos observados.
1.7. PARÂMETRO : valor (usualmente desconhecido) que caracteriza uma população (por exemplo, a média populacional e o desvio-padrão populacional são parâmetros).
População Dúvidas
x x x x x x x x Parâmetros: Amostra Quantas unidades?
x x x x x x x x Média aritmética x x x x x Quais as unidades?
x x x x x x x x x x x x x x x x
Mediana Moda
x x x x x x x x x x
Estimadores ou Estatísticas:
x x x x x x x x Variância absoluta Média aritmética
x x x x x x x x Desvio Padrão Mediana
Variância relativa Moda Coeficiente de Variação Proporção
Variância absoluta Desvio Padrão Total Variância relativa Coeficiente de Variação Proporção Total
Refere-se a qualquer evento que se pretende analisar cujo estudo seja possível de aplicação de técnicas da estatística. A Estatística dedica-se ao estudo dos fenômenos de massa, que são resultantes do concurso de um grande número de causas, total ou parcialmente desconhecidas.
Fenômenos Coletivos ou de Massa Não podem ser definidos pôr uma simples observação. Exemplos: a natalidade, a mortalidade, a nupcialidade, a idade média dos agricultores do Estado do Pará, o sexo dos agricultores.
Fenômenos Individuais Compõem os fenômenos coletivos. Exemplos: cada nascimento, cada pessoa que morre, cada agricultor investigado.
É preciso definir qual(is) a(s) característica(s) de interesse que será(ão) analisada(s). A característica de interesse pode ser de natureza qualitativa ou quantitativa.
. ATRIBUTOS : são todas as características de uma população que não podem ser medidas. Os indivíduos ou objetos são colocados em categorias ou tipos e conta-se a freqüência com que ocorrem.
Apostila: Curso de Estatística Básica – por Profº João Góes
Exemplos: Sexo (masculino e feminino); estado civil (solteiro, casado, viúvo, etc.); tipo de moradia (madeira, tijolo), situação do aluno (aprovado, reprovado), religião.
1. Dicotomia : quando a classe em que o atributo é considerado admite apenas duas categorias. Exemplos: Sexo (masc. e fem.); Existência ou ausência de certo produto agrícola (existência, ausência), resposta a uma pergunta: (concorda, não concorda), (sim, não). 2. Classificação policotômica ou policotomia : quando a classe em que o atributo é considerado admite mais de duas categorias. Exemplos: Estado civil (solteiro, casado, viúvo), classe social (alta, média ou baixa). . VARIÁVEL : é o conjunto de resultados possíveis de um fenômeno (ou observação, ou característica).
Para os fenômenos:
- sexo - dois resultados possíveis: masculino e feminino; (não pode ser medida: é um atributo) - número de filhos tidos de um grupo de casais - resultados possíveis: 0, 1, 2, 3, 4, 5, ..., n; - peso de pessoas adultas - resultados possíveis: 60 kg, 59,3 kg, 75,3 kg, 65,3 kg, ...; pode tomar um infinito número de valores num certo intervalo.
1. Variável Qualitativa : quando seus valores são expressos pôr atributos ou qualidade.
Exemplos:
. População : Estudantes universitários do Estado do Pará. Variáveis : sexo, profissão, escolaridade, religião, meio onde vivem (rural, urbano). . População : População dos bairros periféricos do município de Belém Variáveis : tipo de casa, existência de água encanada (sim, não), bairro de origem.
Variáveis qualitativas que não são ordenáveis recebem o nome de nominais. Exemplo: religião, sexo, raça, cor.
Raça do Paraense - 2001 Raça Frequência Branca Negra Parda Outra Total
Fonte: Fictícia
Variáveis qualitativas que são ordenáveis recebem o nome de ordinais. Exemplo: nível de instrução, classe social.
Apostila: Curso de Estatística Básica – por Profº João Góes
peças defeituosas.
e observar o número de portadores da moléstia.
A primeira fase do trabalho estatístico consiste em uma definição ou formulação correta do problema a ser estudado e a seguir escolher a natureza dos dados. Além de considerar detidamente o problema objeto de estudo o analista deverá examinar outros levantamentos realizados no mesmo campo e análogos, uma vez que parte da informação de que necessita pode, muitas vezes, ser encontrada nesses últimos. Saber exatamente aquilo que pretende pesquisar é o mesmo que definir de maneira correta o problema. Por exemplo:
É definir com exatidão o que será pesquisado. É recomendável ter em vista um objetivo para o estudo, em lugar de coletar o material e definí-lo no decorrer do trabalho ou só no fim deste.
. Dados pessoais: grau de instrução, religião, nacionalidade, dados profissionais, familiares, econômicos, etc. . Dados sobre comportamento: como se comportam segundo certas circunstâncias. Ex: possível remanejamento da área habitada. . Opiniões, expectativas, níveis de informação, angústias, esperanças, aspirações sobre certos assuntos. . Dados sobre as condições habitacionais e de saneamento que avalie as condições em que vivem e a qualidade de vida de certo grupo.
O problema está definido. Como resolvê-lo? Se através de amostra, esta deve ser significativa para que represente a população. O planejamento consiste em se determinar o procedimento necessário para resolver o problema e, em especial, como levantar informações sobre o assunto objeto de estudo. Que dados deverão ser coletados? Como se deve obtê-los? É preciso planejar o trabalho a ser realizado tendo em vista o objetivo que se pretende atingir.
Apostila: Curso de Estatística Básica – por Profº João Góes
É nesta fase que será escolhido o tipo de levantamento a ser utilizado, que podem ser: a) levantamento censitário, quando a contagem for completa, abrangendo todo o universo; b) levantamento pôr amostragem, quando a contagem for parcial. Outros elementos importantes que devem ser tratados nessa fase são o cronograma das atividades, através do qual são fixados os prazos para as várias fases, os custos envolvidos, o exame das informações disponíveis, o delineamento da amostra, a forma como serão coletados os dados, os setores ou áreas de investigação, o grau de precisão exigido e outros.
Refere-se a obtenção, reunião e registro sistemático de dados, com o objetivo determinado. A escolha da fonte de obtenção dos dados está diretamente relacionada ao tipo do problema, objetivos do trabalho, escala de atuação e disponibilidade de tempo e recursos. a) Fontes primárias: é o levantamento direto no campo através de mensurações diretas ou de entrevistas ou questionários aplicados a sujeitos de interesse para a pesquisa. Vantagens: grau de detalhamento com respeito ao interesse dos quesitos levantados; maior precisão das informações obtidas. b) Fontes secundárias: quando são publicados ou registrados pôr outra organização. A coleta de dados secundários se realiza através de documentos cartográficos (mapas, cartas, imagens e fotografias obtidas por sesoriamento remoto ou por fotogrametria e imagens de radar). Estas fontes de informação são de extrema importância. Das fotografias aéreas em escalas reduzidas ou mais detalhadas, das imagens de radas ou satélite e de cartas obtêm-se informações quanto ao uso do solo, drenagem, estruturas viárias e urbanas, povoamento rural, recursos florísticos, minerais e pedológicos, estrutura fundiária e de serviços, dados altimétricos, etc. Vantagens: inclui um processo de redução e agregação de informações. A coleta dos dados pode ser feita de forma direta ou indireta.
A coleta é dita direta, quando são obtidos diretamente da fonte primária, como os levantamentos de campo através de questionários. Há três tipos de coleta direta: a) a coleta é contínua quando os dados são obtidos ininterruptamente, automaticamente e na vigência de um determinado período: um ano, por exemplo. É o caso dos registros de casamentos, óbitos e nascimentos, escrita comercial, as construções civis. b) a coleta dos dados é periódica quando feita em intervalos constantes de tempo, como o recenseamento demográfico a cada dez anos e o censo industrial, anualmente. c) a coleta dos dados é ocasional quando os dados forem colhidos esporadicamente, atendendo a uma conjuntura qualquer ou a uma emergência, como por exemplo, um surto epidêmico.
A coleta é dita indireta quando é inferida a partir dos elementos conseguidos pela coleta direta, ou através do conhecimento de outros fenômenos que, de algum modo, estejam relacionados com o fenômeno em questão. Um instrumento por meio do qual se faz a coleta das unidades estatísticas é o questionário. Deve ficar bem claro no questionário, que ele é organizado de acordo com dispositivos legais, que há sansões e que o sigilo sobre as informações individuais será absoluto. É aconselhável que um pequeno percentual dos exemplares do questionário seja tirado e aplicado a uma parcela de informantes, afim de testar a aceitação do mesmo, constituindo tal iniciativa, a pesquisa piloto. A boa aceitação dos questionários determinará a tiragem completa dos exemplares ou a sua alteração.
Apostila: Curso de Estatística Básica – por Profº João Góes
Nessa etapa, o interesse maior consiste em tirar conclusões que auxiliem o pesquisador a resolver seu problema. A análise dos dados estatísticos está ligada essencialmente ao cálculo de medidas, cuja finalidade principal é descrever o fenômeno. Assim, o conjunto de dados a ser analisado pode ser expresso pôr número-resumo, as estatísticas, que evidenciam características particulares desse conjunto.
De acordo com as Normas de Apresentação Tabular - 3ª edição/1993 - da Fundação IBGE, o arredondamento é feito da seguinte maneira:
Número a arredondar Arredondamento para Número arredondado 6,197 Inteiro 12,489 Inteiro 20,733 Décimos 35,992 Centésimos
Número a arredondar Arredondamento para Número arredondado 15,504 Inteiro 21,671 Inteiro 16,571 Décimos 17,578 Centésimos 215,500 Inteiros 216,500 inteiros 216,750 décimos 216,705 centésimos
OBS: Não faça arredondamento sucessivos Ex.: 17,3452 passa a 17,3 e não para 17,35 , para 17,4. Se houver necessidade de um novo arredondamento, voltar aos dados originais.
A apresentação tabular é uma apresentação numérica dos dados. Consiste em dispor os dados em linhas e colunas distribuídos de modo ordenado, segundo algumas regras práticas ditadas
Apostila: Curso de Estatística Básica – por Profº João Góes
pelo Conselho /nacional de Estatística e pelo IBGE. Tais regras acham-se publicadas e dispõem sobre os elementos essenciais e complementares da tabela, a especificação dos dados e dos sinais convencionais, o procedimento correto a ser desenvolvido no preenchimento da tabela e outros dispositivos importantes. As tabelas tem a vantagem de conseguir expor, sinteticamente e em um só local, os resultados sobre determinado assunto, de modo a se obter uma visão global mais rápida daquilo que se pretende analisar. Reunindo, pois os valores em tabelas compactas, consegue-se apresentá-los e descrever- lhes a variação mais eficientemente. Essa condensação de valores permite ainda a utilização de representação gráfica, que normalmente representa uma forma mais útil elegante de apresentação da característica analisada.
Um dos objetivos da Estatística é sintetizar os valores que uma ou mais variáveis podem assumir, para que se tenha uma visão global dessa ou dessas variáveis. Isto é possível apresentando esses valores em tabelas e gráficos, que irão fornecer rápidas e seguras informações a respeito das variáveis em estudo, permitindo determinações mais coerentes.
TABELA é um quadro que resume um conjunto de observações.
Como construir uma tabela que forneça informações de forma precisa e correta: 1º passo: Começar pelo título, que explica o conteúdo da tabela. 2º passo: Fazer o corpo da tabela, composto pelos números e informações que ela contém. É formado por linhas e colunas. Para compor o corpo da tabela, é necessário: I) O cabeçalho, que indica o que a coluna contém. Deve estar entre traços horizontais, para melhor vizualização. II) A coluna indicadora, que diz o que a linha contém 3º passo: Escrever o total (as tabelas podem apresentar um total ou não). Aparece entre traços horizontais. 4º passo: Coloque a fonte. Deve entrar no rodapé, sendo obrigatória.
Uma tabela compõem-se de: Tabela 3. Produção de Café Brasil - 1978- Anos Quantidade (1000 ton) 1978 (1)^2535 1979 2666 1980 2122 1981 3760 1982 2007 1983 2500 Fonte: Fictícia Nota: Produção destinada para o consumo interno. (1) Parte exportada para a Argentina.
Rodapé: fonte, chamadas e notas
Apostila: Curso de Estatística Básica – por Profº João Góes
Paraná 550 Goiás 420 Rio de Janeiro 306 Rio Grande do Sul 560 Fonte: Fictícia
. Elemento variável: localidade (fator geográfico) . Elemento fixo: tempo e o fenômeno
É a série cujos dados estão em correspondência com a espécie, ou seja, variam com o fenômeno. Tabela 3. Rebanhos Brasileiros Espécie Quantidade (1000 cabeças) Bovinos 140 000 Suínos 1 181 Bubalinos 5 491 Coelhos 11 200 Fonte: IBGE
. Elemento variável: fenômeno (espécie) . Elemento fixo: local e o tempo
As combinações entre as séries anteriores constituem novas séries que são denominadas séries compostas ou mistas e são apresentadas em tabelas de dupla entrada. Tabela 3. Exportação Brasileira de alguns produtos agrícolas - 1990 - 1992 Produto Quantidade (1000 ton) 1990 1991 1992 Feijão 5600 6200 7300 Arroz 8600 9600 10210 Soja 4000 5000 6000 Fonte: Ministério da Agricultura Nota: Produtos mais exportados no período.
Este exemplo se constitui numa Série Temporal-Específica
. Elemento variável: tempo e a espécie . Elemento fixo: local Obs: uma tabela nem sempre representa uma série estatística, pode ser um aglomerado de informações úteis sobre certo assunto. Tabela 3. Situação dos espetáculos cinematográficos no Brasil - 1967 Especificação Quantidade
Apostila: Curso de Estatística Básica – por Profº João Góes
Número de cinemas 2. Lotação dos cinemas 1.722. Sessões pôr dia 3. Filme de longa metragem 131.330. Meia entrada 89.581. Fonte: Anuário Estatístico do Brasil - IBGE
A Série homógrada é aquela em que a variável descrita apresenta variação discreta ou descontínua. São séries homógradas a série temporal, a geográfica e a específica.
A série heterógrada é aquela na qual o fenômeno ou fato apresenta gradações ou subdivisões. Embora fixo, o fenômeno varia em intensidade. A distribuição de freqüências ou seriação é uma série heterógrada.
A Estatística Descritiva pode descrever os dados através de gráficos. A apresentação gráfica é um complemento importante da apresentação tabular. A vantagem de um gráfico sobre a tabela está em possibilitar uma rápida impressão visual da distribuição dos valores ou das freqüências observadas. Os gráficos propiciam uma idéia inicial mais satisfatória da concentração e dispersão dos valores, uma vez que através deles os dados estatísticos se apresentam em termos de grandezas visualmente interpretáveis.
a. Simplicidade: possibilitar a análise rápida do fenômeno observado. Deve conter apenas o essencial. b. Clareza: possibilitar a leitura e interpretações correta dos valores do fenômeno. c. Veracidade: deve expressar a verdade sobre o fenômeno observado.
a. Diagramas: gráficos geométricos dispostos em duas dimensões. São mais usados na representação de séries estatísticas. b. Cartogramas: é a representação sobre uma carta geográfica, sendo muito usado na Geografia, História e Demografia. c. Estereogramas: representam volumes e são apresentados em três dimensões. d. Pictogramas: a representação gráfica consta de figuras representativas do fenômeno. Desperta logo a atenção do público.
Apostila: Curso de Estatística Básica – por Profº João Góes
As regras para a construção são as mesmas do gráfico em curvas. As bases das colunas são iguais e as alturas são proporcionais aos respectivos dados.
Exemplo: Tabela 4. Produção de Soja do Município X - 1991- Anos Quantidade (ton.) 1991 117. 1992 148. 1993 175. 1994 220. 1995 265. Fonte: Secretaria Municipal de Agricultura Para cada ano é construído uma coluna, variando a altura (proporcional a cada quantidade). As colunas são separadas uma das outras. Observação: O espaço entre as colunas pode variar de 1/3 a 2/3 do tamanho da base da coluna.
Uso do gráfico em colunas para representar outras séries estatísticas
Tabela 4. Áreas (Km^2 ) das Regiões Fisiográficas - Brasil - 1966 Regiões Fisiográficas Área (Km^2 ) Norte 3.581. Nordeste 965. Sudeste 1.260. Sul 825. Centro-oeste 1.879. Brasil 8.511. Fonte: IBGE.
Obs: Na tabela as regiões são apresentadas em ordem geográficas. No gráfico as colunas são ordenadas pela altura, da maior para a menor, da esquerda para a direita.
As alturas dos retângulos são iguais e arbitrárias e os comprimentos são proporcionais aos respectivos dados.
Apostila: Curso de Estatística Básica – por Profº João Góes
As barras devem ser separadas uma das outras pelo mesmo espaço de forma que as inscrições identifiquem as diferentes barras. O espaço entre as barras pode ser a metade (½) ou dois terços(2/3) de suas larguras. As barras devem ser colocadas em ordem de grandeza de forma decrescente para facilitar a comparação dos valores. A categoria “outros” (quando existir) são representadas na barra inferior, mesmo que o seu comprimento exceda o de alguma outra. Outra representação gráfica da Tabela 4.3:
Tabela 4. Matrícula efetiva no Ensino Superior, segundo os ramos de ensino -Brasil - 1995 Ramos de ensino Matrículas Filosofia, Ciências e Letras 44. Direito 36. Engenharia 26. Administração e Economia 24. Medicina 17. Odontologia 6. Agricultura 4. Serviço Social 3. Arquitetura e Urbanismo 2. Farmácia 2. Demais ramos 11. Total 180. Fonte: Fictícia
OBS: Quando a variável em estudo for qualitativa e os nomes das categorias for extenso ou as séries forem geográficas ou específicas é preferível o gráfico em barras, devido a dificuldade em se escrever a legenda em baixo da coluna.
É um tipo de gráfico útil para estabelecer comparações entre as grandezas de cada categoria dos fenômenos estudados. A modalidade de apresentação das colunas é chamado de Gráfico de Colunas Remontadas. Ele proporciona economia de espaços sendo mais indicado quando a série apresenta um número significativo de categorias. Exemplo: Tabela 4. Entrada de migrantes em três Estados do Brasil - 1992- Número de migrantes Anos Total
Estados
Amapá São Paulo Paraná 1992 4.526 2.291 1.626 609 1993 4.633 2.456 1.585 592 1994 4.450 2.353 1.389 708 Fonte: Fictícia
Apostila: Curso de Estatística Básica – por Profº João Góes
Outras maneiras de representar graficamente a Tabela 4.7:
As tabelas estatísticas, geralmente, condensam informações de fenômenos que necessitam da coleta de grande quantidade de dados numéricos. No caso das distribuições de freqüências que é um tipo de série estatística, os dados referentes ao fenômeno objeto de estudo se repetem na maioria das vezes sugerindo a apresentação em tabela onde apareçam valores distinto um dos outros.
É a série estatística que condensa um conjunto de dados conforme as freqüências ou repetições de seus valores. Os dados encontram-se dispostos em classes ou categorias junto com as freqüências correspondentes. Os elementos época, local e fenômeno são fixos. O fenômeno apresenta-se através de gradações, ou seja, os dados estão agrupados de acordo com a intensidade ou variação quantitativa gradual do fenômeno.
a. Dados brutos: são aqueles que não foram numericamente organizados, ou seja, estão na forma com que foram coletados.
Tabela 5.1 - Número de filhos de um grupo de 50 casais
2 3 0 2 1 1 1 3 2 5
6 1 1 4 0 1 5 6 0 2
1 4 1 3 1 7 6 2 0 1
3 1 3 5 7 1 3 1 1 0
3 0 4 1 2 2 1 2 3 2
b. Rol: é a organização dos dados brutos em ordem de grandeza crescente ou decrescente.
Tabela 5.2 - Número de filhos de um grupo de 50 casais
0 0 0 0 0 0 1 1 1 1
1 1 1 1 1 1 1 1 1 1
1 1 2 2 2 2 2 2 2 2
2 3 3 3 3 3 3 3 3 4
4 4 5 5 5 6 6 6 7 7
c. Distribuição de freqüências: é a disposição dos valores com as respectivas freqüências. O número de observações ou repetições de um valor ou de uma modalidade, em um levantamento
Apostila: Curso de Estatística Básica – por Profº João Góes
qualquer, é chamado freqüência desse valor ou dessa modalidade. Uma tabela de freqüências é uma tabela onde se procura fazer corresponder os valores observados da variável em estudo e as respectivas freqüências.
c.1. Distribuição de freqüências para variável discreta Os dados não são agrupados em classes. Tabela 5.3 - Número de filhos de um grupo de 50 casais Número de filhos ( x (^) i )
Contagem ou tabulação
Número de casais ( f (^) i )
Total (F 0 E 5) Tabela 5.4 - Número de filhos de um grupo de 50 casais Número de filhos ( x (^) i )
Numero de casais ( f (^) i )
Total (F 0 E 5)
Obs: 1. X: representa a variável Número de filhos.
c.2. Distribuição de freqüências para variável contínua
Os dados da variável são agrupados em classe (grupo de valores).
1. Dados brutos
Apostila: Curso de Estatística Básica – por Profº João Góes