






























































Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Encontra documentos específicos para os exames da tua universidade
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Apostila de Estatística Descritiva
Tipologia: Notas de estudo
1 / 70
Esta página não é visível na pré-visualização
Não perca as partes importantes!































































Existem várias definições para métodos, Lakatos e Marconi (1982:39-40) mencionaram diversas definições, entre elas:
A definição de estatística não é única, a estatística abrange muito mais do que um simples traçado de gráficos e cálculos de medidas. Uma definição seria:
A estatística é uma coleção de métodos para planejar experimentos, obter dados e organizá-los, resumi- lo, analisá-los interpretá-los e deles extrair conclusões.
Dois métodos científicos podemos destacar: o método Experimental e o Método Estatístico. O método experimental consiste em manter constante todas as causas (fatores) menos uma e variar esta causa de modo que o pesquisador possa descobrir seus efeitos caso existam.
O método estatístico diante da impossibilidade de se manter causas constantes, admite todas essas causas presentes variando-as registrando essa variação e procurando determinar no resultado final que influências cabem a cada uma delas.
As Aplicações da estatística se desenvolveram de tal forma que, hoje, praticamente todo o campo de estudo se beneficia da utilização de métodos estatísticos. Os fabricantes fornecem melhores produtos a custos menores através de técnicas de controle de qualidade. Controlam-se doenças com o auxilio de análises que antecipam epidemias. Espécies ameaçadas são protegidas por regulamentos e leis que reagem a estimativas estatísticas de modificação de tamanho da população. Visando reduzir as taxas de casos fatais, os legisladores têm melhor justificativas para leis como as que regem a poluição atmosférica, inspeções de automóveis, utilização de cinto de segurança, etc.
Não é de hoje que ocorrem abusos com a estatística. Assim é que , há cerca de um século, o estadista Benjamin Disraeli disse: “Há três tipos de mentiras: as mentiras, as mentiras sérias e as estatísticas”. Já se disse também que “os números não mentem; mas os mentirosos forjam os números” ( Figures don’t lie; liars figure ) e que “se torturarmos os dados por bastante tempo, eles acabam por admitir qualquer coisa”. O historiador Andrew Lang disse que algumas pessoas usam a estatística “como um bêbado utiliza um poste de iluminação – para servir de apoio e não para iluminar”. Todas essa afirmações se referem aos abusos da estatística quando os dados são apresentados de forma enganosa. Eis alguns exemplos das diversas maneiras como os dados podem ser distorcidos.
ª Pequenas amostras ª Números imprecisos ª Estimativas por suposição ª Porcentagens distorcidas ª Cifras parciais ª Distorções deliberadas ª Perguntas tendenciosas ª Gráficos enganosos ª Pressão do pesquisador ª Más amostras
Os motoristas mais Idosos são mais Seguros do que os mais Moços? A American Association of Retired People – AARP (Associação Americana de Aposentados) alega que os motoristas mais idosos se envolvem em menor número de acidentes do que os mais jovens. Nos últimos anos, os motoristas com 16-19 anos de idades causaram cerca de 1,5 milhões de acidentes em comparação com apenas 540.000 causados por motoristas com 70 anos ou mais, de forma que a alegação da AARP parece válida. Acontece, entretanto que os motoristas mais idosos não dirigem tanto quanto os mais jovens. Em lugar de considerar apenas o número de acidentes , devemos examinar também as taxas de acidentes. Eis as taxas de acidentes por 100 milhões de milhas percorridas: 8,6 para motoristas com idade de 16 a 19, 4,6 para os com idade de 75 a 79, 8,9 para os com idade 80 a 84 e 20,3 para os motoristas com 85 anos de idade ou mais. Embora os motoristas mais jovens tenham de fato o maior número de acidentes, os mais velhos apresentam as mais altas taxas de acidente.
Texto extraído do livro: Tiola, Mario F. Introdução à Estatística. 7 ª^ ed. Rio de Janeiro – RJ. LTC. 1999.
A estatística dedutiva também conhecida como Descritiva se encarrega de descrever o conjunto de dados desde a elaboração da pesquisa até o cálculo de determinada medida.
A estatística Indutiva ou inferencial está relacionada a incerteza. Inicia-se no cálculo das Probabilidades e se desenvolve por todo a área da inferência.
Após a definição do problema a ser estudado e o estabelecimento do planejamento da pesquisa (forma pela qual os dados serão coletados; cronograma das atividades; custos envolvidos; exame das informações disponíveis; delineamento da amostra, etc.), o passo seguinte é a coleta dos dados, que consiste na busca ou compilação dos dados das variáveis, componentes do fenômeno a ser estudado.
A coleta dos dados é direta quando os dados são obtidos diretamente da fonte originária, como no caso da empresa que realiza uma pesquisa para saber a preferência dos consumidores pela sua marca.
A coleta dos dados é indireta quando é inferida a partir dos elementos conseguidos pela coleta direta.
A revisão crítica dos dados procede com a finalidade de suprimir os valores estranhos ao levantamento, os quais são capazes de provocar futuros enganos.
Convém organizarmos o conjunto de dados de maneira prática e racional. Tal organização denomina-se Série Estatística (que será abordado na próxima unidade). Sua apresentação pode ocorrer por meio de Tabelas e/ou Gráficos.
As regras de Amostragem podem ser classificadas em duas categorias gerais:
PROBABILÍSTICA - São amostragem em que a seleção é aleatória de tal forma que cada elemento tem igual probabilidade de ser sorteado para a amostra.
NÃO-PROBABILISTICAS OU INTENCIONADAS - São amostragem em que há uma escolha deliberada dos elementos da amostra.
Também conhecida por amostragem ocasional, acidental, casual, randômica, etc. A amostragem simples ao acaso destaca-se por ser um processo de seleção bastante fácil e muito usado. Neste processo, todos os elementos da população têm igual probabilidade de serem escolhidos, desde o início até completo processo de coleta.
Para realizarmos este sorteio devemos fazer uso das “tábuas de números aleatórios” (veja página seguinte). Estas apresentam os dígitos de 0 a 9 distribuídos aleatoriamente.
Supor que nós tenhamos uma população com 1.000 elementos, que numeramos de 000 a 999, para selecionarmos uma amostra aleatória, de 200 elementos, basta escolhermos uma posição de qualquer linha e extrairmos conjuntos de três algarismos, até completarmos os 200 elementos da amostra. O processo termina quando for sorteado o elemento 200. Se o número sorteado não existia na população simplesmente não o consideramos, e prosseguimos com o processo.
Trata-se de uma variação da amostragem simples ao acaso, muito conveniente quando a população está naturalmente ordenada , como fichas em um fichário, listas telefônicas etc. Requer uma lista dos itens da população, e, assim, padece das mesmas restrições já mencionadas na aleatória ao acaso. Se os itens da lista não se apresentarem numa ordem determinada à amostragem Sistemática pode dar uma amostra realmente aleatória.
Sejam os seguintes elementos:
¾ N: tamanho da população;
¾ n: tamanho da amostra.
Sorteia-se, utilizando a tábua de números aleatórios, um número x entre 1 e a formando-se a amostra dos elementos correspondentes ao conjunto de números:
x ; x+a ; x+2a ;...; x+(n-1)a.
Sorteia-se um número de 1 a 10. Seja 3 (x = 3) o número sorteado. Logo, os elementos numerados por 3;13;23;33;... serão os componentes da amostra.
No caso de possuir uma população com uma certa característica heterogênea, na qual podemos distinguir subpopulações mais ou menos homogêneas, denominadas de estratos, podemos usar a amostragem estratificada.
Estratificar uma população em L subpopulações denominada estratos, tais que:
a. No. de inscrições no Seguro Social b. No. de passageiros no ônibus da linha Rio-São Paulo c. Escolaridade d. Peso Médio dos Recém Nascidos e. Altitude acima do nível do mar f. Uma pesquisa efetuada com 1015 pessoas indica que 40 delas são assinantes de um serviço de computador on-line g. Cada cigarro Camel tem 16,13mg de alcatrão h. O radar indique que Nolan Ryan rebateu a ultima bola a 82,3mi/h i. O tempo gasta para uma pessoa fazer uma viagem de carro de Brasília até Belo Horizonte é de aproximadamente 8:00h a uma velocidade média de 93,75km/hs
j) Resultado da extração da loteria Federal: i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua.
k) Comprimento de um seguimento de reta: i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua.
l) Área de um Círculo: i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua.
m) Raça: i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua.
n) Quantidade de livro de uma biblioteca: i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua.
o) Religião: i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua.
p) Salário dos Empregados de uma empresa: i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua.
q) Estado Civil: i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua.
r) Profissão: i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua.
s) Volume de água contido numa piscina: i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua.
“Um relatório patrocinado pela Flórida Citrus Comission concluiu que os níveis de colesterol podem ser reduzidos mediante ingestão de produtos cítricos”. Por que razão a conclusão poderia ser suspeita
população, uma amostra aleatória simples com três elementos.
Um dos objetivos da estatística é sintetizar os valores que uma ou mais variáveis podem assumir, para que tenhamos uma visão global da variação das mesmas.
Tabela é uma maneira de apresentar de forma resumida um conjunto de dados.
A tabela se apresenta da seguinte forma:
Tabela 1 – Produção de Café Brasil – 1991 a 1995
Anos Produção (1.000 t) 1991 2. 1992 2. 1993 2. 1994 3. 1995 2. Fonte : IBGE TÍTULO DA TABELA:
Conjunto de informações, as mais completas possíveis, respondendo às perguntas: O que?, Quando? e Onde? , Localizado no topo da tabela, além de conter a palavra “TABELA” e sua respectiva numeração.
É o conjunto de Linhas e Colunas que contém informações sobre a variável em estudo.
a) Cabeçalho da Coluna – Parte superior da tabela que especifica o conteúdo das colunas;
b) Coluna Indicadora – Parte da tabela que especifica o conteúdo das linhas;
c) Linhas – retas imaginárias que facilitam a leitura, no sentido horizontal, de dados que se inscrevem nos seus cruzamentos com as linhas;
d) Casa ou Célula – espaço destinado a um só número;
e) Total – deve ser SEMPRE destacado de alguma forma;
f) Laterais da tabela – não devem ser fechadas. Caso as feche, passa a ser chamada de “QUADRO”.
g) Número – preferencialmente utilizar separador de 1000 (por exemplo: 1.854.985 ao invés de 1854985).
Há ainda a considerar os elementos complementares da tabela, que são a fonte , as notas , e as chamadas , localizadas, de preferência, no rodapé.
a) Fonte – identifica o responsável (pessoa física ou jurídica) ou responsável pelos dados numéricos;
b) Notas – é o texto que irá esclarecer o conteúdo estudado, que poderá ser de caráter geral ou específico de uma tabela;
c) Chamadas – símbolo remissivo atribuído a algum elemento de uma tabela que necessita de uma nota específica.
A substituição de uma informação da tabela poderá ser feita pelos sinais abaixo:
a) - dado numérico igual a zero;
b) ... Quando não temos os dados;
c)? Quando temos dúvida na informação;
d) 0 quando o valor for muito pequeno.
VARIÁVEL: o local FIXO: a época e o fenômeno
A série específica recebe também outras denominações tais como série categórica ou série por categoria. Agora o caráter variável é o fenômeno.
VARIÁVEL: o fenômeno FIXO: a época e o local
Neste caso todos os elementos (época, local e fenômeno) são fixos. Embora fixo, o fenômeno apresenta-se agora através de graduações, isto é, os dados referentes ao fenômeno que se está representando são reunidos de acordo com a sua magnitude. Normalmente os problemas de tabulação são enquadrados neste tipo de série, que iremos estudar com maior detalhe mais adiante neste curso.
Proporção, Porcentagem e Razão.
Introdução
Do ponto de vista estatístico, estas podem ser consideradas como medidas muito simples que permitem estabelecer comparações entre diversos grupos.
¾ Proporção
Considere um número de empregados que foi distribuído em quatro repartições de uma certa empresa de acordo com sua função. Estas repartições são mutuamente exclusivas (cada pessoa somente poderá ser alocada em uma única repartição) e exaustivas (todas as pessoas deverão ser alocadas).
Em termos simbólicos podemos escrever: N 1 = número de pessoas alocadas na repartição 1 N 2 = número de pessoas alocadas na repartição 2 N 3 = número de pessoas alocadas na repartição 3 N 4 = número de pessoas alocadas na repartição 4 N = N 1 + N 2 + N 3 + N 4 = número total de empregados Neste caso, a proporção de empregados pertencentes à primeira repartição é determinada
mediante o cálculo do quociente
(^3) e
Note que o valor de uma proporção não pode exceder a unidade, e que a soma de todas as proporções será sempre igual à unidade. Assim,
Exemplo:
Tabela 01. Número de empregados contratados (consultores) e com carteira assinada em dois órgãos públicos
EMPREGADO ÓRGÃO PÚBLICO 1 ÓRGÃO PÚBLICO 2 CONSULTOR: TEMPO INTEGRAL 580 680 MEIO EXPEDIENTE 430 1. CARTEIRA ASSINADA 4.810 10. TOTAL 5.820 12.
FONTE: Departamento de Recursos Humanos destes Órgãos Públicos
Não é simples raciocinar em termos absolutos e dizer qual dos dois órgãos públicos conta com maior número de empregados consultores em suas duas modalidades de expedientes porque o número total de empregados difere muito entre si. Por outro lado, a comparação direta pode ser estabelecida rapidamente, se os dados forem expressos em proporções.
A proporção de consultores com tempo integral no órgão público 1 é:
E no órgão público 2, seguindo o mesmo raciocínio temos:
Note que, em números absolutos, estes valores são muito próximos (580 e 680). Entretanto, o órgão público 2 apresenta uma proporção inferior de consultores com tempo integral.
Analogamente, fazendo os cálculos para ambos os órgãos públicos, têm:
◊ ÓRGÃO PÚBLICO 1
◊ Consultores com ½ expediente:
◊ Carteira assinada:
◊ Consultores com ½ expediente:
◊ Carteira assinada:
Assim, temos a seguinte tabela de proporções:
Tabela 02. Proporção de empregados contratados (consultores) e com carteira assinada em dois órgãos públicos