Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas


Estatística Descritiva, Notas de estudo de Engenharia Informática

Apostila de Estatística Descritiva

Tipologia: Notas de estudo

Antes de 2010

Compartilhado em 27/05/2009

spy-rfs-7
spy-rfs-7 🇧🇷

5

(1)

2 documentos

1 / 70

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
Apostila
De
Estatística
Professores: Wanderley Akira Shiguti
Valéria da S. C. Shiguti
Brasília 2006
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46

Pré-visualização parcial do texto

Baixe Estatística Descritiva e outras Notas de estudo em PDF para Engenharia Informática, somente na Docsity!

Apostila

De

Estatística

Professores: Wanderley Akira Shiguti

Valéria da S. C. Shiguti

Brasília 2006

INTRODUÇÃO

1.1. PANORAMA HISTÓRICO
  • Toda Ciência tem suas raízes na história do homem;
  • A Matemática que é considerada “A Ciência que une a clareza do raciocínio à síntese da linguagem”, originou-se do convívio social, das trocas, da contagem, com caracter prático, utilitário e empírico;
  • A Estatística é um ramo da Matemática que teve origem semelhante;
  • Desde a Antigüidade vários povos já registravam o número de habitantes, de nascimento, de óbitos, faziam estimativas de riquezas individuais e sociais, etc;
  • Na idade média colhiam-se informações, geralmente com a finalidade tributária;
  • A partir do século XVI começaram a surgir às primeiras análises de fatos sociais, como batizados, casamentos, funerais, originando as primeiras tábuas e tabelas e os primeiros números relativos;
  • No século XVII o estudo de tais fatos foi adquirindo proporções verdadeiramente científicas;
  • Godofredo Achenwall, batizou a nova ciência (ou método) com o nome de ESTATÍSTICA, determinando assim o seu objetivo e suas relações com a ciência.
1.2. MÉTODO

Existem várias definições para métodos, Lakatos e Marconi (1982:39-40) mencionaram diversas definições, entre elas:

  • Método é o “caminho pelo qual se chega a um determinado resultado...” (Hegemberg, 1976: II-115)
  • Método é “um procedimento regular, explícito e passível de ser repetido para conseguirmos alguma coisa, seja material ou conceitual” (Bunge 1980: 19).
1.3. A ESTATÍSTICA

A definição de estatística não é única, a estatística abrange muito mais do que um simples traçado de gráficos e cálculos de medidas. Uma definição seria:

A estatística é uma coleção de métodos para planejar experimentos, obter dados e organizá-los, resumi- lo, analisá-los interpretá-los e deles extrair conclusões.

1.4. O MÉTODO ESTATÍSTICO

Dois métodos científicos podemos destacar: o método Experimental e o Método Estatístico. O método experimental consiste em manter constante todas as causas (fatores) menos uma e variar esta causa de modo que o pesquisador possa descobrir seus efeitos caso existam.

O método estatístico diante da impossibilidade de se manter causas constantes, admite todas essas causas presentes variando-as registrando essa variação e procurando determinar no resultado final que influências cabem a cada uma delas.

1.6. USOS E ABUSOS DA ESTATÍSTICA
USOS DA ESTATÍSTICA

As Aplicações da estatística se desenvolveram de tal forma que, hoje, praticamente todo o campo de estudo se beneficia da utilização de métodos estatísticos. Os fabricantes fornecem melhores produtos a custos menores através de técnicas de controle de qualidade. Controlam-se doenças com o auxilio de análises que antecipam epidemias. Espécies ameaçadas são protegidas por regulamentos e leis que reagem a estimativas estatísticas de modificação de tamanho da população. Visando reduzir as taxas de casos fatais, os legisladores têm melhor justificativas para leis como as que regem a poluição atmosférica, inspeções de automóveis, utilização de cinto de segurança, etc.

ABUSOS DA ESTATÍSTICA

Não é de hoje que ocorrem abusos com a estatística. Assim é que , há cerca de um século, o estadista Benjamin Disraeli disse: “Há três tipos de mentiras: as mentiras, as mentiras sérias e as estatísticas”. Já se disse também que “os números não mentem; mas os mentirosos forjam os números” ( Figures don’t lie; liars figure ) e que “se torturarmos os dados por bastante tempo, eles acabam por admitir qualquer coisa”. O historiador Andrew Lang disse que algumas pessoas usam a estatística “como um bêbado utiliza um poste de iluminação – para servir de apoio e não para iluminar”. Todas essa afirmações se referem aos abusos da estatística quando os dados são apresentados de forma enganosa. Eis alguns exemplos das diversas maneiras como os dados podem ser distorcidos.

ª Pequenas amostras ª Números imprecisos ª Estimativas por suposição ª Porcentagens distorcidas ª Cifras parciais ª Distorções deliberadas ª Perguntas tendenciosas ª Gráficos enganosos ª Pressão do pesquisador ª Más amostras

Os motoristas mais Idosos são mais Seguros do que os mais Moços? A American Association of Retired People – AARP (Associação Americana de Aposentados) alega que os motoristas mais idosos se envolvem em menor número de acidentes do que os mais jovens. Nos últimos anos, os motoristas com 16-19 anos de idades causaram cerca de 1,5 milhões de acidentes em comparação com apenas 540.000 causados por motoristas com 70 anos ou mais, de forma que a alegação da AARP parece válida. Acontece, entretanto que os motoristas mais idosos não dirigem tanto quanto os mais jovens. Em lugar de considerar apenas o número de acidentes , devemos examinar também as taxas de acidentes. Eis as taxas de acidentes por 100 milhões de milhas percorridas: 8,6 para motoristas com idade de 16 a 19, 4,6 para os com idade de 75 a 79, 8,9 para os com idade 80 a 84 e 20,3 para os motoristas com 85 anos de idade ou mais. Embora os motoristas mais jovens tenham de fato o maior número de acidentes, os mais velhos apresentam as mais altas taxas de acidente.

Texto extraído do livro: Tiola, Mario F. Introdução à Estatística. 7 ª^ ed. Rio de Janeiro – RJ. LTC. 1999.

1.7. ESTATÍSTICA DEDUTIVA E INDUTIVA

A estatística dedutiva também conhecida como Descritiva se encarrega de descrever o conjunto de dados desde a elaboração da pesquisa até o cálculo de determinada medida.

A estatística Indutiva ou inferencial está relacionada a incerteza. Inicia-se no cálculo das Probabilidades e se desenvolve por todo a área da inferência.

COLETA DOS DADOS:

Após a definição do problema a ser estudado e o estabelecimento do planejamento da pesquisa (forma pela qual os dados serão coletados; cronograma das atividades; custos envolvidos; exame das informações disponíveis; delineamento da amostra, etc.), o passo seguinte é a coleta dos dados, que consiste na busca ou compilação dos dados das variáveis, componentes do fenômeno a ser estudado.

A coleta dos dados é direta quando os dados são obtidos diretamente da fonte originária, como no caso da empresa que realiza uma pesquisa para saber a preferência dos consumidores pela sua marca.

A coleta dos dados é indireta quando é inferida a partir dos elementos conseguidos pela coleta direta.

CRÍTICA DOS DADOS

A revisão crítica dos dados procede com a finalidade de suprimir os valores estranhos ao levantamento, os quais são capazes de provocar futuros enganos.

APRESENTAÇÃO DOS DADOS

Convém organizarmos o conjunto de dados de maneira prática e racional. Tal organização denomina-se Série Estatística (que será abordado na próxima unidade). Sua apresentação pode ocorrer por meio de Tabelas e/ou Gráficos.

TÉCNICAS DE AMOSTRAGEM

As regras de Amostragem podem ser classificadas em duas categorias gerais:

PROBABILÍSTICA - São amostragem em que a seleção é aleatória de tal forma que cada elemento tem igual probabilidade de ser sorteado para a amostra.

NÃO-PROBABILISTICAS OU INTENCIONADAS - São amostragem em que há uma escolha deliberada dos elementos da amostra.

TIPOS DE AMOSTRAGEM
AMOSTRAGEM ALEATÓRIA SIMPLES

Também conhecida por amostragem ocasional, acidental, casual, randômica, etc. A amostragem simples ao acaso destaca-se por ser um processo de seleção bastante fácil e muito usado. Neste processo, todos os elementos da população têm igual probabilidade de serem escolhidos, desde o início até completo processo de coleta.

PROCEDIMENTO
  1. Devemos enumerar todos os elementos da população
  2. Devemos efetuar sucessivos sorteios com reposição até completar o tamanho da amostra ( n )

Para realizarmos este sorteio devemos fazer uso das “tábuas de números aleatórios” (veja página seguinte). Estas apresentam os dígitos de 0 a 9 distribuídos aleatoriamente.

EXEMPLO :

Supor que nós tenhamos uma população com 1.000 elementos, que numeramos de 000 a 999, para selecionarmos uma amostra aleatória, de 200 elementos, basta escolhermos uma posição de qualquer linha e extrairmos conjuntos de três algarismos, até completarmos os 200 elementos da amostra. O processo termina quando for sorteado o elemento 200. Se o número sorteado não existia na população simplesmente não o consideramos, e prosseguimos com o processo.

AMOSTRAGEM SISTEMÁTICA

Trata-se de uma variação da amostragem simples ao acaso, muito conveniente quando a população está naturalmente ordenada , como fichas em um fichário, listas telefônicas etc. Requer uma lista dos itens da população, e, assim, padece das mesmas restrições já mencionadas na aleatória ao acaso. Se os itens da lista não se apresentarem numa ordem determinada à amostragem Sistemática pode dar uma amostra realmente aleatória.

PROCEDIMENTO

Sejam os seguintes elementos:

¾ N: tamanho da população;

¾ n: tamanho da amostra.

Então, calcula-se o intervalo de amostragem através da razão a = Nn (onde a é o inteiro mais próximo).

Sorteia-se, utilizando a tábua de números aleatórios, um número x entre 1 e a formando-se a amostra dos elementos correspondentes ao conjunto de números:

x ; x+a ; x+2a ;...; x+(n-1)a.

EXEMPLO: Seja N = 500, n = 50. Então a =^50050 = 10

Sorteia-se um número de 1 a 10. Seja 3 (x = 3) o número sorteado. Logo, os elementos numerados por 3;13;23;33;... serão os componentes da amostra.

AMOSTRAGEM ESTRATIFICADA

No caso de possuir uma população com uma certa característica heterogênea, na qual podemos distinguir subpopulações mais ou menos homogêneas, denominadas de estratos, podemos usar a amostragem estratificada.

Estratificar uma população em L subpopulações denominada estratos, tais que:

  • Stevenson, William J. Estatística aplicada à administração. Harper & Row do Brasil, São Paulo, 1986, p.
EXERCÍCIOS
  1. População ou universo é: a) Um conjunto de pessoas; b) Um conjunto de elementos quaisquer c) Um conjunto de pessoas com uma característica comum; d) Um conjunto de elementos com pelo menos uma característica em comum; e) Um conjunto de indivíduo de um mesmo município, estado ou país.
  2. Uma parte da população retirada para analisá-la denomina-se: a) Universo; b) Parte; c) Pedaço; d) Dados Brutos; e) Amostra.
  3. A parte da estatística que se preocupa somente com a descrição de determinadas características de um grupo, sem tirar conclusões sobre um grupo maior denomina-se: a) Estatística de População; b) Estatística de Amostra; c) Estatística Inferencial d) Estatística Descritiva; e) Estatística Grupal.
  4. Diga qual tipo de variáveis estamos trabalhando nos casos abaixo:

a. No. de inscrições no Seguro Social b. No. de passageiros no ônibus da linha Rio-São Paulo c. Escolaridade d. Peso Médio dos Recém Nascidos e. Altitude acima do nível do mar f. Uma pesquisa efetuada com 1015 pessoas indica que 40 delas são assinantes de um serviço de computador on-line g. Cada cigarro Camel tem 16,13mg de alcatrão h. O radar indique que Nolan Ryan rebateu a ultima bola a 82,3mi/h i. O tempo gasta para uma pessoa fazer uma viagem de carro de Brasília até Belo Horizonte é de aproximadamente 8:00h a uma velocidade média de 93,75km/hs

  1. Classifique as seguintes variáveis: a) Cor dos olhos i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua.

j) Resultado da extração da loteria Federal: i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua.

k) Comprimento de um seguimento de reta: i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua.

l) Área de um Círculo: i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua.

m) Raça: i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua.

n) Quantidade de livro de uma biblioteca: i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua.

o) Religião: i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua.

p) Salário dos Empregados de uma empresa: i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua.

q) Estado Civil: i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua.

r) Profissão: i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua.

s) Volume de água contido numa piscina: i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua.

  1. Suponha que existem N = 1.000 fichas de pacientes das quais uma amostra aleatória de n = 20 deve ser selecionada. Determine que fichas devem ser escolhidas na amostra de tamanho n = 20. Diga que tipo de amostragem foi feito e como foram selecionadas as fichas.
  2. Suponha que uma pesquisa de opinião pública deve ser realizada em um estado que tem duas grandes cidades e uma zona rural. Os elementos na população de interesse são todos os homens e mulheres do estado com idade acima de 21 anos. Diga que tipo de amostragem utilizará?
  3. Serviço florestal do estado está conduzindo um estudo das pessoas que usam as estruturas de um camping operado por ele. O estado tem duas áreas de camping, uma localizada nas montanhas e outra localizada ao longo da costa. O serviço florestal deseja estimar o número médio de pessoas por acampamento e a proporção de acampamento ocupada por pessoas de fora do estado, durante o fim de semana em particular, quando se espera que todos os acampamentos estejam ocupados. Sugira um plano amostral e explique rapidamente como devem ser feitos.
  4. Um médico está interessado em obter informação sobre o número médio de vezes em que 15. especialistas prescreveram certa droga no ano anterior ( N = 15.000). Deseja-se obter n = 1.600. Que tipo de amostragem você sugeriria e por que?
  5. Um hematologista deseja fazer uma nova verificação de uma amostra de n = 10 dos 854 espécimes de sangue analisados por um laboratório médico em um determinado mês. Que tipo de amostragem você sugeriria e por que?
  6. Um repórter da revista Business Week obtém uma relação numerada de 1.000 empresas com maiores de cotações de ações na bolsa. Ele entrevistará 100 gerentes gerais das empresas correspondentes a esta amostra. Que tipo de amostragem você sugeriria e por que?
  7. Comente rapidamente sobre a pesquisa abaixo

“Um relatório patrocinado pela Flórida Citrus Comission concluiu que os níveis de colesterol podem ser reduzidos mediante ingestão de produtos cítricos”. Por que razão a conclusão poderia ser suspeita

  1. Dada uma população com seis elementos, A, B, C, D, E e F, explique como você faria para obter, dessa

população, uma amostra aleatória simples com três elementos.

UNIDADE II - NORMAS PARA CONSTRUÇÃO DE TABELAS

TABELAS ESTATÍSTICAS

Um dos objetivos da estatística é sintetizar os valores que uma ou mais variáveis podem assumir, para que tenhamos uma visão global da variação das mesmas.

Tabela é uma maneira de apresentar de forma resumida um conjunto de dados.

ELEMENTOS DE UMA TABELA

A tabela se apresenta da seguinte forma:

TÍTULO DA TABELA
CORPO
DA
TABELA
RODAPÉ
EXEMPLO:

Tabela 1 – Produção de Café Brasil – 1991 a 1995

Anos Produção (1.000 t) 1991 2. 1992 2. 1993 2. 1994 3. 1995 2. Fonte : IBGE TÍTULO DA TABELA:

Conjunto de informações, as mais completas possíveis, respondendo às perguntas: O que?, Quando? e Onde? , Localizado no topo da tabela, além de conter a palavra “TABELA” e sua respectiva numeração.

CORPO DA TABELA:

É o conjunto de Linhas e Colunas que contém informações sobre a variável em estudo.

a) Cabeçalho da Coluna – Parte superior da tabela que especifica o conteúdo das colunas;

b) Coluna Indicadora – Parte da tabela que especifica o conteúdo das linhas;

c) Linhas – retas imaginárias que facilitam a leitura, no sentido horizontal, de dados que se inscrevem nos seus cruzamentos com as linhas;

d) Casa ou Célula – espaço destinado a um só número;

e) Total – deve ser SEMPRE destacado de alguma forma;

f) Laterais da tabela – não devem ser fechadas. Caso as feche, passa a ser chamada de “QUADRO”.

g) Número – preferencialmente utilizar separador de 1000 (por exemplo: 1.854.985 ao invés de 1854985).

Há ainda a considerar os elementos complementares da tabela, que são a fonte , as notas , e as chamadas , localizadas, de preferência, no rodapé.

a) Fonte – identifica o responsável (pessoa física ou jurídica) ou responsável pelos dados numéricos;

b) Notas – é o texto que irá esclarecer o conteúdo estudado, que poderá ser de caráter geral ou específico de uma tabela;

c) Chamadas – símbolo remissivo atribuído a algum elemento de uma tabela que necessita de uma nota específica.

SINAL CONVENCIONAL:

A substituição de uma informação da tabela poderá ser feita pelos sinais abaixo:

a) - dado numérico igual a zero;

b) ... Quando não temos os dados;

c)? Quando temos dúvida na informação;

d) 0 quando o valor for muito pequeno.

VARIÁVEL: o local FIXO: a época e o fenômeno

¾ SÉRIE ESPECÍFICA

A série específica recebe também outras denominações tais como série categórica ou série por categoria. Agora o caráter variável é o fenômeno.

VARIÁVEL: o fenômeno FIXO: a época e o local

¾ DISTRIBUIÇÃO DE FREQÜÊNCIA

Neste caso todos os elementos (época, local e fenômeno) são fixos. Embora fixo, o fenômeno apresenta-se agora através de graduações, isto é, os dados referentes ao fenômeno que se está representando são reunidos de acordo com a sua magnitude. Normalmente os problemas de tabulação são enquadrados neste tipo de série, que iremos estudar com maior detalhe mais adiante neste curso.

Proporção, Porcentagem e Razão.

Introdução

Do ponto de vista estatístico, estas podem ser consideradas como medidas muito simples que permitem estabelecer comparações entre diversos grupos.

¾ Proporção

Considere um número de empregados que foi distribuído em quatro repartições de uma certa empresa de acordo com sua função. Estas repartições são mutuamente exclusivas (cada pessoa somente poderá ser alocada em uma única repartição) e exaustivas (todas as pessoas deverão ser alocadas).

Em termos simbólicos podemos escrever: N 1 = número de pessoas alocadas na repartição 1 N 2 = número de pessoas alocadas na repartição 2 N 3 = número de pessoas alocadas na repartição 3 N 4 = número de pessoas alocadas na repartição 4 N = N 1 + N 2 + N 3 + N 4 = número total de empregados Neste caso, a proporção de empregados pertencentes à primeira repartição é determinada

mediante o cálculo do quociente

N

N

1 ; para as demais repartições segue o mesmo procedimento: N

N

2 , N

N

(^3) e

N

N

Note que o valor de uma proporção não pode exceder a unidade, e que a soma de todas as proporções será sempre igual à unidade. Assim,

N

N

N

N

N

N

N

N

N

N

Exemplo:

Tabela 01. Número de empregados contratados (consultores) e com carteira assinada em dois órgãos públicos

EMPREGADO ÓRGÃO PÚBLICO 1 ÓRGÃO PÚBLICO 2 CONSULTOR: TEMPO INTEGRAL 580 680 MEIO EXPEDIENTE 430 1. CARTEIRA ASSINADA 4.810 10. TOTAL 5.820 12.

FONTE: Departamento de Recursos Humanos destes Órgãos Públicos

Não é simples raciocinar em termos absolutos e dizer qual dos dois órgãos públicos conta com maior número de empregados consultores em suas duas modalidades de expedientes porque o número total de empregados difere muito entre si. Por outro lado, a comparação direta pode ser estabelecida rapidamente, se os dados forem expressos em proporções.

A proporção de consultores com tempo integral no órgão público 1 é:

N

N

E no órgão público 2, seguindo o mesmo raciocínio temos:

N

N

Note que, em números absolutos, estes valores são muito próximos (580 e 680). Entretanto, o órgão público 2 apresenta uma proporção inferior de consultores com tempo integral.

Analogamente, fazendo os cálculos para ambos os órgãos públicos, têm:

◊ ÓRGÃO PÚBLICO 1

◊ Consultores com ½ expediente:

N

N

◊ Carteira assinada:

N

N

◊ ÓRGÃO PÚBLICO 2

◊ Consultores com ½ expediente:

N

N

◊ Carteira assinada:

N

N

Assim, temos a seguinte tabela de proporções:

Tabela 02. Proporção de empregados contratados (consultores) e com carteira assinada em dois órgãos públicos