




























































































Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Encontra documentos específicos para os exames da tua universidade
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Completa apostila de estatistica com exercicios
Tipologia: Exercícios
1 / 109
Esta página não é visível na pré-visualização
Não perca as partes importantes!





























































































1.3. Um pouco da história da Estatística
5000 AC Registros egípcios de presos de guerra;
2000 AC Censo Chinês;
695 Primeira utilização da média ponderada pelos árabes na contagem de moedas;
1654 Pierre de Fermat e Blaise Pascal estabelecem os Princípios do Cálculo das Probabilidades;
1763 Inferência Estatística (Reverendo Bayes);
1930 Controle de Qualidade nas indústrias;
1959 Estudo retrospectivo de doenças (Mantel & Haenszel);
1996 Profundidade da Regressão (Rousseeuw e Hubert);
1997 Modelos Fatoriais;
2001 100 anos da Biometrika.
Maiores detalhes sobre a história da Estatística no site: http://www.redeabe.org.br/historia.htm
1.4. Exercícios – Parte I – A
(a) Para avaliar a eficácia de uma campanha de vacinação no Estado de Minas Gerais, 200 mães de recém-nascidos durante o primeiro semestre de um dado ano, em uma dada maternidade em Belo Horizonte, foram perguntadas a respeito da última vez que vacinaram seus filhos.
População:
Amostra:
(b) Uma amostra de sangue foi retirada de um paciente com suspeita de anemia.
População:
Amostra:
(c) Para verificar a audiência de um programa de TV, 563 indivíduos foram entrevistados por telefone com relação ao canal em que estavam sintonizados.
População:
Amostra:
2.1. Definição de Variável
Qualquer característica associada a uma população é chamada de variável. Porque o nome variável? Porque ela “varia” de alguma forma.
Exemplos: Idade: pode variar de 0, 1 , 2, ... anos
Sexo: pode ser masculino ou feminino Estado Civil: pode ser solteiro, casado, divorciado, etc.
2.2. Classificação das Variáveis
As variáveis podem ser classificadas como Qualitativas ou Quantitativas. Algumas variáveis como sexo, grau de instrução, estado civil, região de procedência, apresentam como possíveis resultados uma qualidade (ou atributo) do indivíduo pesquisado, logo, estas variáveis são chamadas de variáveis Qualitativas.
As variáveis como número de filhos, salário, idade, apresentam como possíveis resultados números resultantes de uma contagem ou mensuração , logo, estas variáveis são chamadas de variáveis Quantitativas.
Exemplo: Um pesquisador está interessado em fazer um levantamento sobre alguns aspectos socio-econômicos dos empregados da seção de orçamentos de uma empresa. Usando informações obtidas do departamento pessoal, ele elaborou a Tabela 2.1.
Tabela 2.1: Informações sobre estado civil, grau de instrução, número de filhos, salário (expresso como fração do salário mínimo), idade (medida em anos e meses) e procedência de 36 empregados da seção de orçamentos de uma Empresa. Idade N° Estado Civil Grau de Instrução N° de Filhos Salário Anos Meses Região de Procedência 1 Solteiro Fundamental ... 4,00 26 3 Interior 2 Casado Fundamental 1 4,56 32 10 Capital ... ... ... ... ... ... ... ... 35 Casado Médio 2 19,40 48 11 Capital 36 Casado Superior 3 23,30 42 2 Interior
Fonte: Bussab e Morettin (2002)
Observações sobre a Tabela 2.1.
De modo geral, para cada elemento investigado numa pesquisa, tem-se associado um (ou mais de um) resultado correspondendo à realização de uma característica (ou características). Por exemplo, considerando a variável estado civil, para cada empregado pode-se associar um dos resultados, solteiro ou casado (note que poderia haver outras possibilidades, como separado, divorciado, mas somente as duas mencionadas foram consideradas no estudo).
2.3. Exercícios – Parte I – A
ID : Identificação do aluno;
Turma : Turma a que o aluno foi alocado (A ou B);
Sexo : Feminino (F) ou Masculino (M);
Idade : Idade;
Alt : Altura;
Peso : Peso;
Filh : Número de filhos na família;
Fuma : Hábito de fumar (sim ou não);
Toler: Tolerância ao cigarro: (I) Indiferente, (P) Incomoda Pouco e (M) Incomoda Muito;
Exer : Horas de atividade física, por semana;
Cine : Número de vezes que vai ao cinema por semana;
OpCine : Opinião a respeito das salas de cinema na cidade: (B) regular a boa e (M) muito boa
TV : Horas gastas assistindo TV, por semana
OpTV : Opinião da programação na TV: (R) Ruim, (M) Média, (B) Boa e (N) não sabe.
Tabela 2.2: Informações do questionário estudantil.
ID Turma Sexo Idade Alt Peso Filh Fuma Toler Exer Cine Opcine Tv OpTV
1 A F 17 1,60 60,5 2 Não P 0 1 B 16,5 R 2 A F 18 1,69 55,0 1 Não M 0 1 B 7 R ... ... ... ... ... ... ... ... ... ... ... ... ... ...
49 B M 17 1,80 71,0 1 Não P 7 0 M 14 R
50 B M 18 1,83 86,0 1 Não P 7 7 M 20 B
Fonte: Magalhães e Lima (2004).
Classifique as variáveis da Tabela 2.2. como
Variável Qualitativa Nominal:
Variável Qualitativa Ordinal:
Variável Quantitativa Discreta:
Variável Quantitativa Contínua:
A amostragem é naturalmente usada em nossa vida diária. Por exemplo, para verificar o tempero de um alimento em preparação, podemos provar (observar) uma pequena porção deste alimento. Estamos fazendo uma amostragem, ou seja, extraindo do todo (população), uma parte (amostra) com propósito de avaliarmos sobre a qualidade do tempero de todo o alimento.
3.1. Por que fazer Amostragem?
Existem várias razões para o uso de amostragem em levantamento de grandes populações. Algumas delas são:
Economia: Em geral, torna-se bem mais econômico o levantamento de somente uma parte da população. Tempo: Numa pesquisa eleitoral, a três dias de uma eleição presidencial, não haveria tempo suficiente para pesquisar toda a população de eleitores do país. Operacionalidade: É mais fácil realizar operações de pequena escala. Um dos problemas típicos nos grandes censos é o controle dos entrevistadores.
3.2. Quando o uso de amostragem não é interessante?
População pequena: Não há necessidade de utilizar técnicas estatísticas, pois neste caso é aconselhável realizar o censo (análise de toda a população). Característica de fácil mensuração: Talvez a população não seja tão pequena, mas a variável que se quer observar é de tão fácil mensuração, que não compensa investir num plano de amostragem. Por exemplo, para verificar a porcentagem de funcionários favoráveis à mudança no horário de um turno de trabalho, podemos entrevistar toda a população no próprio local de trabalho. Esta atitude pode ser politicamente mais recomendável. Necessidade de alta precisão: A cada dez anos o IBGE realiza um Censo^1 Demográfico para estudar diversas característica da população brasileira. Dentre estas características têm- se o número total de habitantes, que é fundamental para o planejamento do país. Desta forma, o número de habitantes precisa ser avaliado com grande precisão e, por isto, se pesquisa toda a população.
3.3. Tipos de Amostragem
3.3.1. Amostragem Aleatória Simples (AAS)
A técnica de Amostragem Aleatória Simples (ou Amostragem Casual Simples) é o método mais simples e um dos mais importantes para a seleção de uma amostra. Para a seleção de uma AAS precisamos ter uma lista completa dos elementos da população. Este tipo de amostragem consiste em selecionar a amostra através de um sorteio. Sua principal característica está no fato de todos os elementos da população ter igual probabilidade de serem escolhidos.
(^1) Censo: estudo de todos os elementos da população.
2) Sorteia-se, utilizando a tabela de números aleatórios, um número x entre 1 e i formando a amostra: x, (x + i), (x + 2i), ... , (x + (n-1)i).
Exemplo : Numa turma com N = 36 alunos, deseja-se retirar uma amostra de n = 5 elementos para verificar uma característica de interesse. Utilize a técnica de amostragem sistemática para retirar essa amostra.
1) Calcular: i = N/n = 36/5 = 7,2. Considerando a parte inteira do número, temos que i = 7 ;
2) Sortear um número entre 1 e 7 da Tabela de Números Aleatórios. Escolhendo a última linha e a primeira coluna, temos que o primeiro número que está entre 1 e 7 é 6. Logo a amostra será composta dos elementos: {06, 13, 20, 27, 34}
Exemplo: Considere agora, uma população com 500 elementos e, deseja-se retirar dessa população 10 elementos. Obtenha uma AS utilizando a primeira linha da Tabela de Números Aleatórios, quando for necessário.
3.3.3. Amostragem Estratificada (AE)
A população é dividida em subgrupos, denominados estratos (por exemplo, por sexo, renda, bairro, etc.) e a AAS é utilizada na seleção de uma amostra de cada estrato. Esses estratos devem ser internamente mais homogêneos do que a população toda, com respeito às variáveis em estudo. Aqui, um conhecimento prévio sobre a população em estudo é fundamental.
Estrato 1 Subgrupo 1 da amostra Estrato 2 Subgrupo 2 da amostra ... ... ... Estrato k Subgrupo k da amostra
Amostra Estratificada
A AE tem as seguintes características:
Exemplo : Com o objetivo de realizar uma pesquisa de opinião sobre a gestão atual da reitoria em uma determinada universidade, realizaremos um levantamento por amostragem. A população é composta por 100 professores, 100 servidores técnicos administrativos e 300 alunos, que identificaremos da seguinte forma:
População Professores P001 P002 … P
Servidores S001 S002 ... S
Alunos A001 A002 ... A
Supondo que a opinião sobre a gestão atual da reitoria possa ser relativamente homogêneo dentro de cada categoria, realizaremos uma amostragem estratificada proporcional por categoria, para obter uma amostra global de tamanho n = 10. A tabela a seguir mostra as relações de proporcionalidade.
Estrato Proporção na População Tamanho do subgrupo na amostra
Professores 100/500 = 0,20 (ou 20%) n (^) p = ( 0,20)*10 = 2
Servidores 100/500 = 0,20 (ou 20%) n (^) s = ( 0,20)*10 = 2
Alunos 300/500 = 0,60 (ou 60%) n (^) a = ( 0,60)*10 = 6
Para selecionar aleatoriamente dois professores, podemos usar a Tabela de Números Aleatórios, tomando dois números com três algarismos. Usando, por exemplo a primeira linha da tabela de números aleatórios, temos os seguintes professores selecionados: {P045, P020}. Para os servidores, usando a segunda linha da tabela, temos: {S055, S058}. Usando a terceira linha da tabela, temos a seguinte amostra de alunos: {A050, A136, A270, A152, A247, A004}. A amostra {P045, P020, S055, S058, A050, A136, A270, A152, A247, A004} é uma amostra estratificada proporcional da comunidade da universidade. Cada indivíduo desta amostra deverá ser pesquisado para se obter a opinião em relação à gestão atual da reitoria.
3.3.4. Amostragem por Conglomerado (AC)
A população é dividida em subpopulações (conglomerados) distintas (quarteirões, residências, famílias, bairros, etc.). Alguns dos conglomerados são selecionados segundo a AAS e todos os indivíduos nos conglomerados selecionados são observados. Em geral, é menos eficiente que a AAS ou AE, mas por outro lado é bem mais econômica. Tal procedimento amostral é adequado quando é possível dividir a população em um grande número de pequenas subpopulações.
A AC tem as seguintes características:
Exemplo: Realização de uma pesquisa eleitoral em uma cidade com 12 zonas eleitorais. Usando a técnica de amostragem por conglomerados, podemos selecionar aleatoriamente 2 zonas eleitorais e, em seguida, entrevistar todos os eleitores dessas zonas selecionadas
Zona 1
2
3
4
5
6
7
8
9
10
11
12
Entrevistar todos os eleitores dessas zonas
Zona 1
2
3
4
5
6
7
8
9
10
11
12
Zona 1
2
3
4
5
6
7
8
9
10
11
12
Entrevistar todos os eleitores dessas zonas
4.1. Variáveis Qualitativas Unidimensionais
Quando se estuda uma variável, o maior interesse do pesquisador é conhecer o comportamento dessa variável, analisando a ocorrência de seus possíveis resultados.
A tabela a seguir apresenta a distribuição de freqüências da variável grau de instrução dos dados da Tabela 2.1.
Tabela 4.1: Freqüências e Porcentagens dos 36 empregados da seção de orçamentos da Companhia MB segundo o grau de instrução. Grau de Instrução Freqüência (ni ) Proporção (f (^) i ) Porcentagem (100 x f (^) i) Fundamental 12 Médio 18 Superior 6 Total n = 36 1, Fonte: Bussab e Morettin (2002)
Interpretação da Tabela 4.1.: Nota-se que dos 36 empregados da seção de orçamentos, 33,33% tem nível fundamental, 50% nível médio e apenas 16,67% nível superior.
Notação: Usaremos a notação ni para indicar a freqüência (absoluta) de cada classificação ou categoria da variável. A notação f (^) i = ni /n para indicar a proporção (ou freqüência relativa) de cada categoria, sendo o “n” o número total de observações.
As proporções são muito úteis quando se querem comparar resultados de duas pesquisas distintas. O próximo exemplo ilustra este fato.
Exemplo: Suponhamos que se queira comparar a variável grau de instrução para empregados da seção de orçamentos com a mesma variável para todos os empregados da Companhia MB. Digamos que a empresa tenha 2000 empregados e que a distribuição de freqüências seja a tabela abaixo:
Tabela 4.2: Freqüências e Porcentagens dos 2000 empregados da Companhia MB, segundo o grau de instrução. Grau de Instrução Freqüência (ni ) Proporção (fi ) Porcentagem (100 x fi) Fundamental 650 Médio 1020 0, Superior Total n = 2000^ 1, Fonte: Bussab e Morettin (2002)
Comparação entre a Tabela 4.1. e a Tabela 4.2.: Não podemos comparar diretamente as colunas das freqüências (n (^) i ) das duas tabelas pois os totais de empregados são diferentes nos dois casos (n = 36 e n = 2000). Mas as colunas das porcentagens (ou proporções) são comparáveis, pois reduzimos as freqüências relativas a um mesmo total.
4.2. Variáveis Quantitativas Unidimensionais
A construção de tabelas de freqüências para variáveis quantitativas necessita de certos cuidados. Por exemplo, a construção da tabela de freqüências para a variável Salário da Tabela 2.1., usando o mesmo procedimento que o grau de instrução, não resumirá as 36 observações num grupo menor, pois não existem observações iguais.
Solução : Agrupar os dados por faixas de salário. Assim, construímos uma tabela chamada Tabela de Classes de Freqüências.
Exemplo: Distribuição de Freqüências dos salários dos 36 empregados da seção de orçamentos da Companhia MB por faixas de salário:
Tabela 4.3: Freqüências e Porcentagens dos 36 empregados da seção de orçamentos da Companhia MB por faixas de salário. Classe de Salário Freqüência (ni ) Proporção (f (^) i ) Porcentagem (100 x f (^) i) 04 |-- 08 10 0,2778 27,78% 08 |-- 12 12 12 |-- 16 8 16 |-- 20 5 20 |-- 24 1 Total 36 1,
Obs.: Procedendo desse modo, ao resumir os dados referentes a uma variável quantitativa, perde-se alguma informação. Por exemplo, não sabemos quais são os oito salários da classe de 12 a 16, a não ser que investiguemos a tabela original. Sem perda de muita precisão, poderíamos supor que todos os oito salários daquela classe fossem iguais ao ponto médio da referida classe, isto é, 14.
Número de Classes
A escolha dos intervalos é arbitrária. A familiaridade do pesquisador com os dados é que lhe indicará quantas e quais classes (intervalos) devem ser usadas. Entretanto, deve-se observar que, com um número pequeno de classes, perde-se informação, e com um número grande de classes, o objetivo de resumir os dados fica prejudicado.
Solução: Normalmente, sugere-se o uso de 4 a 8 classes com a mesma amplitude.
Dentre muitas regras citadas na literatura, duas tem sido universalmente adotadas, caso o pesquisador não tenha idéia alguma sobre o número de classes adotar. O número ideal de classes é um número inteiro próximo de:
Regra 1: C = 1 + 3 , 2 xlogn Regra 2: C = n
onde n é o número de elementos pesquisado.
As duas regras são equivalentes para n ≤ 80. A partir daí, a Regra 2 fornece valores que crescem rapidamente e desse modo a Regra 1, proposta por Sturges tem sido preferida.
4.4. Exercícios – Parte I – A
Tabela 4.7: Conjuntos de dados da empresa MB Indústria e Comércio Func. Seção* Admin. Direito Redação Estat. Inglês Metodologia Política Economia 1 P 8,0 9,0 8,6 9,0 B A 9,0 8, 2 P 8,0 9,0 7,0 9,0 B C 6,5 8, 3 P 8,0 9,0 8,0 8,0 D B 9,0 8, 4 P 6,0 9,0 8,6 8,0 D C 6,0 8, 5 P 8,0 9,0 8,0 9,0 A A 6,5 9, 6 P 8,0 9,0 8,5 10,0 B A 6,5 9, 7 P 8,0 9,0 8,2 8,0 D C 9,0 7, 8 T 10,0 9,0 7,5 8,0 B C 6,0 8, 9 T 8,0 9,0 9,4 9,0 B B 10,0 8, 10 T 10,0 9,0 7,9 8,0 B C 9,0 7, 11 T 8,0 9,0 8,6 10,0 C B 10,0 8, 12 T 8,0 9,0 8,3 7,0 D B 6,5 8, 13 T 6,0 9,0 7,0 7,0 B C 6,0 8, 14 T 10,0 9,0 8,6 9,0 A B 10,0 7, 15 V 8,0 9,0 8,6 9,0 C B 10,0 7, 16 V 8,0 9,0 9,5 7,0 A A 9,0 7, 17 V 8,0 9,0 6,3 8,0 D C 10,0 7, 18 V 6,0 9,0 7,6 9,0 C C 6,0 8, 19 V 6,0 9,0 6,8 4,0 D C 6,0 9, 20 V 6,0 9,0 7,5 7,0 C B 6,0 8, 21 V 8,0 9,0 7,7 7,0 D B 6,5 8, 22 V 6,0 9,0 8,7 8,0 C A 6,0 9, 23 V 8,0 9,0 7,3 10,0 C C 9,0 7, 24 V 8,0 9,0 8,5 9,0 A A 6,5 9, 25 V 8,0 9,0 7,0 9,0 B A 9,0 8, (*) P = Departamento Pessoal; T = Seção Técnica e V = Seção de Vendas. Fonte: Bussab e Morettin (2002)
Baseado na Tabela 4.7., construa a distribuição de freqüências da variável Metodologia, com as freqüências absoluta e relativa, as porcentagens, dê um título e interprete.
Ainda baseado na Tabela 4.7., construa uma Tabela de Classes de Freqüências para a variável Redação, com as freqüências absoluta e relativa, as porcentagens, dê um título e interprete.
Construa uma tabela de dupla entrada para as variáveis “seção” e conceito tirado em “Inglês” da Tabela 4.7.
Construa uma tabela de contingência para as variáveis “seção” e “notas em estatística” da Tabela 4.7.
Construa uma tabela de contingência para as variáveis “notas em redação” e “política” da Tabela 4.7.
5.1. Mínimo e Máximo
O mínimo é a menor observação do conjunto de dados, enquanto que o máximo é a maior observação.
Exemplo: Considere o seguinte conjunto de dados: 4, 5, 4, 6, 5, 8, 4. Logo,
Min = __ e Max = __.
5.2. Moda
Valor ou atributo que ocorre com maior freqüência.
Exemplo (a): 2, 5, 2, 7, 8 Moda = __.
Exemplo (b): 3, 4, 2, 2, 4, 5 Moda = __ e __. “Conjunto _ _ _ _ _ _ _”
Exemplo (c): 1, 2, 3, 4, 5 Moda = não tem “Conjunto _ _ _ _ _ _”
Moda para dados agrupados em Tabelas de Freqüências
Exemplo: Uma empresa de segurança deseja estudar qual o número de ligações a cobrar mais freqüentes que são recebidas em um determinado bairro de classe alta da cidade de São Paulo no mês de março. Foram selecionadas 30 residências e observadas 10 ligações em cada residência. O resultado foi:
Números de Ligações a Cobrar (x (^) i ) Número de Residências (n (^) i) 0 2 1 5 2 15 3 8 Total 30
Moda = __.
Interpretação: __ ligações a cobrar foi o que ocorreu com maior freqüência.
5.3. Média
Valor que representa o centro do conjunto de dados. Considere n observações de um conjunto de dados representados por x 1 , x 2 , ..., x (^) n. A média desse conjunto é obtida pela soma das n observações dividido por n , ou seja,
n
x
n
x x x x x
n
i
i n
∑ = 1 +^2 +^3 +L^ + = =^1 (5.1)
Exemplo: Considere o seguinte conjunto de notas: 2, 5, 3, 7, 8. A média das notas é ___.