
























































Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Encontra documentos específicos para os exames da tua universidade
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
estatistica
Tipologia: Notas de estudo
1 / 64
Esta página não é visível na pré-visualização
Não perca as partes importantes!

























































1.1 O que é estatística e suas divisões
Para muitos a Estatística não passa de conjuntos de tabelas de dados numéricos. Mas será que a estatística é só isso?
A Estatística originou-se com a coleta e construção de tabelas de dados para o governo. A situação evoluiu e esta coleta de dados representa somente um dos aspectos da Estatística. Hoje em dia podemos adotar a seguinte definição para a Estatística:
A Estatística constitui-se num conjunto de técnicas e métodos científicos que tratam da coleta, análise e interpretação de informações numéricas, cujo objetivo principal é auxiliar na tomada de decisões ou tirar conclusões em situações de incerteza, a partir de informações numéricas.
A Teoria Estatística moderna se divide em dois grandes campos:
Estatística Descritiva - consiste num conjunto de métodos que ensinam a reduzir uma quantidade de dados bastante numerosa por um número pequeno de medidas, substitutas e representantes daquela massa de dados.
Estatística Indutiva ou Inferência Estatística - consiste em inferir (deduzir ou tirar conclusões a respeito das) propriedades de um universo a partir de uma amostra. O processo de generalização, que é característico do método indutivo, está associado a uma margem de incerteza. A medida da incerteza é tratada mediante técnicas e métodos que se fundamentam na Teoria das Probabilidades.
A Estatística Descritiva abrange métodos gráficos e numéricos, utilizados para resumir dados de maneira que características importantes da amostra possam ser expostas.
A disponibilidade de uma grande quantidade de dados e de métodos computacionais muito eficientes revigorou a área da Estatística denominada “Estatística Descritiva”.
Na maioria das vezes não podemos investigar o fenômeno que estamos interessados em estudar em todos os elementos da população por ser o custo muito alto, por necessitar de muito tempo para o levantamento dos dados. Para resolver o problema devemos trabalhar com um subconjunto da população, chamado de AMOSTRA.
Se selecionarmos os elementos da amostra de acordo com critérios estatísticos, podemos conhecer as informações relativas à população através da amostra.
A inferência estatística procura com base nos dados amostrais tirar conclusões sobre a população. Considere o exemplo abaixo para ilustrar as definições dadas.
viáveis, com vistas à economia de observações e, portanto, de custo; planejamento de métodos de coleta e análise de dados para a exploração mineral;
Os empregados de uma empresa devem tornar-se mais familiarizados com estatística. Eles devem entender e conhecer as técnicas estatísticas disponíveis, e adaptação de dados de experimentos para a análise estatística. Um profissional treinado em Estatística terá maior facilidade em identificar um problema em sua área de atuação, determinar os tipos de dados que irão contribuir para a sua análise, coletar estes dados e a seguir estabelecer conclusões e determinar um plano de ação para a solução do problema detectado. Qualquer um que derive informações a partir de dados está agindo como um estatístico.
População - Conjunto de indivíduos, objetos ou informações que apresentam pelo menos uma característica comum, cujo comportamento interessa-nos analisar. Ou, em outras palavras, conjunto de todas as medidas, observações relativas ao estudo de determinado fenômeno.
i) Deseja-se conhecer o consumo total de energia elétrica em MWH nas residências da cidade de Salvador no ano de 1998. População ou universo : todos as residências que estavam ligadas a rede elétrica em Salvador, em 1998. Características : X = consumo anual de energia elétrica em MWH. ii) Deseja-se saber se nas indústrias situadas no Estado da Bahia, em 1997, existia algum tipo de controle ambiental. População ou universo : indústrias situadas no Estado da Bahia em1997.
Característica : X = existência ou não de algum tipo de controle ambiental na indústria.
iii) Estudo sobre a precipitação pluviométrica na Região Nordeste no ano 1997. População ou universo : área referente à Região Nordeste. Característica : X = precipitação pluviométrica.
Populações finitas e infinitas : Quanto ao número de elementos, as populações podem ser classificadas em finita ou infinita, dependendo do número de elementos que a compõe.
Exemplos : i) População finita: empresas do Pólo Petroquímico de Camaçari. ii) População infinita: as pressões atmosféricas ocorridas nos diversos pontos do Continente em determinado momento.
Em geral, como os universos são grandes, investigar todos os elementos populacionais para determinarmos a característica necessita muito tempo, e/ou o custo é elevado, e/ou o processo de investigação leva a destruição do elemento observado, ou, como no caso de populações infinitas, é impossível observar a totalidade da população. Assim, estudar parte da população constitui-se um aspecto fundamental da Estatística.
Amostra : É qualquer subconjunto da população.
As características da população que nos interessa analisar recebem o nome de variáveis. As características ou variáveis podem ser divididas em dois tipos: qualitativas e quantitativas.
Variáveis qualitativas - quando o resultado da observação é apresentado na forma de qualidade ou atributo. Exemplos: sexo; estado civil; grau de escolaridade; etc.
Variáveis quantitativas - quando o resultado da observação é um número, decorrente de um processo de mensuração ou contagem. Exemplos: número de filhos; salário mensal; altura; peso; idade; tamanho da família; etc.
As variáveis qualitativas são divididas em dois tipos: nominal , para a qual não existe nenhuma ordenação nas possíveis respostas da referida variável, e ordinal , para a qual existe uma ordenação. Por exemplo,
Qualitativa NOMINAL (SEXO, COR DOS OLHOS,TIPOS DE DEFEITOS...) ORDINAL (CLASSE SOCIAL, GRAU DE INSTRUÇÃO, PORTE DE EMPRESA...)
As variáveis quantitativas são divididas em: discretas , que assumem valores em um conjunto finito ou enumerável de números, contínuas , que assumem valores em um intervalo números reais. Quantitativa CONTÍNUA (PESO, ALTURA, VIDA ÚTIL DE BATERIA...) DISCRETA (NÚMERO DE FILHOS, NÚMERO DE CARROS, NÚMERO DE DEFEITOS...)
Tabela 2.1: Porte das indústrias de matérias plásticas nas principais regiões metropolitanas do Brasil - 1999 Porte da Indústria Números de indústrias
(100x fri ) Grande 23 21, Média 70 66, Pequena 13 12, Total geral 106 100, Fonte: Dados fictícios
a) Variável Quantitativa Discreta
Exemplo 2.2: Foi observado o número de defeitos apresentados por uma máquina industrial durante o período de 30 dias. Os resultados foram os seguintes: 1 1 1 0 1 1 0 2 1 3 1 0 1 1 1 2 0 1 1 1 4 1 0 3 2 2 1 1 0 1
Tabela 2.2: Número de defeitos em uma máquina industrial durante o período de 30 dias Número de defeitos
Quantidade ( fi ) % (100x fri ) 0 6 20, 1 17 56, 2 4 13, 3 2 6, 4 1 3, Total 30 100, Fonte: Dados fictícios
b) Variável Quantitativa Contínua
Para certo conjunto de dados, vamos adotar a seguinte nomenclatura:
Determinação do número de classes e amplitude do intervalo de classes:
Não existem regras gerais, universalmente aceitas, para a determinação do número de classes. Existem, no entanto, algumas regras propostas por diferentes autores, que dão ideia aproximada do número de classes em função do número de dados.
Um dos métodos utilizado é chamado de regra de Sturges ou regra do logaritmo. Ele estabelece que
em que k é o número de classes e n é o número de dados. Outra maneira para obter o número de classes é
Mesmo conhecendo alguns métodos para a determinação do k , deve-se saber que a escolha dependerá antes da natureza dos dados, da unidade de medida e da experiência e do bom senso de quem fará a organização dos dados da pesquisa.
Uma vez encontrado o número de classes, determina-se a amplitude do intervalo de classes através da fórmula:
Exemplo 2.3: (Werkema, 1995) Os dados abaixo representam o rendimento em (%) de uma reação para fabricação de uma substância química, em 80 bateladas produzidas por uma indústria. A empresa decidiu construir uma tabela de frequência para obter um resumo do conjunto de dados. 70,7 71,8 73,9 74,4 75,9 76,0 76,6 76,7 77,4 78,0 78,1 78, 78,2 78,4 78,4 78,4 78,5 78,5 78,5 78,9 79,0 79,1 79,3 79, 79,5 79,5 79,7 79,8 79,9 79,9 80,1 80,2 80,4 80,4 80,5 80, 80,7 80,7 80,9 81,3 81,4 81,6 81,8 81,9 82,0 82,0 82,1 82, 82,5 82,7 82,9 83,0 83,0 83,2 83,4 83,5 83,6 83,6 83,7 83, 84,3 84,5 84,5 84,5 84,6 85,2 85,5 85,5 85,7 86,4 86,5 86, 86,8 86,8 87,1 87,1 87,1 87,3 88,5 90,
Procedimento para construir uma tabela de distribuição de frequências com intervalos de classes.
Solução: Neste caso, n = 80 ⇒ k = (80)1/2^ ≅ 9
A amplitude total será dada por AT = 90 – 70,7 = 19,3.
Assim, a amplitude de cada intervalo de classe será: h ≅ 2,
Dessa forma, a tabela de distribuição de frequências para dados agrupados em classes fica da seguinte maneira:
k ≅ n.
k
h =
k ≅ 1 + 3 , 3 log 10 n ,
Exemplo 2.4:
Tabela 2.5: Mastercard Tipo de fraude Cartão roubado Cartão falsificado Pedido por correio/telefone Outros Fonte: Triola, Mario F.
Figura 2.1: Tipo de fraude nos cartões de crédito da Mastercard Internacional no
Fonte: Triola, Mario F.
2º) Gráfico em colunas
Utilizado para representação de discretas.
Exemplo 2.5:
Tabela 2.6: Número de residência, que participaram do ensino de música na
Paripe Periperi Plataforma Praia Grande Total Fonte: Escola de Música XYZ, Salvador.
Tabela 2.5: Tipo de fraude nos cartões de crédito da Mastercard Internacional no Brasil - 2000 Tipo de fraude Quantidade Cartão roubado 243 Cartão falsificado 85 Pedido por correio/telefone 52 Outros 46 Fonte: Triola, Mario F.
: Tipo de fraude nos cartões de crédito da Mastercard Internacional no 2000
Fonte: Triola, Mario F.
representação de variáveis qualitativas e quantitativas
Número de crianças de baixa renda, segundo o bairro de residência, que participaram do ensino de música na Escola XYZ, em Salvador - 1998 Bairro Número de crianças Paripe 11 Periperi 39 Plataforma 45 Praia Grande 25 Total 120 Fonte: Escola de Música XYZ, Salvador.
: Tipo de fraude nos cartões de crédito da Mastercard Internacional no Brasil -
e quantitativas
de crianças de baixa renda, segundo o bairro de residência, que participaram do ensino de música na
Figura 2.2: Número de crianças de baixa renda, segundo o bairro de residência, que participaram do ensino de música na Escola XYZ, em Salvador - 2008
Fonte: Escola de Música XYZ, Salvador
Exemplo 2.6:
Tabela 2.7: Estudantes da Universidade XYZ Segundo área de estudo e ano de ingresso Área / Ano 1998 1999 2000 Exatas 120 156 68 Humanas 72 85 112 Biológicas 169 145 73 Fonte: Dados Fictícios
Figura 2.3: Estudantes da Universidade XYZ Segundo área de estudo e ano de ingresso
Fonte: Dados Fictícios
com maior frequência. Para construirmos o gráfico de Pareto é necessário obtermos a planilha de dados mostrada na tabela a seguir.
Tabela 2.9: Planilha de dados para construção de gráfico de Pareto. Tipo de defeito Quantidade de defeito
Total acumulado
Percentagem do total geral (%)
Percentagem acumulada Revest. Inadeq. 55 55 43,3 43, Trinca 41 96 32,3 75, Arranhão 12 108 9,4 85, Fina ou Grosa 11 119 8,7 93, Não- Acabada 5 124 3,9 97, Outros 3 127 2,4 100, Total 127 / 100 / Fonte: Dados fictícios
Na Tabela 2.9 os tipos de defeitos foram listados em ordem decrescente de quantidade na coluna 1, a quantidade de defeitos aparece na coluna 2 e o total acumulado está na coluna 3. Nas colunas 4 e 5 estão as percentagens totais e as percentagens acumuladas respectivamente. As barras do gráfico de Pareto foram construídas a partir dos dados da coluna 2 e a curva acumulada conhecida como curva de Pareto, foi traçada a partir dos números da coluna 5.
Observando a Figura 2.5, foi imediato para indústria perceber que os dois tipos de defeitos mais frequentes, “Revestimento inadequado” e “trinca”, representavam 75,6% dos defeitos detectados nas lentes produzidas pela empresa. Portanto, “Revestimento inadequado” e “trinca” foram considerados os defeitos mais importantes, que devem ser eliminados em primeiro lugar esse tipo de defeito é chamado de poucos defeitos vitais , enquanto que os outros representam apenas os muitos defeitos triviais pois representam a minoria das observações.
No Acabada^ Outros Muito Fina ou
Muito G
rossa Trinca Arranh o Revestimento Inadequado 55 41 12 11 5 3 43.3 32.3 9.4 8.7 3.9 2. 43.3 75.6 85.0 93.7 97.6 100.
100
50
0
100
80
60
40
20
0
Defeitos Quantidade Percentagem Perc. Acumulada
Controle Percentagem Acumulada
4º) Gráfico em linhas ou curvas Utilizado para descrever séries temporais que são dados observados em instantes ordenados do tempo.
Exemplo 2.9: Tabela 2.10: Índice de Produto Industrial Brasil – 1979 Meses IPI Janeiro 18. Fevereiro 17. Março 19. Abril 18. Maio 20. Junho 20. Julho 20. Agosto 21. Setembro 19. Outubro 22. Novembro 20. Dezembro 18. Fonte: FIBGE
Figura 2.6: Índice de Produto Industrial Brasil – 1979
Fonte: FIBGE
Figura 2.8: Rendimento (%) de uma Reação para Produção de uma Substância Químic
Fonte: Dados fictícios
Exercício: As especificações estabelecem um limite inferior para o rendimento igual a 78%. A partir de um histograma, você acredita que o processo especificação? Justifique.
Fonte: Dados fictícios
Há vários problemas com este gráfico. Ele impressiona mais pela tecnologia utilizada do que pela informação que passa para o leitor. Os dados não são tridimensionais. As grades do fundo mais o efeito tridimensional distraem a visão e dificultam comparações entre trimestre e regiões. Uma forma de melhorar o gráfico é dar-lhe a dimensão correta. ou similares, que só atrapalham a visão do leitor. Faça mais de um gráfico até encontrar um que seja informativo, claro, e que não possua objetos desnecessários.
0
10
20
30
40
50
60
70
80
90
primeiro segundo
Distribuição das vendas do produto X por trimestre segundo as zonas
Rendimento (%) de uma Reação para Produção de uma Substância Químic
As especificações estabelecem um limite inferior para o rendimento igual a histograma, você acredita que o processo está satisfazendo a
Há vários problemas com este gráfico. Ele impressiona mais pela tecnologia utilizada do que pela informação que passa para o leitor. Os dados não são tridimensionais. As grades do fundo mais o efeito tridimensional distraem a visão e entre trimestre e regiões. Uma forma de melhorar o gráfico é lhe a dimensão correta. As linhas de grade. Não utilize faixas horizontais, verticais ou similares, que só atrapalham a visão do leitor. Faça mais de um gráfico até encontrar ormativo, claro, e que não possua objetos desnecessários.
terceiro quarto
Distribuição das vendas do produto X por trimestre segundo as zonas
Leste Oeste Norte
Rendimento (%) de uma Reação para Produção de uma Substância Químic
As especificações estabelecem um limite inferior para o rendimento igual a está satisfazendo a
Há vários problemas com este gráfico. Ele impressiona mais pela tecnologia utilizada do que pela informação que passa para o leitor. Os dados não são tridimensionais. As grades do fundo mais o efeito tridimensional distraem a visão e entre trimestre e regiões. Uma forma de melhorar o gráfico é s linhas de grade. Não utilize faixas horizontais, verticais ou similares, que só atrapalham a visão do leitor. Faça mais de um gráfico até encontrar ormativo, claro, e que não possua objetos desnecessários.
Não apresente gráficos supérfluos. Se retirarmos a figura abaixo, toda a informação poderá ser transmitida textualmente, com uma simples frase: “20% das respostas foram positivas e 80% negat
Observe que o efeito 3 cada categoria da variável. A retirada do efeito 3 proporções relativas observadas em cada amostra.
0
10
20
30
40
50
60
70
80
90
100
primeiro
Distribuição das vendas do produto X por trimestre
Não apresente gráficos supérfluos. Se retirarmos a figura abaixo, toda a informação poderá ser transmitida textualmente, com uma simples frase: “20% das tivas e 80% negativas”.
o efeito 3-D dificulta o julgamento das porcentagens relativas de cada categoria da variável. A retirada do efeito 3-D ajudará o leitor a julgar melhor as proporções relativas observadas em cada amostra.
primeiro segundo terceiro quarto
Distribuição das vendas do produto X por trimestre segundo as zonas
Leste Oeste Norte
Sim 20%
Não 80%
Não apresente gráficos supérfluos. Se retirarmos a figura abaixo, toda a informação poderá ser transmitida textualmente, com uma simples frase: “20% das
D dificulta o julgamento das porcentagens relativas de D ajudará o leitor a julgar melhor as
Leste Oeste Norte
Tabela 3.1: Medidas da Espessura (mm) de 160 Azulejos do Estoque (dados ordenados) TURMA A TURMA B 2,3 3,1 3,8 4,5 4,9 5,6 5,8 6, 2,4 3,1 3,9 4,5 4,9 5,6 5,8 6, 2,4 3,3 3,9 4,5 5,0 5,6 5,8 6, 2,4 3,3 3,9 4,5 5,1 5,7 5,8 6, 2,6 3,4 4,0 4,5 5,1 5,7 5,9 6, 2,7 3,4 4,0 4,6 5,1 5,7 5,9 6, 2,7 3,5 4,0 4,6 5,3 5,7 5,9 6, 2,8 3,5 4,0 4,7 5,3 5,7 5,9 6, 2,8 3,5 4,0 4,7 5,3 5,7 5,9 6, 2,8 3,5 4,1 4,9 5,3 5,7 5,9 6, 2,9 3,5 4,1 4,9 5,3 5,7 6,0 6, 2,9 3,5 4,1 5,1 5,3 5,7 6,0 6, 2,9 3,6 4,2 5,2 5,3 5,7 6,0 6, 3,0 3,6 4,2 5,4 5,4 5,7 6,1 6, 3,0 3,7 4,2 5,4 5,4 5,7 6,1 6, 3,0 3,7 4,3 5,5 5,4 5,7 6,1 6, 3,1 3,7 4,3 5,6 5,4 5,8 6,1 6, 3,1 3,7 4,3 5,6 5,4 5,8 6,1 6, 3,1 3,8 4,4 5,7 5,5 5,8 6,2 6, 3,1 3,8 4,4 5,9 5,5 5,8 6,2 7, Fonte: Dados fictícios
logo temos que,
n
x
n
x x x x
n
i
i n
∑ = 1 +^2 +...+ = =^1
Podemos pensar na média aritmética como o valor “típico” do conjunto de dados e é considerada a principal medida de posição central. Algumas das razões que fazem com que seja a medida de posição mais recomendada são:
Entretanto, esta medida apresenta alguns inconvenientes como o fato de ser muito sensível a valores extremos, isto é, a valores excessivamente pequenos ou excessivamente grandes, em relação às demais observações do conjunto de dados.
Exemplo 3.1: Estamos interessados em conhecer o salário médio mensal de certa empresa com cinco funcionários. Temos o seguinte conjunto de salários mensais, em reais: 123 - 145 - 210 - 225 - 2.500. Podemos observar que quatro dos cinco salários apresentam valores entre 123 e 225 reais, porém a média salarial de 640,6 reais é bastante distinta desse conjunto pela influência do salário de 2.500 que puxou o valor médio para cima.
Em algumas situações, os números que queremos sintetizar têm graus de importância diferentes. Utiliza-se então uma média ponderada. Vamos ver a seguir a definição da média aritmética ponderada.
..., pn é definida por
∑
∑
=
n
i
i
n
i
i i p p
x.p x
1
(^1) , ou simplesmente por ∑
p
x.p x (^) p.
Obs: Quando os dados estão agrupados por frequências (absolutas ou relativas) os ponderadores serão as frequências.
Exemplo 3.2: Em um grupo de pessoas, 70% são adultos e 30% são crianças. O peso médio dos adultos é 70 kg e o peso médio das crianças é 40 kg. Qual o peso médio do grupo? Solução: É a média aritmética ponderada dos dois subgrupos. A resposta é
Exemplo de aplicação: (Azulejos)
Para responder à questão do valor típico da espessura dos azulejos produzidos pelas Turmas A e B calculamos então as médias aritméticas, pois o desejado é obter a espessura média M tal que se a espessura de cada azulejo fosse sempre igual a M a soma total seria a mesma.
Resumindo em uma tabela as médias aritméticas (em mm), temos:
Tabela 3.2: Valor da média aritmética por turma para dados da espessura dos azulejos Turma Média aritmética A 3, B 5,
Observando as médias aritméticas das amostras observadas, parece existir diferença, em termos médios, entre as espessuras dos azulejos que estão sendo continuamente produzidos pelas turmas A e B.