Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas


54314 materialestatistica3, Notas de estudo de Economia

Apostila de índices

Tipologia: Notas de estudo

Antes de 2010

Compartilhado em 06/08/2010

ary-villar-filho-12
ary-villar-filho-12 🇧🇷

5 documentos

1 / 26

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
ESPM - ESTATÍSTICA III – 2008.1
PROFESSOR EDSON CHENÇO
DADOS ESTATÍSTICOS
Simbologia Básica
Abreviaturas
= somatório ou totalizador
N = número de elementos de uma população
n = número de elementos de uma amostra
μ = média populacional probabilística
m = média aritmética
m’ = média aritmética ponderada
me = mediana
mo = moda
s = desvio padrão
s2 = variância
| | = módulo
z = variável aleatória normal padronizada
P = probabilidade
E = experimento aleatório
p = sucesso
q = fracasso
A ! = arranjo
P! = permutação
C! = combinação
NI = números índices
U = união
= intersecção
= variação
= infinito
= espaço amostral
IC = intervalos de confiança
Li = limite inferior
h = amplitude
CV = coeficiente de variação relativa
(r) = coeficiente de correlação linear
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a

Pré-visualização parcial do texto

Baixe 54314 materialestatistica3 e outras Notas de estudo em PDF para Economia, somente na Docsity!

ESPM - ESTATÍSTICA III – 2008.

PROFESSOR EDSON CHENÇO

DADOS ESTATÍSTICOS

Simbologia Básica

Abreviaturas

∑ = somatório ou totalizador N = número de elementos de uma população n = número de elementos de uma amostra

μ = média populacional probabilística m = média aritmética m’ = média aritmética ponderada me = mediana

mo = moda s = desvio padrão s^2 = variância

| | = módulo

z = variável aleatória normal padronizada

P = probabilidade

E = experimento aleatório

p = sucesso

q = fracasso

A! = arranjo

P! = permutação

C! = combinação

NI = números índices

U = união

∩ = intersecção

∆ = variação

∞ = infinito

Ω = espaço amostral

IC = intervalos de confiança

Li = limite inferior

h = amplitude

CV = coeficiente de variação relativa

(r) = coeficiente de correlação linear

IC = intervalo de confiança

INTRODUÇÃO

Os dados podem ser classificados como qualitativos ou categorizados e quantitativos ou numéricos.

Se o entrevistado responde a uma pergunta com uma palavra, o dado que ele informa é de natureza qualitativa. Ele está relatando uma “qualidade” ou um “atributo”, o que a princípio significa a mesma coisa. Se o entrevistado diz um número quando perguntado e esse número expressa uma quantidade, tamanho, ele está relatando um dado numérico, ou seja, quantitativo.

Dados numéricos discretos surgem de processos de contagem; por essa razão, só podem assumir determinados valores numéricos. São exemplos de dados discretos: número de filhos, número de batimentos cardíacos por minuto, etc.

Dados numéricos contínuos são obtidos por medição. São exemplos: altura, peso, idade, temperatura, etc. A variável admite qualquer tipo de valor, inteiro e fracionário juntos ou somente fracionários.

Taxa ou coeficiente é a razão entre o número de indivíduos que apresentam, ou apresentaram, determinada característica no decurso de certo período e o total de indivíduos na população. Em Estatística III usaremos muito o termo coeficiente para caracterizar determinadas situações.

Escala de Medição dos Dados

  • Escala Nominal : valores numéricos em uma escala nominal apenas dão nome a uma categoria ou classe; os valores são utilizados somente para diferenciar os objetos, categorias ou nomes. Exemplo: identificando numa pesquisa de mercado os estados brasileiros por números, como: 1 – Rio de Janeiro, 2 – São Paulo, 3 – Minas Gerais e assim por diante.
  • Escala Ordinal : valores numa escala ordinal dão nome e ordem a um objeto, categoria ou classe. Os números são utilizados para diferenciar os objetos em relação a sua superioridade segundo algum critério estabelecido. Exemplo, numa pesquisa de satisfação, os entrevistados podem dar notas de 5 a 10.
  • Escala de Intervalos : valores numa escala de intervalos eliminam a limitação da escala ordinal estabelecendo intervalos iguais onde é possível ordenar as medições e, ao mesmo tempo, explicar em quanto difere uma observação de outra. Por exemplo, o aumento de temperatura de ontem para hoje é de 5 graus, isto é, de 20 para 25 graus centígrados. Podemos dizer então, que hoje está mais quente que ontem.

Amostragem

80,00 e aciona a máquina. Se aparecerem 2 maças, ganha R$ 40,00; Se aparecerem 2 bananas, ganha R$ 80,00; R$ 140,00 se aparecerem 2 peras e ganha R$ 180,00 se aparecerem duas laranjas. Qual a esperança de ganho numa única jogada?

  1. Na produção de uma peça são empregadas duas máquinas. A primeira é utilizada para efetivamente produzir as peças e o custo de produção é de R$ 50,00 por unidade. Das peças produzidas nessa máquina, 90% são perfeitas. As peças defeituosas (produzidas na primeira máquina) são colocadas na segunda máquina para a tentativa de recuperação (torná-las perfeitas). Nesta segunda maquina o custo por peça é de R$ 25,00, mas apenas 60% das peças são de fato recuperadas. Sabendo-se que cada peça perfeita é vendida por R$ 90,00 e que cada peça defeituosa é vendida por R$ 20,00, calcule o lucro por peça esperado pelo fabricante.
  2. Um banco pretende aumentar a eficiência de seus caixas. Oferece um prêmio de R$ 150,00 para cada cliente atendido além de 42 clientes por dia. O banco tem um ganho operacional de R$ 100,00 para cada cliente atendido além de 41. As probabilidades de atendimento são:

Número de clientes Até 41 42 43 44 45 46 Probabilidades 0,88 0,06 0,04 0,01 0,006 0,

  1. Um jogador A aposta com B R$ 100,00 e lança dois dados, nos quais as probabilidades de sair cada face são proporcionais aos valores da face. Se cair soma 7, ganha R$ 50, de B. Se sair soma 11, ganha R$ 100,00 de B e se sair soma 2, ganha R$ 200,00 de B. Nos demais casos A perde a aposta. Qual a esperança de lucro (ganho) do jogador A em uma única jogada?
  2. (^) Sendo as distribuições das variáveis X e Y, independentes, construir a distribuição conjunta de (x,Y), sendo Z = 3X + Y, calcular E(Z) e VAR(Z), usando a distribuição Z.

NÚMEROS ÍNDICES

Os números-índices são medidas estatísticas freqüentemente usadas por administradores, economistas e engenheiros, para comparar grupos de variáveis relacionadas entre si e obter um quadro simples e resumido das mudanças significativas em áreas relacionadas como preços de matérias-primas, preços de produtos acabados, volume físico de produto etc. Mediante o emprego de números índices é possível estabelecer comparações entre:

a) variações ocorridas ao longo do tempo;

b) diferenças entre lugares;

c) diferenças entre categorias semelhantes, tais como produtos, pessoas, organizações etc.

É grande a importância dos números-índices para o administrador, especialmente quando a moeda sofre uma desvalorização constante e quando o processo de desenvolvimento econômico acarreta mudanças continuas nos hábitos dos consumidores, provocando com isso

modificações qualitativas e quantitativas na composição da produção nacional e de cada empresa individualmente. Assim, em qualquer análise, quer no âmbito interno de uma empresa, ou mesmo fora dela, na qual o fator monetário se encontra presente, a utilização de números- índices torna-se indispensável, sob pena de o analista ser conduzido a conclusões totalmente falsas e prejudiciais à empresa.

Por exemplo, se uma empresa aumenta seu faturamento de um período a outro, isso não quer dizer necessariamente que suas vendas melhoraram em termos de unidades vendidas. Pode ter ocorrido que uma forte tendência inflacionaria tenha obrigado a empresa a aumentar acentuadamente. Os preços de seus produtos, fazendo gerar um acréscimo no faturamento (em termos "nominais"), o qual, na realidade, não corresponde a uma melhora de situação.

Fora dos problemas gerados por alterações nos preços dos produtos, os números-índices são úteis também em outras áreas de atuação da empresa como, por exemplo, no campo da pesquisa de mercado. Neste caso, podem ser utilizados nas mensurações do potencial de mercado, na análise da lucratividade por produto, por canais de distribuição etc. Em suma, os números índices são sempre úteis quando nos defrontamos com análises comparativas.

Para o administrador, o conhecimento de números-índices é indispensável igualmente como um instrumento útil ao exercício profissional, quer seus problemas estejam voltados para a microeconomia quer para a macroeconomia. No primeiro caso, poder-se-ia citar, por exemplo, a necessidade de se saber até que ponto o preço de determinado produto aumentou com relação aos preços dos demais produtos em um mesmo mercado. Se, por outro lado, o problema for quantificar a inflação, será preciso medir o crescimento dos preços dos vários produtos sob os aspectos acima considerados, podendo-se vislumbrar a noção de agregado subjacente ao conceito de número-índice. Por essa razão, costuma-se conceber o número-índice como uma medida utilizada para proporcionar uma expressão quantitativa global a um conjunto de medidas que não podem ser simplesmente adicionadas em virtude de apresentarem individualmente diferentes graus de importância.

Cada número-índice de uma série ( de números) costuma vir expresso em termos percentuais. Os índices mais empregados medem, em geral, variações ao longo do tempo e exatamente nesse sentido que iremos tratá-los neste material. Além disso, limitaremos o estudo às suas principais aplicações no campo de administração e de economia, as quais se situam no âmbito das variações de preços e de quantidades.

Conceito de Relativo

A quantidade total de dinheiro gasto cada ano, em relação a certo ano base, varia de um ano para outro devido às variações no número de unidades compradas dos diferentes artigos e igualmente devido a mudanças nos preços unitários de tais artigos. Temos, portanto, três variáveis em jogo: preço, quantidade e valor, sendo este último o resultado do produto do preço pela quantidade.

Relativo (Relação) de Preço

Trata-se do número-índice mais simples. Relacionando-se o preço de um produto numa época (chamada época atual ou época dada) com o de uma época o (chamada básica ou simplesmente base) teremos um relativo de preço. Fazendo-se P t = preço numa época atual e Po preço na época-base, define-se então o relativo de preço.

Exemplo de Aplicação:

O preço de determinando artigo em 1999 foi R$ 1,20 e em 2000 subiu para R$ 1,38. Tomando-se por base o ano 1999, determinar o preço relativo em 2000.

Relativo (Relação) de Quantidade

O índice de Paasche pondera preços ( P ) de insumos ( i ) em duas épocas, inicial ( 0 ) e atual ( t ), tomando como pesos quantidades ( Q ) arbitradas para estes insumos na época atual. Como essas quantidades são consideradas adequadas à época atual e não à época inicial, admite-se que o denominador possa se apresentar, eventualmente, super dimensionado e assim o índice de Paasche apresentar tendência a rebaixamento.

  • Índice Ideal de Fischer – Média Geométrica dos Índices

Exemplo de Aplicação:

1. Dada a evolução de preços e quantidades no período de 2003 a 2005 para dois produtos

fabricados por Edson & Portugal Ltda.

2003 2004 2005 P Q P Q P Q

PRODUTO A 18 25 26 30 28 32

PRODUTO B 19 32 24 28 25 29

As quantidades estão em unidades produzidas e o preço em reais. Determine os índices de preços e quantidades de Laspeyres, Paasche e o Ideal de Fischer para os 3 períodos de tempo.

Assimetria e Curtose

Assimetria: as distribuições de freqüência podem ser simétricas, assimétricas positivas, assimétricas positivas ou retangulares.

Para calcular o coeficiente de assimetria, fazemos:

Ass. = 3 ( Média – Mediana)

Desvio Padrão

Observe as distribuições a seguir:

xi Peso em Kg fi Produtos

2 – 4 4 4 – 8 8 8 – 12 12 12 – 16 8 16 - 20 4

xi (Peso em Kg) fi( Produtos)

2 – 4 18 4 – 8 21 8 – 12 12 12 – 16 8 16 - 20 4

xi (Peso em Kg) fi( Produtos)

2 – 4 4 4 – 8 9 8 – 12 12 12 – 16 23 16 - 20 20

Coeficiente de Curtose: mostra o grau de achatamento ou afilamento de uma distribuição de freqüências.

Dado pela fórmula:

Q 3 –__ Q 1

2 (P90 – P10)

Observe as distribuições a seguir:

xi (Peso em Kg) fi( Produtos)

2 – 4 4 4 – 8 8 8 – 12 12 12 – 16 8 16 - 20 4

xi (Peso em Kg) fi( Produtos)

2 – 4 4 4 – 8 4 8 – 12 4 12 – 16 3

Dado o conjunto de dados a seguir, faça a atribuição de postos:

A = 5; 5; 3; 16; 11; 9; 12; 10

Quando a variável é contínua (como peso, por exemplo), fica mais fácil atribuir postos por que os dados são, em sua maioria, diferentes. Quando a variável é discreta (número de filhos, por exemplo) ocorrem normalmente muitos empates.

Para conferir se os seus cálculos estão corretos na organização dos postos é muito fácil: haja ou não empates, a soma dos postos será sempre n (n + 1)/2. Faça o cálculo para o exemplo anterior.

O Teste Mann-Whitney

Para que serve?

O teste MW serve para testar a hipótese de que duas populações têm a mesma distribuição. Este teste é, portanto, uma alternativa para o Teste T Student no caso de variáveis independentes. Mas este teste só deve ser aplicado se a amostra for pequena. A única exigência do teste MW é que as observações sejam medidas em escala ordinal ou numérica.

Como se faz?

A lógica do teste pode ser entendida por meio de exemplos porque é bastante simples. Imagine que você conduziu um experimento com dois grupos, o controle e o experimental, e observou cinco unidades de cada grupo. Os dados e os respectivos postos, de 1 a 10, estão apresentados na tabela 1 a seguir. Note que os valores observados no controle são todos menores do que os observados no grupo experimental. Logo, a soma dos postos para controle, que indicaremos por ∑R 1 , é menor do que a soma dos postos do grupo experimental, que indicaremos por ∑R 2. Faremos também nas tabelas 2 e 3 observações um pouco diferentes em relação a apresenta∑R 1 ação dos valores. Observe a seguir:

No final das observações, vamos ver as características de cada uma das apresentações e tirar as primeiras conclusões.

A seguir as tabelas 1, 2 e 3.

Tabela 1:Um exemplo de dados que não se sobrepõem:

DADOS POSTOS

Controle Experimental Controle Experimental

4 12 6 12 8 13 9 16 10 18 ∑R 1 ∑R 2

Tabela 2: Um exemplo de dados que pouco se sobrepõem:

DADOS POSTOS

Controle Experimental Controle Experimental

4 8 6 12 12 10 9 16 13 18 ∑R 1 ∑R 2

Tabela 3: Um exemplo de dados que se sobrepõem:

DADOS POSTOS

Controle Experimental Controle Experimental

4 8 6 12 12 10 18 16 13 9 ∑R 1 ∑R 2

O Teste MW está baseado na diferença entre ∑R 1 e ∑R 2. Veja como se faz esse teste:

Primeiro passo: estabeleça o nível de significância. A hipótese em teste é a de que, nos dois grupos em comparação, a variável em análise tem a mesma distribuição.

Segundo passo: Chame um grupo de 1 e outro de 2. Se os grupos têm o mesmo tamanho, será chamado de grupo 1 aquele que tiver a menor soma dos postos.

Terceiro passo: Determine os postos para cada um dos elementos;

Quarto passo: Determine ∑R 1 e ∑R (^) 2.

Quinto Passo: Calcule a estatística MW, também conhecida como teste U.

Sexto Passo: Determine o valor Z, pois o teste U tem distribuição muito próxima da normal padronizada.

Exemplo Prático

Imagine que, para testar o sabor , para refrigerantes diet foi feito um ensaio casualizado com 17 consumidores. O ensaio, duplo-cego, utilizou corante sem gosto na observação. O novo produto foi dado a oito consumidores que constituíram o grupo experimental e o refrigerante com corante para nove consumidores que formaram o grupo de controle. Uma hora depois de ingerir o refrigerante, registraram a nota dada ao sabor que variou em escala analógica de 0 a

  1. Os dados estão na tabela a seguir:

Quinto Passo: Usando o menor valor de U, determine Z.

Sexto Passo: Vá a tabela 1 do apêndice desta apostila e localize o valor crítico.

Sétimo Passo: Faça a análise do resultado.










Trabalho 1 – Desenvolva uma situação-problema ligada a Marketing ou Administração em que pode ser utilizado o Teste MW. Crie os fatores, faça o teste e apresente os resultados. Este trabalho poderá ser realizado com equipes de até 4 pessoas.

Teste Estatístico de Kruskal-Wallis

O teste de KW serve para mostrar a hipótese de que várias populações têm a mesma distribuição. É uma alternativa para a análise de variância com uma classificação. Por essa razão, este teste é algumas vezes referido na literatura como análise de variância por postos (ANOVA by ranks test). O teste KW só deve ser aplicado se a amostra for pequena e/ou com pressuposições, exigidas para proceder à análise de variância, estiverem seriamente comprometidas. Como no teste MW, o teste KW pressupõe que a variável em análise seja medida em escala ordinal ou numérica.

Como se faz:

A lógica do teste é semelhante à do teste MW. Imagine que você observou K grupos com n casos, respectivamente.

Primeiro Passo: Junte os n 1 + n 2 +....+ n (^) k = n dados em um só conjunto. Atribua a cada dado um posto. Então os postos vão de 1 até n dados.

Segundo Passo:

Calcule os somatórios dos postos de cada grupo, isto é, ∑R 1 , ∑R (^) 2, .....,. ∑Rk. Se as somas estiverem corretas, serão igual a n (n+1)/2.

Quarto Passo:Aplique na fórmula de verificação que é dada por:

H= ___ 12___ [(∑R 1 ) 2 /n 1 + (∑R 2 ) 2 /n 2 +....+ (∑R (^) k) 2 /nk – 3 (n + 1)

n ( n + 1)

Em que ∑R 1 , ∑R2, .....,. ∑R (^) k , são a soma dos postos 1,2,...,k, respectivamente;

Se K grupos provieram de uma mesma população ou de populações idênticas, as somas dos postos dos K grupos devem ser muito semelhantes, diferindo apenas por razões do acaso (hipótese de nulidade). Sob essa hipótese, a estatística H tem distribuição aproximada.

Observações:

  1. Restrições: Se houver apenas três grupos em comparação, é preciso haver pelo menos cinco casos por grupo;

  2. Empates: Deve-se ficar atento aos empates. Quanto maior é o número de empates e quanto menor é a amostra, mais sensível é o resultado.

Exemplo de Aplicação:

Para examinar o tempo de durabilidade de três produtos diferentes avaliados em um teste de qualidade usados por gerentes de produtos, foi feito um ensaio técnico com 15 consumidores. Note que as amostras são pequenas e as variâncias são diferentes, por isso o teste KW, ou seja, H, é conveniente.

Tabela 2

Tempo de durabilidade, em segundos, de três produtos usados por consumidores.

Produto A Produto B Produto C 62 108 72 138 216 132 78 174 156 96 234 204 66 270 84

Primeiro Passo: junte os 5 + 5 + 5 = 15 dados em um só conjunto; Atribua um posto para cada um dos dados, começando pelo posto 1 para o valor mais baixo (62) e o posto 15 para o valor mais alto (270). Observe que neste exemplo não houve empates.

Segundo Passo: Some os valores de , ∑R 1 , ∑R2, e ∑R (^) 3.

Uma tabela auxiliar facilitará bastante esse cálculo. É só preencher a tabela que está apresentada a seguir.

∑R 1 = ∑R 2 = ∑R 3 =

Aplique o teste KW (H):

Faça a análise dos resultados:









Teste de Wilcoxon

Este teste deve ser aplicado quando os dados se encontram pareados para uma mesma variável e esta seja medida em escala ordinal ou numérica;

Como se faz:

Calcule a diferença entre a primeira e a segunda medição feita no mesmo par, para todos os pares da amostra. Exclua as diferenças iguais a zero Sem olhar o sinal, atribua um posto para cada diferença, ou seja, atribua postos aos valores absolutos das diferenças. Procedendo dessa maneira, você atribui à menor diferença (em valor absoluto) o posto 1 e à maior diferença o posto n. Coloque sinais nos postos, respeitando os sinais das diferenças. Postos atribuídos às diferenças que tenham sinal negativo receberão sinal negativo. E os que tenham postos atribuídos as diferenças com sinal positivo, receberão também, sinal positivo.

Para a realização do teste de W, utiliza-se a fórmula:

Z = ∑ R/ √ ∑R^2 , onde R são os postos assinalados; Sob hipótese de nulidade, Z tem

distribuição aproximadamente normal.

Exemplo de Aplicação:

Imagine que para testar o efeito de um novo programa de jogos feito em um ensaio com 8 possíveis consumidores que iriam se submeter a uma competição, observou-se os níveis de ansiedade, antes e depois de da utilização do programa. Os dados foram registrados usando uma escala própria.

Tabela 3 – Grau de Ansiedade antes e depois de testar um programa de jogos.

Consumidores Antes Depois

1 23 14 2 26 14 3 28 29 4 29 25 5 37 31 6 26 18 7 27 30 8 32 30

Primeiro Passo: Calcule as diferenças entre os níveis de ansiedade antes e depois de ter testado o jogo.

Segundo Passo: Atribua postos aos valores absolutos das diferenças. Os postos vão de 1 a 8;

Terceiro Passo: Assinale os postos, isto é, dê sinal negativo aos postos que correspondem às diferenças negativas e dê sinal positivo aos postos que correspondem às diferenças positivas;

Quarto Passo: Some os postos negativos e os postos positivos. Para conferir se a soma dos postos está correta, despreze o sinal, e utilize a fórmula n ( n + 1 ) / 2.

Quinto Passo: Utilize a Fórmula Z = ∑ R/ √ ∑R^2 e faça a análise dos resultados. Para isso

utilize a tabela da distribuição normal reduzida – Apêndice 2 da apostila.

Uma tabela ajudará a fazer toda esta operação de forma facilitada.

Consumidor Antes Depois Diferença Posto Posto Assinalado R (R) 2

1 23 14 2 26 14 3 28 29 4 29 25 5 37 31 6 26 18 7 27 30 8 32 30

Aplicar a fórmula:

Fazer a análise:




Perceba que este teste tem uma certa semelhança com o teste de Mann Whitney. Observe também o volume enorme de número de empates.

Para esse teste utiliza-se a fórmula, derivada de MW e dada por:

Pr= ___ 12___ ∑R^2 – 3N (k + 1)

Nk (k + 1)

Aplique a fórmula:

Analise os resultados:









Correlação e Regressão Linear

Pré-requisito para Teste de Spierman

  • Nas instituições de ensino superior há uma relação direta entre a qualidade do ensino e a taxa de evasão.
  • O frio está para o setor farmacêutico como o Dia das Mães está para o comércio. As vendas de medicamentos não controlados, como analgésicos, antigripais e vitaminas disparam.
  • O faturamento das empresas de energia é diretamente influenciado pela temperatura, especialmente no inverno no sul e verão intenso no norte e nordeste.

A partir desses exemplos, você poderá encontrar outras relações como, por exemplo, reduzindo o custo, o preço do produto será reduzido e será possível aumentar a quantidade vendida. Ou ainda, o funcionário com maior escolaridade terá teoricamente, maiores chances profissionais.

Podemos relacionar duas ou mais variáveis em conjunto e partir da análise de seus comportamentos, fazer correlações.

Vamos iniciar nosso estudo a partir das correlações mais simples chamadas lineares.

Observe as situações apresentadas à seguir:

“À medida que o automóvel sobre de preço, o valor das parcelas do consórcio sobem também. ”

Variável independente? ________ Variável dependente? _______

X Y

Observe agora esta situação:

X Y

Observe esta nova situação:

“A medida que nossa idade aumenta, diminui a expectativa de vida adicional”

Consideremos que a média de vida do brasileiro é de 70 anos.

Variável independente? _______

Variável dependente? _______

X Y

Observe a situação a seguir: