Baixe estatística aplicada e outras Exercícios em PDF para Estatística, somente na Docsity! CONTEÚDO PROGRAMATICO DE ESTATÍSTICA. Estatística descritiva, Probabilidade, Variável Aleatória, Modelos Teóricos Discretos, Modelos Teóricos Contínuos, Probabilidades, Inferência Estatística, Estimação, Testes de significância, Regressão Linear Simples, Regressão Linear Múltiplas. Estatística O termo “Estatística” vem de status, que, em latim significa “estado”, “situação”. A Estatística está intimamente ligada a medidas descritivas de eventos em massa e fornece regras para colher, organizar e interpretar dados obtidos por meio de medições ou contagens.OBS: Estado “conjunto de qualidades ou características com que as coisas se apresentam, ou o conjunto de condições em que se encontram em determinado momento”. A partir do séc XVIII, vários países europeus em desenvolvimento passaram a aplicar a Estatística na economia, na indústria e no comércio. Hoje ela é utilizada em todos os países e em todas as areas de conhecimento quando se quer analisar um determinado fenômeno (social, político, biológico, econômico, genético, etc.) Em linhas gerais, pode-se dizer que, na elaboração de uma pesquisa, são cumpridos os seguintes passos: Definição do problema a ser investigado; Elaboração dos instrumentos para coleta de dados (questionário, entrevistas, filmagens, dentre outros); Coleta de dados; Organização dos dados coletados; Análise desses dados; Projeção da análise, com o objetivo de prever ocorrências futuras e tomar decisões. População em Estatística, refere-se à totalidade envolvida no fenômeno a ser analisado. Amostra parcela da população. Em geral, não há como pesquisar a totalidade envolvida na pesquisa. Média é a soma de todos os valores dividida pelo nº desses valores. Mediana é o valor que ocupa a posição central dos dados ordenados.Quando há um número ímpar de elementos, só existe um valor central. Nesse caso, ele é a mediana.Se houver um par de elementos, a mediana é dada pela média aritmética.Md Moda é o valor que ocorre com maior freqüência.Mo 1 Exemplos: Suponha que, num grupo de trabalhadores, haja os seguintes números de horas de trabalho diário: 7 – 8,5 – 8 – 7,5 – 9 – 8 – 8,5 – 10 – 6 – 8 – 6,5 Calcule: a) média = X 7,909 b) mediana = Md 8 c) Moda = Mo 8 6 6,5 7 7,5 8 8 8,5 8,5 9 10 Considere os salários mensais (em reais) de 8 trabalhadores. 280 – 300 – 450 – 350 – 320 – 250 – 450 – 300. Calcule: a) média = X 337,5 b) mediana = Md 310 c) Moda = Mo a Moda é 300 e 450, portanto BI MODAL 250 280 300 300 320 350 450 450 Há quatro jovens reunidos numa sala. Eles têm, em média, 13 anos. Se entrar na sala um rapaz de 23 anos, qual passa a ser a média das idades do grupo? Exercícios: 15 2 Amplitude do intervalo: h h = R : K Construir um Histograma. Conforme ao objetivos da Estatística Descritiva, a tabela de distribuição das freqüências sintetiza e organiza uma coleção de dados, facilitando a compreensão análise desses dados. Medidas de Tendência Central Média. Quando os valores de Xi estão agrupados com suas respectivas freqüências absolutas Fi, a média aritmética ou média amostral é expressa por: X= ∑ x i Fi n Exemplo. Xi Fi X i X i . Fi 18 – 25 6 21,5 129 5 25 – 32 10 28,5 285 32 – 39 13 35,5 461,5 39 – 46 8 42,5 340 46 – 53 6 49,5 297 53 – 60 5 56,5 282,5 60 – 67 2 63,5 127 ∑ 50 --------- 1922 X= ∑ x i Fi n = 1922 50 =38 ,44 .anos Mediana Colocados em ordem crescente, mediana Md é o valor que divide a amostra, ou população, em duas partes iguais. Cálculo da mediana – variável discreta. Se n for ìmpar, a mediana será o elemento central (de ordem n+1 2 ). Se n for par, a mediana será a média entre os elementos centrais(de ordem n 2 e n 2 +1 ). Exemplo: 1) Calcular a mediana para as distribuições: (ímpar) Xi Fi Fac 1 1 1 2 3 4 3 5 9 4 2 11 ∑ 11 --------- 2) (par) Xi Fi Fac 82 5 5 85 10 15 87 15 30 89 8 38 90 4 42 ∑ 42 ---------- Calculo da mediana – Variável contínua. 6 1º calcula-se a ordem n 2 . A variável é contínua, independentemente se n é par ou ímpar. 2º Pela Fac, identifica –se a classe que contém a mediana (classe md). 3º Utiliza-se a fórmula: Md=lmd+( n 2 −∑ Fac Fmd ).h Em que: lmd = limite inferior da classe Md. n = tamanho da amostra ou nº de elementos; ∑ Fac = soma das freqüências anteriores à classe Md; Fmd = freqüência da classe Md. Exemplo: Dada a distribuição amostral, calcular a mediana. Intervalo das classes Fi Fac 35 – 45 5 5 45 – 55 12 17 55 – 65 18 35 65 – 75 14 49 75 – 85 6 55 85 – 95 3 58 ∑ 58 --------- Existem também outras medidas como os Quartis, os Decis e os Percentis. Quartis Os quartis dividem um conjunto de dados em quatro partes iguais. Q1 = 1º quartil, deixa 25% dos elementos Q2 = 2º quartil, coincide com a mediana, deixa 50% dos elementos Q3 = 3º quartil, deixa 75% dos elementos Eis as fórmulas para os cálculos de Q1 e Q3, para o caso de variáveis contínuas. 7 em que: lDi = limite inferior da classe Di i = 1,2,3,....,9 n = tamanho da amostra ∑Fac = soma das freqüências anteriores à classe Di h = amplitude da classe Di FDi = freqüência da classe Di Percentis São as medidas que dividem a série em 100 partes iguais. O cálculo de um percentil (Pi) é dado por: 1º passo: calcula-se a ordem in 100 , em que: i = 1, 2, 3, ..., 98, 99. 2º passo: pela Fac identifica-se a classe Pi. 3º passo: usa-se a fórmula: Pi= lpi + ( in100 −∑ Fac)h F pi em que: lDi = limite inferior da classe Pi i = 1,2,3,....,99 n = tamanho da amostra ∑Fac = soma das freqüências anteriores à classe Pi h = amplitude da classe Pi Fpi = freqüência da classe Pi Exemplo: Determine o 4º decil e o 72º percentil da seguinte distribuição: Classe Fi Fac 4 – 9 8 8 9 – 14 12 20 14 – 19 17 37 19 – 24 3 40 ∑ 40 _______ Solução: 1º passo: n = 40 D4 = ? P72 = ? in 10 = 4 .(40 ) 10 =16 º in 100 = 72 .(40 ) 100 =28 ,8 º 3n 4 = 3(56 ) 4 =42 º 2º passo: Identifica-se as classes D4 e P72 pela Fac. 3º passo: Para D4: lD4 = 9 ∑ Fac = 8 n = 40 h = 5 FD4 = 12 Para P72: lP72 = 14 ∑ Fac = 20 n = 40 h = 5 FP72 = 17 10 D4 = 9+ ( 4 . 4010 −8). 5 12 =12 ,33 P72 = 14+ (72. 40100 −20). 5 17 =16 ,59 Portanto, nessa distribuição, o valor 12,33 divide a distribuição em duas partes: uma (à esquerda) com 40% dos elementos e a outra com 60%. O valor 16,59 indica que 72% dos elementos da distribuição estão abaixo de 16,59 e 28 % acima. Moda: Dentre as principais medidas de posição, destaca-se a Moda. É o valor mais freqüente da distribuição. Para distribuição simples (sem agrupamento em classe). A identificação da moda é facilitada pela simples observação do elemento que apresenta maior freqüência. Para dados agrupados em classe (Variável contínua) há diversas fórmulas para o cálculo da Moda. Destacaremos o cálculo da moda por meio da fórmula de Czuber. 1º Identifica-se a classe modal (classe com maior freqüência); 2º Aplica-se a fórmula: Mo=lmo+ Δ1 Δ1+Δ2 .h lmo = limite inferior da classe modal (classe com maior freqüência) Δ1 = diferença entre a freqüência da classe modal e a freqüência da classe imediatamente anterior. Δ2 = diferença entre a freqüência da classe modal e a freqüência da classe imediatamente posterior. h = amplitude da classe Modal. Exemplo: 1) Determine a moda para a distribuição: classes Fi 0 – 1 3 1 – 2 10 2 – 3 17 3 – 4 8 4 – 5 5 ∑ 43 2) Determine a moda para a distribuição: Salários US$ Fi Fi/h 11 80 – 180 70 70/100 = 0,7 180 – 250 140 140/ 70 = 2 250 – 300 140 140/ 50 = 2,8 300 – 500 60 60/ 200 = 0,3 ∑ 410 ---------------- Medidas de Dispersão São medidas estatísticas utilizadas, para avaliar a grau de veriabilidade, ou dispersão, dos valores em torno da média. Servem para medir a representatividade da média. Amplitude total; É uma medida de dispersão dada pela diferença entre o maior e o menor valor da série. Variância amostral Como se deseja medir a dispersão dos dados em relação à média, é interessante analisar os desvios de cada valor (Xi) em relação à média X , isto é: di = (Xi - X ). Se os di forem baixos, teremos pouca dispersão; ao contrário, se os desvios forem altos, teremos elevada dispersão.É fácil constatar que a soma dos desvios em torno da média é zero. Para o cálculo da variância utilizaremos a seguinte fórmula pratica: S2= 1 n−1 [∑ X i2Fi− (∑ X i Fi) n 2 ] Desvio padrão amostral Para melhor interpretar a dispersão de uma variável, calcula-se a raiz quadrada da variância, obtendo-se o desvio padrão que será expresso na unidade de medida original. Assim: S=√S2 Exemplo: 1) Calcular a variância e o desvio padrão da seguinte distribuição amostral. Xi Fi Xi.Fi Xi2.Fi 5 2 7 3 8 5 9 4 11 2 ∑ 16 12