Pré-visualização parcial do texto
Baixe Apostila de Estatística e outras Notas de estudo em PDF para Engenharia Civil, somente na Docsity!
Universidade Federal Rural do Semi-Árido — UFERSA Departamento de Ciências Vegetais - DCV Fitotecnia APOSTILA DE ESTATÍSTICA dk Professora: MSc. Gilmara Alves Cavalcanti Natal/RN Mude mas comece devagar, potque a direção é mais importante que a velocidade. Quando sair, Procure andar pelo outro lado da rua. Depois mude de caminho, ande por outras tuas, calmamente, observando com atenção os lugares por onde você passa. Mude. Lembre-se que a vida é uma só. Se você não encontrar razões para ser livre, invente-as. Seja criativo. Experimente coisas novas. “roque novamente. Mude, de novo. Experimente outra vez. (Clarice Lispector) De tudo ficaram três coisas: A certeza de que estamos sempre a começar... A certeza de que é preciso continuar... A certeza de que seremos intertompidos antes de terminar... Portanto, devemos: Fazer da interrupção um caminho novo... Fazer da queda um passo de dança... Do medo uma escada... Do sonho uma ponte... Da procura um encontro... E assim terá valido a pena existir... (Fernando Sabino) UNIDADE 1: ESTATÍSTICA DESCRITIVA, 1.1 - INTRODUÇÃO. ESTATÍSTICA ma» CIÊNCIA "A ciência não é um conhecimento definitivo sobre a realidade, mas um conhecimento hipotético, que pode ser questionado e corrigido”, (Sónia Vieira) Ensinar ciência não significa apenas descrever fatos, enunciar leis e apresentar novas descobertas, mas ensinar o método científico, que é a maneira de buscar o conhecimento. Exige: Organização dos dados, análise e tomada de decisões em condições de incerteza. ESTATÍSTICA: ferramenta do método científico Os métodos estatísticos vêm sendo cada vez mais utilizados nas mais diversas áreas. O que é Estatística? Definições: (1) "É a parte da Matemática Aplicada que trata de chegar a conclusões a partir de dados observados", (2) "É a ciência que trata de da organização, descrição, análise. & interpretação de dados experimentais". (3) "E a ciência que se ocupa dos fenômenos aleatórios”. (4) “É o estudo dos métodos e procedimentos para recolher, classificar, resumir e analisar dados e, a partir deles, estabelecer inferências científicas". (5) "Não se limita ao levantamento e apresentação de dados numéricos dispostos em tabelas e gráficos, mas também constitui na ciência da tomada de decisões ante a incerteza". (6) "É a ciência ocupada em medir com precisão a imprecisão". (7) "É a ciência que se ocupa em medir a incerteza”. Generalizando: É a ciência que coleta, classifica e avalia numericamente fatos que servirão de base para extrair conclusões. É um conjunto de técnicas para se obter conhecimento preciso a partir de informações incompletas; é um sistema científico para coleta, organização, análise, interpretação e apresentação de informações que possam ser colocadas sob forma numérica. A Estatística trata de idéias e métodos que visam aperfeiçoar a obtenção de conclusões a partir de informações numéricas, na presença da incerteza. Profa. MSc. Gilmara Álves Cavalcanti 4 Métodos Estatísticos: são métodos adaptados ao esclarecimento de dados quantitativos sujeitos à influência de uma multiplicidade de causas. Ramos da Estotística: 5) b) e) Estatística Descritiva: trata da observação de fenômenos de mesma natureza, da coleta de dados numéricos referentes a esses fenômenos, da sua organização e classificação através de tabelas e gráficos, bem como da análise e interpretação. Utiliza números para descrever fatos. A finalidade é tornar as coisas mais fáceis de entender, relatar e discutir. Ex.: taxa de desemprego; custo de vida; altura média de estudantes; Probabilidade Estatística: utilizado para situações que envolvem o acaso (aleatoriedade). Ex.: jogos de cartas e de dados; jogos esportivos; decisão de atravessar uma rua; Inferência Estatística: cstuda as características de uma população com base em dados obtidos de amostras — Amostragem. Ex.: provar um pedaço de bolo; verificar a temperatura da água de uma piscina; folhear um novo livro; grandes processos industriais (amostra piloto); RAZÕES PARA O USO DA AMOSTRAGEM: > Custo (observações custam dinheiro, portanto, quanto maior o número de dados, maior o custo envolvido) — a amostragem reduz a quantidade de dados e. consegilentemente, us custos; > Valor da Informação dura pouco (para ser úlil a informação deve ser obtida e usada rapidamente, visto que, às vezes o exame de um artigo o destrói) — a amostragem é a única maneira de obter isso; > Tempo; OBS: Estatística Indutiva pode ser denominada como inferencial, Portanto, a estatística indutiva estuda as características de uma população, com base em dados.obtidos de amostras. Inferência = Indução + Margem de Erro OBS;: Os três ramos da estatística não são separados. Eles tendem a se entrelaçar. 1.2 - O MÉTODO ESTATÍSTICO (Coleta, Organização e Apresentação de Dados). A realização de uma pesquisa deve passar, necessariamente, pelas fases resumidas no diagrama abaixo, se um resultado satisfatório e preciso é desejado. Delinição do Planejamento Coleta dos R Crítica dos Problema Dados Dados Análise e Interpretação Tabelas e Apresentação dos Dados Gráficos dos Dados Profa. MSc. Gilmara Alves Cavalcanti 5 1.2.1- POPULAÇÃO E AMOSTRA. VARIÁVEIS, Inferência = Obtenção de resultados para uma população com base em observações Estatística extraídas a partir de uma amostra retirada desta população. POPULAÇÃO: É o conjunto de elementos (na totalidade) que têm, em comum. uma determinada característica. Pode ser finita, como por exemplo, o conjunto de alunos de uma determinada escola, ou infinita, como o número de vezes que se pode jogar um dado. AMOSTRA: É qualquer subconjunto da população. A técnica de seleção desse subconjunto de elementos é chamada de Amostragem. VARIÁVEL: É condição inerente à uma população natural existir variação quanto aos atributos que lhe podem ser estudados. Portanto, a variabilidade € uma característica comum a dados de observação c experimentos. Um atributo sujeito à variação é descrito em Estatística por uma variável. Nominal Í Qualitativa > Tempo Tempo Tempo Tempo Diagrama de Diagrama de Diagrama de Diagrama de Linhas Simples Superfície Simples Linhas em Faixa Superfície em Faixa 1.2.3.2 — Diagrama de Colunas e de Barras ” Diagrama de Colunas/Barras Simples: usado para apresentar variáveis qualitativas ou ordinais. As variações quantitativas da tabela são representadas por colunas dispostas verticalmente ou horizontalmente. É usado para representar qualquer tipo de série. Procedimento — 1) Traçar os eixos Xe Y. 2) Eixo X (categorias da variável em estudo). 3) Construir barras retanguiares. X (variável de estudo: categorias) —— base Y (frequência ou frequência relativa) —» altura OBS: (1) As barras são desenhadas separadamente, de forma a ficar claro que a variável é qualitativa ou ordinal, , (2) Os gráficos de barras podem ser classificados em três tipos: Simples, Superpostas (Remontadas) ou Múltiplas. (3) Os espaços entre cada coluna (ou barra) devem ser iguais entre si, e corresponder a no mínimo 1/3 e no máximo 2/3, da medida da base. Profa. MSc. Gilmara Alves Cavalcanti 16 * Diagrama de Colunas/Barras Superpostas e Múltiplas: usado para comparar o comportamento de duas ou mais variáveis (séries mistas). Legenda: f Í LlCategoria 1 r [Categoria 2 > Categorias Categorias Categorias Diagrama de Diagrama de Diagrama de Colunas Simples Colunas Múltiplas Colunas Superpostas OBS: Os Diagramas de Barras Simples, Múltiplas ou Superpostas obedecem ao mesmo critério, entretanto, os retângulos são construídos no sentido horizontal. 1.2.3.3 — Diagrama de Setores em Círculo (Gráfico de Pizza) É um círculo cuja área se divide em segmentos representativos das partes proporcionais de um todo. É usado para apresentar variáveis qualitativas ou ordinais. Procedimento — 1) “Vraçar uma circunferência (360º). 2) Representar as categorias da variável em estudo. Calcular o valor do ângulo central [ 100% - 360º E» x=(3,6).0% [%- x x : valor do ângulo central; f'%: frequência relativa; 3) Marcar no círculo o valor de x. 1.2.3.4 — Histograma, Polígono de Fregiiências e Ogiva de Galton: são os gráficos representativos da distribuição de frequência em classes. (a) Histagrama Planejamento — 1. Largura (L): L = (espaço da origem - em em) + (nº de classes).(distância da base cada retângulo - em em) 2. Altura (B): H= (0,6).L 3. Medidas Gráficas (MG): 31-MG=H / (maior valor de “*” na tabela) = constante 3.2-MG = constante (Ã , ua £), constante.(f:)......., constante.(f,) altura do primeiro retângulo (em em) altura do segundo retângulo (em cm) .... Profa. MSc. Gilmara Alves Cavalcanti 17 LISTA DE EXERCÍCIOS 1.2.3 1, Construa, de forma adequada, todos os possíveis gráficos para cada uma das tabelas abaixo. (a) Tabela 01. Produção brasileira de trigo, por Unidade da Federação. 1994. Ur Quantidade (1000 t) Sao Paulo 670 Santa Catarina 451 Paraná 550 Goiás 420 Rio de Janeiro 306 Rio Grande do Sul 560 Fonte: Fictícia (b) Tabela 02. Rebanho brasileiro. Espécie Quantidade (1000 cabeças) Bovinos 140.000 Suínos 1181 Bubalinos 5.491 Coelhos 13.200 Fonte: IBGE (c) Tabela 03. Exportações brasileiras de produtos agricolas. 1990 — 1992. Produto | Quantidade (1000 t) 1990 | 1991 | 1992 Feijão | 5.600 | 6.200 | 7.300 Arroz | 8.600 | 9.600 | 10.210 Soja | 4.000 | 5.000 | 6.000 Fonte: Ministério da Agricultura (d) Tabela 04. Situação dos espetáculos cinematográficos. Brasil, 1967. (g) Tabela 07. Taxas municipais de urbanização (em %). Alagoas, 1970. Taxas (%) | Nº de Municípios 6|-16 29 16 |-- 26 24 26 |--36 16 36|.- 46 13 46 |--56 4 56-66 3 66 |-- 76 2 76 |-- 86 2 86 196 1 Total 94 Fonte: Apostila de Estatistica (h) Tabela 08. Estatura (em em) de 40 alunos do colégio B. . Taxas (%) Nº de Alunos 150 |-- 154 4 154 |-- 158 9 158 |-- 162 1i 162 |- 166 8 166 |- 170 5 170 [1174 3 Total . 40 Fonte: Apostila de Estatística (i) Tabela 09. Quantidade de faltas no semestre de 20 alunos do colégio B. Especificação Quantidade “Taxas (%) Nº de Alunos Número de Cinemas 2.438 4 +-3 2 Lotação dos Cinemas 1.722.348 34-5 4 Sessões por Dia 3.933 st-7 8 Filme de Longa Metragem 131.330.488 7|-9 4 Meia Entrada 89.581.234 SH 2 Fonte: IBGE Total 20 (e) Tabela 05. Produção agrícola do Estado A. Brasil, 1995, Produtos Quantidade (ton) Café 400.000 Açúcar 200.000 Milho 100.000 Feijão 20.000 Fonte: Fictícia (£) Tabela 06. Entrada de migrantes em três estados do Brasil. 1992 — 1994, Anos Estado Amapá | São Paulo | Paraná 1992 2291 1.626 609 1993 2.456 1.585 592 1994 2.353 1.389 708 Fonte: Apostila de Estatística () Tabeta 10. Quantidade de chuva caída em Natal, em mm”, 1984-1993 Anos | Quantidade de Chuva 1984 2.102 1985 2.224 1986 2.438 1987 1,478 1988 2.163 1989 1155 1990 1.234 1991 1.359 1992 1.615 1993 852 Fonte: EMPARN Profa. MSc. Gilmara Alves Cavalcanti 19 1.3 - MEDIDAS DE POSIÇÃO (MEDIDAS DE TENDÊNCIA CENTRAL). Os dados quantitativos, apresentados em tabelas e gráficos, constituem a informação básica do problema. Mas é conveniente apresentar medidas que mostrem a informação de maneira resumida. Frequentemente, um conjunto de dados pode se reduzir a uma ou a algumas medidas numéricas que resumem todo o conjunto. Duas características importantes dos dados. que as medidas numéricas podem evidenciar são: o valor central do conjunto e a dispersão dos números. O capítulo a seguir trata das medidas de tendência central. MEDIDAS DE TENDÊNCIA CENTRAL ' São medidas que tendem para o centro da distribuição e têm a capacidade de representá- la como um todo. Dão o valor do ponto em torno do qual os dados se distribuem. As principais são: Média Aritmética, Mediana, Moda e algumas Separatrizes. 1.3.1 — MÉDIA ARITMÉTICA É a mais importante medida de tendência central, pois possui propriodades matemáticas convenientes. A média aritmética pode ser definida em dois tipos: populacional (4) e amostral (X). Nos dois casos existem três situações quanto aos cálculos. 1. Dados apresentados em forma de dados brutos/rol: A média será: | K- 3x "soma de todos os clementos do rol , a número de elementos do rol Exemplo 01: A média minima para aprovação em determinada disciplina é 5,0. Se um estudanie obtém as notas 7,5; 8,0; 3,5; 6,0; 2,5; 2,0; 5,5; 4,0; nos trabalhos mensais da disciplina cm questão, pergunta-se se ele foi ou não aprovado. 2. Dados apresentados em forma de distribuição de frequência simples: — SA A média: | X= Lts) Exemplo 02: Calcular a média do banco de dados 01. n (Unidade IN) e analisar o resultado. 3. Dados apresentados em forma de distribuição de frequência em classes: = PM,.f, Amédia: | X = LEMA) Exemplo 03: Calcular a média do banco de dados 02. n (Unidade IT) e analisar o resultado. Propriedades: 1. Em um conjunto de números pode sempre ser calculada; 2. É única para um dado conjunto de números; 3. É sensível (ou afetada) por todos os valores do conjunto; 4. Somando-se uma constante a cada valor do conjunto, a média ficará aumentada do valor dessa constante. Similarmente se subtrairmos, multiplicarmos ou dividirmos. 5. A soma dos desvios dos números de um conjunto a contar da média é zero; Profa. MSc. Gilmara Alves Cavalcanti 20