


















































Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Encontra documentos específicos para os exames da tua universidade
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Conceitos e Implementações da Estatísca em Ciência Exatas-Ciência da Computação.
Tipologia: Notas de estudo
1 / 58
Esta página não é visível na pré-visualização
Não perca as partes importantes!



















































Não há um conceito elaborado capaz de descrever Estatística em toda a sua abrangência. Entretanto, dentre os vários conceitos existentes, optamos pelo seguinte - Estatística é a ciência que tem por objetivo a permanente pesquisa de técnicas e métodos voltados para aplicação à coleta de dados, à classificação, à apresentação, à análise e à interpretação de dados quantitativos, visando a utilização dos mesmos para a tomada de decisões.
É a parte da Estatística que tem por objetivo estudar os fenômenos estatísticos de mesma natureza, mediante a coleta de dados, a organização, a análise dos dados e a apresentação dos mesmos. A análise compreende, também, o cálculo de algumas medidas (estatísticas) visando permitir ao pesquisador fazer a descrição resumida de um conjunto de dados, de forma a facilitar o entendimento e a compreensão dos mesmos a fim de que as pessoas interessadas possam conhecer o perfil daquele fenômeno na população.
ESTATÍSTICA INDUTIVA OU ESTATÍSTICA INFERENCIAL
É a parte mais complexa da Estatística, pois além da Estatística Básica envolve também o Cálculo de Probabilidades. Ela tem por objetivo fazer a generalização das conclusões para a população como um todo com base no particular (amostra). Essas generalizações são feitas sob uma certa margem pequena de incerteza da validade das mesmas. Essa margem de incerteza pode ser quantificada com o auxílio de técnicas e métodos tratados pela Teoria do Cálculo de Probabilidades.
Fenômeno estatístico é qualquer evento passível de repetição e é resultante de um grande número de causas, total ou parcialmente, desconhecidas.
É o fenômeno cujo perfil não pode ser estudado através de uma observação. Como exemplo podemos citar: a) o nível salarial dos trabalhadores piauienses b) a natalidade piauiense
Esses fenômenos só podem ser conhecidos através de um certo “grande” número de fenômenos individuais.
População é um conjunto de elementos, pessoas, animais, ou objetos animados ou inanimados que possuam pelo menos uma característica em comum, sobre a qual desejamos estudar.
O conjunto de elementos que constituem a população objeto de um estudo estatístico deve ser bem caracterizado e definido, pois todas as análises e conclusões obtidas pelo estudo sobre suas características só serão válidas para essa população. As populações podem ser finitas ou infinitas. Quando se pesquisa uma ou mais características de uma população, tem-se a população de resultados de cada uma dessas características.
É um conjunto de elementos selecionados de uma população mediante critérios técnicos para serem estudados com o objetivo de tirar conclusões válidas para a população como um todo.
É a característica de uma população que pode ser conhecida previamente e que tem valor igual
para todos os elementos da população. Exemplos: a) Idade mínima para tirar o título de eleitor no Brasil b) Número de vereadores de certo município piauiense
É uma grandeza ou atributo associado a cada elemento da população, referente a uma de suas
características. Exemplos: a) número de disciplinas cursadas por aluno da UESPI no período de um ano b) estado civil dos alunos da UESPI
De acordo com a sua natureza, a variável pode ser qualitativa ou quantitativa. Variável qualitativa é a variável cujo resultado é um atributo. O atributo é dicotômico se admitir apenas duas classes e será policotômico, se admitir mais de duas classes. Exemplos: a) Variável SEXO - masculino, feminino - atributo dicotômico b) Variável ESTADO CIVIL: estado civil - solteiro, casado, separado, desquitado, divorciado, viúvo - atributo policotômico.
A variável quantitativa é a variável cujo resultado é um número. As variáveis quantitativas podem ser discretas ou contínuas. Variável discreta é aquela cujos resultados são numeráveis, isto é, só podem assumir valores inteiros. Exemplo: a) Número de disciplinas cursadas por aluno da UESPI no período de um ano b) Número de erros de digitação, por hora de trabalho
Variável contínua é a variável cujos resultados podem assumir qualquer valor real. Exemplos: a) Temperatura ambiente na sala do laboratório de biologia b) Tempo de duração das interrupções no fornecimento de energia elétrica à Universidade Estadual do Piauí – UESPI.
CENSO
Censo é a coleta feita, exaustivamente junto a todos os elementos de uma população, referente a uma ou mais características de uma população.
É uma técnica que consiste em pesquisar apenas parte da população com o objetivo de estudar esses resultados e tirar conclusões que sejam válidas para conhecermos o perfil da característica ou características estudadas na população como um todo.
Coleta periódica - é quando a coleta é feita em períodos regulares e determinados. Exemplo: O
Censo Demográfico. Coleta ocasional - é quando se faz a coleta de dados para atender a uma emergência ou problemas de ordem conjuntural. Exemplos: a) levantamento sobre casos de dengue em Teresina b) pesquisas eleitorais.
Coleta indireta
A coleta indireta, embora menos usual, é feita por inferência a partir dos elementos conseguindo pela coleta direta ou através do conhecimento de outros fenômenos que de alguma forma se relacionam com o fenômeno em questão.
De acordo com a origem os dados coletados podem ser Primários ou Secundários.
Os dados primários são dados coletados pelo próprio pesquisador ou instituição responsável pela sua coleta.
Os dados são secundários quando os dados são obtidos de uma fonte que não é aquela responsável pelo realização do trabalho.
4ª) Crítica e apuração dos dados A crítica consiste em controlar o recebimento dos dados e analisar previamente o correto preenchimento (registro) dos dados. Em seguida faz-se a apuração propriamente dita. Os dados que até então se encontram de forma não organizada e, portanto, não fornecendo informações, devem ser resumidos, sumarizados e condensados em quadros e tabelas pela contagem e agrupamento dos mesmos, possibilitando a sua leitura e a compreensão do comportamento do fenômeno estudado. A apuração pode ser feita de forma manual, mecânica ou por meios eletrônicos que são, habitualmente, os mais comuns..
5ª) Apresentação dos dados A apresentação dos dados consiste na elaboração de tabelas contendo os dados numéricos e a representação gráfica dos mesmos. As tabelas deverão ser elaboradas de forma clara e legível a fim de que os dados possam ser lidos e compreendidos pelos usuários. Para isso é recomendável que a confecção das tabelas obedeça às normas da ABNT. (Associação Brasileira de Normas Técnicas).
DIFERENÇA ENTRE DADOS E INFORMAÇÕES
Pode-se inicialmente dizer que toda informação é necessariamente um dado, entretanto o inverso não é verdadeiro. Existem diversas situações em que os dados estão disponíveis, porém não fornecem nenhum conhecimento imediato do fenômeno em estudo, a menos que sejam trabalhados para produzirem as informações. Ao se fazer uma pesquisa mediante o preenchimento de um formulário para cada elemento da população, o pesquisador disporá de um conjunto de formulários contendo os dados, porém não dispõe de informações, conhecimento sobre a população pesquisada. As informações serão geradas quando o pesquisador fizer a apuração desses dados e o manuseio dos mesmos a fim de produzir o conhecimento sobre o perfil das variáveis estudadas. A esse conhecimento é que se denomina informação.
NOÇÕES BÁSICAS SOBRE AMOSTRAGEM
É uma técnica que consiste em pesquisar apenas parte da população com o objetivo de
estudarmos os seus dados, para conhecermos o perfil da variável ou das variáveis estudadas e fazermos a generalização das conclusões para a população como um todo.
De acordo com as características das populações, elas poderão ser finitas ou infinitas. Neste material serão estudadas somente as populações finitas ou infinitas numeráveis.
A Teoria da Amostragem é um assunto muito amplo e requer um bom nível de conhecimento da natureza da variável ou das variáveis a serem estudadas e requer, também, bom conhecimento do cálculo de probabilidades.
A determinação do tamanho mínimo da amostra é um processo tratado pela teoria da amostragem e é afetado pelo perfil da variável na população e está, também, sujeita a restrições de ordem econômica (custos), tempo, aspectos operacionais, entre outras. Todavia, em diversas situações podemos estar interessados em realizar estudos de uma ou mais variáveis de uma
população e, nem sempre, dispomos de recursos para realizar uma pesquisa, tecnicamente correta. Porém, para isso, podemos arbitrar o tamanho da amostra.
De uma população composta de N elementos, podemos estar interessados em retirar uma amostra de n (arbitrado) elementos. A fim de evitar qualquer parcialidade no processo de seleção dos elementos a fazerem parte da amostra, podemos utilizar algumas técnicas, simples, que descremos a seguir.
A amostra aleatória simples é aquela em que todos os elementos da população têm a mesma probabilidade de fazer parte da amostra. Para isso podemos enumerar todos os elementos da população com os números inteiros a partir de 0 (zero).
Se a população for pequena, podemos escrever o número de cada elemento da população em pedacinhos de papel de mesmo tamanho e colocá-los numa caixa para, depois de bem misturados, fazermos as retiradas de n papéis que nos permitirão identificar os elementos na população. Todavia, independentemente do tamanho da população, podemos fazer uso dos números aleatórios para fazermos o sorteio dos elementos da amostra.
Existem funções que geram números aleatórios entre 0 e 9 e com eles podemos compor uma tabela – Tabela de Números Aleatórios – que devemos utilizar para realizar o sorteio dos elementos no cadastro da população. Suponhamos que, de uma população de 168 elementos, devemos retirar uma amostra de 15 elementos. Nesse caso enumeraremos os elementos da população, de 000 a 167. A seguir utilizamos uma tabela de números aleatórios e arbitramos a coluna e a linha onde começar o sorteio. Como o cadastro vai de 000 a 167, utilizaremos um conjunto de três dígitos para identificar os 15 elementos que deverão fazer parte da amostra. Caso o número seja maior que 167 ele será descartado e faz-se a procura do próximo elemento, seguindo na tabela, o critério de cima para baixo ou vice-versa e, de forma semelhante, da esquerda para a direita, se for esta a opção. Se um mesmo número for sorteado mais de uma vez, desconsidere as repetições, e faz- se o sorteio de um novo número.
Exemplo: Os dados a seguir são referentes aos Coeficientes de Inteligência de um grupo de 168 pessoas e serão considerados como uma população.
E, portanto, a amostra será composta de n 1 = 13 alunos do curso de Ciências Biológicas, n 2 = 18 alunos da Matemática, n 3 = 9 alunos da Física e n^4 = 12 alunos da Química.
Se eles estiverem num cadastro único poderão ser enumerados de 000 a 179, os alunos de Ciências Biológicas; de 180 a 419 os da Matemática; de 420 a 539 os da Física e de 540 a 695 os alunos da Química. De forma semelhante ao exemplo anterior, faz-se o sorteio dos 13 elementos das Ciências Biológicas, na seqüência de 000 a 179; dos 18 elementos da Matemática, na seqüência de 180 a 419; dos 9 elementos da Física, na seqüência de 420 a 539 e os dos 12 elementos da Química na seqüência de 540 a 695. Daí, é só identificar os elementos no cadastro e coletar os dados.
Existem situações em que a população já se encontra cadastrada numericamente, como é o caso das matriculas dos alunos de uma universidade, a numeração das unidades consumidoras da companhia de distribuição de energia, dos prontuários médicos nos arquivos hospitalares, entre outras. Nesses casos o pesquisador poderá optar entre uma amostra aleatória simples ou a amostra sistemática. Se quisermos obter uma amostra de tamanho n de uma população de N elementos, usando a amostragem sistemática o processo consiste nos seguintes passos: Primeiro passo, dividimos: = k, pois de cada grupo de k elementos deverá ser selecionado um elemento da população; segundo passo: consiste em sortear – usando a tabela de números aleatórios – o elemento do primeiro grupo que se encontra numerado de 1 a k. Os demais elementos da amostra serão obtidos, sistematicamente, obtendo a ordem dos elementos no cadastro, mediante a soma da ordem do elemento sorteado acrescido do valor k. Vejamos;
Se tivermos uma população com 1120 elementos enumerados de 0000 a 1119 e dela queremos retirar uma amostra sistemática de 80 elementos, teremos:
Então, utilizando a tabela de números aleatórios, sorteamos o elemento do grupo enumerado de 0000 e 0013. Supondo que o número sorteado seja o 0008, então o segundo elemento será: 0008 + k = 0022; o 3º elemento será 0022+k = 0036 e assim por diante. Portanto, a amostra será composta pelos elementos da população cuja ordem no cadastro é:
8º, 22º, 36º, ...........................................1100º e 1114º
Daí é só identificar os elementos na população e fazer a coleta de dados.
Por outro lado, se desejamos coletar dados de uma amostra dos candidatos que se inscreverão no próximo vestibular, será necessário lançar mão da amostragem sistemática, pois não sabemos, a priori, quantos candidatos comparecerão para fazerem inscrição. Nesse caso, se for arbitrado uma amostra de 10 % dos candidatos, isto implicará que, de cada dez candidatos um deles deverá ser selecionado para a coleta dos dados. Para isso, geralmente, faz-se o sorteio de um dos dez primeiros candidatos - através da tabela de números aleatórios – e os demais serão identificados sistematicamente. Se, por exemplo, o sorteado foi o de nº 7, os demais serão os de ordem 17, 27, 37 e assim por diante até o final das inscrições.
Exemplo : Obter uma amostra de 15 elementos, considerando a população de coeficientes de
inteligência acima relacionada.
Solução: De 168 pessoas serão retiradas 15. Então:
Isto significa que de cada 11 pessoas uma deverá fazer parte da amostra. Arbitrando que o primeiro elemento será identificado mediante o sorteio de um número de 00 a 10. Com o auxílio da tabela de números aleatórios podemos arbitrar, como exemplo, a utilização dos dois primeiros dígitos da esquerda para a direita, a partir da 3ª linha de baixo para cima na primeira coluna da direita.. Logo o elemento inicial será o de ordem 10. Daí, pelo critério acima descrito os elementos da amostra serão os de ordem: 10º, 21º, 32º, 43º, 54º, 65º, 76º, 87º, 98º, 109º, 120º, 131º, 142º, 153º, 164º no cadastro da população. Identificando esses elementos no cadastro, temos:
Representação gráfica de Séries Temporais
Há uma série de tipos de gráficos que podem ser usados para representação dos dados da tabela acima. A escolha do tipo de gráfico é muito importante, pois deverá ser um gráfico que ofereça,
ao leitor, uma fácil comparação visual dos dados e de fácil compreensão pelo leitor. Por essa razão, a escolha do gráfico está intimamente ligada ao nível do público leitor a que se destina o trabalho. Abaixo são apresentados alguns modelos. Veja:
A Série Especificativa, também denominada Série Categórica é a Série formada por um conjunto de dados referentes a uma certa localidade e mesmo período de tempo, observados para diferentes espécies ou categorias de fenômenos. Assim sendo, tem-se: Elementos fixos : Época (fator cronológico) Local (fator geográfico) Elemento variável : Fenômeno (fator especificativo)
Exemplo:
Sendo os gráficos uma forma de comunicação visual dos dados, se torna muito importante que seja feita uma boa escolha do modelo de gráfico a ser utilizado. Os dois gráficos a seguir, embora sejam também modelos muito práticos, eles não oferecem a mesma comparabilidade entre as categorias do fenômeno como a que fica evidenciado no modelo acima.
Já este último modelo embora seja também um modelo interessante, apresenta problemas na hora de identificar as barras a partir da legenda, devido ao grande nº de categorias.
A Série Geográfica - também denominada Série Espacial ou Série de Localização - é a série formada por um conjunto de dados referente a um mesmo fenômeno e mesmo período de tempo, observado em diferentes espaços geográficos. Assim tem-se:
Elementos fixos : Época (fator cronológico) Fenômeno (fator especificativo) Elemento variável : Local (fator espacial)
Vários são os tipos de tabelas e para cada caso é importante que seja feita uma boa escolha
quanto ao tipo de gráfico a ser adotado a fim de que ele possa ser compreendido pelos possíveis usuários da publicação. Vejo o caso a seguir:
Este é um gráfico interessante, porém de maior dificuldade de entendimento pelo público leigo.
Esse é o gráfico de linha e é um modelo interessante para mostrar o comportamento do fenômeno ao longo do tempo.
Este é o gráfico de barras, muito interessante, pois é de fácil compreensão por qualquer leitor.
Os três gráficos acima são exemplos de possíveis alternativas a serem adotadas para ilustrar aquilo que os dados evidenciam. É uma forma de permitir uma comunicação visual quanto ao perfil da variável ou variáveis estudadas. Porém o primeiro deles é de mais difícil entendimento pelo público leigo. NORMAS PARA APRESENTAÇÃO TABULAR
As tabelas contendo as Séries Estatísticas devem ser elaboradas obedecendo as normas elaboradas pela Associação Brasileira de Normas Técnicas - ABNT, editada pela Fundação Instituto Brasileiro de Geografia e Estatística - FIBGE - sob o título - Normas de Apresentação Tabular. Esta publicação abrange as normas orientadoras referentes a apresentação de um trabalho estatístico completo. Entretanto, aqui serão abordados somente alguns pontos, os mais importantes e fundamentais, ficando os demais a critério do estudante. Toda tabela deve ser elaborada com o objetivo de simplificar a leitura e a compreensão dos dados, propiciando ao leitor uma visão global do fenômeno ou fenômenos estudados, sem contudo, trazer prejuízos quanto à precisão, fidedignidade e detalhamentos que possam interessar aos usuários dos dados. Existem vários detalhes a serem observados, contudo, serão abordados somente os elementos essenciais e indispensáveis numa série estatística. São eles:
Título - O título é uma descrição sucinta e precisa do conteúdo da tabela e deve caracterizar o fenômeno e seus detalhes (o que ?), o tempo a que se refere (quando?) e a área geográfica (onde ?). O título deve ser colocado na parte superior da tabela logo acima do cabeçalho.
Cabeçalho - é a parte de uma tabela onde devem ser colocados os indicadores do conteúdo das colunas.
A distribuição de freqüências é um tipo de Série Estatística, pois tem os seus três fatores - tempo, local e espécie do fenômeno - fixos. O fenômeno apesar de fixo, varia na sua grandeza e isso sugere que os dados sejam agrupados em função dessa grandeza. Para isso é necessário que seja definido a subdivisão dessa grandeza, em intervalos menores, a fim de que as observações possam ser agrupadas e assim ser elaborada a tabela - distribuição de freqüências O fenômeno pode referir-se a uma variável discreta ou contínua. Será tratado, em primeiro lugar, o caso em que a variável seja discreta. Quando a variável é discreta as observações podem ser agrupadas em função de seus resultados diretos e isso não oferece dificuldades.
Exemplo :Uma pesquisa foi realizada junto ao universo de 24 Microempresas de um certo município, em 1997, a fim de verificar o número de empregados por empresa. Os resultados foram os seguintes: 3, 0, 2, 4, 5, 4, 3, 2, 1, 1, 3, 2, 4, 0, 1, 2, 3, 4, 2, 3, 0, 1, 3 e. 5. Daí, se forem ordenados os valores, do menor para o maior, tem-se:
Rol: 0, 0, 0, 1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4,5 e 5.
Pode-se ainda, agrupar esses dados numa distribuição de freqüências. Veja:
Esses dados agrupados constituem a denominada distribuição de freqüências sem perda de precisão ou distribuição por ponto. Entretanto , como geralmente acontece, o trabalho estatístico envolve um grande número de observações e sendo o fenômeno referente a uma variável discreta, essa variável pode assumir uma lista muito longa de resultados e, nesse casso, uma tabela de freqüências, elaborada na forma acima, pouco ajudaria na apresentação e na análise dos dados. Assim sendo, as observações podem e devem ser agrupadas por intervalos como ilustrado no exemplo a seguir.
Exemplo : Numa certa Unidade da Federação, em 2008, foi realizada uma pesquisa em um grupo de 120 empresas, selecionadas aleatoriamente, do cadastro geral das empresas, com o objetivo de estudar o número de empregados por Empresa. Os resultados foram coletados, criticados e depois de apurados, deu origem à seguinte Distribuição de freqüências:
Por outro lado, se o fenômeno refere-se a uma variável aleatória contínua, as observações devem ser agrupadas em intervalos seqüenciais, do menor para o maior. Existem alguns
critérios técnicos que podem ser usados como sugestão para que seja definido o número de intervalos (classes) da variável a fim de fazer o agrupamento das observações, isto é, elaborar a distribuição de freqüências. Entretanto, na prática esse número de classes, na maioria das vezes, tem sido arbitrado pelo organizador e apresentador dos dados da forma mais adequada, visando facilitar a caracterização e o entendimento do perfil do fenômeno na população. Exemplo:
Exemplo: Dos alunos de uma Universidade foram selecionados, aleatoriamente, 168 estudantes e estes foram submetidos a um teste para avaliar o Coeficiente de Inteligência (X).. Os resultados foram os seguintes:
O pesquisador deseja analisar esses dados a fim de verificar o perfil dos estudantes daquela Universidade com relação ao Coeficiente de Inteligência. Para isso terá de desenvolver a organização desses dados, de forma a compactá-los em uma tabela, fazer a sua representação gráfica e calcular algumas medidas estatísticas de forma a permitir a visualização do comportamento dos dados e a verdadeira compreensão sobre o perfil dessa variável Coeficiente de Inteligência com base nos dados da amostra, e assim poder fazer a generalização para os alunos de toda a Universidade.
Como primeiro passo pode-se ordenar o ROL. O rol é organização dos dados em ordem crescente ou decrescente. Veja os dados a seguir: Rol:
Como pode ser visto, a ordenação dos dados em escala crescente, ajuda, mas ainda assim não oferece muita facilidade para a análise dos mesmos.
Então, deve-se pensar na elaboração de uma tabela onde as notas dos estudantes serão agrupadas em intervalos denominados, classes****. Essa tabela é denominada Distribuição de Freqüências. O primeiro passo para a sua elaboração consiste em determinar o número de intervalos em que devem ser agrupadas as notas. Essa é uma tarefa que deve ser definida pelo pesquisador em conjunto com os usuários dos dados. Porém, quando não se tem objetivos bem claros pode-se recorrer a alguns critérios técnicos para determinação do número de classes em que serão agrupados.
DETERMINAÇÃO DO NÚMERO DE CLASSES.
Se o pesquisador não tem objetivos bem claros sobre o número de intervalos para a elaboração da Distribuição de Frequências, ele poderá recorrer à Fórmula de Sturges. Por esse critério o total de observações (N: população ou n: amostra) deverá ser agrupado em k classes, onde o valor de k será obtido pela fórmula:
Para a determinação do tamanho dos intervalos de classe é necessário encontrar a amplitude amostral, isto é, a diferença entre o maior valor observado e o menor valor observado, ou seja:
Amplitude Amostral = AA = X (^) max – X (^) mín
Daí, é só dividir a AA pelo valor de k e teremos o valor correspondente a amplitude dos intervalos de classes. Por questão de facilidade dos cálculos e
K = 1 + 3,33. log (N)
Amplitude da distribuição (AT) – é a amplitude do intervalo compreendido entre o limite inferior da primeira classe e o limite superior da última classe.
Intervalo de Classe ( h )- é o comprimento dos intervalos em que foram divididos a amplitude da distribuição.
Número de classes ( k )- é o número de intervalos – classes – em que tenha sido dividido a amplitude total da distribuição.
Freqüência de classe – refere-se as freqüências de cada classe e pode ser a frequência absoluta ou a frequência relativa.
Freqüência absoluta simples ( f (^) i ) – é o número de observações que pertencem a cada classe.
Freqüência relativa simples ( fr (^) i ) – é o percentual de observações que pertencem a cada
classe. Ela é obtida dividindo-se a freqüência absoluta simples de cada classe pelo total das observações e multiplicando-se o resultado por 100.
Ponto médio de classe ( X (^) i ) - é o centro do intervalo de classe e é encontrado somando-se o
limite inferior ao limite superior da mesma classe e dividindo-se o resultado por 2.
Freqüência absoluta acumulada – As freqüências acumuladas podem ser obtidas ‘abaixo de ‘ ou ‘acima de’. As freqüências acumuladas ‘abaixo de’ são obtidas somando-se todas as freqüências a partir da primeira classe até a classe desejada. Dessa forma a freqüência absoluta
acumulada da 4a^ classe será a soma das freqüências absolutas simples da 1^ a, 2^ a, 3^ a^ da 4^ a^ classe, inclusive. Já a freqüência absoluta acumulada ‘acima de’ é a soma das freqüências a partir da classe desejada até a última classe. Assim, a freqüência absoluta acumulada “acima de” para a 3 a^ classe será a soma das freqüências da 3 a, 4a^ , 5a, e assim por diante até a última classe.
Freqüência relativa acumulada – é obtida dividindo- se a freqüência absoluta acumulada de cada classe pelo total das freqüências e multiplicando-se o resultado por
ATh = l= LX (^) sfr s – li – li == (^) i (^) i Fac (^) j = ∑ f (^) i para i =1 até k
A representação gráfica de distribuição de frequências tem por objetivo permitir ao pesquisador a visualização do comportamento dos dados ou seja, o perfil da variável estudada. Para isso podem ser elaborados o Histograma e o Polígono das freqüências simples e o Histograma e a Ogiva das freqüências acumuladas. Veremos a seguir esses gráficos para os dados da tabela a seguir:
A elaboração do histograma consiste na representação gráfica da distribuição de freqüências no sistema de eixos de coordenadas cartesianas. Para isso faz-se a marcação dos intervalos de classes no eixo do X e a seguir desenha-se as colunas de larguras iguais aos intervalos de classe e com alturas proporcionais às freqüências de classe. Quando os intervalos de classes são todos iguais as alturas das colunas poderão ser baseadas tanto nas freqüências absolutas quanto nas freqüências relativas de classe, pois em ambos os casos a configuração gráfica será a mesma.
Veja o histograma a seguir:
Outro forma de representação gráfica de uma distribuição de freqüências é através do polígono de freqüências que consiste em marcar os intervalos de classes no eixo do X e posteriormente marcar os pontos com alturas (ordenadas) iguais aos valores das freqüências de classe, nos pontos correspondentes aos pontos médios de classes. Nesse caso, sempre que a natureza da variável permitir, deverão ser marcadas duas classes de mesma amplitude: uma anterior e uma posterior, de freqüências nulas e então fazer a união dos pontos até tocar o eixo do X conforme pode ser visto no exemplo a seguir.
Ou visualizando os dois modelos num só gráfico, temos:
Facrj =
As medidas de tendência central são a média aritmética, a moda e a mediana. Todas elas são medidas importantes e se complementam na análise de um conjunto de dados. A Média Aritmética é a divisão eqüitativa do valor total da variável pelos elementos de uma população ou amostra. Ela representa a socialização absoluta da variável. Já a Mediana é o valor da variável que divide o grupo de n observações em dois grupos com o mesmo número de elementos, sendo a metade com valores iguais ou menores que a mediana e a outra metade com valores superiores à mediana. Por último, a moda é o valor da variável que mais se repete na série de dados.
Método de obtenção das medidas de tendência Central
Dados não agrupados
Se os dados estiverem na forma x1, x2, x (^) 3, x4, ........... x (^) n , isto é, não estiverem agrupados, tem- se que:
Média aritmética
A média aritmética é obtida fazendo-se a soma de todos os valores observados e dividindo o total pelo número de observações, como segue:
onde n é o nº de observações.
A mediana
O primeiro passo é organizar o Rol. Se o nº de observações for ímpar, a mediana será o valor central do Rol, ou seja, é o valor correspondente ao elemento do Rol, de ordem. Porém, se o
média dos elementos do Rol de ordem e..
A moda
A moda é o valor que aparece com a maior freqüência na série de dados.
Exemplo : Uma amostra de dez empresas foi pesquisada sobre o número de empregados e os resultados foram: 5, 9, 12, 5, 10, 5, 3, 8, 7, 4. Pede-se: a. a média de empregados por empresa b. a mediana c. a moda
Solução:
a) = = = 6,8 empregados por empresa
b) a mediana: Rol : 3, 4, 5, 5, 5, 7, 8, 9, 10, logo, como o nº de elementos n igual a 10 é par, a mediana será a média aritmética dos elementos de ordem e 1, isto é, a mediana é a média do 5º e do 6º elementos do Rol.
Olhando para o Rol vê-se que 5º elemento é 5 e o 6º elemento é 7. Daí :
Md = = 6 empregados
d. a moda é o valor que mais se repete e, portanto é o número 5, ou seja, 5 é o número de empregados observados com a maior freqüência no grupo de empresas pesquisadas.
Dados agrupados
Média aritmética
Se os dados estiverem agrupados numa distribuição de freqüência a média aritmética é obtida como segue: = onde os X (^) i representam os pontos médios das classes A mediana
Com relação à distribuição de freqüência – tabela do exemplo na página 29 – vê-se que, para dividir o grupo de 132 elementos em dois grupos de 66 elementos cada, faz-se necessário contar os elementos a partir do menor limite (li =2) até um número denominado md, tal como ilustrado no esquema gráfico a seguir.
Observando a coluna das freqüências acumuladas – na tabela da página seguinte - vê-se que o total de 66 elementos se completa na classe de 6 ---- 8. E para encontrar o valor da mediana, tem-se que:
Onde: linf – é o limite da classe onde se completa a metade das observações Facant - freqüência acumulada da classe anterior à classe que contém a mediana f (^) md - freqüência da classe que contém a mediana h – amplitude da classe que contém a mediana
A moda.