Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas


Introdução à Estatística: Conceitos Básicos e Aplicações, Notas de aula de Estatística

Planejamento estratégico, Variáveis qualitativas e quantitativas, Métodos tabulares e gráficos, Medidas de Posição, Variabilidade, Associação, Outliers.

Tipologia: Notas de aula

2020

Compartilhado em 29/03/2020

beatriz-e
beatriz-e 🇧🇷

1 documento

1 / 69

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
Notas de Aula de Estatística
Professor Kleison Freitas
2020.1
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45

Pré-visualização parcial do texto

Baixe Introdução à Estatística: Conceitos Básicos e Aplicações e outras Notas de aula em PDF para Estatística, somente na Docsity!

N otas de A ula de E statística

P rofessor Kleison Freitas

I nformações S obre a D isciplina

- Apresentação: Cursando a disciplina de Estatística, o acadêmico poderá utilizar a ferramenta estatística

na tomada de decisões que tangem às funções empresariais ou acadêmicas, através de uma postura crítica e

reflexiva.

- Objetivos

  1. Compreender o uso da estatística na prática acadêmica ou empresarial;
  2. Desenvolver cálculos básicos da estatística e interpretá-los;
  3. Utilizar a objetividade e a probabilidade como uma base nas tomadas de decisões;
  4. Entender o uso e a importância da inferência e da previsão estatística em pesquisas de mercado, de opinião

e em consultorias empresariais.

- Metodologias e Recursos: Utilizar as técnicas estatísticas através de aulas expositivas, práticas em

laboratório de informática com uso do Microsoft Excel e possibilitando o discente na resolução de problemas

em sua área de atuação e formação.

- Sistema de Avaliação: Verificar no Portal da disciplina - Sistema de frequência: O aluno deve ter no mínimo 75% de frequência. Se o aluno tiver acima de 15

faltas estará reprovado por falta, visto que cada aula são três faltas ou três presenças, respectivamente. O

aluno deverá administrar as suas faltas.

B ibliografia R ecomendada

 TRIOLA, M. F. Introdução à Estatística. 11ª Edição. Rio de Janeiro. Livros Técnicos e Científicos, 201 4.

 MORETIN, L. G. Estatística básica: Probabilidade e Inferência. Volume único. São Paulo: Pearson,

 LAPONNI, J.C. Estatística Usando o Excel. 4ª Edição. Editora Campus, 2005.

C alculadoras S ugeridas e O brigatórias

Modelo Casio fx 82 MS ou HP – Modelo: 12C

Modelo Casio fx 82 ES

N ota de A ula 1I ntrodução G eral à E statística

1. ESTATÍSTICA: É uma ciência que utiliza teorias probabilísticas para explicar a frequência da ocorrência

de eventos, tendo como objetivo maior obter, organizar e analisar dados, a fim de estimar a previsão de

fenômenos, conforme o caso estudado.

De forma prática e didática, a estatística se resume na:

A estatística é uma ciência importante, útil e com um escopo abrangente de aplicação em negócios,

administração política física e ciências sociais, dentre outras áreas, quase ilimitado.

Na prática empresarial e industrial, a Estatística é uma ferramenta-chave e segura para entender

sistemas variáveis, controlar processos, sumarizar dados e tomar decisões baseados nos mesmos.

1.1. Aplicações: Algumas ciências utilizam à estatística como uma ferramenta própria, possuindo-a com suas

terminologias próprias, como sendo:

 Estatística Aplicada à Tecnologia da Informação: É um ramo da estatística que trabalha com a mineração

dos dados cadastrados em um banco de dados, a fim de encontrar anomalias ou tendências em séries

qualitativas ou quantitativas;

 Bioestatística: É o planejamento, coleta, avaliação e interpretação de todos os dados obtidos em pesquisa

na área biológica, médica e áreas da saúde em geral;

 Estatística Econômica ou Econometria: É um ramo da estatística direcionado para a análise de fenômenos

econômicos;

 Estatística aplicada à Engenharia: É um ramo da estatística que estuda as suas aplicações no controle de

processos de produtos e serviços, no planejamento de novas estratégias de produção, nas vendas, no controle

de qualidade, em ensaios destrutivos e não destrutivos, com o objetivo de verificar a porcentagem de peças

não conforme as especificações ou a probabilidade de vida de equipamentos ou peças, dentre outras;

 Estatística Física: É o ramo da física que através da estatística analisa sistemas físicos de alta complexidade,

com elevado número de entidades constituintes, como os átomos, as moléculas, os íons, entre outros;

 Estatística Social: É o ramo da estatística que avalia fatores relativos à realidade social, econômica e

ambiental de um país e seu uso para a formulação e a avaliação de políticas públicas;

Coleta de Dados

Tratamento dos Dados

Apresentação dos Resultados

1.3. Variáveis: São as características associadas ao objeto de estudo investigado ou do experimento realizado.

Podendo ser:

Qualitativas ou Categorizadas: São variáveis que exprimem qualidade do elemento investigado.

Podendo ser:

Nominal: Quando o dado se apresenta sob o aspecto qualitativo e não importa a ordem de disposição

delas, ou seja, não há uma hierarquia embutida.

Exemplos: Tipo de espécie de uma planta, Tipo de adubo utilizado, Área da Biologia pretendida, Gênero

de pacientes de um hospital, dentre outros.

Ordinal: Quando há uma hierarquia embutida, ou seja, um grau de relevância de um indivíduo para

outro mediante suas características.

Exemplos: Classe social, Grau de instrução, Desempenho (ótimo, bom, regular, ruim e péssimo), Cargo

dos funcionários na empresa, Grau de dor (forte, moderada ou leve), dentre outros.

Quantitativas ou Numéricas: São atributos resultantes de uma contagem ou mensuração. Podendo ser:

Discreta: São todas as variáveis numéricas cujos valores se obtém a partir de procedimento de

contagem originado de um conjunto amostral finito ou enumerável. As variáveis discretas assumem

valores inteiros. Exemplos: Número de peixes encontrados em um rio, Número de pacientes vacinados

contra uma doença, dentre outros.

Contínua: São variáveis numéricas cujos valores são obtidos por procedimento de mensuração (ou

não enumerável), de sorte que ao menos teoricamente, os resultados das medidas são capazes de

variações insensíveis ou contínuas. As variáveis contínuas podem assumir qualquer valor num intervalo

contínuo e são quantificadas em uma escala infinita de valores, por isso, diz-se que as variáveis contínuas

são muito informativas. Exemplos: Peso, Altura, Temperatura, Espessura, Velocidade, Idade, Renda (em

Reais), dentre outros.

N ota de A ula 2I nferência E statística - A mostragem

1. INTRODUÇÃO:

O profissional, na grande maioria das vezes, trabalha com limitações de tempo, escassez financeira,

de recursos humanos, de produtos, de materiais, dentre outros, impedindo-o de analisar afundo o processo

como um todo, mas de um lado não se faz necessário estudá-lo por inteiro, pois a Estatística defende que

apenas o estudo de uma parcela deste pode atender de forma eficaz às necessidades desejadas.

Desta forma, quando se deseja estudar uma população ( ou universo) específica, o pesquisador tem

duas formas possíveis de fazê-lo, ou de forma censitária, o que exige a observação de todos os elementos que

formam essa população, ou analisar apenas uma parcela que represente este universo, ou seja, uma amostra.

A finalidade da amostragem é permitir fazer suposições, predições, generalizações ( ou inferências)

acerca de características de uma população com base na análise de apenas alguns de seus elementos. Essa

técnica é amplamente utilizada em diversas situações do dia-a-dia das empresas e de vários pesquisadores, de

várias áreas profissionais, pois proporciona economia de recursos, de tempo, rapidez nos resultados e maior

controle. No caso das indústrias, a verificação da qualidade de seus produtos, é um exemplo disto, pois é

impossível analisar todos os produtos fabricados, pois muitos deles após a análise não podem ser mais

comercializados, desta forma, isto implica em prejuízo para a empresa, portanto recorrer a um estudo de

amostragem é o indicado. Outro exemplo, é analisar a opinião de moradores de um determinado bairro de

um município em que analisar todos além de alto custo, é demorado e inacessível a todos.

Desta forma, conhecer e entender os procedimentos básicos aplicáveis à realização de estudos

estatísticos por inferência e por consequência utilizando uma amostra significativa, é uma condição si ne qua

non para qualquer profissional de qualquer área, que queira ter uma segurança e consistência nas tomadas de

decisões. Assim, para se inteirar do assunto, alguns conceitos iniciais são necessários:

2.5. Estimativa: É o valor numérico do estimador obtido com base nos resultados amostrais. Um exemplo

prático de estimativa é a Idade média de uma parte significativa dos alunos de uma sala de aula, ou seja, a

média amostral ( x ), a variância amostral ( S ²), são exemplos de estimadores.

2.6. Margem de Erro ( e): Um estudo em que se optou na utilização da amostragem como método de coleta

de dados, sempre apresentará uma “falha” embutida nas suas análises, visto que não se analisou todo o

universo. Essa “falha” é conhecida como margem de erro ( ou erro amostral), e tem uma relação forte e

inversamente proporcional com o tamanho da amostra e dos resultados que foram obtidos com a pesquisa,

ou seja, quanto maior for a quantidade de elementos pesquisados, menor a quantidade de erros cometidos, ou

seja, menor a margem de erro, mas em contrapartida, maior o custo financeiro da mesma. E vice-versa

quando o tamanho amostral for menor.

Um exemplo prático de margem de erro é visto nas pesquisas eleitorais em que através de uma

amostragem de eleitores um determinado candidato aparece com um percentual de tantos por centos de

aceitação ao pleito, levando-se em consideração a margem de erro tolerável de tantos pontos percentuais para

mais ou para menos, ou seja, ele estará entre x % e y % dentro da margem de erro, isso quer dizer que, se fosse

analisada toda a população de eleitores, existem uma possibilidade de que no dia da eleição o resultado

percentual do candidato fique entre x % e y %.

A margem de erro é definida, na grande maioria das vezes, antes da coleta de dados, para evitar

assim retrabalho aos pesquisadores do estudo, pois caso a margem de erro fique muito alta (acima de 5% para

mais ou para menos), o retrabalho é inevitável ocasionando um custo a mais a quem encomendou a pesquisa,

e isso ocorre, na prática, por falta de planejamento amostral adequado ao estudo almejado.

Assim, para planejar um estudo estatístico com uso de amostragem faz-se necessário conhecer dois

processos básicos de amostragens, as amostras não probabilísticas e as probabilísticas.

3. TÉCNICAS DE AMOSTRAGEM:

3.1. Amostras não probabilísticas:

Uma amostra é não probabilística ( ou não casual ou não aleatória), quando a probabilidade de seleção

de cada unidade amostral da população é desconhecida. Nesse caso, não se podem supor os resultados

obtidos para o universo da população, visto que a amostra, por ser não probabilística é não significativa.

Desta forma, devem ser evitadas, porque além de não conhecer a margem de erro e a confiabilidade,

introduzem tendenciosidade ( ou viés ou vício) na seleção das unidades e estimação das mesmas, ou seja,

distorcendo os dados do estudo para uma determinada direção.

As amostras não probabilísticas mais comuns são:

a) Amostras por Conveniência: As amostras por conveniência ocorrem quando as unidades a serem

analisadas estão mais acessíveis ao pesquisador de acordo com as conveniências sociais, econômicas, de

tempo, dentre outras. É um tipo de amostragem que é vantajosa por ser rápida, de baixo custo e de fácil

acessibilidade, mas não há nada que a credite estatisticamente.

b) Amostras por Cotas: São amostras em que se leva em conta a porcentagem de alguma(s) característica(s)

da população de origem.

c) Amostras por Julgamento ou Intencional: É uma forma de amostragem por conveniência na qual os

elementos populacionais são selecionados com base no julgamento arbitrário do pesquisador, ou seja, o

pesquisador identifica os elementos que corroborarão com o objetivo do seu estudo sem o risco de fugir

deste objetivo pré-definido, ou seja, não há uma escolha aleatória dos elementos pesquisados e sim o

contrário.

d) Amostras de Voluntários: Quando a pesquisa inclui alguns procedimentos perigosos, difíceis ou

dolorosos, desta forma a amostragem de sujeitos voluntários é a mais indicada, pois somente voluntários

estarão dispostos a participar.

O problema deste tipo de amostragem é que ao ser colocado um anúncio em uma rede social, por

exemplo, para recrutar voluntários, só responderão pessoas muito especiais, como por exemplo, pessoas

aventureiras, ou as pessoas mais corajosas ou as mais motivadas. E muita das vezes, este tipo de pessoa, nem

faz parte do público-alvo do estudo.

OBS 1: O n 0 representa a primeira aproximação do tamanho da amostra ( n ) caso não se conheça o N.

OBS 2: Caso conheça o N seja muito grande (tender para o infinito), não é necessário considerar o seu

tamanho exato. Neste caso, o cálculo da primeira aproximação ( n 0 ) já é suficiente para o cálculo.

Exercício 1 – Estudo sobre abertura de um empreendimento: Um empreendedor foi ao SEBRAE

(Serviço Brasileiro de Apoio às Micro e Pequenas Empresas) buscar informações sobre os procedimentos

para abertura de uma nova loja de matérias de construção em um determinado bairro de Fortaleza, Ceará. O

consultor de marketing informou que o primeiro passo seria fazer uma pesquisa de mercado para verificar se o

negócio teria sucesso ou não na região desejada. Assim, o empreendedor conseguiu identificar que no bairro

há 2.35 6 residências. Assim, quantas residências deverão ser pesquisadas para responder aos questionamentos

do empreendedor a fim de que o mesmo tome a decisão de montar ou não o seu empreendimento após a

análise estatística, se for considerado:

a) Uma margem de erro de 4%, com uma confiança de 95%?

b) Se diminuirmos a margem de erro para 2%, qual será o tamanho da amostra ( n ), mantendo a mesma

confiança de 95%?

c) E se pesquisássemos 2000 residências, qual seria a margem de erro, com a confiança de 95%?

Baseado nos itens anteriores:

d) Se para o empreendedor o que importa é o resultado estatístico da pesquisa, qual das alternativas (“ a ”,

b ” e “ c ”) você aconselharia ela a utilizar? Por quê?

e) Se para o empreendedor o que importa é o quanto ela vai pagar pela pesquisa, ou seja, o custo da mesma,

qual das alternativas (“ a ”, “ b ” e “ c ”) você aconselharia ela a utilizar? Por quê?

f) Se para o empreendedor o que importa é o resultado estatístico da pesquisa e ao mesmo tempo com

menor custo , qual das alternativas (“ a ”, “ b ” e “ c ”) você aconselharia ela a utilizar? Por quê?

b) Amostra Aleatória Estratificada (AAE): Muitas vezes a população se divide em subpopulações ( ou

estratos), sendo razoável supor que em cada estrato a variável de interesse analisada apresenta um

comportamento substancialmente diverso, ou seja, a população é considerada heterogênea, mas homogêneo

dentro de cada estrato.

Assim, deve-se adotar um tipo de amostragem que represente bem as diferentes características

dentro de cada um dos grupos, podendo ser, por exemplo, proporcional ao tamanho de cada um deles.

Exercício 2 – Um investidor deseja verificar se em um determinado bairro de Fortaleza vale a pena ou não a

construção e implantação de um restaurante mediante uma aceitação expressiva do público-alvo analisado.

Caso o nível de aceitação a este tipo de empreendimento seja acima de 70% o investidor estudará a

possibilidade de instalação da empresa. Assim, o investidor conseguiu levantar junto com a prefeitura a

quantidade de domicílios no bairro e verificou que é de 2.550. Estes domicílios cadastrados são os que pagam

anualmente o IPTU, onde 1.500 deles são residenciais e 1.050 são comerciais. Assim, com confiança de

96 % , quantos deles serão pesquisados, por categoria, utilizando uma amostra aleatória estratificada , se a

margem de erro for de 3%?

c) Amostra Sistemática (AS): Esse tipo de amostragem é uma variação da amostragem aleatória simples,

mas que exige que um sistema aleatoriamente seja definido.

Segue abaixo outros tipos de exemplos de amostras sistemáticas:

Exemplo 1 : Um engenheiro de controle da qualidade seleciona cada centésima fonte de computador que passa

em uma esteira transportadora.

Exemplo 2 : Um professor retira da população para compor a amostra os alunos aleatoriamente escolhidos que

possuem o algarismo “0” como último número da sua matrícula.

d) Amostra por Conglomerado: Primeiramente, na amostra por conglomerado, a população-alvo é dividida

em estratos mutuamente exclusivos e coletivamente exaustivos. Após isso, reduz-se, arbitrariamente, a

quantidade de estratos a serem analisados. Após isso, sorteiam-se quais grupos serão pesquisados e por fim,

define-se qual o tipo de amostra probabilística deverá ser utilizada (AAS, AAE ou AS). Podendo também, se

assim o pesquisador desejar, utilizar o censo nos grupos selecionados para coleta de dados. Com isso, a

amostragem por conglomerado tem duas grandes vantagens: a viabilidade e o baixo custo, ou seja, a que traz

o menor custo-benefício, se comparado às outras técnicas probabilísticas disponíveis.

2.1. Média Aritmética Simples: É definida como sendo o quociente da soma de todos os valores de um

conjunto de dados pelo total de valores deste conjunto.

Média amostral Média populacional

n

x

X

n

i

i  ^1 N

x

N

i

i   ^1 , Onde

x i = Valores da variável

n = Número de valores da amostra

N = Número de valores da população

OBS 1 : A média por ser influenciada por todos os valores do conjunto de dados é considerada como uma

medida sensível, ao contrário das outras medidas de tendência central existentes.

Propriedades:

a) A média de um grupo de dados sempre será única, independente da sua localização;

b) O resultado de multiplicar a média pela quantidade “ n ” de valores da variável x é igual a soma dos “ n

valores da variável;

c) A soma algébrica dos desvios tomados em relação à média é sempre nula: 

n

i

xi X 1

d) Somando-se ou subtraindo-se uma constante “ c ” (valor invariável) a todos os valores de uma variável, a

média do conjunto ficará aumentada ou diminuída dessa constante, respectivamente, de forma análoga, se

multiplicar ou dividir, a média ficará multiplicada ou dividida, respectivamente.

 

n

x c

X

n

i

i

1 e

 

n

x c

X

n

i

i  

1

e n

c

x

X

n

i

i  

1

Falando ainda de média, há a média aparada, que não é tão utilizada na prática estatística pois a

mesma tende a manipular o resultado final desta medida de tendência central, mas vale a pena conhecer o que

é este tipo de medida como segue no próximo tópico.

2.1.1. Média Aparada: Uma média aparada é calculada aparando-se certa porcentagem dos maiores ou

menores valores do conjunto de dados. Por exemplo, para calcular a média aparada de 10%, deve-se eliminar

10% dos valores maiores e 10% dos valores menores, e então calcular a média dos valores que sobraram.

Podendo-se usar de forma arbitrária a porcentagem a ser retirada da amostra para um novo cálculo. Ao

contrário da média aritmética, a média aparada é uma medida resistente, pois não sofre influência dos valores

extremos.

A segunda medida de tendência central a analisar é a moda, como segue no próximo tópico.

2.2. Moda ( Mo): Na linguagem coloquial, moda é algo que está em evidência, ou seja, algo que se vê

bastante. Na Estatística, como o próprio nome sugere, a Moda é aquele elemento que mais vezes aparece no

conjunto de dados. Não é muito sensato dizer que a moda é uma medida de tendência central, pois nem

sempre ela representa o centro do conjunto de dados, visto que ela identifica o(s) valor(es) que ocorre(m)

com maior frequência, podendo ser único, se existir, como pode também não existir. Nesse caso, é mais

correto chamá-la de medida de posição.

Quando dois valores ocorrem com a mesma frequência máxima, cada um deles é uma moda.

Das diferentes medidas de tendência central, a moda é a única medida que pode ser usada com

dados em nível nominal de mensuração, conforme o exemplo 1:

Exemplo 1: Um estudo sobre tempos de reação de pessoas em um teste foi composto por 30 canhotos, 50

destros e 20 ambidestros. Embora não possamos tomar a média numérica dessas características, podemos

afirmar que a moda é destro, que é a característica com maior frequência.

Quando no conjunto há apenas um valor que se repete além dos demais de forma máxima, chama-

se este conjunto de unimodal, bem como se tiver dois valores que se repete além dos demais, de forma

máxima e na mesma quantidade é bimodal, assim acima de 2 modas é multimodal. Se o conjunto de dados

não tiver nenhum valor que se repete além dos demais de forma máxima, o conjunto de dados é amodal.

OBS 2 : Se o conjunto de dados tiver os valores: 1, 1, 2, 2, 3, 3, o conjunto é multimodal, pois todos os valores

se repetem 2 vezes, ou seja, a frequência é a mesma para todos. Agora se for: 1, 2, 3, 4, é amodal, pois não há

repetição de valores.

E se for: 10, 10, 10, 10 é unimodal, pois o valor 10 é o que ocorre com maior frequencia.

A terceira medida de tendência central a ser analisada é a mediana. Muitos confundem a mediana

com a média, mas são medidas completamente diferente, tanto na sua forma de encontrar quanto na sua

interpretação, como segue no próximo tópico.

sim alguns ou nenhum dos valores (amodal), apresentado resultados “distorcidos” da realidade dos dados

apresentados.

Quando se descreve os dados, além das medidas de tendência central, é necessário analisar a

variabilidade dos dados, pois através destas pode-se tirar algumas conclusões mais consistentes na tomada de

decisão. Assim, o próximo item mostrar as medidas de variabilidades mais utilizadas no campo estatístico.

3. MEDIDAS DE DISPERSÃO:

Ao se fazer a descrição dos dados, além de verificar o centro da distribuição deles através das

medidas de tendência central é prescindível verificar também se os dados se comportam de forma

homogênea ou heterogênea, e isso será possível através das medidas de dispersão.

Essa verificação é importante, pois através delas podem-se tomar decisões mais consistentes e

eficazes. Um exemplo disso eram que os bancos, há uns anos atrás, costumavam exigir que os clientes

formassem filas separados para os diversos guinches, mas atualmente passaram adotar a fila única. O motivo

dessa modificação foi que o tempo médio de espera era o mesmo para ambos os formatos de filas, não

afetando a eficiência dos caixas, mas a adoção de fila única ocorreu ao fato de os clientes preferirem tempos

de espera com menor variação. Assim, é que milhares de bancos efetuaram essa modificação que resultou em

uma variação menor (e clientes mais satisfeitos), mesmo que a média de tempo de atendimento não tenha

sido afetada.

Com isso, pode-se concluir que as medidas de dispersão avaliam a variabilidade dos dados com

relação à sua média. As medidas de dispersão mais usadas são a amplitude total, variância, desvio padrão e

coeficiente de variação.

3. 1. Variância ( S²):

A variância é uma medida de dispersão que mensura a variabilidade dos dados, através da soma do

quadrado dos desvios pela quantidade de valores da variável menos um ( n - 1) no caso amostral, e por N se for

populacional.

Pela propriedade “ b ” da média aritmética, verifica-se que a soma dos desvios será sempre zero,

fazendo com que o pesquisador suponha que não há desvio (ou variabilidade) no conjunto de dados

analisado, mas se todos os valores não forem iguais, haverá variabilidade sim, mas mesmo assim sempre

somando os desvios o resultado será zero. Nesse caso, para que esse problema seja contornando, eleva-se os

desvios ao quadrado, ocasionando a não anulação dos mesmos.

Com isso, a notação matemática da variância é:

Variância amostral Variância populacional

 

1

2

2

 

n

x X

S

n

i

i ^ 

N

x

n

i

i

2

2

 , onde

x i = Valores da variável x i = Valores da variável

X = Média aritmética simples μ = Média populacional

n = Número de valores da amostra N = Número de valores da população

Propriedades:

a) A variância de uma constante “ c ” é igual a zero;

b) Ao somar ou subtrair uma mesma constante “ c ” a todos os valores do conjunto de dados, a variância não

ficará alterada;

c) Se multiplicar ou dividir cada valor do conjunto de dados por uma mesma constante “ c ”, a variância ficará

multiplicada ou dividida, respectivamente, pela constante ao quadrado ( c ²).

Mas, mesmo elevando os desvios ao quadrado, surge o seguinte questionamento: E se ao invés de

elevar cada desvio ao quadrado e depois somar, não seria melhor utilizar o módulo, em que os desvios

resultam em valores absolutos e depois utilizar a soma deles? Ou seja, assim:

n

i

xi X 1

? E após isso, dividir

tudo pela quantidade de valores ( n ), obtendo aí o desvio médio dado pela seguinte notação

n

x X

DM

n

i

i

A resposta para essa pergunta é não, pois o módulo fará com que os desvios negativos fiquem

positivos, apresentando uma realidade distorcida dos dados.

Ao elevar ao quadrado, todos os desvios são elevados ao quadrado e não somente alguns, portanto,

o melhor a ser utilizado é a variância porque ela dá certeza absoluta que as amostras são diferentes. Já o

módulo não dá essa informação de variabilidade, ao contrário, ele nos dá evidências de que as amostras são

iguais. Por exemplo: Suponha que uma turma fez uma prova e a média desta foi 7,0, e um aluno tirou 8,0, ou

seja, a dispersão foi de 1 ponto para mais (8 - 7 = 1 ponto). Se outro aluno tirar 6,0, a dispersão é 1 ponto

para menos (6 – 7 = - 1 ponto). Se usar o módulo, a dispersão ao invés de ser - 1 e 1, será 1 e 1, mostrando

que não há dispersão das notas dos dois alunos, ou seja, ao invés de um aluno ter tirado a nota 6 e o outro a

nota 8, ambos tiraram a nota 8, pois o desvio com o uso do módulo foi 1 ponto para mais.

Mas mesmo a variância sendo considerada a ideal para tomar decisões sobre a variabilidade dos

dados, a mesma apresenta um grande problema com unidade de medida dos dados que a compõem, pois

estes serão elevados ao quadrado, dificultando assim a sua interpretação, pois se a unidade de medida for em

metro, será metro quadrado, se for em centímetro, ficará centímetro ao quadrado e assim por diante.