




























































































Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Encontra documentos específicos para os exames da tua universidade
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Excelente apostila de Estatistica
Tipologia: Notas de estudo
1 / 109
Esta página não é visível na pré-visualização
Não perca as partes importantes!





























































































Módulo 1 Conceitos Iniciais: a) População ou Universo – É o Conjunto dos Elementos de um grupo de objetos que tem características comuns. Exemplos: O Conjunto formado pelos alunos de uma classe; O Conjunto formado pelos clientes de um banco; O Conjunto formado pelas peças fabricadas por uma determinada máquina.
b) Amostra – É um Subconjunto de uma População. Exemplos: Uma Amostra contendo 7 alunos de uma classe que contém 20 alunos; Uma Amostra contendo 100 clientes de um determinado banco; Uma amostra contendo 10 peças de um lote contendo 200 peças. Via de regra, o número de elementos da Amostra é muito menor do que o número de elementos da População. Com isso, o estudo das propriedades da População é facilitado, pois se manipula com um número reduzido de dados.
c) Dados Brutos – De acordo com Spiegel [1] dados brutos são aqueles que ainda não foram numericamente organizados. Exemplo: O rendimento de cada um dos 10 clientes de uma agencia bancária que estavam aguardando numa fila é respectivamente: $500, $540, $830, $600, $710, $680, $780, $640, $800, $860. Os Dados Brutos são apresentados na mesma seqüência que foram coletados não apresentando nenhuma organização.
d) Rol – Um Rol é um arranjo feito a partir dos dados brutos de tal sorte que seus elementos sejam postos ou em ordem crescente ou decrescente. Exemplo: Para os Dados Brutos do exemplo anterior, o Rol em ordem crescente seria: $500, $540, $600, $640, $680, $710, $780, $800, $830, $860.
e) Tamanho da População e Tamanho da Amostra − O tamanho da população é dado pelo número de elementos que a compõem; o mesmo valendo para o tamanho da amostra. De uma forma geral, o tamanho da amostra é representado por n e o da população por N. No nosso exemplo n =10 e N é desconhecido, porém, espera-se que seja muito maior do que n.
Módulo 2 Medidas de Tendência Central É muito comum selecionar ou eleger um ou mais elementos que melhor representam uma população ou uma amostra. Para se escolher o elemento ou elementos mais representativos de uma população ou de uma amostra pode-se recorrer a diversos critérios.Os mais adotados são a Média Aritmética, a Moda, a Mediana, etc.
a) Média Aritmética – A Média Aritmética ou simplesmente a Média entre n valores é por definição a soma desses
Exemplo:
$500, $540, $830, $600, $710, $680, $780, $640, $800, $860 é
Então, se o critério da Média for adotado, pode-se afirmar que o número 694 é o que melhor representa o conjunto de valores dados. Note que a Média não pertence necessariamente ao conjunto que lhe deu origem. Note que no exemplo dado, $694 não é um elemento do conjunto abaixo: {$500, $540, $830, $600, $710, $680, $780, $640, $800, $860.}
=
n
i
1
E a média populacional μ de N valores x 1 ,x 2 ,x 3 ,...xN , por:
=
N
i
1
μ
b) Moda – A Moda de uma população ou de uma amostra é dada por aquele (ou aqueles elementos) que aparece com maior freqüência. Exemplos: Dado o conjunto {1, 2, 3, 3, 4, 4, 7, 7, 7, 9}, a moda será: Moda = 7 Note que a Moda é 7, uma vez que este valor aparece três vezes ou seja é o elemento que ocorre com maior freqüência.
Dado o conjunto {1, 2, 3, 3, 4, 4, 7, 7, 9}, note que ele possui três Modas: Moda = 3, 4 e 7. São três Modas, pois os valores 3, 4 e 7 aparecem duas vezes no conjunto e os demais aparecem somente uma única vez, portanto 3, 4 e 7 são os elementos que aparecem com maior freqüência.
Dado o conjunto {1, 2, 3, 5, 7, 9, 11,13}, note que ele não possui Moda pois todos os elementos aparecem com igual freqüência. Diz-se neste caso que o conjunto é Amodal (não apresenta moda). Deve ficar claro que diferentemente da Média, a Moda será obrigatoriamente um elemento do conjunto.
Módulo 3 Medidas de Dispersão Os elementos de um conjunto podem estar Dispersos ou Aglomerados como mostra a figura abaixo:
Para se avaliar o grau de Aglomeração ou de Dispersão de um conjunto dados EM RELAÇÃO À MÉDIA, lança- se mão das Medidas de Dispersão. As principais Medidas de Dispersão EM RELAÇÃO À MÉDIA são a Amplitude, a Variância e o Desvio Padrão.
a) Amplitude – É a diferença entre o maior e o menor elemento do Rol. Exemplo: Sejam os seguintes dados brutos: $500, $540, $830, $600, $710, $680, $780, $640, $800, $860. O Rol apresentado em ordem crescente é: $500, $540, $600, $640, $680, $710, $780, $800, $830, $860. O menor elemento do Rol é 500 e o maior, 860. Logo a amplitude será: Amplitude = 860 – 500 = $
definição, a média aritmética dos quadrados das diferenças de cada um dos dados em relação a sua média, isto é:
N
1
Não é difícil demonstrar que a Variância Populacional é dada por:
2 1
=
N
i
Já a Variância Amostral é geralmente representada por S^2 e dada por:
n
1
Ou alternativamente,
2 1
n
i
= Exemplo: Suponha que se deseje determinar a Dispersão Amostral em torno da Média dos 10 dados brutos abaixo através da Variância: $500, $540, $830, $600, $710, $680, $780, $640, $800, $860.
Observe que a variância poderia ser calculada de forma mais direta através de:
Note que a unidade da Variância do exemplo anterior é $^2 (Unidade Monetária ao Quadrado) que é de difícil interpretação. Para contornar este inconveniente costuma-se utilizar a raiz quadrada da Variância para medir a dispersão em trono da média.
c) Desvio Padrão – Segundo Kazmier[2], ... é difícil interpretar o significado do valor da variância porque as unidades nas quais tal valor é expresso não são as mesmas do que as das observações do conjunto de dados. Por
que se utiliza com mais freqüência...”
O Desvio Padrão Populacional é dado por σ = σ^2 E o amostral por
Para o exemplo anterior o Desvio Padrão S será:
Note que a unidade do Desvio Padrão é a mesma dos dados fornecidos no exemplo, ou seja, $ (Unidades Monetárias).
d) Coeficiente de Variação – Como mencionado inúmeras vezes neste módulo, as medidas de dispersão servem para medir a distribuição dos elementos de um conjunto em torno da média. Agora surge a seguinte questão:
Qual dessas amostras tem dados mais dispersos? Por exemplo: Um conjunto composto por 18 corpos de prova de um determinado aço apresenta limite de escoamento médio de 433.67 MPa com desvio 19.37 MPa. Um outro, composto por 30 corpos de prova possui limite de escoamento médio de 425.67 MPa e desvio de 15.69 MPa. Pergunta-se qual desses conjuntos é a mais disperso? Para responder a esse tipo de pergunta é que se criou um índice denominado Coeficiente de Variação ( CV ) que permite comparar os desvios de conjuntos de dados diferentes. Por definição, o Coeficiente de Variação de um conjunto é a razão entre o Desvio Padrão e a Média aritmética desse conjunto: Para comparar as dispersões de duas populações pode-se recorrer a seguinte expressão:
μ
σ
E para se comparar as dispersões de duas amostras recorre-se a:
Então, para o exemplo citado anteriormente, tem-se: 1 a^ Conjunto:
2 a^ Conjunto:
Portanto, o primeiro é mais disperso do que o segundo, pois apresenta um Coeficiente de Variação maior.
Módulo 4 Histogramas e Freqüências Os dados coletados geralmente são apresentados de forma bruta em tabelas ( dados brutos ) e, desta forma, fica difícil tirar conclusões a partir dos mesmos. O exemplo citado por Shamblinl[3] mostra esse problema: Um gerente de uma loja fez um levantamento diário das vendas de um determinado produto e pôs esses dados numa tabela. Tabela de Dados Brutos dia Quantidade vendida
dia Quantidade vendida
dia Quantidade vendida. 01 26 11 24 21 30 02 28 12 24 22 29 03 24 13 26 23 24 04 25 14 27 24 27 05 25 15 27 25 25 06 29 16 25 26 26 07 23 17 28 27 24 08 26 18 26 28 25 09 26 19 22 29 26 10 27 20 28 30 23
Do jeito que está, a obtenção de informações como a distribuição de freqüência a partir da tabela anterior, se torna uma tarefa muito difícil. Para tornar mais claras informações contidas nas tabelas de dados brutos, costuma-se primeiramente preparar um Rol a partir desses dados: Rol 22 23 23 24 24 24 24 24 25 25 25 25 25 26 26 26 26 26 26 26 27 27 27 27 28 28 28 29 29 30
a) Tabela de Distribuição de Freqüências – A partir do Rol, pode-se dispor os elementos numa Tabela de Distribuição de Freqüências onde os dados são apresentados juntamente com o número de vezes que os mesmos aparecem: Identificador i
Numero de vendas por dia xi
Freqüência f(xi ) 1 22 1 2 23 2 3 24 5 4 25 5 5 26 7 6 27 4 7 28 3 8 29 2 9 30 1
b) Histograma – Uma outra forma muito utilizada na apresentação dos dados é através de Diagramas de Barras ou Histogramas. Histograma
c) Freqüência Relativa – Os dados também podem estar associados a suas Freqüências Relativas: Por definição, a Freqüência Relativa de um dado é a razão entre a freqüência do dado e a soma total das freqüências. Num Histograma com N elementos existirão N freqüências f(xi ). Por exemplo, no problema do gerente da loja, tem-se: f(x 1 ) = 1, f(x 2 ) = 2, f(x 3 ) = 5, etc. Se a soma dessas freqüências for representada por sf , então, sf = f(x 1 ) + f(x 2 ) + ...+ f(x n ) Portanto as freqüências relativas serão:
Ou ainda,
Então para o exemplo da loja, tem-se: Identificador I
Numero de vendas por dia xi
Freqüência f(xi )
Freqüência Relativa fr(xi ) 1 22 1 1/ 2 23 2 2/ 3 24 5 5/ 4 25 5 5/ 5 26 7 7/ 6 27 4 4/ 7 28 3 3/ 8 29 2 2/ 9 30 1 1/
As freqüências relativas muitas vezes podem ser interpretadas como as probabilidades das ocorrências. Essa interpretação será válida desde que os fatos ocorridos no passado possam predizer o que provavelmente vá ocorrer no futuro. Por exemplo, a freqüência do dado 25 é 5/30, portanto, se dados passados puderem ser usados para estimar comportamentos futuros, então, a probabilidade p de se vender 25 automóveis num determinado dia será de 5/30. Em outras palavras, quando x 4 = 25, fr(x 4 ) = 5/30 ou seja p(x 4 ) = 5/30.
É também muito comum se apresentar os histogramas de freqüências acumuladas em termos percentuais ou relativos como mostra a figura adiante:
Num histograma como esse se pode responder perguntas do tipo: Qual a percentagem de dias onde se vendemos 23 ou menos automóveis? Vê-se que pelo histograma esse percentual é de 10% (3 /30).
Variância – Sabe-se que a Variância de um conjunto de dados pode ser determinada a partir da seguinte expressão:
N
1
Porém, pode ocorrer que muitos dos elementos do conjunto apareçam mais de uma vez, como pode ser visto pela seguinte tabela: Identificador i
Numero de vendas por dia xi
Freqüência f(xi ) 1 22 1 2 23 2 3 24 5 4 25 5 5 26 7 6 27 4 7 28 3 8 29 2 9 30 1
Nestes casos fica muito mais fácil recorrer a das seguintes expressões para se calcular a variância:
=
k
i
1
Na tabela anterior, tem-se N = 30 e k = 9. Para facilitar o cálculo da Variância a partir de uma tabela de freqüência relativa, costuma-se passar N para dentro do somatório.
k i
1
Mas note que a razão entre f(xi ) e N é nada mais nada menos do que a Freqüência Relativa fr(xi ). Isto é:
Portanto, a expressão anterior poderá ser escrita da seguinte maneira:
=
k
i
1
Nos casos que for válido escrever p(xi ) = fr(xi ) , a expressão anterior se torna:
=
k
i
1
Demonstra-se que,
2 1
=
k
i
Seguindo os mesmos passos podemos demonstrar que a média μ pode também ser expressa por:
=
k
i
1
Observação : Quando o Tamanho da População N é muito grande, costuma-se colher amostras de Tamanho n (N >>n) para se estimar a Média e a Variância da População. Para se fazer a distinção entre as Estatísticas da Amostra e as Estatísticas da População, reitera-se que será adotada a seguinte notação:
População Amostra Tamanho N n
Estimativa
adotar:
da Variância Amostral de acordo com uma das seguintes expressões:
2 2
Onde n é o Tamanho da Amostra e a Variância Amostral é dada por:
=
n
i
1
=
n
i
1
2 1
=
n
i
e no caso de k dados repetidos, a Variância Amostral poderá ser opcionalmente calculada através de:
=
k
i
1
2 1
=
k
i
de uma das seguintes expressões:
Módulo 5 Classes O que será feito neste módulo é praticamente igual ao que foi feito no módulo anterior (Histogramas e Freqüências). A única diferença é que ao invés de se trabalhar com os dados isoladamente, trabalhar-se-á com classes de dados. Tendo coletado uma grande quantidade de dados brutos e preparado o Rol, costuma-se separar esses dados em intervalos denominados Intervalos de Classe e montar o que se convencionou chamar de Tabela de Distribuição de Freqüências por Classes. Por exemplo, suponha que foi feito um levantamento das idades de 50 funcionários de uma empresa, obtendo-se o seguinte resultado: Dados Brutos:
31,48,34,33,35,45,55,44,32,28,44,45,30,46,60,61,40,52,32,44,44,54,48,55,40, 65,26,40,60,53,18,20,53,28,40,20,30,20,59,60,37,38,49,30,40,40,47,44,47,44.
Para se montar uma Tabela de Distribuição de Freqüência por Classes, recomenda-se seguir os seguintes passos:
Construir o Rol: 18,20,20,20,26,28,28,30,30,30,31,32,32,33,34,35,37,38,40,40,40,40,40,40,44, 44,44,44,44,44,45,45,46,47,47,48,48,49,52,53,53,54,55,55,59,60,60,60,61,65.
Montar uma Tabela de Distribuição de Freqüências: Tabela de Freqüências, Freqüências Acumuladas e Freqüências Relativas. Dado Freqüência Freqüência Acumulada
Freqüência Relativa
Freqüência Relativa Acumulada 1 18 1 1 1/50 1/ 2 20 3 4 3/50 4/ 3 26 1 5 1/50 5/ 4 28 2 7 2/50 7/ 5 30 3 10 3/50 10/ 6 31 1 11 1/50 11/ 7 32 2 13 2/50 13/ 8 33 1 14 1/50 14/ 9 34 1 15 1/50 15/ 10 35 1 16 1/50 16/ 11 37 1 17 1/50 17/ 12 38 1 18 1/50 18/ 13 40 6 24 6/50 24/ 14 44 6 30 6/50 30/ 15 45 2 32 2/50 32/ 16 46 1 33 1/50 33/ 17 47 2 35 2/50 35/ 18 48 2 37 2/50 37/ 19 49 1 38 1/50 38/ 20 52 1 39 1/50 39/ 21 53 2 41 2/50 41/ 22 54 1 42 1/50 42/ 23 55 2 44 2/50 44/ 24 59 1 45 1/50 45/ 25 60 3 48 3/50 48/ 26 61 1 49 1/50 49/ 27 65 1 50 1/50 50/
É importante notar que dos 50 dados coletadas alguns se repetem, portanto basta trabalhar com 27 deles como mostra a tabela anterior. Mediana : 44 Moda(s) : 40 e 44 Média : 41.76 Amplitude : 47. Variância : 137.78 Desvio Padrão: 11.
Será adotado um número de classe nc = 7
Tamanho do Intervalo de Classe O Tamanho do Intervalo de Classe, designado por h , é dado por: h = Amplitude ÷ nc No presente caso, h = 47 ÷ 7 h = 6. h = 7.
Montar a Tabela de Distribuição de Freqüência por Classes Tabela de Distribuição de Freqüência. Classe Intervalo das Classes
Média do Intervalo
Freqüência Freqüência Acumulada
Freqüência Relativa
Freqüência Relativa Acumulada (^1 18) |–– 25 21.5 4 4 4/50 4/ (^2 25) |–– 32 28.5 7 11 7/50 11/ (^3 32) |–– 39 35.5 7 18 7/50 18/ (^4 39) |–– 46 42.5 14 32 14/50 32/ (^5 46) |–– 53 49.5 7 39 7/50 39/ (^6 53) |–– 60 56.5 6 45 6/50 45/ (^7 60) |–– 67 63.5 5 50 5/50 50/ Totais 50 1
Histograma de Distribuição de Freqüências Acumuladas:
Histograma de Distribuição de Freqüências Acumuladas Relativas:
Módulo 6 Análise Combinatória O estudo das Probabilidades e das Distribuições de Probabilidade fica facilitado quando se aplicam os conceitos e expressões tais como Arranjos, Permutações e Combinações. Por isso, uma breve revisão desses termos será apresentada neste módulo. Arranjo Simples – Um Arranjo é uma Imagem de uma aplicação Injetora. Exemplo:
Como Arranjo é sinônimo de Imagem de uma Aplicação Injetora, então um Arranjo de uma aplicação injetora entre os conjuntos A e B será { 3, 6, 9 }.
Número ou Quantidade de Arranjos – A quantidade de Arranjos é igual ao número de aplicações injetoras que se pode formar entre dois conjuntos. Exemplo Quantos Arranjos (Aplicações Injetoras) pode-se formar com os elementos dos conjuntos A e B abaixo?
Note que o conjunto A possui p = 3 elementos e o conjunto B , n = 5 elementos. Pode-se demonstrar que o número de arranjos procurados é dado por:
5 , 3
Em termos gerais pode-se dizer que o Número de Arranjos que se pode formar com n elementos p a p é dado por:
,
Exemplo: Um dado conjunto A possui 8 elementos ao passo que um outro designado por B possui 12 elementos. Quantos Arranjos (Aplicações Injetoras) se pode formar entre A e B? Solução: n = 12; p = 8
12 , 8
Em Probabilidade, a fórmula do Binômio de Newton é muito utilizada na demonstração de expressões importantes, principalmente naquelas referentes às Distribuições de probabilidade. Em breve, o conceito de distribuição de probabilidade será apresentado e que em algumas delas aparecem termos do tipo ( p+q)n , onde p e q são quantidades a serem oportunamente definidas. Então é lícito escrever:
n n r r
− ( + ) =( + ) =∑= 0
Módulo 7 Probabilidade Convém que antes de se apresentar uma definição formal de Probabilidade que se discuta alguns conceitos básicos, tais como: 1)Fenômeno Aleatório – Também denominado Experimento Aleatório , é qualquer fenômeno cujo resultado é completamente imprevisível, ou seja, é não determinístico. Lopes [5] afirma que os experimentos aleatórios podem gerar diferentes resultados mesmo que repetido sob as mesmas condições. Neste trabalho, os Experimentos Aleatórios serão representados pela letra grega ε. Por exemplo:
2) Espaço Amostral – É o conjunto formado por todos os resultados possíveis de um experimento aleatório. Este conjunto pode ser vazio, finito ou infinito. A maioria das publicações que tratam deste assunto costuma representar o Espaço Amostral pela letra S e os elementos de S por s. Por exemplo, o Espaço Amostral S dos Experimentos Aleatórios ε :
3) Evento – Um Evento é qualquer subconjunto do Espaço Amostral. Geralmente os Eventos são representados por letras maiúsculas, normalmente A, B, E , etc. Por exemplo, seja o Espaço Amostral de todos os resultados possíveis do lançamento de um dado não viciado: S = {1,2,3,4,5,6}. Associado ao referido espaço amostral pode-se citar como Evento os seguintes Subconjuntos:
Enfoque Clássico: Segundo Kazmier[2], ...se existem “a” de resultados possíveis favoráveis à ocorrência de um evento “A” e” “b” resultados possíveis não favoráveis à ocorrência de “A” e sendo todos os resultados igualmente verossímeis e mutuamente exclusivos ( não podem ocorrer simultaneamente ), então a Probabilidade de “A” ocorrer é: “
Exercícios: