








































































Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Encontra documentos específicos para os exames da tua universidade
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Apostila de probabilidade e estatística elaborada pelos professores Alexsandro Cavalcanti, Amanda dos Santos e Rosângela Silveira do DEPARTAMENTO DE MATEMÁTICA E ESTATÍSTICA, Universidade de Campina Grande
Tipologia: Notas de estudo
1 / 80
Esta página não é visível na pré-visualização
Não perca as partes importantes!









































































UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I DEPARTAMENTO DE MATEMÁTICA E ESTATÍSTICA Disciplina: Probabilidade e Estatística (6 créditos - Engenharias) Período 2004. Professores: Alexsandro Cavalcanti, Amanda dos Santos e Rosângela Silveira Data: Aluno(a):.
1 a^ NOTA DE AULA
O conceito de Estatística pode ser considerado de duas maneiras. O primeiro conceito, logo relaciona a Estatística com tabelas e grácos nos quais os dados obtidos são represen- tados, ou melhor, relaciona a números especícos. Ouvimos, assim, falar em estatísticas do IBGE, estatísticas relacionadas à saúde e educação, índices econômicos, pesquisas de opinião, etc. Um segundo conceito refere-se ao conjunto de processos ou técnicas em- pregadas na investigação e análise de fenômenos. Neste caso, a Estatística é a ciência ou método cientíco que estuda os fenômenos aleatórios e, procura inferir as leis que os mesmos obedecem. Assim, um conceito mais abrangente e absoluto deve englobar tanto o primeiro conceito, o qual é o mais popular, quanto o segundo, o qual normalmente escapa à noção corrente.
Denição 1.1 (Estatística). A Estatística é uma ciência que se preocupa com a coleta, organização, descrição, análise e interpretação dos dados, a m de extrair in- formações a respeito de uma população.
Dentro dessa idéia, podemos considerar a Ciência Estatística como dividida basica- mente em duas partes:
Nesta disciplina, serão abordados tópicos referentes à estatística descritiva, conceitos fundamentais de probabilidade e os modelos probabilísticos mais importantes para o estudo da inferência estatística.
Um dos principais conceitos utilizados na estatística é o de população.
1.2.1 População e Amostra
Denição 1.2 (População). A população é um conjunto de todos os elementos (pes- soas, objetos, etc) que possuem pelo menos uma característica em comum, a(s) qual(is) os relacionam ao problema que está sendo estudado.
Exemplo 1.1. Se o problema a ser pesquisado está relacionado com a qualidade de um certo produto produzido numa indústria, a população pode ser composta por todas as peças produzidas numa determinada hora, turno, dia ou mês, dependendo dos objetivos;
Exemplo 1.2. Se o objetivo de um estudo é pesquisar o nível de renda familiar de uma certa cidade, a população seria todas as famílias desta população. Mas, se o objetivo fosse pesquisar apenas a renda mensal do chefe da família, a população a ser pesquisada seria composta por todos os chefes de família desta cidade.
A População pode ser:
Podemos citar como exemplo de população nita o conjunto formado pelos alunos que cursam a disciplina de estatística num determinado semestre da UFCG. Um exemplo de população innita seria o conjunto formado por todos os alunos de estatística do Brasil, pois este conjunto é composto por um número incontável de elementos.
Denição 1.3 (Amostra). A amostra é apenas uma parte da população, ou seja, é um subconjunto da população.
Vários motivos levam a necessidade de se observar apenas uma parte da população, como, por exemplo: a falta de tempo, recursos nanceiros e/ou humanos. A amostra deve ser obtida através de técnicas de amostragem, as quais tem como objetivo principal garantir a representatividade da população, ou seja, fazer com que a amostra seja um retrato el da população.
Exemplos de amostra podem ser considerados por conjuntos formados por apenas uma parte dos elementos populacionais descritos nos exemplos 1 e 2.
1.2.2 Parâmetro e Estatística
Dois novos conceitos estreitamente relacionados com os de população e amostra são os de Parâmetro e Estatística, tendo em vista que:
(a) As variáveis quantitativas discretas - são variáveis numéricas obtidas a partir de procedimento de contagem. Por exemplo: Quantidade de pessoas numa família, quantidade de acidentes numa indústria, etc. (b) As variáveis quantitativas contínuas - são variáveis numéricas cujos valores são obtidos por um procedimento de mensuração, podendo assumir quaisquer valores num intervalo dos números reais, como por exemplo, a temperatura, altura, salário, etc..
Observação 1. O fato de uma variável ser expressa por números não signica que ela seja necessariamente quantitativa, por que a classicação da variável depende de como foi medida, e não do modo como se manifesta. Por exemplo, para a variável peso de um lutador de boxe, se for anotado o peso marcado na balança, a variável é quantitativa contínua; por outro lado, se esse peso for classicado segundo as categorias do boxe, a variável é qualitativa ordinal.
1 a^ LISTA DE EXERCÍCIOS
1 - Dena e/ou explique com suas próprias palavras, o que você entende por Ciência Estatística e quais os principais ramos (partes) da Estatística.
2 - Através de um exemplo, dena: População e Amostra.
3 - Considere as seguintes situações:
Identique em qual das situações nós temos um exemplo de Parâmetro e outro de Estatística (no sentido de medida). Justique sua resposta.
4 - O que você entende por variável? Justique a sua resposta por intermédio de um exemplo.
5 - Como você diferencia uma variável discreta de uma variável contínua? Utilize um exemplo para melhor ilustrar.
6 - Dena e/ou explique com suas próprias palavras, o que você entende por amostragem.
7 - Qual é o principal objetivo de qualquer plano de amostragem?
8 - As estatísticas geradas por intermédio de uma amostra devem ser representativas desta amostra ou da população de origem? Justique a sua resposta.
9 - Para que uma amostra seja representativa, é necessário apenas que a mesma tenha um tamanho apropriado? Justique a sua resposta.
10 - A Revista dos Eventos, N 13 , tentando sanar, ao menos parcialmente, a carência de informações precisas sobre a indústria de eventos, promoveu a 1 a^ PESQUISA - O Mercado de Congressos no Brasil. Os resultados desta pesquisa se baseiam em 40 questionários respondidos sobre um total de 1000, os quais foram encaminhados por entrega pessoal a dirigentes de entidades integrantes do cadastro da própria Revista dos Eventos. Qual é o problema ou a limitação desta pesquisa? Pelo menos teoricamente, qual seria o melhor procedimento para este tipo de pesquisa, já que a empresa possui um cadastro das entidades?
11 - Classique cada uma das informações (variáveis) abaixo, de acordo com os tipos de variáveis.
a) Nome b) Nível de satisfação c) Idade d) Número de dias hospedado
Uma maneira adequada de apresentar os dados e suas respectivas freqüências é através de uma Tabela de Freqüências, a qual é constituída por uma coluna referente aos dados e outra referente às freqüências associadas a cada valor observado (ni). Veja como ca para o conjunto de dados da Figua 1:
Tabela 1: Tabela de Freqüências da variável idade, para um grupo de 12 pessoas. Idade Frequência (ni) 12 2 15 3 17 1 18 4 19 1 20 1 Total de observações (n) 12
Uma medida bastante útil na interpretação de tabelas de freqüências é a freqüência relativa (fi), a qual é dada pela razão entre a freqüência do i-ésimo valor observado, ni e o total de dados observados, n. Pode-se, ainda, representar a freqüência relativa em termos de porcentagem, bastando para isso multiplicar a freqüência relativa fi por 100.
Para alguns tipos de variáveis, tais como a qualitativa ordinal e as quantitativas (disc- reta ou contínua), pode ser útil também, a informação de quantas observações apresentam valores menores ou iguais a um certo valor xado. Este tipo de informação é denominado de freqüência acumulada, fac, a qual também pode ser expressa em termos relativos ou por porcentagens.
Vejamos, agora, como ca a tabela de freqüências anterior com estas informações adicionadas:
Tabela 2: Tabela de Freqüências da variável idade, para um grupo de 12 pessoas. Idade ni fi fi × 100 (%) fac (%) 12 2 0,1667 16,67 16, 15 3 0,2500 25,00 41, 17 1 0,0833 8,33 50, 18 4 0,3333 33,33 83, 19 1 0,0833 8,33 91, 20 1 0,0833 8,33 100, Total (n) 12 1,0000 100,
Observação: Ao conjunto de todos os pares de valores, referentes a cada dado obser- vado e sua respectiva freqüência, denominamos de Distribuição de Freqüências. Desta forma, os pares (12, 2), (15, 3), (17, 1), (18, 4), (19, 1) e (20, 1) representam a distribuição de freqüências da variável idade para esse grupo de pessoas.
Representação Gráca
Uma representação gráca da distribuição de freqüências de uma variável tem a van- tagem de, numa maneira rápida e concisa, informar sobre a variabilidade da mesma.
Gráco de Colunas - é mais adequado para variáveis discretas mas também pode ser utilizado para variáveis qualitativas ordinais, ou ainda, para variáveis qualitativas nominais cujos nomes das categorias são pequenos.
Neste gráco, cada valor observado é representado por retângulos de mesma base e alturas proporcionais às freqüências. Para ilustrar, veja como ca este gráco para a distribuição de freqüências da variável idade, utilizando a freqüência absoluta e relativa em termos de porcentagem:
Figura 1:
Figura 2:
2.1.2 Distribuição de Frequências para Dados Agrupados em Classes
Em algumas situações, é necessário o agrupamento de dados em categorias ou classes para se proceder a construção de uma tabela de freqüências. Por exemplo, em um conjunto de dados contínuos, um mesmo valor não ocorrerá com grande freqüência, ou até mesmo, não se repetirá por mais de uma vez. Uma vantagem em agrupar os dados em classes consiste na organização de grandes conjuntos de dados de forma mais clara e objetiva. Por outro lado, uma desvantagem, consiste na perda de informações por não se saber exatamente quais os valores ocorridos dentro de cada classe.
Para ilustrar como proceder a construção de uma tabela de freqüências em classes, considere o seguinte conjunto de dados:
Tabela: Dados referentes às notas no 1 o^ estágio de 20 estudantes de estatística.
Código do aluno 1 2 3 4 5 6 7 8 9 10 Nota 7,5 8,0 9,0 7,3 6,0 5,8 10,0 3,5 4,0 6, Código do aluno 11 12 13 14 15 16 17 18 19 20 Nota 7,5 7,0 8,5 6,8 9,5 9,8 10,0 4,8 5,5 7,
(Construir a tabela de freqüências para dados agrupados)
Representação Gráca de uma Variável Quantitativa Contínua - Histograma
Para a representação gráca de variáveis quantitativas contínuas é necessário alguma adaptação do gráco de colunas, uma vez que, em geral, é necessário agrupar os dados em classes e conseqüentemente há perda de informações.
Histograma - é um gráco indicado para representar dados agrupados em classes. Este gráco é uma adaptação do gráco de colunas, onde as bases correspondem aos intervalos de classe e as alturas são proporcionais às freqüências de classe. Veja como ca o histograma para a distribuição das notas:
(Construir o histograma para a distribuição de freqüências em classes)
Nesta seção veremos algumas medidas que tem como objetivo resumir um conjunto de dados em um único valor o qual possa fornecer informações sobre o comportamento dos dados, ou seja, sobre a distribuição de freqüências da variável.
2.2.1 Medidas de Tendência Central
As medidas de tendência central são bastante utilizadas e representam o centro ou o meio de um conjunto de dados. As principais são: a mediana, a moda, e a média aritmética.
A seguir estas medidas são denidas e obtidas para os dois seguintes conjuntos de dados que representam o número de gols registrados em cada partida de futebol, durante 5 e 6 jogos, respectivamente:
Conjunto de dados 1: Número de gols por partida de futebol, em 5 jogos.
Conjunto de dados 2: Número de gols por partida de futebol, em 6 jogos.
(a) PM d = n+1 2 , se o total de observações, n, é ímpar. Assim, a mediana será o valor observado na posição PM d; (b) P (^1) M d = n 2 e P (^2) M d = n 2 + 1, se o total de observações, n, é par. Pois, neste caso, existem duas posições centrais e a mediana será a média aritmética dos valores observados nestas duas posições.
Notação: M d ou M d(X).
Média =
soma dos valores total de observações (n)
Notação: M e, M e(X) ou x. Exemplo 7: A partir do conjunto de dados 1, a média é obtida por:
M e(X) = x =
soma dos valores total de observações (n)
Observação: 1)∑ A média aritmética pode ser expressa através do uso do símbolo de somatório (sigma). Por exemplo, se x 1 , x 2 ,... , xk são k valores distintos da variável X, podemos escrever:
M e(X) = x =
x 1 + x 2 +... + xk k
k
∑^ k
i=
xi
Agora, se, de um total de n valores observados (ou observações), x 1 ocorreu n 1 vezes, x 2 ocorreu n 2 vezes,..., xk ocorreu nk vezes, então a média de X pode ser reescrita como:
M e(X) = x =
x 1 .n 1 + x 2 .n 2 +... + xk.nk n
n
∑^ k
i=
xi.ni (1)
∑^ k
i=
xi.
ni n
∑^ k
i=
xi.fi. (3)
Onde:
∑k i=1 ni^ é o total de observações, e,
Exemplo 8: A partir do segundo conjunto de dados, 1 2 2 3 5 5 , temos:
M e(X) = x =
n
∑^ k
i=
xi.ni =
Exercício: Dado o seguinte conjunto de dados:
Determine a média, moda e mediana. Solução:
2.2.2 Medidas de Tendência Central para Dados Agrupados
Sabemos que ao agrupar um conjunto de dados em classes, perde-se informação sobre cada valor individual e, no caso em que seja impossível recuperar cada valor observado, pode-se supor que todos os dados dentro de uma classe tenham seus valores iguais ao ponto médio desta classe. Assim, pode-se, por exemplo, utilizar os pontos médios das classes e suas respectivas freqüências para calcular a média aritmética de maneira análoga ao exposto anteriormente. Da mesma forma, pode-se adotar como valor modal, o ponto médio da classe modal e como mediana, o ponto médio da classe mediana.
Exemplo: Dada a seguinte distribuição de freqüência da variável S=salário (dados agrupados em classes):
Salário Frequência Absoluta 4 , 00 | − 8 , 00 10 8 , 00 | − 12 , 00 12 12 , 00 | − 16 , 00 8 16 , 00 | − 20 , 00 8 20 , 00 | − 24 , 00 2
Determine o valor (aproximado) da média, moda e mediana.
Vejamos, agora, como ca a variância para as variáveis X e Y :
Assim, de acordo com a variância, podemos dizer que a variável X apresenta ...
Observação: Para o cálculo da variância, quando os dados estão agrupados em classes, basta substituir o valor xi por si, ou seja, utilizar a mesma fórmula da variância, substituindo os verdadeiros valores observados pelo ponto médio da i-ésima classe.
Denição 2.2 (Desvio Padrão). - é a raiz quadrada da variância.
D.P.(X) = s =
s^2 =
n
∑^ k
i=
(xi − x)^2 × ni
O uso do desvio padrão como medida de variabilidade é preferível pelo fato de ser expresso na mesma unidade de medida dos valores observados. Pois, a variância pode causar problemas de interpretação por ser expressa em termos quadráticos.
Denição 2.3 (Coeciente de Variação). - O coeciente de variação (CV) é uma medida relativa de variabilidade. O seu valor é determinado por intermédio do quo- ciente entre o desvio padrão e a média aritmética dos dados.
s x
× 100 (expresso em porcentagem (%))
A utilidade imediata do coeciente de variação é a possibilidade de avaliar o grau de representatividade da média. Esta medida também é bastante útil na comparação entre conjunto de dados, em relação à variabilidade; ainda que as unidades de medida nos conjuntos de dados sejam distintas. Por exemplo, comparar a variabilidade das distribuições da variável peso expressa em quilogramas (Kg) e altura expressa em metros (m).
Um critério de decisão sobre a representatividade ou não da média, pode ser dada pela seguinte linha de corte:
Se CV ≥ 50%, a média não é representativa. Se CV < 50%, a média é representativa.
Exemplos:
a) O desvio padrão das variáveis X e Y é DP (X) = DP (Y ) = s =
b) Considere os quilômetros rodados por 3 carros: 30 Km, 40 Km e 50 Km. Calcule a média, a variância, o desvio padrão e o CV. Interprete essas medidas.
2.2.4 Medidas de Posição: Quartis, Decis e Percentis
Assim como a mediana divide os dados em duas partes iguais, os três quartis, denota- dos por Q 1 , Q 2 e Q 3 , dividem as observações ordenadas (em ordem crescente) em quatro partes iguais. A grosso modo:
Basicamente, dois passos são necessários para se encontrar as medidas em questão. Primeiro deve-se identicar a sua posição, e, em seguida, determinar o seu valor.
Veja a seguir, como obter os valores referentes aos percentis, quando se está traba- lhando com dados brutos ou em distribuição de freqüências para dados não agrupados:
1 ◦^ ) Identicar a posição do percentil que se deseja encontrar, através da seguinte expressão:
L =
k 100
× n
Onde:
Uma vez dominados os cálculos para os percentis, pode-se seguir o mesmo processo para calcular os quartis e decis, tendo-se o cuidado de calcular o valor de L, pelas fórmulas L =
(k 4
× n, k = 1, 2 , 3 e L =
( (^) k 10
× n, k = 1, 2 ,... , 9 , respectivamente. Pode-se, ainda, obter os quartis e decis pelas seguintes relações existentes entre estas medidas e os percentis:
Usando os dados brutos, determine:
a) A média, a moda e o desvio padrão;
b) O primeiro, segundo e terceiro quartil;
c) Construa uma tabela de frequências para os dados agrupados em 7 classes;
d) Construa o histograma e o diagrama em caixa;
Agora, utilizando a distribuição de frequências obtida acima, obtenha:
a) A média, a moda e o desvio padrão;
b) O primeiro, segundo e terceiro quartil utilizando o histograma;
2 a^ LISTA DE EXERCÍCIOS
1 - Considere uma distribuição de freqüências qualquer representada por
(x 1 , n 1 ), (x 2 , n 2 ),... , (xk, nk).
Mostre que a soma dos desvios em relação à média é igual zero, ou seja, que∑ k i=1(xi^ −^ x)^ ×^ ni^ = 0.
2 - Obtenha a média e a mediana para o seguinte conjunto de dados:
a) Se substituímos o valor 40 por 70 , os valores da média e da mediana serão os mesmos? Justique? b) Analisando os resultados acima, ressalte uma característica vantajosa da medi- ana em relação à média.
3 - Mostre que:
∑^ k
i=
(xi − x)^2 × ni =
∑^ k
i=
x^2 i ni −
k i=1 xi
n
∑^ k
i=
x^2 i ni − nx^2
E, por isso, a variância também pode ser obtida pela seguinte fórmula:
V ar(X) = s^2 =
n
∑^ k
i=
x^2 i ni − x^2
4 - Na turma A do curso normal da Escola X, estão matriculados 50 alunos no cor- rente ano. O levantamento das chas biométricas revelou as seguintes estaturas em centímetros: 165 164 151 160 155 169 153 156 165 160 170 157 162 162 155 154 151 155 162 150 168 160 154 151 168 155 156 158 166 155 154 152 163 156 170 158 171 159 175 154 159 158 153 158 156 162 165 156 161 157 a) Elabore uma distribuição de freqüências, fazendo o limite inferior da primeira classe igual a 150 (inclusive) e amplitudes dos intervalos de classe igual a 5 cm. b) Baseado na distribuição de freqüência calcule: a média, a mediana, a moda, os quartis. c) Esboce o histograma
5 - As taxas de juros recebidas por 10 ações durante certo período foram (medidas em porcentagem): 2.59; 2.64; 2.60; 2.62; 2.57; 2.55; 2.61; 2.50; 2.63; 2.64. Calcule a média e a mediana.