




























































































Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Encontra documentos específicos para os exames da tua universidade
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Estatística e Probabilidade
Tipologia: Notas de estudo
1 / 126
Esta página não é visível na pré-visualização
Não perca as partes importantes!





























































































PROBABILIDADE
Este material foi produzido com o objetivo de dar suporte aos graduandos do curso de Licen- ciatura em Matemática na disciplina Estatística e Probabilidades.
Dois grandes blocos são apresentados: a Estatística Descritiva e a Teoria de Probabilidades. A primeira utiliza-se de métodos para organizar, resumir e descrever os aspectos importantes de um conjunto de características observadas ou comparar tais características entre dois ou mais conjun- tos. Os blocos são divididos em quatro temas.
No Tema 1, apresentamos alguns conceitos introdutórios. As séries estatísticas e as represen- tações tabular e gráfica. Além disso, abordaremos o cálculo das médias, da moda e da mediana de uma distribuição de freqüências.
No Tema 2, trabalharemos as separatrizes e as medidas de dispersão, assimetria e curtose.
No Tema 3, veremos os principais resultados na teoria de probabilidades.
No Tema 4, expande-se o conceito de probabilidade com a inserção do conceito de variável aleatória. Os eventos que possuem determinadas características são associadas a determinadas funções de probabilidade. O grau de dependência entre duas variáveis aleatórias é inserido e tam- bém é apresentado o conceito de Regressão Linear.
Aqui, observar-se-á como a Estatística é essencial para a compreensão dos resultados de uma pesquisa.
Prof. Paulo Henrique Ribeiro do Nascimento
APRESENTAÇÃO DA DISCIPLINA
a ser manifestada a necessidade de instrumentos matemáticos, aptos a analisar este tipo de fenômenos, em todas as ciências que põem o problema do tratamento e interpretação de um grande número de dados. Pode- se datar dos fins do século XIX, o desenvolvimento da estatística matemática e suas aplicações, com F. Galton (1.822-1.911), K. Pearson (1.857-1.936) e métodos estatísticos na investigação experimental se fica a dever, fundamentalmente, aos trabalhos de K. Pearson e R. A. Fisher (1.890-1.962). A partir de Pearson e Fisher o desenvolvimento da estatística matemática, por um lado, e dos métodos estatísticos aplicados, por outro, têm sido tal que é praticamente impossível referir nomes.
Em todas as áreas da ciência, a coleta de dados se faz necessária e com isso a Estatística tem crescido muito nos últimos anos, especialmente com o advento dos computadores e surgimento de softwares cada vez mais sofisticados. Observar uma extensa listagem de dados coletados não nos permite chegar a uma conclusão concisa. Este fato se agrava se esse conjunto de dados, possui muitas características que devam ser investigadas.
Os métodos descritivos são utilizados, portanto, para organizar, resumir e descrever aspectos importantes de um conjunto de características observadas ou comparar tais características entre dois ou mais conjuntos.
Ao se resumir ou condensar um conjunto de dados, informações são perdidas, visto que, não estamos mais trabalhando com as observações originais. Entretanto, esta perda de informação é pequena se compararmos ao ganho que se tem com a clareza da interpretação proporcionada.
A descrição dos dados também tem como objetivo identificar anomalias, até mesmo resultante do registro incorreto de valores, e dados dispersos, aqueles que não seguem a tendência geral do restante do conjunto.
Não só nos artigos técnicos direcionados para pesquisadores, mas também, nos artigos de jornais e re- vistas escritos para o público leigo, é cada vez mais freqüente a utilização dos recursos de descrição para complementar a apresentação de um fato, justificar ou referendar um argumento.
As ferramentas descritivas são os muitos tipos de gráficos e tabelas e as medidas de síntese, como os índices e as médias.
1.1 Método Estatístico
A Estatística originou-se da coleta e construção de tabelas de dados para o governo. A situação foi evoluindo e esta coleta de dados representa somente um dos aspectos da Estatística. Hoje em dia podemos adotar a seguinte definição para a Estatística: Ciência que se baseia na Teoria das Probabilidades e cujo objetivo principal é nos auxiliar a tomar decisões ou tirar conclusões em situações de incerteza, a partir de informações numéricas.
1.1 Definição. Método é um conjunto de meios dispostos convenientemente para se chegar a um determinado objetivo.
Dos métodos científicos podemos destacar os métodos:
Experimental - consiste em manter constantes todas as causas (fatores), menos uma, e variar esta causa de modo que o pesquisador possa descobrir seus efeitos, caso existam. É o método preferido no estudo da Física e da Química. Estatístico - diante da impossibilidade de manter as causas constantes, admite todas essas causas presentes variando-as, registrando essas variações e procurando determinar, no resultado final, que influências cabem a cada uma delas. Como exemplo, podemos citar a determinação das causas que definem o preço de uma mercadoria. Para aplicarmos o método experimental, teríamos de fazer variar a quantidade da mercadoria e verificar se tal fato iria influenciar seu preço. Porém, seria necessário que não houvesse
ESTATÍSTICA E PROBABILIDADE 9
alteração nos outros fatores. Assim, deveria existir, no momento da pesquisa, uma uniformidade dos salários, o gosto dos consumidores deveria permanecer constante, seria necessária a fixação do nível geral dos preços das outras necessidades e etc. Mas, isso tudo é impossível. Daí a necessidade de utilização do método estatístico.
10 FTC EaD | LICENCIATURA EM MATEMÁTICA
iv) Deseja-se conhecer o patrimônio líquido, faturamento, número de empregados, tempo de existência, das empresas situadas no Pólo Petroquímico de Camaçari neste ano. População ou universo: χ = {empresas existentes no Pólo Petroquímico de Camaçari no ano em estudo}. Características: ג = {patrimônio líquido, faturamento, número de empregados, tempo de existência}.
v) Deseja-se conhecer a idade, o peso, a estatura, a classe social e o tipo de dieta alimentar das crianças até dois anos de idade residentes no bairro Cabula, Salvador, em 2000. População ou universo: χ = {crianças até dois anos de idade residentes no Cabula em 2000 }. Característica: ג = {idade, peso, estatura, classe social, tipo de dieta alimentar}. vi) O Serviço de Meteorologia pretende estudar a temperatura ambiente na cidade de Salvador às 8 h de hoje. População ou universo: χ = {Salvador}. Característica: ג = {a temperatura ambiente às 8 h de hoje}.
Devemos considerar ainda que as populações podem ser homogêneas (cujas partes todas são da mesma natureza) ou heterogêneas (pelo menos uma das partes possui natureza distinta) Em geral, como os universos são grandes, investigar todos os elementos populacionais para determinarmos a característica necessita muito tempo, e/ou o custo é elevado, e/ou o processo de investigação leva a destru- ição do elemento observado, ou, como no caso de populações infinitas, é impossível observar a totalidade da população. Assim, para minimizar a influência dessas dificuldades, estudar parte da população constitui-se um aspecto fundamental da Estatística. 1.3 Definição. [Amostra] Chamamos de amostra um subconjunto próprio e finito da população.
A seleção da amostra é baseada em características da população.
População característica
−^ Técnicas de amostragem−−−−−−−−−−−−−−−−−−→ Amostra
descritiva
Conclusões sobre as características da população
←−^ Inferência Estatística−−−−−−−−−−−−−−−−− Informações contidas nos dados
Figura 1.1: Notas de Aula da Disciplina MAT116 - USP
A estatística, portanto, muito se baseia em fatos deduzidos pela teoria da amostragem. Por exemplo: Seja μ a razão que expressa a intenção de voto a cada 10 eleitores indagados que o candidato a Prefeito Alberto Magalhães receberia se fosse analisada toda a população de uma cidade que está para realizar eleições brevemente. Como é um resultado difícil de se obter, vamos trabalhar com amostras. Seja ¯x 1 , ¯x 2 ,... , ¯xk , as razões que expressam a intenção de voto a cada 10 eleitores indagados, obtidas das amostras de tamanho n de determinadas regiões da cidade. Sabemos que estas medidas só terão algum significado se um número razoável destas estiverem suficientemente próximas da medida μ. Cada erro absoluto é calculado por |¯xi − μ| = εi. Se torna interessante para a Estatística analisar o comportamento dos erros nas diversas amostras referidas. Como o tamanho da amostra influencia na magnitude do erro, quanto maior for a amostra, mais provável será que se tenha uma melhor estimativa.
12 FTC EaD | LICENCIATURA EM MATEMÁTICA
Desta forma, analisaremos quais εi são menores que um valor fixo “aceitável” ε para o erro. Claro que, quanto maior a quantidade de valores εi menores ou iguais que ε, mais confiável será a estimativa, ou seja, quando trabalhamos com amostras, visando conhecer a população, é necessário conhecer a probabilidade α de que o erro obtido não seja maior do que ε:
P(|¯xi − μ| ≤ ε) = 1 − α.
Assim, dizemos que cada amostra é representativa da população e que a medida ¯xi , de uma amostra previamente selecionada, pode ser utilizada como estimativa para a medida μ.
Uma medida, obtida com cálculos baseados em informações de uma amostra, é chamada de estatística enquanto que a medida, obtida com cálculos baseados em informações de uma população, é chamada de parâmetro. A parte da Estatística responsável pela determinação do tamanho da amostra e da forma de seleção dos seus elementos é chamada Amostragem.
1.4 Variáveis Estatísticas
A Estatística ocupa-se, fundamentalmente, das propriedades das populações cujas características são passíveis de representação numérica como resultado de medições e contagens. Essas características da pop- ulação são comumente chamadas de variáveis. As variáveis podem ser divididas em dois grupos: qualitativas e quantitativas.
QUALITATIVA
NOMINAL (sexo, estado civil, cor dos olhos, etc.) ORDINAL (classe social, grau de instrução, etc.)
CONTÍNUA (peso, altura, salário mensal, etc.) DISCRETA (número de filhos, número de carros, idade, etc.)
Variáveis qualitativas - quando o resultado da observação é apresentado na forma de qualidade ou atributo. Exemplos: setor de atividade econômica; estado civil; porte da empresa; etc.
Para resumir as informações levantadas durante uma pesquisa usaremos a técnica e a representação mais apropriada, a depender do tipo de variável que estamos analisando.
ESTATÍSTICA E PROBABILIDADE 13
1.6 Apresentação de uma Série Estatística
O modo de condensação ou apresentação das informações são dadas por tabelas ou gráficos que facilitam a visualização do fenômeno, permitem a comparação com outros elementos ou, ainda, fazer previsões. Os principais tipos de gráficos serão apresentados, porém, antecedendo-os, serão apresentadas as normas de apresentação tabular e as tabelas das séries estatísticas que deram origem aos gráficos.
A representação tabular (tabela) é uma das modalidades mais utilizadas para a apresentação dos dados estatísticos coleta dos na amostragem.
NORMAS DE APRESENTAÇÃO TABULAR DE DADOS
As normas a seguir foram retiradas do documento: Normas de apresentação tabular do Centro de Documen- tação e Disseminação de Informação 3 a^ edição IBGE, Rio de Janeiro, 1.993. Têm como objetivo fixar conceitos e procedimentos aplicáveis a elaboração de tabelas de dados numéricos, de modo a garantir a clareza das informações apresentadas.
Apresentemos o esboço de uma tabela onde a seguir conceituaremos os elementos que a compõe.
Topo : Espaço superior de uma tabela destinado ao seu título; Título: Conjunto de termos indicadores do conteúdo de uma tabela. Toda tabela deve ter título, inscrito no topo, para indicar a natureza e as abrangências geográfica e temporal dos dados numéricos. As indicações da natureza e da abrangência geográ- fica dos dados numéricos devem ser feitas sem abreviações, por extenso, de forma clara e concisa;
Cabeçalho das colunas Coluna ↓
Linha → Célula
RODAPÉ Centro : Espaço central de uma tabela destinado a moldura, aos dados numéricos e aos termos necessários a sua compressão. No centro identificam-se quatro espaços menores: o espaço do cabeçalho, a coluna, a linha e a célula. Espaço do cabeçalho: espaço superior do centro de uma tabela destinado a indicação do conteúdo das colunas. Toda tabela deve ter cabeçalho, escrito no espaço do cabeçalho, para indicar, complemen- tarmente ao título, o conteúdo das colunas. O conteúdo das colunas deve ser feito com palavras ou com notações, de forma clara e concisa. Recomenda-se que a indicação com palavras seja feita por extenso, sem abreviações; Coluna: Espaço vertical do centro de uma tabela destinado aos dados numéricos (coluna de dados numéricos) ou aos indicadores de linha (colunas indicadoras); Linha: Espaço horizontal do centro de uma tabela destinado aos dados numéricos. Toda tabela deve ter indicadores de linha, inscritos nas colunas indicadoras, para indicar, complementarmente ao título, o conteúdo as linhas. O conteúdo das linhas deve ser feito com palavras ou com notações, de forma clara e concisa. Recomenda-se que a indicação com palavras seja feita por extenso, sem abreviações;
Dado numérico : Quantificador de um fato especifico observado. A estrutura dos dados numéricos e dos termos necessários a compreensão de uma tabela deve ser feita com, no mínimo, três traços horizontais paralelos. O primeiro para separar o topo, o segundo para separar o espaço do cabeçalho. O terceiro para separar o rodapé;
ESTATÍSTICA E PROBABILIDADE 15
Célula : espaço mínimo do centro de uma tabela, resultante do cruzamento de uma linha com uma coluna, destinado ao dado numérico ou ao sinal convencional. Sinal convencional: Representação gráfica que substitui um dado numérico. A substituição de um dado numérico deve ser feita por um dos sinais abaixo, conforme o caso: − zero não resultante de arredondamento; ·· Não se aplica a um dado numérico; · · · Dado numérico não disponível; x Dado omitido ; 0 0, 0 0, 00 etc.
zero aproximado de um dado numérico originalmente positivo.
etc.
zero aproximado de um dado numérico originalmente negativo.
Quando uma tabela
contiver sinais convencionais, estes deverão ser apresentados em nota geral com seus respectivos sig- nificados. No caso de publicação que contenha tabelas com sinais convencionais, na qual a apresentação dos sinais e de seus significados figure em destaque, e dispensável a nota geral em cada tabela. Rodapé : Espaço inferior de uma tabela destinado a fonte, a nota geral e a nota especifica. Fonte: Identificador do responsável (pessoa física ou jurídica) ou responsáveis pelos dados numéri- cos. Toda tabela deve ter fonte, inscrita a partir da primeira linha de seu rodapé. A identificação do responsável ou responsáveis pelos dados numéricos deve ser feita com palavras, por extenso, e prece- dida da palavra Fonte ou Fontes. Quando os dados sao extraídos de algum documento, recomenda-se a indicação da referencia bibliográfica do documento e quando a tabela contiver dados numéricos resul- tantes de transformação dos dados numéricos obtidos na fonte, o responsável pela operação deve ser identificado em nota geral ou nota especifica. Nota geral: Texto esclarecedor do conteúdo geral de uma tabela, quando necessário. Deve ser inscrito logo após o rodapé da tabela e ser precedido do termo Nota ou Notas. Nota específica: Texto esclarecedor de algum elemento especifico de uma tabela, quando necessário. Deve ser inscrito no rodapé, logo após a nota geral (quando esta existir). Quando uma tabela contiver mais de uma nota especifica, estas devem ser distribuídas obedecendo a ordem de numeração das chamadas, separando-se uma das outras por um ponto. Chamada : Símbolo remissivo atribuído a algum elemento de uma tabela que necessita uma nota específica. A remissiva atribuída a algum elemento deve ser feita em algarismos arábicos em destaque: entre parên- teses, entre colchetes, exponencial. Quando uma tabela contiver mais de uma chamada, estas devem ser distribuídas sucessivamente, de cima para baixo e da esquerda para a direita, em ordem crescente de numeração. Unidade de medida : Termo indicador da expressão quantitativa ou metrológica dos dados numéricos. Uma tabela deve ter unidade de medida, inscrita no espaço do cabeçalho ou nas colunas indicadoras, sem- pre que houver necessidade de se indicar, complementarmente ao título, a expressão quantitativa ou metrológica dos dados numéricos. A unidade de medida deve ser feita com símbolos ou palavras entre parênteses.
Apresentação do Tempo
1 o. Toda série temporal consecutiva deve ser apresentada, em uma tabela, por seus pontos, inicial e final, ligados por hífen (-).
16 FTC EaD | LICENCIATURA EM MATEMÁTICA
EP 1.1. Arredondar cada um dos seguintes valores para a aproximação pedida: (a) 48, 6 para o inteiro mais próximo (g) 5, 781 para décimos (b) 2, 484 para centésimos (h) 23, 350 para uma casa decimal (c) 0, 0045 para milésimos (i) 4, 99 para décimos (d) 22, 250 para décimos (j) 25, 351 para décimos (e) 1.001, 39 para o inteiro mais próximo (k) 324 para a dezena mais próxima (f) 6.498 para a centena mais próxima (l) 5.872 para o milhar mais próximo
A seguir, exemplificaremos, através de tabelas, algumas séries estatísticas.
Exemplo 1.7. Série temporal
Índice de Produto Industrial Brasil - 1979 Meses IPI Janeiro 18. Fevereiro 17. Março 19. Abril 18. Maio 20. Junho 20. Julho 20. Agosto 21. Setembro 19. Outubro 22. Novembro 20. Dezempbro 12. Tabela 1.1: FONTE: IBGE
Exemplo 1.8. Série geográfica
População residente segundo os municípios da região metropolitana de salvador − 1991 Municípios População (em 1.000 habitantes) Camaçari 114 Candeias 68 Dias D’Avila 31 Itaparica 15 Lauro de Freitas 69 Madre de Deus 9 Salvador 2. São Francisco do Conde 20 Simões Filho 73 Vera Cruz 22 Total 2. Tabela 1.2: FONTE: IBGE, Censo Demográfico, Bahia. 1991.
Exemplo 1.9. Série específica
Rebanhos brasileiros − 1992 Rebanho Quantidade Bovinos 154. Eqüinos 550 Ovinos 19. Suínos 34. Caprinos 12. FONTE: Revista Isto É.
Exemplo 1.10. Série conjugada
Terminais telefônicos em serviço 1991 − 1993 Região 1991 1992 1993 Sudeste 6.234.501 6.729.467 7.231. Sul 1.497.315 1.608.989 1.746. Nordeste 1.287.813 1.379.101 1.486. Centro-Oeste 713.357 778.925 884. Norte 342.938 375.658 403. FONTE: Revista Isto É.
EP 1.2. Assinale a alternativa correta. População ou universo é um:
(a) conjunto de pessoas;
18 FTC EaD | LICENCIATURA EM MATEMÁTICA
(b) conjunto de indivíduos apresentando uma característica especial;
(c) conjunto de todos os indivíduos apresentando uma característica comum objeto de estudo.
(d) conjunto de objetos;
(e) n.d.a.
EP 1.3. Estabelecer quais dados são discretos e quais são contínuos:
(a) número de ações vendidas diariamente na Bolsa de Valores;
(b) temperaturas registradas em um posto de meteorologia;
(c) vida média das válvulas de televisão produzidas por uma determinada companhia;
(d) salários anuais de professores do colégio;
(e) comprimentos de 1000 parafusos produzidos por uma fábrica.
EP 1.4. Entre as alternativas seguintes, assinale aquela que contiver uma afirmação verdadeira.
(a) Dados Brutos são aqueles que estiverem numericamente organizados;
(b) Rol é um arranjo de dados numéricos brutos;
(c) O conjunto das alturas de 100 estudantes, do sexo masculino, de uma universidade, arranjados em ordem crescente ou decrescente de grandeza, é um exemplo de rol de dados.
EP 1.5. Entre as alternativas seguintes, assinale aquela que corresponder a uma afirmação falsa.
(a) Faz-se um levantamento por censo quando todos os elementos da população são pesquisados.
(b) Faz-se levantamento por amostragem quando se pesquisa parte dessa população e, com base no sub- conjunto pesquisado, pode-se tirar conclusão acerca da população. (c) A decisão entre os tipos de levantamento a serem realizados, censo e amostragem, depende de prazo para a realização da pesquisa e recursos financeiros disponíveis, entre outras variáveis que possam implicar em vantagens ou desvantagens do censo e da amostragem.
(d) As afirmações contidas nas alternativas “a” e “c” são falsas.
(e) n.d.a.
EP 1.6. As fases principais do método estatístico são:
(a) coleta de dados, amostragem, apresentação tabular, apresentação gráfica e definição do problema;
(b) coleta de dados, amostragem, apresentação tabular, apresentação gráfica e definição do problema;
(c) amostragem, apresentação tabular, apuração dos dados, interpretação dos dados e planejamento; (d) definição do problema, planejamento, coleta dos dados, apuração, apresentação dos dados, análise e interpretação dos dados;
(e) coleta de dados; apuração dos dados, análise e interpretação dos dados, apresentação dos dados.
EP 1.7. [TCU-94] Assinale a opção correta.
(a) Estatística Inferencial compreende um conjunto de técnicas destinadas à síntese de dados numéricos.
ESTATÍSTICA E PROBABILIDADE 19