Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas


Noções de Estatística e Probabilidade, Manuais, Projetos, Pesquisas de Ciências Biologicas

Um livro para iniciar no estudo da estatística.

Tipologia: Manuais, Projetos, Pesquisas

2016

Compartilhado em 03/02/2016

joao-carlos-pires-de-oliveira-4
joao-carlos-pires-de-oliveira-4 🇧🇷

4.6

(84)

26 documentos

1 / 219

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
UNIVERSIDADE FEDERAL DE OURO PRET0
INSTITUTO DE CIÊNCIAS EXATAS E BIOLÓGICAS
DEPARTAMENTO DE MATEMÁTICA
Noções de Estatística e Probabilidade
Prof: Vicente Garibay Cancho
-Ouro Preto, 5 de Agosto de 2004-
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51
pf52
pf53
pf54
pf55
pf56
pf57
pf58
pf59
pf5a
pf5b
pf5c
pf5d
pf5e
pf5f
pf60
pf61
pf62
pf63
pf64

Pré-visualização parcial do texto

Baixe Noções de Estatística e Probabilidade e outras Manuais, Projetos, Pesquisas em PDF para Ciências Biologicas, somente na Docsity!

UNIVERSIDADE FEDERAL DE OURO PRET

INSTITUTO DE CIÊNCIAS EXATAS E BIOLÓGICAS

DEPARTAMENTO DE MATEMÁTICA

Noções de Estatística e Probabilidade

Prof: Vicente Garibay Cancho

-Ouro Preto, 5 de Agosto de 2004-

Conteúdo

Capítulo 1

Introdução

1.1 Introdução e Denição de Estatística

O termo estatística é derivado da palavra "estado", em virtude de ser função tradicional dos governos centrais levantar registros da população, tais como nascimentos, mortes, prossões e entre outras atividades. Contar e medir esses fatos gera muitas classes de dados numéricos.

A estatística é concebida popularmente como colunas de cifras ou grácos, associadas geralmente com médias. Esse conceito se aproxima muito da denição tradicional de estatística: coleção, organização, resumo e apresentação de dados numéricos. Atualmente a estatística é uma ciência (ou método) baseada na teoria de probabilidades, cujo objetivo principal é auxiliar-nos a tomar decisões ou tirar conclusões em situações de incerteza, a partir de informações numéricas.

Como um procedimento de tomada de decisões, a estatística tem uma importância crescente em vários campos, por exemplo, na produção industrial, na medicina, na nutrição e biologia, na economia, na política, na psicologia, na análise de opinião pública e outras ciências sociais, na agricultura, na física, na química e na engenharia.

1.2 Populações e Amostras

Uma população é o conjunto maior de indivíduos ou objetos cujo estudo nos interessa ou acerca dos quais deseja ter informações. Os elementos desse conjunto se denominam dados ou observações. As observações mensuráveis denominam-se dados quantitativos. Por exemplo, altura de estudantes, idade de pessoas, a duração de uma lâmpada de luz ( vida útil das lâmpadas) etc. Porém, o sexo, o estado civil das pessoas, a marca de cigarros são não mensuráveis e denominam-se dados qualitativos. Assim, uma população estatística é o conjunto de observações quantitativas ou qualitativas. A população sendo innita, portanto, é impossível ter uma informação completa sobre ela, a população sendo numerosa talvez não seja possível estudar cada um dos seus elementos. Nesses casos, recorre-se à informação proporcionada por uma parte nita da população chamada amostra. Em estatística é freqüente trabalhar com as chamadas amostras aleatórias, nas quais todos os elementos da população têm a mesma chance de serem escolhidos para compor a amostra. Uma amostra aleatória tem a propriedade de reetir as características da população da qual foi sorteada. Alguns exemplos de população

  • população: todos os eleitores do Brasil

CAPÍTULO 1. INTRODUÇÃO 3

amostra: 2000 eleitores entrevistados em uma pesquisa pelo IBOPE.

  • população: todas peças produzidas por uma maquina em um dia.

amostra: 30 peças sorteadas ao acaso da produção de um dia maquina.

  • população: um lote de artigos recebidas por uma empresa.

amostra: 20 artigos sorteados ao acaso para inspeção.

1.3 Parâmetro e Estatística

Um parâmetro é uma medida que descreve alguma característica de toda a população. Para deter- minar seu valor, é necessário utilizar a informação da população(censo). Com isso, as decisões são tomadas com certeza absoluta.

Uma estatística é uma medida que é obtida a partir dos dados amostrais e descreve alguma caracte- rística de uma amostra. As decisões nesse caso, tomadas com um grau de incerteza.

1.4 Etapas do Método de Análise Estatística

A estatística, como ciência, tem como objetivo desenvolver procedimentos que permitam obter con- clusões acerca dos parâmetros de uma população a partir das informações contida na amostra. Para a aplicação objetiva e pragmática dos procedimentos e técnicas estatísticas é recomendável seguir as seguintes etapas:

i) Formulação do problema e denição de um objetivo

ii) Planejamento do experimento.

iii) Recolha de dados.

iv) Análise de dados.

v) Estabelecimento de inferência estatística acerca da população (com base na informação amostral).

1.4.1 Formulação do problema

É evidente a necessidade de encarar essa etapa com máximo rigor pois dela dependerá a forma como se desenvolverão todos os passos seguintes. Nesse sentido, deve-se determinar, nessa etapa, de forma clara, quais são os problemas apresentados e quais são os objetivos da investigação.

1.4.2 Planejamento do experimento

Nessa etapa deve-se denir que informações devem ser e como são recolhidos( amostra ou censo ?). O objetivo é obter um conjunto adequado de dados que permita alcançar os objetivos da pesquisa.

CAPÍTULO 1. INTRODUÇÃO 5

1.5.1 Propriedades das somatórios

  1. O número de termos da somatório,

∑b i=a

Xi é igual b − a + 1

  1. Se c é uma constante qualquer, então

∑n i=

cXi = c

∑n i=

Xi

  1. (^) n ∑

i=

(Xi + Yi − Zi) =

∑^ n

i=

Xi +

∑^ n

i=

Yi −

∑^ n

i=

Zi

∑n i=

Xi =

∑n j=

Xj

1.6 Somatório double

Freqüentemente em estatística deseja-se conhecer a interação entre duas variáveis, assim por exemplo, considere as 20 determinações de pressão sangüínea sistólica tomadas a um indivíduo que participa de um programa idealizado para estudar fontes e intensidade de variação de leituras da pressão sangüínea. A pressão do sangue foi medida por 4 médicos em cada uma das 5 visitas. Os dados são apresentados na seguinte tabela 1.1 Com a nalidade de ordenar linearmente essas duas classicações, utiliza-se

Tabela 1.1: Leituras da pressão sanguínea sistólica de um individuo tomadas em 5 visitas por 4 observadores Número de visitas número de médicos 1 2 3 4 1 118 112 116 118 2 120 116 112 112 3 114 120 112 117 4 118 116 118 116 5 118 108 122 116

um sistema de dois subíndices, isto é, usam-se um subíndice para o número de visitas e outro para o número de médicos. Em tais situações é freqüente utilizar as letras i e j para indicar o número da linha e o número da coluna, respectivamente. A cada observação denota-se por Xij que indica o dado da i-ésima linha e j-ésima coluna. No conjunto de dados da tabela 1.1, X 34 = 117, X 32 = 120, por exemplo.

Considere agora, os diversos tipos de soma, por exemplo, a soma dos elementos da terceira linha é ∑^4

j=

X 3 j. (na linha 3, o primeiro subíndice é xo, o que muda é o segundo subíndice).

Para somar todos elementos da tabela 1.1, pode-se proceder de duas maneiras, primeiro somar os elementos correspondentes a cada linha e logo determinar a soma dessas somas ou somar cada coluna e logo somar essas somas.

CAPÍTULO 1. INTRODUÇÃO 6

por linhas temos:

∑^4

j=

X 1 j +

∑^4

j=

X 2 j +

∑^4

j=

X 3 j +

∑^4

j=

X 4 j +

∑^4

j=

X 5 j =

∑^5

i=

∑^4

j=

Xij

por colunas temos: ∑^5

1=

Xi 1 +

∑^5

i=

Xi 2 +

∑^5

i=

Xi 3 +

∑^5

i=

Xi 4 =

∑^4

j=

∑^5

i=

Xij

No exemplo: ∑^5

i=

∑^4

j=

Xij = 464 + 460 + 463 + 468 + 464 = 2319.

∑^4

j=

∑^5

i=

Xij = 588 + 572 + 580 + 579 = 2319.

Em geral, suponha que a tabela 1.1, tenha n linhas e m colunas, então, soma de todos elementos da tabela é: (^) n ∑

i=

∑^ m

j=

Xij.

1.7 Exercícios

  1. Vericar as seguintes expressões:

(a)

∑n i=

[Xi(Xi + X¯) + (Xi − X¯)^2 ] = 2

∑n j=

X j^2 , se X¯ = (^1) n

∑n i=

Xi.

(b)

∑n i=

(Xi − X¯) = 0, se X¯ = (^1) n

∑n i=

Xi.

(c)

∑n i=

Xi(Xi − X¯) =

∑n i=

(Xi − X¯)^2. se X¯ = (^) n^1

∑n i=

Xi.

(d)

∑n i=

∑^ n j=

(Xi − X¯)(Yj − Y¯ )^2 = 0, se X¯ = (^) n^1

∑n i=

Xi e Y¯ = (^) n^1

∑n i=

Yi

(e)

∑n i=

[Xi(Xi + X¯) − X¯^2 ] =

∑n i=

X i^2 , se X¯ = (^1) n

∑n i=

Xi.

  1. Na seguinte tabela tem-se a quantidade em toneladas de açúcar transportada desde os depósitos de uma distribuidora aos supermercados de Belo Horizonte. Depósito Supermercados 1 2 3 1 5 6 8 2 4 4 2 3 6 4 9 4 5 7 8 5 4 3 2

Capítulo 2

Análise Descritiva

2.1 Introdução

O objetivo da estatística descritiva, já identicado anteriormente, é o de representar de uma forma compreensível a informação contida nos dados. A necessidade de um esforço de classicação desses dados e de síntese da informação neles contida resulta da incapacidade que, normalmente, a mente humana tem de assimilar e interpretar conjuntos signicativos de dados que sejam apresentados de uma forma desorganizada.

A forma de representar a informação contida numa amostra ou numa população depende antes de tudo, da escala na qual são expressos os dados que a integram. Por essa razão, antes de analisar as técnicas de estatística descritiva mais freqüentemente utilizadas, é apresentado uma classicação dos dados (ou variáveis).

2.2 Classicação dos Dados

Os dados podem ser classicados em qualitativos e quantitativos

2.2.1 Dados qualitativos

São aqueles dados cujos resultados não podem ser expressos em forma numérica. Esses tipos de dados classicam-se em:

Qualitativo ordinal

Para esses tipos de dados é possível estabelecer uma relação de ordem entre as possíveis categorias, por exemplo, grau de instrução de funcionários de uma empresa (1 0 grau, 20 grau, superior), opinião de um grupo de pessoas sobre um programa de TV( ruim, regular, bom, muito bom).

CAPÍTULO 2. ANÁLISE DESCRITIVA 9

Qualitativo nominal

Nesses tipos de dados não há uma relação de ordem entre as possíveis categorias. Por exemplo: cor de preferência, lugar de procedência dos estudantes de uma universidade.

2.2.2 Dados quantitativos

São aqueles cujos resultados são expressos em forma numérica e são de dois tipos:

Quantitativos discretos

São dados que tem um número nito ou innito enumerável de possíveis valores. Usualmente são associados a processos de contagem, onde o resultado é representado mediante um número inteiro. Por exemplo; número de alunos por sala de aula, número de lhos por família na cidade de Ouro Preto, etc.

Quantitativos contínuos

São dados que têm um número innito não enumerável de possíveis valores e são representados por números de um intervalo real. Por exemplo: Altura do aluno da turma 21, peso de crianças recém nascidas num hospital universitário etc.

2.3 Organização e Representação de Dados

2.3.1 Organização de dados qualitativos

Se os dados são qualitativos são simplesmente, agrupados segundo a freqüência e a proporção ou porcentagem de cada categoria e representados gracamente mediante barras horizontais ou verticais ou diagramas circulares (ou gráco de pizza).

Exemplo 2.3.1 A 40 alunos que foram reprovados em alguma disciplina do semestre anterior. per- guntado em quais disciplinas tinham sido reprovados e as respostas foram as seguintes:

Cálculo II Cálculo II Cálculo I Álgebra Estatística Estatística Cálculo II Biologia Química Cálculo II Estatística Cálculo I Estatística Álgebra Álgebra Estatística Cálculo II Álgebra Álgebra Cálculo I Cálculo I Estatística Cálculo II Cálculo II Cálculo II Estatística Cálculo I Estatística Genética Mecânica Economia Estatística Cálculo I Bioquimica Cálculo II Cálculo I Fisica Cálculo II Quimica Física

A freqüência absoluta são o resultado de um processo de contagem das respostas obtidas entre os 40 alunos consultados. Assim, por exemplo, 10 alunos desaprovaram na disciplina de Cálculo II, 7 desaprovaram em cálculo I, etc. Observa-se que a soma das freqüências absolutas é igual ao número total de alunos consultados ou também chamada de tamanho da amostra a qual será denotado por n.

Suponha que um conjunto de dados qualitativos tenha k categorias (no exemplo k = 5) então

∑k i=

fi = n

CAPÍTULO 2. ANÁLISE DESCRITIVA 11

Figura 2.1: Distribuição de alunos desaprovados no semestre 2003/1.

Podem ser utilizados, também, efeitos tridimensionais para obter uma melhor apresentação. Por exemplo, o gráco anterior pode ser mostrado como:

Para organizar e representar dados qualitativos ordinais, geralmente, ordena-se as categorias dos dados em ordem de maior a menor hierarquia.

2.3.2 Organização de dados quantitativos

Quantitativos discretos

Para dados quantitativos discretos cujo número de resultados possíveis não é grande ( não é maior que 12 ou 15), a informação pode ser classicada e representada diretamente sem perda de informação da mesma.

Nesses casos, primeiro ordena-se a informação segundo sua magnitude e, em seguida obtém-se as freqüências absolutas associadas a cada valor observado. As freqüências relativas e percentuais são obtidas de forma similar à descrita na seção anterior.

Para representar, gracamente um conjunto de dados quantitativos discretos é construído um sistema de eixos cartesianos XY. No eixo vertical, utiliza-se uma escala para representar a magnitude de algum tipo de freqüência; em geral consideram-se as freqüências percentuais. No eixo horizontal, utiliza-se uma escala para representar os valores observados. Logo, para cada um dos dados na escala horizontal levanta-se um segmento de reta vertical cuja magnitude é determinada pela freqüência correspondente.

Exemplo 2.3.2 Com a nalidade de estudar o número de emergências que chegam a um hospital por dia, o administrador de um hospital selecionou uma amostra 50 dias, ao acaso, dos arquivos de um hospital. Os dados são os seguintes:

CAPÍTULO 2. ANÁLISE DESCRITIVA 12

Figura 2.2: Distribuição de alunos desaprovados no semestre 2003/

Ao ordenar os dados em ordem crescente tem-se: 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 3 3 4 4 4 4 4 5 5 5 6 7

Tabela 2.2: Distribuição de freqüências do número de emergências atendidas pelo hospital

Número de Frequência Freqüência Freqüência emergências Absoluta Relativa Percentual Xi fi fri pi 0 10 0,20 20 1 16 0,32 32 2 12 0,24 24 3 2 0,04 4 4 5 0,10 10 5 3 0,06 6 6 1 0,02 2 7 1 0,02 2 Total 50 1,00 100

De maneira similar ao exemplo 2.3.1, as freqüências absolutas são o resultado de um processo de contagem das respostas obtidas nos 50 dias observados. Assim, por exemplo, em 12 dias (em cada um dos 12 dias ) observou-se que o número de emergências atendidas pelo hospital foi igual 2, que em dois

CAPÍTULO 2. ANÁLISE DESCRITIVA 14

Figura 2.4: Distribuição do número de emergências atendidas pelo hospital

  1. Determinar a amplitude de cada intervalo de classe ( h):

h =

A

k quando o quociente A/k não é exato o valor de h deve ser arredondado ao valor superior mais próximo, segundo o número de cifras decimais dos dados.

  1. Gerar os limites dos intervalos. Para o primeiro intervalo considere como limite inferior o valor da observação de menor magnitude, isto é, LI 1 = Xmin. Os limites inferiores dos outros intervalos são obtidos da seguinte forma: LIi = LIi− 1 +h, para i = 2 , 3 ,... , k. Os limites superiores dos intervalos são obtidos: LSi = LIi+1, para i = 1, 2 ,... , k − 1 ou LSi = LSi− 1 + h , para i = 2, 3 ,... , k.
  2. Cada um dos intervalos é da forma [LIi; LSi), isto é, fechado na esquerda e aberto na direita.
  3. Obter as marcas de classe ou ponto médio ( X i′) que são valores representativos da informação contida num intervalo. Numericamente são obtido como a média dos limites inferior e superior do intervalo. Isto é, X i′ = LIi + LSi 2

= LIi + h 2

, i = 1,... , k

  1. Uma vez denidos os intervalos de classe, o passo seguinte consiste em classicar cada observa- ção em um dos ditos intervalos e determinar as freqüências absolutas, isto é, o número de observações que estão dentro de cada intervalo de classe. A partir dessas freqüências, as freqüên- cias relativas e percentuais correspondentes a cada intervalo de classe são obtidos. Além disso, para o caso de dados quantitativos contínuos pode-se determinar a densidade de freqüências ou simplesmente densidade ( di) denido pelo quociente das freqüências relativas (ou freqüências percentual ) e amplitude de intervalo de classe, isto faz com que a área total do histograma seja igual a um (ou 100%).
  2. Adicionalmente, quando se dispõe de dados quantitativos contínuos é conveniente obter as freqüên- cias acumuladas procedendo da seguinte forma:

CAPÍTULO 2. ANÁLISE DESCRITIVA 15

(a) Freqüência acumulada absoluta ( Fi):

Fi =

∑^ i

j=

fj = f 1 + f 2 + · · · + fi = Fi− 1 + fi;

(b) Freqüência acumulada relativa ( Fri ):

Fri =

∑^ i

j=

frj = fr 1 + fr 2 + · · · + fri = Fri− 1 + fri ;

(c) Freqüência acumulada percentual ( Pi):

Pi =

∑^ i

j=

frj = p 1 + p 2 + · · · + pi = Pi− 1 + pi;

(d) Densidade acumulada ( Di):

Di =

∑^ i

j=

dj = d 1 + d 2 + · · · + di = Di− 1 + di;

É necessário levar em conta que as freqüências estão associadas aos intervalos e não às observações, como foi considerado anteriormente para dados qualitativos e quantitativos discretos.

Para representar gracamente, a informação pode ser usada qualquer tipo de freqüência. Em especial, recomenda-se utilizar a freqüência relativa ou percentual que permite analisar a informação indepen- dente do número de observações. Além disso, é possível comparar os resultados com os obtidos em estudos similares sempre que os intervalos de classe forem iguais, ou, ao menos, similares.

O procedimento descrito anteriormente pode ser aplicado também quando se tem dados quantitativos discretos cujo número de resultados possíveis é grande ( maior que 20 ) e sua representação gráca, através dos procedimentos descritos na seção anterior não é apropriada.

Exemplo 2.3.3 Os seguintes dados representam a quantidade de hemoglobina (Hb) em g/dl encon- trados em 40 animais expostos a um produto tóxico. 5,2 10,2 7,0 7,1 10,2 8,3 9,4 9,2 5,4 8, 6,5 7,1 6,6 7,8 6,8 7,2 8,4 9,6 8,7 7, 8,5 5,7 6,4 10,1 8,2 9,0 7,8 8,2 7,8 6, 5,3 6,2 9,1 8,6 7,0 7,7 8,3 7,5 9,8 7,

Para obter a tabela de distribuição de freqüências, procede-se da seguinte maneira:

n = 40, k = 1 + 3, 3 log 10 (40) = 6, 2868 ≈ 6 A = Xmax − Xmin = 10, 2 − 5 , 2 = 5, 0 , h = Ak = 56 = 0, 8333 ≈ 0 , 9 (arredondamento por excesso a uma decimal, ou seja, à mesma precisão dos dados),

LI 1 = Xmin = 5, 2 LI 2 = LI 1 + h = 5, 2 + 0, 9 = 6, 1 LS 1 = LI 2 = 6, 1 X 1 ′ = LI^1 + 2 LS^1 = 5, 65 LI 3 = LI 2 + h = 6, 1 + 0, 9 = 7, 0 LS 2 = LI 3 = 7, 0 X 2 ′ = LI^1 + 2 LS^1 = 6, 55