




























































































Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Encontra documentos específicos para os exames da tua universidade
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Um livro para iniciar no estudo da estatística.
Tipologia: Manuais, Projetos, Pesquisas
1 / 219
Esta página não é visível na pré-visualização
Não perca as partes importantes!





























































































Prof: Vicente Garibay Cancho
-Ouro Preto, 5 de Agosto de 2004-
1.1 Introdução e Denição de Estatística
O termo estatística é derivado da palavra "estado", em virtude de ser função tradicional dos governos centrais levantar registros da população, tais como nascimentos, mortes, prossões e entre outras atividades. Contar e medir esses fatos gera muitas classes de dados numéricos.
A estatística é concebida popularmente como colunas de cifras ou grácos, associadas geralmente com médias. Esse conceito se aproxima muito da denição tradicional de estatística: coleção, organização, resumo e apresentação de dados numéricos. Atualmente a estatística é uma ciência (ou método) baseada na teoria de probabilidades, cujo objetivo principal é auxiliar-nos a tomar decisões ou tirar conclusões em situações de incerteza, a partir de informações numéricas.
Como um procedimento de tomada de decisões, a estatística tem uma importância crescente em vários campos, por exemplo, na produção industrial, na medicina, na nutrição e biologia, na economia, na política, na psicologia, na análise de opinião pública e outras ciências sociais, na agricultura, na física, na química e na engenharia.
1.2 Populações e Amostras
Uma população é o conjunto maior de indivíduos ou objetos cujo estudo nos interessa ou acerca dos quais deseja ter informações. Os elementos desse conjunto se denominam dados ou observações. As observações mensuráveis denominam-se dados quantitativos. Por exemplo, altura de estudantes, idade de pessoas, a duração de uma lâmpada de luz ( vida útil das lâmpadas) etc. Porém, o sexo, o estado civil das pessoas, a marca de cigarros são não mensuráveis e denominam-se dados qualitativos. Assim, uma população estatística é o conjunto de observações quantitativas ou qualitativas. A população sendo innita, portanto, é impossível ter uma informação completa sobre ela, a população sendo numerosa talvez não seja possível estudar cada um dos seus elementos. Nesses casos, recorre-se à informação proporcionada por uma parte nita da população chamada amostra. Em estatística é freqüente trabalhar com as chamadas amostras aleatórias, nas quais todos os elementos da população têm a mesma chance de serem escolhidos para compor a amostra. Uma amostra aleatória tem a propriedade de reetir as características da população da qual foi sorteada. Alguns exemplos de população
amostra: 2000 eleitores entrevistados em uma pesquisa pelo IBOPE.
amostra: 30 peças sorteadas ao acaso da produção de um dia maquina.
amostra: 20 artigos sorteados ao acaso para inspeção.
1.3 Parâmetro e Estatística
Um parâmetro é uma medida que descreve alguma característica de toda a população. Para deter- minar seu valor, é necessário utilizar a informação da população(censo). Com isso, as decisões são tomadas com certeza absoluta.
Uma estatística é uma medida que é obtida a partir dos dados amostrais e descreve alguma caracte- rística de uma amostra. As decisões nesse caso, tomadas com um grau de incerteza.
1.4 Etapas do Método de Análise Estatística
A estatística, como ciência, tem como objetivo desenvolver procedimentos que permitam obter con- clusões acerca dos parâmetros de uma população a partir das informações contida na amostra. Para a aplicação objetiva e pragmática dos procedimentos e técnicas estatísticas é recomendável seguir as seguintes etapas:
i) Formulação do problema e denição de um objetivo
ii) Planejamento do experimento.
iii) Recolha de dados.
iv) Análise de dados.
v) Estabelecimento de inferência estatística acerca da população (com base na informação amostral).
É evidente a necessidade de encarar essa etapa com máximo rigor pois dela dependerá a forma como se desenvolverão todos os passos seguintes. Nesse sentido, deve-se determinar, nessa etapa, de forma clara, quais são os problemas apresentados e quais são os objetivos da investigação.
Nessa etapa deve-se denir que informações devem ser e como são recolhidos( amostra ou censo ?). O objetivo é obter um conjunto adequado de dados que permita alcançar os objetivos da pesquisa.
∑b i=a
Xi é igual b − a + 1
∑n i=
cXi = c
∑n i=
Xi
i=
(Xi + Yi − Zi) =
∑^ n
i=
Xi +
∑^ n
i=
Yi −
∑^ n
i=
Zi
∑n i=
Xi =
∑n j=
Xj
1.6 Somatório double
Freqüentemente em estatística deseja-se conhecer a interação entre duas variáveis, assim por exemplo, considere as 20 determinações de pressão sangüínea sistólica tomadas a um indivíduo que participa de um programa idealizado para estudar fontes e intensidade de variação de leituras da pressão sangüínea. A pressão do sangue foi medida por 4 médicos em cada uma das 5 visitas. Os dados são apresentados na seguinte tabela 1.1 Com a nalidade de ordenar linearmente essas duas classicações, utiliza-se
Tabela 1.1: Leituras da pressão sanguínea sistólica de um individuo tomadas em 5 visitas por 4 observadores Número de visitas número de médicos 1 2 3 4 1 118 112 116 118 2 120 116 112 112 3 114 120 112 117 4 118 116 118 116 5 118 108 122 116
um sistema de dois subíndices, isto é, usam-se um subíndice para o número de visitas e outro para o número de médicos. Em tais situações é freqüente utilizar as letras i e j para indicar o número da linha e o número da coluna, respectivamente. A cada observação denota-se por Xij que indica o dado da i-ésima linha e j-ésima coluna. No conjunto de dados da tabela 1.1, X 34 = 117, X 32 = 120, por exemplo.
Considere agora, os diversos tipos de soma, por exemplo, a soma dos elementos da terceira linha é ∑^4
j=
X 3 j. (na linha 3, o primeiro subíndice é xo, o que muda é o segundo subíndice).
Para somar todos elementos da tabela 1.1, pode-se proceder de duas maneiras, primeiro somar os elementos correspondentes a cada linha e logo determinar a soma dessas somas ou somar cada coluna e logo somar essas somas.
por linhas temos:
∑^4
j=
X 1 j +
j=
X 2 j +
j=
X 3 j +
j=
X 4 j +
j=
X 5 j =
i=
j=
Xij
por colunas temos: ∑^5
1=
Xi 1 +
i=
Xi 2 +
i=
Xi 3 +
i=
Xi 4 =
j=
i=
Xij
No exemplo: ∑^5
i=
j=
Xij = 464 + 460 + 463 + 468 + 464 = 2319.
j=
i=
Xij = 588 + 572 + 580 + 579 = 2319.
Em geral, suponha que a tabela 1.1, tenha n linhas e m colunas, então, soma de todos elementos da tabela é: (^) n ∑
i=
∑^ m
j=
Xij.
1.7 Exercícios
(a)
∑n i=
[Xi(Xi + X¯) + (Xi − X¯)^2 ] = 2
∑n j=
X j^2 , se X¯ = (^1) n
∑n i=
Xi.
(b)
∑n i=
(Xi − X¯) = 0, se X¯ = (^1) n
∑n i=
Xi.
(c)
∑n i=
Xi(Xi − X¯) =
∑n i=
(Xi − X¯)^2. se X¯ = (^) n^1
∑n i=
Xi.
(d)
∑n i=
∑^ n j=
(Xi − X¯)(Yj − Y¯ )^2 = 0, se X¯ = (^) n^1
∑n i=
Xi e Y¯ = (^) n^1
∑n i=
Yi
(e)
∑n i=
[Xi(Xi + X¯) − X¯^2 ] =
∑n i=
X i^2 , se X¯ = (^1) n
∑n i=
Xi.
2.1 Introdução
O objetivo da estatística descritiva, já identicado anteriormente, é o de representar de uma forma compreensível a informação contida nos dados. A necessidade de um esforço de classicação desses dados e de síntese da informação neles contida resulta da incapacidade que, normalmente, a mente humana tem de assimilar e interpretar conjuntos signicativos de dados que sejam apresentados de uma forma desorganizada.
A forma de representar a informação contida numa amostra ou numa população depende antes de tudo, da escala na qual são expressos os dados que a integram. Por essa razão, antes de analisar as técnicas de estatística descritiva mais freqüentemente utilizadas, é apresentado uma classicação dos dados (ou variáveis).
2.2 Classicação dos Dados
Os dados podem ser classicados em qualitativos e quantitativos
São aqueles dados cujos resultados não podem ser expressos em forma numérica. Esses tipos de dados classicam-se em:
Qualitativo ordinal
Para esses tipos de dados é possível estabelecer uma relação de ordem entre as possíveis categorias, por exemplo, grau de instrução de funcionários de uma empresa (1 0 grau, 20 grau, superior), opinião de um grupo de pessoas sobre um programa de TV( ruim, regular, bom, muito bom).
Qualitativo nominal
Nesses tipos de dados não há uma relação de ordem entre as possíveis categorias. Por exemplo: cor de preferência, lugar de procedência dos estudantes de uma universidade.
São aqueles cujos resultados são expressos em forma numérica e são de dois tipos:
Quantitativos discretos
São dados que tem um número nito ou innito enumerável de possíveis valores. Usualmente são associados a processos de contagem, onde o resultado é representado mediante um número inteiro. Por exemplo; número de alunos por sala de aula, número de lhos por família na cidade de Ouro Preto, etc.
Quantitativos contínuos
São dados que têm um número innito não enumerável de possíveis valores e são representados por números de um intervalo real. Por exemplo: Altura do aluno da turma 21, peso de crianças recém nascidas num hospital universitário etc.
2.3 Organização e Representação de Dados
Se os dados são qualitativos são simplesmente, agrupados segundo a freqüência e a proporção ou porcentagem de cada categoria e representados gracamente mediante barras horizontais ou verticais ou diagramas circulares (ou gráco de pizza).
Exemplo 2.3.1 A 40 alunos que foram reprovados em alguma disciplina do semestre anterior. per- guntado em quais disciplinas tinham sido reprovados e as respostas foram as seguintes:
Cálculo II Cálculo II Cálculo I Álgebra Estatística Estatística Cálculo II Biologia Química Cálculo II Estatística Cálculo I Estatística Álgebra Álgebra Estatística Cálculo II Álgebra Álgebra Cálculo I Cálculo I Estatística Cálculo II Cálculo II Cálculo II Estatística Cálculo I Estatística Genética Mecânica Economia Estatística Cálculo I Bioquimica Cálculo II Cálculo I Fisica Cálculo II Quimica Física
A freqüência absoluta são o resultado de um processo de contagem das respostas obtidas entre os 40 alunos consultados. Assim, por exemplo, 10 alunos desaprovaram na disciplina de Cálculo II, 7 desaprovaram em cálculo I, etc. Observa-se que a soma das freqüências absolutas é igual ao número total de alunos consultados ou também chamada de tamanho da amostra a qual será denotado por n.
Suponha que um conjunto de dados qualitativos tenha k categorias (no exemplo k = 5) então
∑k i=
fi = n
Figura 2.1: Distribuição de alunos desaprovados no semestre 2003/1.
Podem ser utilizados, também, efeitos tridimensionais para obter uma melhor apresentação. Por exemplo, o gráco anterior pode ser mostrado como:
Para organizar e representar dados qualitativos ordinais, geralmente, ordena-se as categorias dos dados em ordem de maior a menor hierarquia.
Quantitativos discretos
Para dados quantitativos discretos cujo número de resultados possíveis não é grande ( não é maior que 12 ou 15), a informação pode ser classicada e representada diretamente sem perda de informação da mesma.
Nesses casos, primeiro ordena-se a informação segundo sua magnitude e, em seguida obtém-se as freqüências absolutas associadas a cada valor observado. As freqüências relativas e percentuais são obtidas de forma similar à descrita na seção anterior.
Para representar, gracamente um conjunto de dados quantitativos discretos é construído um sistema de eixos cartesianos XY. No eixo vertical, utiliza-se uma escala para representar a magnitude de algum tipo de freqüência; em geral consideram-se as freqüências percentuais. No eixo horizontal, utiliza-se uma escala para representar os valores observados. Logo, para cada um dos dados na escala horizontal levanta-se um segmento de reta vertical cuja magnitude é determinada pela freqüência correspondente.
Exemplo 2.3.2 Com a nalidade de estudar o número de emergências que chegam a um hospital por dia, o administrador de um hospital selecionou uma amostra 50 dias, ao acaso, dos arquivos de um hospital. Os dados são os seguintes:
Figura 2.2: Distribuição de alunos desaprovados no semestre 2003/
Ao ordenar os dados em ordem crescente tem-se: 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 3 3 4 4 4 4 4 5 5 5 6 7
Tabela 2.2: Distribuição de freqüências do número de emergências atendidas pelo hospital
Número de Frequência Freqüência Freqüência emergências Absoluta Relativa Percentual Xi fi fri pi 0 10 0,20 20 1 16 0,32 32 2 12 0,24 24 3 2 0,04 4 4 5 0,10 10 5 3 0,06 6 6 1 0,02 2 7 1 0,02 2 Total 50 1,00 100
De maneira similar ao exemplo 2.3.1, as freqüências absolutas são o resultado de um processo de contagem das respostas obtidas nos 50 dias observados. Assim, por exemplo, em 12 dias (em cada um dos 12 dias ) observou-se que o número de emergências atendidas pelo hospital foi igual 2, que em dois
Figura 2.4: Distribuição do número de emergências atendidas pelo hospital
h =
k quando o quociente A/k não é exato o valor de h deve ser arredondado ao valor superior mais próximo, segundo o número de cifras decimais dos dados.
= LIi + h 2
, i = 1,... , k
(a) Freqüência acumulada absoluta ( Fi):
Fi =
∑^ i
j=
fj = f 1 + f 2 + · · · + fi = Fi− 1 + fi;
(b) Freqüência acumulada relativa ( Fri ):
Fri =
∑^ i
j=
frj = fr 1 + fr 2 + · · · + fri = Fri− 1 + fri ;
(c) Freqüência acumulada percentual ( Pi):
Pi =
∑^ i
j=
frj = p 1 + p 2 + · · · + pi = Pi− 1 + pi;
(d) Densidade acumulada ( Di):
Di =
∑^ i
j=
dj = d 1 + d 2 + · · · + di = Di− 1 + di;
É necessário levar em conta que as freqüências estão associadas aos intervalos e não às observações, como foi considerado anteriormente para dados qualitativos e quantitativos discretos.
Para representar gracamente, a informação pode ser usada qualquer tipo de freqüência. Em especial, recomenda-se utilizar a freqüência relativa ou percentual que permite analisar a informação indepen- dente do número de observações. Além disso, é possível comparar os resultados com os obtidos em estudos similares sempre que os intervalos de classe forem iguais, ou, ao menos, similares.
O procedimento descrito anteriormente pode ser aplicado também quando se tem dados quantitativos discretos cujo número de resultados possíveis é grande ( maior que 20 ) e sua representação gráca, através dos procedimentos descritos na seção anterior não é apropriada.
Exemplo 2.3.3 Os seguintes dados representam a quantidade de hemoglobina (Hb) em g/dl encon- trados em 40 animais expostos a um produto tóxico. 5,2 10,2 7,0 7,1 10,2 8,3 9,4 9,2 5,4 8, 6,5 7,1 6,6 7,8 6,8 7,2 8,4 9,6 8,7 7, 8,5 5,7 6,4 10,1 8,2 9,0 7,8 8,2 7,8 6, 5,3 6,2 9,1 8,6 7,0 7,7 8,3 7,5 9,8 7,
Para obter a tabela de distribuição de freqüências, procede-se da seguinte maneira:
n = 40, k = 1 + 3, 3 log 10 (40) = 6, 2868 ≈ 6 A = Xmax − Xmin = 10, 2 − 5 , 2 = 5, 0 , h = Ak = 56 = 0, 8333 ≈ 0 , 9 (arredondamento por excesso a uma decimal, ou seja, à mesma precisão dos dados),
LI 1 = Xmin = 5, 2 LI 2 = LI 1 + h = 5, 2 + 0, 9 = 6, 1 LS 1 = LI 2 = 6, 1 X 1 ′ = LI^1 + 2 LS^1 = 5, 65 LI 3 = LI 2 + h = 6, 1 + 0, 9 = 7, 0 LS 2 = LI 3 = 7, 0 X 2 ′ = LI^1 + 2 LS^1 = 6, 55