Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas


apostila estatistica, Notas de estudo de zootecnia

APOSTILA DE ESTATÍSTICA

Tipologia: Notas de estudo

2013

Compartilhado em 05/03/2013

cazemiro-vidal-8
cazemiro-vidal-8 🇧🇷

2 documentos

1 / 100

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
Noções de Bioestatística
Luis Guillermo Coca Velarde, D.Sc.
Departamento de Estatística
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51
pf52
pf53
pf54
pf55
pf56
pf57
pf58
pf59
pf5a
pf5b
pf5c
pf5d
pf5e
pf5f
pf60
pf61
pf62
pf63
pf64

Pré-visualização parcial do texto

Baixe apostila estatistica e outras Notas de estudo em PDF para zootecnia, somente na Docsity!

Noções de Bioestatística

Luis Guillermo Coca Velarde, D.Sc.

Departamento de Estatística

E-mail: [email protected] [email protected]

Índice

Prefácio

A utilização da Estatística pelas diversas áreas Biomédicas tem crescido de forma significativa nos últimos anos ao ponto de ter dado origem ao termo Bioestatística. Assim, toda pesquisa científica nessa área apresenta o cálculo de uma média, um gráfico, o resultado de um teste ou outra ferramenta estatística adequada para o problema específico. A própria Estatística tem se desenvolvido a passos agigantados ao ponto de muitos dos recentes avanços ainda não serem conhecidos pelos profissionais da área Biomédica, o que sugere a necessidade de uma interação constante com os estatísticos. A interação mencionada anteriormente exige uma compreensão dos con- ceitos básicos da Bioestatística de forma a facilitar a troca de informação com os estatísticos, o que resultará num melhor planejamento da pesquisa e uma melhor utilização dos dados coletados. O presente trabalho nasceu a partir das anotações de aula das disciplinas Estatística I e Estatística Aplicada às Ciências Médicas com a intenção de apresentar as ferramentas básicas da Bioestatística aos alunos dos cursos de graduação e pós-graduação em áreas das Ciências Biomédicas da Universi- dade Federal Fluminense, especificamente para os alunos da Faculdade de Nutrição e para os alunos do Curso de Pós-Graduação em Ciências Médicas. O primeiro capítulo apresenta as idéias básicas envolvidas numa pesquisa como população, tipo de estudo, dados, entre outros. A seguir são apresen- tadas as ferramentas usadas para o resumo inicial dos dados. Posteriormente, são mostrados os elementos básicos da teoria de probabilidades, incluindo al- gumas aplicações. Finalmente, os três últimos capítulos tratam da inferência estatística, apresentando os conceitos básicos e os testes mais usados. É necessário mencionar que a intenção deste trabalho não é entrar nos de- talhes da teoria Estatística envolvida por trás das ferramentas apresentadas, contudo, não podemos esquecer que ela é indispensável para que as decisões baseadas em resultados estatísticos sejam as mais confiáveis possíveis. Várias pessoas contribuíram para a elaboração deste texto. Os alunos a quem eu dei aulas desde 1998 na UFF sempre solicitaram este tipo de auxilio e por isto serviram como motivação. Diversos monitores, alunos do curso de Nutrição, trabalharam comigo e ajudaram a criar ou compilar os exem- plos e exercícios desta apostila. Em especial, as monitoras Cristine e Mariá

Capítulo 1

Conceitos iniciais

Diariamente, os meios de comunicação apresentam informações estatísticas provenientes de pesquisas científicas, porém, diversos graus de confiabilidade devem ser atribuídos a essas estatísticas, já que existem diversos fatores que não são incluídos nos relatórios lidos pela população. A palavra pesquisa tem uma conotação poderosa, ficando implícita a con- fiabilidade dos resultados apresentados por ela. Sendo assim, poucas pessoas que não estão envolvidas com a pesquisa estão interessadas com os detalhes dela, importando-se apenas com os resultados finais. Por outro lado, pode se assumir que é possível replicar qualquer pesquisa em igualdade de condições, questionando se os resultados obtidos seriam os mesmos em cada uma das replicações. Pelo exposto anteriormente, toda pesquisa apresenta um ingrediente que foge do controle dos envolvidos e que pode ser chamado de incerteza. A análise estatística permite colocar limites a esta incerteza. Nas pesquisas em ciências biomédicas, geralmente são coletados dados de alguns indivíduos para fazer afirmações sobre grupos maiores, sem interesse particular nesses indivíduos. Então, a informação proveniente de amostras de indivíduos é utilizada para fazer inferência sobre uma população que contém esses mesmos indivíduos. Dessa forma, os conceitos de amostra e população estão ligados com a pesquisa que está sendo desenvolvida. Em algumas situa- ções, geralmente de interesse governamental, é necessária a observação das características de interesse em todos os indivíduos que formam uma popu- lação. Isto constitui um censo. A Estatística aparece nas diversas áreas que um profissional da área de Ciências da Vida pode atuar. Por exemplo, a distribuição Normal padrão, que será vista posteriormente, é utilizada para determinar o estado nutri- cional de crianças. Os modelos de regressão são utilizados para avaliar e quantificar a influência de fatores socioeconômicos e biológicos sobre algu- mas variáveis de interesse como peso ao nascer, estado nutricional, nível de albumina, entre outros.

De forma geral, uma população é um conjunto de indivíduos que apresen- tam uma característica de interesse. Uma amostra é qualquer subconjunto de indivíduos de uma população. Para realizar uma pesquisa que leve a fazer afirmações sobre a população de interesse é necessário seguir os seguintes passos:

  1. Planejamento e desenho
  2. Execução (coleta de dados)
  3. Processamento de dados
  4. Análise de dados
  5. Interpretação, apresentação e publicação de resultados

O primeiro passo desta lista será abordado superficialmente a seguir, as- sim como algumas ideias de amostragem e tipos de variáveis.

1.1 Planejamento de uma pesquisa

É necessário apresentar as diversas formas que se pode realizar um trabalho científico com a finalidade de obter os resultados apropriados ao interesse da pesquisa de forma adequada. Estes estudos serão apresentados de forma a mostrar suas principais características.

1.1.1 Estudos observacionais e experimentais

Em um estudo observacional, o pesquisador coleta a informação sobre os atributos ou faz as medições necessárias, mas não influência as unidades amostrais. Por exemplo, quando se pretende determinar o estado nutricional de uma certa população. Em um estudo experimental, o pesquisador deliberadamente influencia os indivíduos e pesquisa o efeito da intervenção. Estudos em que se pretende conhecer o efeito de uma nova dieta sobre a rapidez em aumentar os níveis de cálcio são exemplos de estudos experimentais. De forma geral, inferências mais fortes são obtidas de estudos experimen- tais porque estes pressupõem um maior controle das unidades amostrais.

1.1.2 Estudos prospectivos e retrospectivos

Existe uma clara diferença entre estudos prospectivos e retrospectivos. Os estudos prospectivos são utilizados quando se pretende conhecer o efeito de algum fator, sendo os dados gerados a partir do início do estudo. Já os

Dependendo das características da populção é possível identificar um es- quema de amostragem para ela. Os esquemas mais adotados estão enumera- dos a seguir:

  1. Amostragem simples aleatória
  2. Amostragem estratificada
  3. Amostragem sistemática
  4. Amostragem por conglomerados

Do ponto de vista estatístico, uma amostra deve estar constituída pelo maior número possível de observações. A teoria de amostragem define pro- cedimentos para calcular o tamanho de amostra necessário para atingir um certo grau de precisão. Em muitas situações este tamanho de amostra é um valor que, sendo o ideal, está fora das possibilidades da pesquisa devido a diversos fatores como tempo ou dinheiro; assim, é necessário desenvolver um estudo específico que leve em consideração a teoria estatística e as possibili- dades reais da pesquisa.

1.3 Tipos de dados

Para qualquer estudo e sob qualquer esquema de amostragem, as informações necessárias serão obtidas a partir de um conjunto de dados. Estes dados podem ser classificados em dois grandes grupos: categóricos e numéricos, e a natureza deles leva à escolha certa de métodos estatísticos de análise.

1.3.1 Dados categóricos

Dados categóricos ou qualitativos são aqueles cujos valores possíveis são ca- tegorias ou características não-numéricas. Estes dados podem ser divididos em ordinais ou nominais dependendo da existência ou não de uma ordem entre os valores possíveis. Como exemplo de dados ordinais, tem-se o estágio de uma doença e de dados nominais o sexo de um indivíduo e o tipo sangüíneo.

Duas categorias

Este tipo de dados categóricos geralmente refere-se à presença ou ausência de algum atributo ou característica. Também recebem os nomes de variáveis sim/não, binárias, dicotômicas ou 0-1. São exemplos: sexo (homem/mulher), gravidez (sim/não), estado civil (casado/solteiro), tabagismo (fumante/não- fumante), entre outros. Estas variáveis binárias geralmente são classificadas como nominais.

1.3.2 Dados numéricos

Também chamados de quantitativos assumem valores numéricos, podendo ser discretos ou contínuos.

Dados discretos

Resultam de contagens de eventos. Exemplo: número de filhos, número de batimentos cardíacos por minuto.

Dados contínuos

Estes dados são obtidos de algum tipo de medição: altura, peso, pressão arterial, temperatura corporal.

1.3.3 Outros tipos de dados

Ranks ou postos

Ocasionalmente, os dados representam a posição relativa dos membros de um grupo com relação a algum ranking. A posição de um indivíduo neste ranking é chamado de posto.

Porcentagens

É necessário ter cuidado quando os dados com os quais se trabalha são por- centagens observadas. Notar que, para uma pressão arterial sistólica (PAS) inicial de 150 mmHg, um aumento de 20% significa que a PAS vai para 180 mmHg e uma diminuição subseqüente de 20% leva a PAS para 144 mmHg.

Escores

São usados quando não é possível fazer medições diretas. Em sua forma mais simples, estes sistemas numéricos classificam uma característica em diversas categorias segundo a opinião de um indivíduo. Por exemplo a dor de um ferimento pode ser classificada como leve, moderada ou severa, podendo ser designado um valor numérico a cada categoria. Deve ser notado que estas escalas são subjetivas.

Dados censurados

Uma observação é chamada censurada se não pode ser medida de forma precisa, mas sabe-se que está além, ou aquém, de um limite. Por exemplo, em alguns experimentos existe um período fixo de acompanhamento, sendo a va- riável de interesse o tempo para aparecer um sintoma ou desaparecer alguma

Capítulo 2

Organização de dados

Quando se estuda uma variável, o primeiro interesse do pesquisador é conhe- cer a distribuição dessa variável através das possíveis realizações (valores) da mesma. O objetivo por trás disto é obter informação que não poderia ser observada através da inspeção visual dos dados. Porém, a informação fornecida pelos dados pode ser apresentada de várias formas: usando tabelas, gráficos ou, inclusive, medidas representativas de dados ou variáveis. Em resumo, os dados precisam ser organizados.

2.1 Distribuição de freqüências

Os dados brutos podem não ser práticos para responder a questões de inte- resse, então, é necessário resumi-los e para isto se faz necessário definir alguns conceitos:

  • Freqüência absoluta é o número de vezes que uma determinada car- acterística ou valor numérico é observada.
  • Freqüência relativa é a proporção, do total, em que é observada uma determinada característica. Sob determinadas condições, as frequên- cias relativas podem ser usadas para estimar quantidades importantes como por exemplo, em epidemiologia, a prevalência, incidência, coefi- cientes de mortalidade e natalidade; em testes clínicos de diagnóstico se tem sensibilidade, especificidade, valor preditivo positivo e valor predi- tivo negativo. Este conceito está associado com a definição clássica de probabilidade.
  • Freqüência acumulada: para um determinado valor numérico ou dado ordinal, é a soma das freqüências dos valores menores ou iguais ao referido valor. Dados este conceitos, é possível resumir um conjunto de dados através das tabelas de distribuições de frequências.

2.1.1 Distribuição de freqüências não-agrupadas

Este tipo de distribuição é utilizada quando o número de valores possíveis da variável em estudo é reduzido. Serve para representar variáveis categóricas e, em alguns casos, numéricas. A disribuição de freqüências não-agrupadas é representada em uma tabela que contém, pelo menos duas colunas:

  1. Listagem de todos os possíveis valores da variável.
  2. Freqüências associadas aos valores da variável em estudo.

Exemplo: Em uma escola do município de Niterói, foram avaliadas 145 crianças com idade entre 6 e 10 anos, calculando-se o estado nutricional segundo os critérios da OMS. Para estas crianças, as tabelas de distribuição de freqüências das variáveis estado nutricional e idade aparecem a seguir:

Categoria f fr Baixo peso 11 0, Normal 105 0, Sobrepeso 25 0, Obeso 4 0, 145 1, Idade f f r F F r 6 11 0,11 11 0, 7 27 0,27 38 0, 8 16 0,16 54 0, 9 19 0,19 73 0, 10 26 0,27 99 1, 99 1,

Onde f é a freqüência absoluta, fr é a freqüência relativa, F é a freqüência absoluta acumulada e F r é a freqüência relativa acumulada.

2.1.2 Distribuição de freqüências agrupadas

A distribuição de freqüências agrupadas é utilizada para variáveis numéri- cas contínuas, ou quando existem muitos valores possíveis para uma variável discreta. O procedimento de construção da tabela é simples mas tedioso ten- do como idéia básica criar intervalos, ou classes, para a variável em estudo e calcular as freqüências para esses intervalos. Os dados de idade de vítimas fatais em acidentes de trânsito na Inglaterra na década de 70, que apare- cem nas tabelas 2.1 e 2.2, serão usados como exemplo. Nestes dados é fácil

  • Prefácio
  • 1 Conceitos iniciais
    • 1.1 Planejamento de uma pesquisa
      • 1.1.1 Estudos observacionais e experimentais
      • 1.1.2 Estudos prospectivos e retrospectivos
      • 1.1.3 Estudos longitudinais e de corte transversal
      • 1.1.4 Estudos de caso-controle e coorte
    • 1.2 Amostragem
    • 1.3 Tipos de dados
      • 1.3.1 Dados categóricos
      • 1.3.2 Dados numéricos
      • 1.3.3 Outros tipos de dados
    • 1.4 Exercícios
  • 2 Organização de dados
    • 2.1 Distribuição de freqüências
      • 2.1.1 Distribuição de freqüências não-agrupadas
      • 2.1.2 Distribuição de freqüências agrupadas
    • 2.2 Representação gráfica de dados
      • 2.2.1 Gráficos de setores
      • 2.2.2 Gráficos de barras e colunas
      • 2.2.3 Gráficos de dispersão
      • 2.2.4 Gráfico de séries de tempo
      • 2.2.5 Histograma
      • 2.2.6 Polígono de freqüências
      • 2.2.7 Tipos de distribuições
    • 2.3 Medidas de posição
      • 2.3.1 Média aritmética (X)
      • 2.3.2 Mediana (Me)
      • 2.3.3 Percentil
    • 2.4 Medidas de variação
      • 2.4.1 Coeficiente de variação
      • 2.4.2 Coeficiente de assimetria
      • 2.4.3 Boxplot ou diagrama de caixas
    • 2.5 Exercícios
  • 3 Elementos de probabilidades e suas distribuições
    • 3.1 Probabilidades
      • 3.1.1 Definições de probabilidade
      • 3.1.2 Probabilidade condicional
      • 3.1.3 Teorema de Bayes
    • 3.2 Algumas aplicações das probabilidades
      • 3.2.1 Comparação de riscos e risco relativo
      • 3.2.2 Epidemiologia
      • 3.2.3 Teste de diagnóstico
    • 3.3 Distribuições de probabilidades
      • 3.3.1 Distribuição Binomial
      • 3.3.2 Distribuição Poisson
      • 3.3.3 Distribuição Exponencial
      • 3.3.4 Distribuição Normal
    • 3.4 Distribuições amostrais
      • 3.4.1 Distribuição t de Student
    • 3.5 Exercícios
  • 4 Inferência estatística
    • 4.1 Intervalos de confiança
    • 4.2 Exercícios
    • 4.3 Teste de hipótese
      • 4.3.1 Valor p
      • 4.3.2 Erros Tipo I e II
      • 4.3.3 Procedimento geral de teste de hipótese
  • 5 Comparação de grupos: dados contínuos
    • 5.1 Teste para a média de um único grupo de observações
      • 5.1.1 Teste do sinal e teste de Wilcoxon
    • 5.2 Teste para as médias de dois grupos de observações pareadas
    • 5.3 Teste para as médias de dois grupos independentes
      • 5.3.1 Teste de Mann-Whitney
    • 5.4 Comparação de mais de duas médias independentes
    • 5.5 Testes de normalidade
    • 5.6 Exercícios
  • 6 Comparação de grupos: dados categóricos
    • 6.1 Uma única proporção
    • 6.2 Proporções em dois grupos independentes
    • 6.3 Duas proporções em amostras pareadas
    • 6.4 Teste χ
    • 6.5 Exercícios
  • A Respostas selecionadas
  • B Distribuição Normal padrão N(0; 1)
  • C Distribuição t-Student
  • D Distribuição χ^2
    • 1,7 3,6 3,5 1,0 2,5 30,5 36,7 57,2 38,2 53,7 0,7 3,
    • 0,5 4,0 2,2 35,2 28,2 33,6 46,6 51,7 1,8 0,7 1,8 1,
    • 0,2 58,6 26,5 56,0 42,1 42,1 2,5 2,6 0,3 2,7 1,5 27,
  • 36,0 42,6 58,9 40,2 3,2 1,4 0,8 3,4 2,5 48,5 56,3 45,
  • 34,5 59,0 2,3 0,3 3,2 5,1 6,5 29,8 45,1 44,0 55,5 26,
    • 5,2 8,5 7,1 7,0 6,2 38,6 48,0 53,2 44,9 45,2 7,7 8,
    • 8,2 8,2 7,7 56,2 40,1 36,0 30,8 30,6 5,3 7,4 6,0 5,
    • 7,1 53,2 29,9 55,0 28,5 34,8 8,5 8,6 8,4 5,1 7,3 46,
  • 50,7 49,8 42,8 45,3 5,6 8,9 8,6 5,4 7,9 53,6 43,3 38,
  • 34,5 39,9 8,7 8,3 8,4 6,2 5,4 55,6 30,3 34,4 43,9 37,
  • 31,8 37,8 48,8 35,8 32,7 7,9 6,2 6,5 7,1 6,4 6,5 8,
    • 5,8 5,8 5,5 44,8 42,2 46,5 36,8 55,0 5,4 6,2 7,1 5,
  • 13,4 42,9 26,9 44,1 56,0 25,3 12,1 13,1 13,8 10,7 10,2 39,
  • 40,1 53,4 38,1 36,1 12,3 13,8 13,4 13,6 12,4 45,3 46,0 41,
  • 49,6 27,3 14,6 14,2 12,1 13,6 14,1 53,3 47,9 35,6 51,9 31,
  • 10,7 12,6 14,4 10,2 10,7 50,0 48,6 34,1 50,1 38,2 14,5 12,
  • 12,1 14,7 10,7 56,4 49,5 37,6 28,2 50,3 14,6 11,1 10,4 10,
  • 13,1 51,7 28,7 39,2 45,5 57,9 10,3 14,6 13,7 11,0 14,8 57,
  • 51,5 31,6 30,4 58,7 12,9 13,6 10,6 14,4 14,7 35,9 27,9 43,
  • 30,8 46,6 10,9 10,9 13,0 10,9 10,1 12,7 10,7 51,6 46,3 25,
  • 15,0 13,0 12,0 14,7 10,7 14,6 10,2 51,0 39,8 39,1 12,2 12,
  • 12,5 16,0 16,0 16,0 16,0 33,1 49,2 58,9 16,0 16,0 16,0 16,
  • 16,0 16,0 16,0 25,3 34,6 32,4 16,0 16,0 16,0 16,0 16,0 16,
  • 16,0 46,6 35,0 79,1 16,0 16,0 17,0 17,0 17,0 17,0 17,0 33,
  • 44,0 67,4 17,0 17,0 17,0 17,0 17,0 17,0 17,0 58,9 39,6 75,
  • 17,0 17,0 17,0 17,0 17,0 17,0 17,0 43,8 49,0 63,7 17,0 17,
  • 17,0 17,0 17,0 17,0 17,0 46,1 35,5 68,2 17,0 17,0 17,0 17,
  • 17,0 19,6 19,4 34,4 53,9 77,8 18,6 19,4 19,2 19,0 18,6 20,
  • 18,6 55,3 27,6 75,4 18,5 18,4 19,0 18,0 19,0 19,4 18,1 33,
  • 37,7 73,0 18,9 19,2 20,0 19,5 18,7 19,2 20,0 53,6 29,7 70,
  • 19,0 19,5 19,1 19,5 18,3 20,0 19,7 33,4 53,0 63,8 19,1 18,
  • 18,7 18,6 18,5 19,2 19,3 49,0 45,0 69,7 18,3 19,9 18,5 19,
  • 18,6 18,0 18,6 46,3 30,2 65,3 19,3 18,1 19,7 19,2 18,4 19,
  • 18,4 33,3 40,7 63,0 19,9 19,8 19,8 18,8 19,8 19,0 19,4 47,
  • 19,5 18,3 18,8 19,5 19,7 18,1 21,2 49,4 55,1 34,7 23,1 21,
  • 22,2 20,3 23,6 20,0 20,5 30,7 33,8 37,3 22,6 24,0 22,3 21,
  • 20,0 22,8 23,2 32,0 49,0 53,2 20,0 23,2 20,7 20,9 22,0 20,
  • 22,5 33,1 53,6 58,9 21,7 22,7 22,3 23,2 23,6 23,1 23,9 53,
  • 25,5 70,3 23,9 21,3 22,5 21,3 21,2 22,3 20,1 38,8 48,2 63,
  • 21,9 22,6 20,2 20,6 22,5 21,6 20,4 38,0 33,5 71,8 23,9 23,
  • 22,9 21,0 23,2 22,1 21,5 40,7 35,3 70,5 23,3 21,4 22,5 22,
  • 23,3 22,4 21,5 69,7 61,3 67,2 20,2 21,9 24,0 20,9 22,2 22,
  • 22,0 70,9 74,5 79,6 23,2 21,1 23,6 23,9 21,5 22,9 23,3 63,
  • 61,7 65,2 21,2 21,3 23,6 23,5 22,3 20,5 23,5 62,8 64,7 76,
  • 23,7 22,8 23,2 22,3 20,6 21,8 22,0 69,3 60,8 74,3 22,6 20,
  • 23,3 22,0 23,3 23,3 21,0 78,1 70,4 66,1 21,8 21,6 21,5 23,
  • 22,2 23,5 20,1 65,1 75,7 71,8 22,1 20,4 23,2 21,9 21,5 20,
  • 21,2 63,2 65,5 69,9 21,2 22,7 20,4 20,3 20,4 23,7 21,1 79,
  • 63,3 74,8 23,8 20,3 23,1 23,3 20,0 21,8 23,6 62,3 63,8 78,
  • 23,9 22,8 22,9 21,6 20,3 22,9 21,3 42,3 58,3 54,8 22,5 20,
  • 20,6 21,4 23,1 23,6 23,6 53,9 43,9 32,4 21,4 22,8 20,6 20,
  • 22,1 23,2 23,8 58,2 26,5 35,6 22,1 21,5 23,6 20,9 23,2 20,
  • 22,8 65,4 68,4 61,6 20,8 58,6 44,1 29,0 44,3 42,5 40,9 71,
  • 78,3 61,5 58,7 41,2 36,8 43,4 53,7 45,7 26,9 73,7 72,3 70,
  • 25,2 28,5 36,0 31,5 55,7 35,4 41,8 78,7 72,6 70,6 40,0 42,
  • 29,6 52,4 35,4 28,2 52,8 75,7 64,2 66,9 54,0 34,4 42,8 32,
  • 56,6 30,7 27,7 72,6 67,5 63,4 43,0 44,3 57,0 47,9 34,6 54,
  • 41,7 63,8 60,3 65,8 57,5 57,5 34,4 34,0 29,5 36,6 40,3 65,
  • 62,3 76,2 34,2 27,7 53,1 54,2 54,6 33,3 53,6 62,1 70,2 66,
  • 38,0 41,5 44,7 35,3 41,3 46,3 25,1 69,5 78,2 73,2 52,1 48,
  • 33,7 43,8 31,0 43,3 53,6 66,4 64,7 75,3 42,1 56,2 38,6 30,
  • 40,4 54,8 43,6 77,3 65,0 75,8 48,9 43,3 34,7 48,6 43,4 27,
  • 39,0 63,5 65,9 66,0 36,9 37,3 40,8 41,8 51,0 33,0 49,6 71,
  • 74,3 76,5 38,0 27,1 58,3 27,2 41,3 38,0 39,9 63,1 70,1 60,
  • 37,5 39,8 55,5 31,5 51,9 45,4 50,8 63,5 75,2 25,2 52,5 40,
  • 37,9 58,5 51,1 37,0 45,6 75,0 65,2 44,6 54,7 46,7 33,9 51,
  • 29,7 42,4 26,6 71,7 64,4 69,9 35,3 45,8 49,6 46,5 40,4 55,
  • 27,1 70,1 75,3 75,7 45,6 51,9 41,8 29,5 36,0 35,1 78,

perceber a dificuldade de apontar qualquer característica geral da situação em estudo devido ao grande volume de números existentes. Uma consideração importante para a elaboração de tabelas de distribuição de freqüências agrupadas é sobre o tamanho de cada intervalo. Nesse sentido existem duas alternativas, a primeira que consiste em considerar intervalos do mesmo tamanho ou a segunda que define tamanhos diferentes para os intervalos, dependendo de diversos fatores associados ao problema específico.

Intervalos de tamanhos iguais

A primeira alternativa na construção de tabelas de distribuição de freqüências é sempre considerar intervalos de tamanho igual. Neste caso, será fácil calcu- lar a freqüência relativa de cada intervalo como sendo a divisão da freqüência absoluta pelo tamanho da amostra. A tabela de distribuição de freqüências para os dados citados anteriormente aparece a seguir:

Idade f fr F F r X^0 0 8 61 0,07 61 0,07 4 8 16 71 0,09 132 0,16 12 16 24 264 0,32 396 0,48 20 24 32 54 0,07 450 0,55 28 32 40 83 0,10 533 0,65 36 40 48 83 0,10 616 0,75 44 48 56 72 0,09 688 0,84 52 56 64 48 0,06 736 0,90 60 64 72 45 0,06 781 0,96 68 72 80 34 0,04 815 1,00 76 815 1,

Nesta tabela, há uma coluna contendo a marca de classe (X^0 ) que é o ponto central de cada intervalo e que será usada, posteriormente, para calcular a média.

Tamanhos de intervalos diferentes

Existe informação adicional quando se trabalha com alguns problemas da área biomédica e esta informação pode ser útil para construir intervalos de tamanhos diferentes. Por exemplo, quando se trabalha com idades e desen- volvimento de massa corporal sabe-se que existem algumas faixas etárias com características importantes e outras em que não existe grande desenvolvimen- to. Isto poderia levar a definir intervalos de tamanho menor em que se espera maior e mais rápido desenvolvimento e intervalos de maior tamanho em que existe relativa estabilidade nesse desenvolvimento. Desta forma, será possível observar as mudanças nas faixas de interesse.

alguns dados numéricos em que existem poucos valores possíveis. Para a elaboração destes gráficos serão construídos setores de uma circunferência cujo ângulo, a partir do centro, será proporcional ao número de indivíduos com uma particular característica, isto é, proporcional com a freqüência. As tabelas 2.3, 2.4 e 2.5 geram exemplos de gráficos de setores em três situações diferentes, apresentados nas Figuras 2.1, 2.2 e 2.3.

Origem dos alunos Frequência Urbana 240 Suburbana 1400 Rural 360

Tabela 2.3: Distribuição da origem de estudantes de uma escola pública

Classificação Número de crianças Normal 84 Sobrepeso 9 Obeso 6

Tabela 2.4: Distribuição da avaliação nutricional de um grupo de crianças usando o índice peso para altura

Classificação Número de jovens Baixo peso 11 Normal 105 Sobrepeso 25 Obeso 4

Tabela 2.5: Distribuição da avaliação nutricional de um grupo de jovens

2.2.2 Gráficos de barras e colunas

Este tipo de gráficos é utilizado para representar dados numéricos discretos e, em alguns casos, dados categóricos. Nele, num dos eixos coordenados são rep- resentadas as frequências e no outro os valores da variável. São construidas colunas ou barras para cada valor da variável com uma altura proporcional com a frequência. Não existe diferença entre o gráfico de barras e o de col- unas a não ser pela troca de variáveis nos eixos coordenados, como aparece no gráfico de colunas da figura 2.4 e no de barras da figura 2.5.

Origem de 2000 estudantes

1 2 %

7 0 %

1 8 % Urbana Suburbana Rural

Figura~2.1: Gráfico de setores da origem de estudantes de uma escola públi- ca.

Índice P/A para crianças

Normal 8 5 %

Sobrepeso 9 %

Obesidade 6 %

Figura~2.2: Gráfico de setores da avaliação nutricional de um grupo de cri- anças, usando o índice peso para altura.