Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas


Estatistica para docente, Manuais, Projetos, Pesquisas de Estatística Aplicada

estatistica para docente estatistica para docente estatistica para docente estatistica para docente estatistica para docente estatistica para docente estatistica para docente estatistica para docente estatistica para docente estatistica para docente estatistica para docente estatistica para docente

Tipologia: Manuais, Projetos, Pesquisas

2020

Compartilhado em 20/05/2020

rodrigo-castro-50
rodrigo-castro-50 🇧🇷

5

(1)

1 documento

1 / 59

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
Estatística Prática para Docentes e Pós-Graduandos
de Geraldo Maia Campos
Prefácio
Que minhas primeiras palavras sejam para explicar por que este livro foi escrito, e por que o
escrevi da maneira como ele se apresenta. Ele não surgiu evidentemente de nenhuma
inspiração momentânea. Pelo contrário, é fruto de anos de meditação e a amparar-me tenho a
experiência de mais de vinte anos dedicados à orientação e à elaboração da análise estatística
de muitas centenas de trabalhos de pesquisa, tanto teses como artigos para publicação, e tanto
de minha própria autoria como de outros pesquisadores, muitos destes bastante experientes
em pesquisa, mas comumente pouco versados em Estatística. Nesses anos todos, eu era
freqüentemente fustigado sempre pela mesma intrigante pergunta: por que teriam as pessoas
tanta dificuldade em entender e em aplicar os métodos estatísticos, que a mim me pareciam
tão lógicos e tão simples? Cheguei à conclusão de que o problema da Estatística deveria ser o
mesmo da Matemática - que a grande maioria dos pesquisadores que a mim recorriam
(geralmente da área biológica) ia declarando logo de início detestar cordialmente. Essa
aversão generalizada à Matemática estendia-se pois à Estatística porque, por algum motivo, o
conceito de Estatística parecia-lhes estar intimamente ligado ao de Matemática. Isso talvez até
seja verdadeiro para quem se dedica a criar, desenvolver ou aperfeiçoar métodos e testes
estatísticos, ou até mesmo para quem pretende programar esses testes em computador. Mas
não o é para aqueles que são apenas usuários dos métodos e testes estatísticos, e não os seus
idealizadores ou programadores. Nesse caso, por que a ojeriza generalizada à Estatística? E
por que a maioria das pessoas não conseguia entender os seus métodos e a sua lógica, não
obstante todas tivessem feito um ou outro curso de Estatística em sua vida, às vezes a
mais de um? Por que seria a Estatística considerada assim tão dificil? Cheguei à conclusão de
que, se a Estatística não era na verdade tão difícil, então era fatal concluir que, se os
estudantes não conseguiam entendê-la, era porque deveria estar sendo ensinada de uma forma
incorreta. Mas, se estava sendo mal ensinada, qual seria a melhor maneira e o modo mais
correto de fazê-lo? Muitas horas de meditação levaram-me por fim a desenvolver um método
de ensino da Estatística, com base nos procedimentos que vinha adotando ao longo dos muitos
anos em que atendi aos que me procuravam para ajudá-los a resolver problemas de Estatística
relacionados com a interpretação dos resultados de seus experimentos. Tratava-se de pessoas
provindas das mais diversas áreas do conhecimento humano, de modo que me via forçado a
fazer muitas perguntas, para tentar entender o que cada uma pretendia com sua pesquisa.
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b

Pré-visualização parcial do texto

Baixe Estatistica para docente e outras Manuais, Projetos, Pesquisas em PDF para Estatística Aplicada, somente na Docsity!

Estatística Prática para Docentes e Pós-Graduandos

de Geraldo Maia Campos

Prefácio

Que minhas primeiras palavras sejam para explicar por que este livro foi escrito, e por que o escrevi da maneira como ele se apresenta. Ele não surgiu evidentemente de nenhuma inspiração momentânea. Pelo contrário, é fruto de anos de meditação e a amparar-me tenho a experiência de mais de vinte anos dedicados à orientação e à elaboração da análise estatística de muitas centenas de trabalhos de pesquisa, tanto teses como artigos para publicação, e tanto de minha própria autoria como de outros pesquisadores, muitos destes bastante experientes em pesquisa, mas comumente pouco versados em Estatística. Nesses anos todos, eu era freqüentemente fustigado sempre pela mesma intrigante pergunta: por que teriam as pessoas tanta dificuldade em entender e em aplicar os métodos estatísticos, que a mim me pareciam tão lógicos e tão simples? Cheguei à conclusão de que o problema da Estatística deveria ser o mesmo da Matemática - que a grande maioria dos pesquisadores que a mim recorriam (geralmente da área biológica) ia declarando logo de início detestar cordialmente. Essa aversão generalizada à Matemática estendia-se pois à Estatística porque, por algum motivo, o conceito de Estatística parecia-lhes estar intimamente ligado ao de Matemática. Isso talvez até seja verdadeiro para quem se dedica a criar, desenvolver ou aperfeiçoar métodos e testes estatísticos, ou até mesmo para quem pretende programar esses testes em computador. Mas não o é para aqueles que são apenas usuários dos métodos e testes estatísticos, e não os seus idealizadores ou programadores. Nesse caso, por que a ojeriza generalizada à Estatística? E por que a maioria das pessoas não conseguia entender os seus métodos e a sua lógica, não obstante todas já tivessem feito um ou outro curso de Estatística em sua vida, às vezes até mais de um? Por que seria a Estatística considerada assim tão dificil? Cheguei à conclusão de que, se a Estatística não era na verdade tão difícil, então era fatal concluir que, se os estudantes não conseguiam entendê-la, era porque deveria estar sendo ensinada de uma forma incorreta. Mas, se estava sendo mal ensinada, qual seria a melhor maneira e o modo mais correto de fazê-lo? Muitas horas de meditação levaram-me por fim a desenvolver um método de ensino da Estatística, com base nos procedimentos que vinha adotando ao longo dos muitos anos em que atendi aos que me procuravam para ajudá-los a resolver problemas de Estatística relacionados com a interpretação dos resultados de seus experimentos. Tratava-se de pessoas provindas das mais diversas áreas do conhecimento humano, de modo que me via forçado a fazer muitas perguntas, para tentar entender o que cada uma pretendia com sua pesquisa.

Assim, acabei descobrindo algo muitíssimo importante: para poder ajudar alguém de uma forma eficaz, é forçoso conhecer o seu trabalho tanto quanto ele próprio, ou provavelmente até mais do que ele. Desse modo, com base nas perguntas que fazia, e nas respostas que costumava receber de meus consulentes, acabei aprendendo onde residiam as dúvidas da maioria das pessoas não afeitas aos métodos estatísticos, e o que deveria ensinar-lhes, para que futuramente fossem capazes de resolver elas próprias os seus problemas. Esse método é muito simples: consiste apenas em ensinar alguns poucos conceitos fundamentais e, a partir destes, traçar um roteiro lógico que habilite as pessoas não propriamente a deduzir fórmulas ou a realizar cálculos matemáticos, mas sim a reconhecer o modelo matemático em que se enquadram os seus experimentos e, com base nessas premissas, a decidirem elas mesmas sobre qual o teste estatístico mais adequado ao tratamento estatístico dos seus dados experimentais, a fim de poderem interpretar corretamente os seus resultados, evidenciar o seu verdadeiro valor e a sua real importância e, finalmente, tirar deles conclusões substanciais, pertinentes e relevantes. Esse é pois o objetivo deste livro.

permite a comparação entre todas as combinações possíveis das marcas de gesso, técnicas de manipulação e proporções de água/pó utilizadas na pesquisa.

A variável única e o denominador comum.

A variável do experimento, portanto, tem necessariamente de ser única, porque só assim poderá servir como um denominador comum no confronto entre tudo aquilo que se deseja comparar numa pesquisa, seja ela qual for. Mas o que vem a ser um denominador comum? Apesar de ter jurado que não falaria em Matemática neste curso, vou responder a essa pergunta com outra pergunta, de ordem puramente aritmética: qual das duas frações abaixo representa a grandeza maior?

E agora, entre as duas novas frações abaixo, qual seria a de maior grandeza?

Agora sim, tomou-se muito fácil garantir que a segunda fração é maior do que a primeira, mesmo que os números envolvidos no segundo exemplo sejam muito maiores que os do primeiro e isso sem precisar fazer mais do que um simples exame visual das duas frações. Mas... por que seria assim? Na verdade as duas frações do primeiro conjunto são exatamente iguais às duas frações do segundo conjunto. A única diferença é que, neste último, as frações foram reduzidas ao mesmo denominador, calculando-se o seu denominador comum, uma tarefa matemática elementar, que aprendemos no curso primário, ao estudarmos frações ordinárias. A variável de um experimento é pois o denominador comum — ou seja, o termo de comparação — que permite cotejar seja lá o que for que queiramos comparar. Por isso tem de ser única ou então cairíamos no caso do primeiro conjunto de frações ordinárias mostrado em nosso exemplo matemático, em que os denominadores são diferentes.

Fatores de variação.

Muito bem, mas se, na pesquisa sobre gessos que estamos adotando como exemplo no presente capítulo, a variável é a dureza dos corpos-de-prova, o que seriam afinal as marcas de

gesso, as técnicas de manipulação e as proporções água / pó? É evidente que tudo isso é importante, ou não seria considerado na pesquisa. Na verdade, são exatamente esses fatores que fazem com que a variável dureza realmente varie. São portanto fatores de variação.Os fatores de variação, ao contrário da variável, podem ser múltiplos, não havendo teoricamente um limite para o seu número. A experiência, porém, bem como o bom-senso que costuma dela advir, aconselha que esse número não deva ser superior a três, e a razão disso será analisada quando se falar sobre algo muito importante em Estatística, que são as interações entre os diversos fatores de variação.

Os dois primeiros passos.

Resumindo o que foi dito até agora, podemos finalmente indicar os dois primeiros passos a serem dados na preparação da análise estatística dos dados experimentais de uma pesquisa, seja esta qual for, esteja ela ainda na fase inicial de planejamento, ou já no seu final, com todos os experimentos realizados e todos os dados experimentais obtidos e convenientemente anotados nos protocolos elaborados para o registro das observações. Esses dois passos iniciais são:

1º passo - Identificação da variável ,

2º passo - Identificação dos fatores de variação.

As repetições (ou réplicas).

Contudo, esses dois elementos — variável e fatores de variação — não são os únicos que devem ser definidos logo no início de um experimento. Há ainda outro, de capital importância, que muitas vezes constitui uma verdadeira dor de cabeça para o pesquisador: o número de repetições (ou réplicas) a ser adotado nos experimentos. Aliás, é preciso dizer que uma das indagações que os estaticistas mais ouvem de seus consulentes, tanto de pesquisadores, como de pós-graduandos, e até mesmo dos orientadores destes, é esta: qual o número ideal de repetições num experimento, para tornar confiáveis os resultados e sua interpretação estatística? Pois bem, vamos responder com a mais absoluta certeza e segurança a essa pergunta: não existe tal número ideal de repetições! Nesse caso, dirão os leitores deste texto, completamente atônitos e decepcionados, o que determinaria qual o número de repetições a ser adotado num experimento? A resposta a esta reformulação da mesma pergunta será dada mais adiante, e não agora, a esta altura deste curso, pois na verdade ainda

Os escores (variáveis subjetivas).

Um recurso muito usado nesse caso para quantificar os dados é substituir os sinais por números: 4, 3, 2, 1 e 0. Esse tipo de graduação (ou de notas, ou de escores) é também bastante usado, quando os dados experimentais traduzem apenas uma impressão subjetiva ou a opinião pessoal — visual, por exemplo — de um grupo de observadores a respeito de um fenômeno qualquer que esteja sendo estudado. Na opinião do autor destas linhas os escores, dada a sua natureza subjetiva, não é uma variável muito forte, mas situações e tipos de pesquisa há em que não há alternativa senão usá-los.

Variáveis nominais.

Além disso, as variáveis podem ser também nominais, como em experimentos que envolvem perguntas que só admitem duas respostas: sim ou não. Também neste caso, os dados nominais acabam se tornando numéricos quando se consideram o número de respostas sim e o de respostas não. Isso significa que, mesmo quando a pesquisa envolve dados de natureza apenas qualitativa, esses dados terão forçosamente de ser transformados em dados quantitativos, para poderem ser analisados estatisticamente.

Dependência ou independência dos dados.

Outra característica importante dos dados experimentais, que deve ser levada em conta, é se eles são independentes ou vinculados (dependentes), que serão comentados mais adiante, com maiores detalhes.

O terceiro passo.

É necessário, pois, saber também, desde o início da pesquisa, quais as características e qual o tipo de variável utilizado, porque essas informações irão sem dúvida condicionar o uso de um ou de outro grupo de testes estatísticos, por ocasião do tratamento dos dados experimentais, com vistas à interpretação correta dos resultados da pesquisa. Este seria portanto o terceiro passo de nosso roteiro para o planejamento estatístico:

3º passo - Identificação do tipo de variável utilizado

3. As repetições

Experimento com uma única observação.

Imaginemos que, num experimento qualquer, se fizesse apenas uma única observação. Esse experimento, é evidente, não teria um valor numérico médio, ou uma média, porque não haveria valores que se pudessem somar, nem um número pelo qual a soma desses valores pudesse ser dividido para calcular essa média. Enfim, em última instância, a soma dos dados (digamos assim) seria igual ao próprio valor único, e o número de dados seria 1, de forma que o valor do dado dividido por 1 seria o seu próprio valor original. Levando esse raciocínio ad absurdum, diríamos então que o valor do dado seria exatamente igual ao valor da média. Isso seria ótimo, poderia pensar alguém menos avisado. Não, não seria. Na verdade, seria péssimo, até mesmo desastroso. Isto porque, se o valor medido estivesse errado, tudo mais estaria também errado, inclusive quaisquer eventuais conclusões que se pudessem tirar desse resultado falso.

Experimento com mais de uma observação.

Todavia, se o número de observações do mesmo fenômeno fosse aumentado para 2, ou 3 ou 10, ou para qualquer outro número maior do que 1, o pesquisador notaria um fato interessante: as medidas apresentariam diferenças entre si, mesmo que ele repetisse sempre os mesmos passos na execução dos experimentos, e mesmo que usasse sempre o mesmo observador para executar as medidas. Enfim, haveria diferenças, mesmo que ele fizesse tudo exatamente igual, desde o começo até o fim de sua pesquisa. Isso seria péssimo, poderia pensar aquele mesmo alguém que já fizera o comentário do parágrafo anterior. Mas na verdade ele estaria novamente enganado, e isso na verdade seria ótimo. Isto porque, mesmo que um, ou alguns, ou mesmo todos os valores medidos estivessem errados, o valor médio desses valores errados estaria sempre mais próximo do valor real daquilo que estava sendo medido, do que muitas vezes qualquer dos dados experimentais considerado isoladamente.

A média dos valores dos dados experimentais.

Do que foi exposto no item anterior, depreende-se que a média tende a aproximar os valores errados do valor real daquilo que se mede. Isto porque a média é uma espécie de

4. As repetições e o experimento-piloto

O número mais adequado de repetições.

O estabelecimento do número de repetições põe novamente em cena a mesma velha pergunta: qual o número mais adequado de repetições? E a resposta seria ainda a mesma já dada anteriormente: não existe tal número. Pelo menos não existe nenhum número mágico — poder-se-ia dizer mesmo cabalístico — que pudesse servir indiferentemente a qualquer experimento. O que há, na verdade, é um número mais adequado de repetições para cada experimento — um número que varia de um experimento para outro, e que precisa portanto ser calculado para cada um deles.

A variabilidade dos dados experimentais.

Mas como fazer esse cálculo? Que leis regem a escolha desse número? A isto, sim, é possível responder: o que rege a escolha do número de repetições mais adequado a um experimento qualquer é a variabilidade dos seus dados experimentais. Mas — poderá objetar alguém — se o experimento ainda não foi realizado, como se pode conhecer o seu grau de variação, ou avaliar a sua variabilidade? É precisamente aí que entram dois novos elementos igualmente muito importantes na execução de qualquer experimento: o experimento piloto e a verificação preliminar da variabilidade dos dados experimentais.

O experimento piloto.

O experimento piloto é aquele que se faz previamente à realização da pesquisa propriamente dita, e visa a testar o método de trabalho e os processos técnicos envolvidos na execução dos experimentos. Em geral o piloto segue o mesmo plano geral de trabalho, que orienta a investigação como um todo. Todavia, difere dele num ponto: no número de repetições — e o faz exatamente porque, a essa altura, o número mais adequado de réplicas ainda não foi fixado de forma definitiva. No experimento piloto, a variável é a mesma já definida, os fatores de variação são os mesmos já estabelecidos para a pesquisa, mas em geral o número de repetições é pequeno, para não tornar o experimento-piloto muito trabalhoso ou muito demorado.

O número inicial de repetições.

É bastante comum a escolha de 3 repetições, como um bom número para começar. Isto porque o número 3 evita a invariabilidade do número 1, foge ao perigo da repetição coincidente representado pelo número 2, e já apresenta alguma variação, a qual no mais das vezes já é suficiente para testar a variabilidade determinada pelos fatores de variação e pelas próprias repetições.

A variabilidade dos dados no experimento piloto.

A verificação preliminar da variabilidade dos dados experimentais é feita após a execução do experimento-piloto. Para isso, faz-se uma análise de variância dos dados obtidos nesse piloto, sem qualquer preocupação quanto ao tipo de distribuição dos dados, e seja lá qual for o número de repetições nele fixado. Realizada essa análise de variância preliminar, faz-se então o teste estatístico para determinar, especificamente para esse experimento, qual seria aquele misterioso e tão procurado número mais adequado de repetições.

O número mais adequado de repetições.

Esse teste é do tipo iterativo e requer um programa de computador, pois de outra forma ele seria muito demorado e trabalhoso. O teste é chamado iterativo porque, partindo do número inicial de repetições do experimento-piloto, ele calcula um novo número de repetições, e volta a introduzir no teste esse número calculado, à guisa de novo valor inicial, recalculando tudo e achando outro número de repetições. Assim, sucessivamente, vai recalculando até que o número de entrada do teste seja igual ao número de saída. Quando essa igualdade ocorre, o teste é dado por terminado, e esse último número de repetições constitui o número mais adequado de repetições para aquele experimento. O teste sugere pois que, para aquela variação detectada pelo experimento-piloto, é necessário aquele número mínimo de réplicas, para que se possam perceber diferenças estatisticamente significantes entre os fatores de variação estudados

uma vez que a multiplicação por um (1) não altera o produto. O mesmo ocorre, se houver apenas dois fatores (colunas e linhas), caso em que o número de dados será:

A única alternativa que jamais poderá ocorrer é a existência apenas de blocos como fator de variação, porque, por definição, bloco é um conjunto de colunas e linhas. Se estas forem ambas iguais a um (1), a idéia de bloco se confundiria com a de coluna, porque haveria então apenas um fator de variação. O mesmo pode-se dizer em relação a um experimento que envolva apenas o fator de variação linhas, uma vez que neste caso seria indiferente colocar as repetições em cada linha ou em cada coluna.

A distribuição dos dados numa tabela.

Por convenção, ou apenas por hábito, é comum reunir os dados da seguinte maneira:

a) em colunas, quando há apenas um fator de variação; b) em colunas e linhas, quando há dois fatores de variação; e c) em colunas, linhas e blocos, quando há três fatores de variação.

O protocolo das observações experimentais.

A determinação do número de fatores de variação e do número de repetições possibilita ao pesquisador construir uma tabela de dados, antes mesmo que qualquer desses dados tenha sido obtido. É costume, ao se planejar uma pesquisa, elaborar o chamado protocolo das observações, que em última análise não é mais que a ficha onde são anotadas todas as informações que possam ter interesse na investigação, tais como identificação dos pacientes, dos corpos-de-prova, ou dos animais de laboratório, além de informações complementares relevantes, como idade, peso, sexo, etc., informações essas que variam muito e dependem do tipo de pesquisa realizada. O protocolo das observações é absolutamente necessário, porque é ali que fica registrado praticamente todo o andamento da pesquisa. Todavia, o pesquisador pode elaborar também, paralela e simultaneamente, uma tabela vazia de dados, espécie de grade, onde já está indicado previamente o lugar onde será colocado o valor numérico referente a cada um dos dados experimentais, à medida que estes vão sendo obtidos na fase experimental da pesquisa. Assim, quando o experimento chegar ao fim, o pesquisador terá em mãos a sua tabela geral de dados, já completa e acabada.

6. A tabela geral de dados

O próprio título deste capítulo já sugere claramente que a tabela com os dados experimentais deva ser abrangente, única e completa. Ou, em outras palavras, todos os dados obtidos devem estar contidos numa tabela única, na qual constem todos os elementos que compõem o fator de variação colocado nas colunas, todos os que compõem as linhas, e todos os que integram os blocos, além, é claro, de todas as repetições. A maneira como esses três fatores são distribuídos (como colunas, linhas ou blocos) depende muito do espaço físico disponível, principalmente considerando que modernamente as tabelas são comumente elaboradas em computador, nos quais o espaço é limitado, principalmente no sentido horizontal da tela do monitor, ou seja em relação ao espaço destinado às colunas. Quanto às linhas e blocos, caso seja necessário, podem alongar-se no sentido vertical, podendo passar à página seguinte, e portanto sem qualquer problema de limitação do espaço. O ideal, contudo, seria que a tabela geral de dados ocupasse apenas uma página, pois isso permitiria o exame visual do conjunto de dados experimentais todos de uma só vez. Isso pode ser conseguido, inclusive em computadores, pela redução do tamanho dos caracteres, o que permite escrever um número maior de caracteres por linha, na tela do monitor, e também no papel quando a tabela é impressa. Quando o número de colunas é pequeno, os blocos poderão ser colocados lado a lado (no sentido horizontal, se o espaço permitir, de modo que a tabela terá, verticalmente, a extensão dada pelo número de linhas e de repetições. Se o número de colunas da tabela for muito grande, ocupando uma grande extensão horizontal, inviabilizando a colocação dos blocos lado a lado, estes poderão ser colocados no sentido vertical, um embaixo do outro. Neste caso, a extensão vertical será dada pelo número de linhas multiplicado pelo número de blocos e de repetições. Em suma, confeccionar tabelas é, na verdade, uma questão de prática, uma vez que esta acaba habilitando o pesquisador a decidir rapidamente sobre qual a melhor conformação física para qualquer tabela de dados que tenha eventualmente de construir. O que foi dito acima é apenas uma sugestão de como começar, a fim de vir um dia a adquirir essa prática. A seguir, estão transcritos alguns modelos de tabelas de dados, identificadas estas por letras maiúsculas. Por exemplo, tecnicamente, não se pode dizer que haja diferença entre as tabelas A, B, C e D.

diferença entre as tabelas C e D está também na sua disposição em dois grupos de cinco repetições para cada linha, na tabela D, e em apenas um grupo com as dez repetições, na tabela C. A opção por qualquer desses quatro tipos de tabelas é apenas uma questão de conveniência, tal como a disponibilidade de espaço em função do número de colunas ou de linhas, ou a maior facilidade ou comodidade na introdução dos dados numéricos no computador, ou às vezes até mesmo por simples conveniência estética. Porém, do ponto de vista puramente técnico, todos os quatro tipos de tabelas apresentados são aceitáveis para esse modelo matemático de experimentos, que envolve apenas um fator de variação, esteja este colocado em colunas ou em linhas. Todavia, por uma espécie de convenção, é costume dispor os dados em colunas, e não em linhas, quando há apenas um único fator de variação, tal como se fez nas tabelas A e B. Mas como ficaria uma tabela que envolvesse tanto colunas como linhas? Imagine-se, por exemplo, um modelo experimental que envolvesse quatro Tratamentos aplicados a dois grupos de pacientes (Controle e Tratado), com cinco repetições (pacientes) em cada grupo. Como seria a tabela para esses dados experimentais? Poderia ser assim:

No caso específico da tabela acima, essa é a configuração mais adequada — com os Tratamentos nas colunas e os grupos experimentais nas linhas. Isto porque, se os Tratamentos estivessem nas linhas e os Grupos experimentais nas colunas, a tabela ficaria muito alongada no sentido vertical, e muito estreita no sentido horizontal, tal como uma lingüiça gráfica a estender-se de cima para baixo — ou seja, antiestética e pouco prática, uma vez que, dependendo do número de repetições, poderia abranger mais de uma página de texto. Mas

nada proíbe que qualquer dos fatores de variação possa ser colocado indiferentemente nas colunas ou nas linhas. É uma simples questão de conveniência gráfica. A única exigência é que as repetições fiquem reunidas na célula da tabela que corresponde ao cruzamento de uma linha com uma coluna. Contudo, há ainda mais um elemento que pode complicar a elaboração de uma tabela de dados: a existência de blocos, ou seja, de um terceiro fator de variação. Quando isso ocorre, cada bloco será uma reedição do modelo para colunas e linhas reproduzido acima, e envolverá tantas novas tabelas (com colunas e linhas) quantos forem os elementos que compõem o fator de variação a que os blocos se referem. Por exemplo: imagine-se que, além dos Tratamentos (A, B, C e D) e dos Grupos experimentais (Controle e Tratado), a pesquisa envolva também três Tempos de observação (1, 3 e 7 dias). Como ficaria a nova tabela de dados, nesse caso? Ainda nesse caso, o critério que vigora é apenas a conveniência gráfica, para decidir qual fator de variação será colocado nas colunas, qual estará nas linhas, e qual ficará nos blocos. É, portanto, pura questão de bom-senso, associado ao bom-gosto, ou ao senso estético de cada um, os quais podem ser comentados e até criticados, mas sem dúvida jamais ensinados. Na página seguinte há uma sugestão para a construção da tabela com os três fatores de variação acima mencionados. Essa tabela ilustrativa foi deixada deliberadamente vazia, sem nenhum dado numérico transcrito, com o propósito único de mostrar que uma tabela vazia de dados pode perfeitamente ser elaborada antes mesmo que qualquer dado experimental tenha sido obtido. À medida que a pesquisa vai se desenvolvendo, os dados irão surgindo e serão anotados na tabela vazia, até preenchê-la toda quando do final da pesquisa. Para elaborar a tabela vazia, basta saber — e isso é sempre possível — quantos são os fatores de variação, quantos elementos integram cada um deles, e qual o número de repetições estabelecido.

variação com os demais, combinação essa que pode muitas vezes alterar o efeito produzido por qualquer dos fatores de variação, quando considerado individualmente (ou separadamente

7. A fase pós-experimental

A esta altura de nossas considerações, a variável e os fatores de variação já foram identificados, o tipo de variável foi reconhecido, e a tabela de dados construída e preenchida com os dados obtidos na fase experimental. E agora? O que fazer com essa tabela e com os dados numéricos nela contidos?

Pequeno retrospecto das fases iniciais

Ficou dito, em capítulos anteriores, que o tratamento estatístico deve ser cogitado já nos primórdios da pesquisa, quando ainda se está na elaboração do seu projeto inicial, ou mesmo durante a fase de execução do plano-piloto dos experimentos. De fato, há muita coisa que já pode ser pensada e estudada nessas fases iniciais, em termos de tratamento estatístico dos dados. Porém há também outros detalhes que somente podem ser considerados após ter em mãos os dados numéricos colhidos nos ensaios. Entre as coisas que podem ser verificadas ainda na fase inicial da pesquisa está a vinculação, ou independência, dos dados experimentais, mas o conhecimento desse pormenor ainda não é tão relevante a essa altura do desenvolvimento da pesquisa, ou de seu tratamento estatístico. Mas se-lo-á mais adiante, ocasião em que o assunto será abordado novamente, tecendo-se então sobre ele considerações mais elaboradas.

A distribuição dos erros experimentais

Muito mais importante, todavia, seria analisar agora a distribuição de freqüências dos dados experimentais; ou, mais apropriadamente, estudar a maneira como os erros desses dados se distribuem em torno da média. Enfim, é preciso saber se a distribuição dos erros experimentais em torno da média é normal, ou seja, se o seu histograma de freqüências segue a configuração geral da curva matemática conhecida como curva normal. Mas... poderão perguntar os eventuais leitores deste texto, por que isso seria assim tão importante? A resposta é: porque os primeiros testes estatísticos, talvez os mais importantes de quantos foram desenvolvidos pelos estudiosos, tiveram por premissa que a distribuição dos erros deveria ser normal, ou seja, que ela deveria ter uma distribuição de freqüências semelhante à da curva de Gauss, também chamada curva normal ou curva dos erros.

Figura 1. Histograma de freqüências de um conjunto de dados experimentais, sobreposto à curva normal matemática com a mesma media e o mesmo desvio-padrão.

Por que curva "normal"?

A denominação curva de Gauss explica-se porque foi esse notável matemático alemão quem encontrou a sua equação matemática. Da mesma forma, a expressão curva dos erros também se justifica, porque Gauss deduziu a sua equação matemática precisamente a partir de estudos realizados sobre a distribuição dos erros de medida em torno da média, ou seja, a lei matemática que regia a dispersão e o afastamento dos valores de medida em relação ao seu valor médio; ou, mais exatamente, em relação ao valor real da grandeza medida. Sim, tudo isso é compreensível. Mas por que essa curva seria chamada normal? Na verdade, eu não sei nem nunca li qualquer explicação racional para isso. Acredito, porém, que essa denominação tenha algo a ver com os fenômenos naturais, tal como ocorre com outras curvas matemáticas, que traduzem fenômenos normalmente encontrados na natureza. É o caso, por exemplo, da curva chamada catenária (do latim catena = cadeia, corrente), cuja equação expressa matematicamente a curva natural descrita por uma corrente metálica, quando presa pelas extremidades e submetida à ação do próprio peso. Agora, caros leitores, mentalizem, por exemplo, uma ampulheta e pensem: qual seria a equação matemática que descreve o perfil do montículo de areia que flui dentro dela e se deposita no seu compartimento inferior? Ou qual seria a equação matemática capaz de descrever o perfil do montículo que se forma, quando se despeja sobre o solo um saco de grãos de um cereal qualquer? Eu pessoalmente estou convencido de que, muito provavelmente, seria uma curva dessa família de curvas conhecidas como curvas normais. Talvez derive daí a denominação normal atribuída a esse tipo de curva

9. Os valores de média e do desvio-padrão

O que significa uma mudança no valor da média?

Na representação gráfica da curva normal, a variação do valor da média, em termos práticos, corresponde a um deslocamento da figura ao longo do eixo horizontal das