Bioestatistica - Texto - Metodologia Científica, Notas de estudo de Estatística
ivan-balducci-7
ivan-balducci-7

Bioestatistica - Texto - Metodologia Científica, Notas de estudo de Estatística

80 páginas
50Números de download
1000+Número de visitas
100%de 0 votosNúmero de votos
1Número de comentários
Descrição
Planejamento Experimental - Experimento-Estudo Observacional-Levantamento
70 pontos
Pontos de download necessários para baixar
este documento
Baixar o documento
Pré-visualização3 páginas / 80
Esta é apenas uma pré-visualização
3 mostrados em 80 páginas
Esta é apenas uma pré-visualização
3 mostrados em 80 páginas
Esta é apenas uma pré-visualização
3 mostrados em 80 páginas
Esta é apenas uma pré-visualização
3 mostrados em 80 páginas
BIOESTATÍSTICA e METODOLOGIA CIENTÍFICA

BIOESTATÍSTICA e METODOLOGIA CIENTÍFICA Prof. Ivan Balducci (FOSJC/ Unesp)

Introdução

Parte 1. Metodologia da pesquisa 1.1. Natureza geral da ciência. Dois exemplos de pesquisa 1.2. Objetividade e pesquisa científica 1.3. Objetividade e explicação 1.4. A abstração e a ciência 1.5. O caráter empírico da ciência 1.6. O objetivo da ciência: teoria e explicação 1.7. Variáveis 1.8. Relações 1.9. Estudos e experimentos 1.10. Problemas, hipóteses e variáveis 1.11. O valor das hipóteses 1.12. Hipóteses e testabilidade 1.13. Explicação científica, teoria e relações 1.14. Probabilidade e estatística. 1.15. Casualização 1.16. Designação aleatória e casualização 1.17. Tamanho da amostra 1.18. Delineamento da pesquisa 1.19. Pesquisa experimental e não-experimental 1.20. Controle 1.21. Definição e características dos experimentos 1.22. Forças e fraquezas da pesquisa experimental 1.23. Pesquisa não-experimental 1.24. O fumo e o câncer do pulmão 1.25. A natureza das variáveis na pesquisa não-experimental 1.26. Experimento sem grupo controle: é possível? 1.27. Investigação sociológica (survey, “levantamentos”)

Parte 2. Experimento

2.1. A finalidade de um experimento 2.2. Fatores de um experimento 2.3. Variável dependente 2.4. Variável independente 2.5. Exercícios sobre os tipos de variáveis em um experimento. Respostas... 2.6. Variáveis individuais. Exemplo 2.7. Identificação de variáveis de confundimento

2.8. Meios para isolar a variável de interesse 2.9. Validade interna de um experimento 2.10. Validade externa de um experimento 2.11. Exercício de revisão. Respostas... 2.12. Bibliografia principal .

Parte 3. Estudos observacionais

3.1. O que são estudos observacionais? 3.2. Razões desses estudos 3.3. Cuidados na inferência 3.4. Tipos de estudos observacionais 3.5. Alguns aspectos da regressão

Parte 4. Estudos observacionais versus experimento

4.1. As limitações dos experimentos 4.2. A grande desvantagem dos estudos observacionais 4.3. A grande vantagem dos estudos observacionais 4.4. Conclusão

Parte 5. Para reflexão

2

INTRODUÇÃO

Por que a nossa disciplina apresenta este nome? Não é fácil com poucas palavras responder a esta pergunta. Vamos

justificar o acerto da escolha do nome de nossa disciplina mediante uma leitura atenta de dois textos. O primeiro é da autoria de Robin F. Badgley e foi publicado em1961 no Canadian Medical Association Journal, (v. 85, p. 246-50). Vamos apresentá-lo traduzido:

“Bioestatística e Metodologia Científica são o fundamento da pesquisa médica quantitativa. Estas duas técnicas complementam-se uma a outra na formulação de problemas de pesquisa, no formular e testar hipóteses e na obtenção de conclusões. Enquanto o conteúdo de um experimento ou de um estudo que usa grupos de dados pode variar, a forma, desconsiderando o conteúdo, pode ser avaliada por alguns princípios lógicos geralmente aceitos. Estes princípios pertencem à organização ou estrutura lógica de um estudo e às técnicas estatísticas usadas na análise de seus dados” .

O segundo texto foi extraído da Tese de Livre Docência apresentada pelo Prof. Ney Moraes à Faculdade de Odontologia de Bauru, USP, em 1976:

“O objetivo final da Ciência é a busca da Verdade. Segundo BERTRAND

RUSSEL(1), uma descrição ou explicação “é científica quando há alguma razão

para acreditarmos que seja verdadeira; não é científica quando emitida por

motivo diverso que o de sua provável verdade”. A Ciência moderna orienta a sua

atenção para duas metas bem definidas: a descrição do Universo e o

estabelecimento de princípios gerais capazes de explicar os fenômenos desse

Universo, formando um “corpo de conhecimentos ordenados do mundo real”(2).

Esse corpo de conhecimentos apresenta-se sob a forma de descrições e

explicações, constituindo o conjunto Leis, Teorias e Hipóteses a respeito dos seres

e fenômenos conhecidos. A partir da consideração de fatos da realidade objetiva, a

Ciência tenta descobrir padrões de regularidade e relações de causalidade de modo

a poder antecipar resultados particulares baseando-se em princípios mais gerais

que regem o comportamento dos fenômenos. As primeiras explicações dos

fenômenos naturais procuravam antes projetar a própria psicologia do observador,

3

dando explicações antropomórficas, do que preocupar-se com a realidade objetiva

do fenômeno observado. Para evitar a subjetividade na busca dessas leis gerais, a

Ciência utiliza-se do Método Científico, entendido como um conjunto de

procedimentos orientados no sentido da busca do conhecimento objetivo.

De acordo com KARL PEARSON(3), “O método científico é caracterizado

pelos seguintes aspectos: a) cuidadosa e acurada classificação dos fatos e

observação de sua correlação e seqüência; b) a descoberta de leis científicas com

ajuda da imaginação criadora; c) autocrítica, de modo a que sua validade seja

aceitável para todas as mentes normalmente constituídas”. CONANT(4), em

“Science and Common Sense”, observa: “Os três elementos da ciência moderna

são: 1) idéias especulativas gerais; 2) raciocínio dedutivo e 3) experimentação”.

Mais adiante, na mesma obra, comenta: “Já li referências ao método científico

que descrevem de maneira bastante acurada as atividades de um cientista

experimental em muitas ocasiões, embora não em todas. São mais ou menos as

seguintes: 1) um problema é reconhecido e um objetivo é formulado; 2) toda

informação relevante é coletada (muitos problemas estão ocultos na palavra

“relevante”); 3) uma hipótese de trabalho é formulada; 4) são tiradas deduções

das hipóteses; 5) as deduções são testadas por experimentação; 6) dependendo

do resultado, a hipótese de trabalho é aceita, modificada ou descartada”. Embora

esse autor esteja em desacordo com tal formulação, não há dúvida que, nas

ciências experimentais, o método científico pode ser caracterizado por essas

atividades e podemos reformulá-las em quatro etapas bem definidas:

1ª) Observação: Os fenômenos do Universo são considerados, medidos,

anotados e descritos objetivamente, buscando-se uma compreensão completa do

que está acontecendo no mundo real. Nesta fase procuramos estabelecer relações

entre seres e atributos.

4

2ª) Formulação de Hipóteses: São feitas conjecturas ou são introduzidos

conceitos novos buscando explicações para os fenômenos observados, suas

relações de causalidade e interações entre fatos. São propostos sistemas de idéias

ou modelos capazes de explicar os fenômenos dentro de uma estrutura universal e

coerente, incorporados ao conjunto de conhecimentos atuais.

3ª) Verificação da Hipótese: Através da experimentação estudamos o

comportamento de fenômenos submetidos às condições capazes de produzir

informações sobre a provável verdade da hipótese que está sendo examinada.

4ª) Generalização: Quando verificada a provável verdade da hipótese num

particular experimento, pelo raciocínio indutivo procuramos fazer predições ou

deduzir conseqüências para seres ou fenômenos de mesma natureza daqueles

sobre os quais a hipótese foi verificada.

Este último item se constitui no ponto mais crítico do método científico,

tendo sido contestado por inúmeros filósofos, desde DAVID HUME (1711-1776)

por não ter suporte lógico irrefutável(5,6). O modelo de raciocínio indutivo pode ser

esquematizado da seguinte maneira: “Se A é verdade, então B deve ocorrer, como

B ocorreu, então A deve ser verdade”. Na realidade, esse modelo é inconclusivo

do ponto de vista estritamente lógico. Entretanto, HENRI POINCARÉ(5) (1854-

1912) desenvolveu a noção de “convencionalismo”, mostrando a importância de

certas “convenções” em ciência. Uma conclusão indutiva bem confirmada, é

provisoriamente aceita como verdadeira, sendo elevada à categoria de princípio,

embora haja necessidade, usualmente, de modificacão pela aquisição de novos

conhecimentos. O raciocínio indutivo é auto-ajustável, permitindo que a maior

soma de experiências anteriores funcione como mecanismo regulador, permitindo

reajustar as conclusões que se seguem (corroboração).

Dentre os procedimentos utilizados para a verificação da provável veracidade

de uma hipótese, a Estatística é capaz de fornecer, em bases probabilísticas, uma

5

medida dos riscos de errar ao se aceitar ou rejeitar uma hipótese. Em

conseqüência disso, a Estatística se apresenta como uma ferramenta extremamente

importante nas mãos do pesquisador, em busca das verdades científicas.

A Estatística participa da cadeia de atividades que caracterizam o método

científico com funções bem definidas. KEMPTHORNE(7) apresenta um diagrama

bastante ilustrativo segundo o qual a atuação da Estatística pode ser situada como

mostra a figura 1:

ESTATÍSTICA Observação

Predição de novos resultados

Abstração dos elementos essenciais que fornecem base a uma teoria lógica

Desenvolvimento da teoria

Figura 1.

A Estatística participa em duas fases:

1. Na tomada de observações.

2. Na comparação das observações com as predições a partir da teoria.

CRAMER(8) , por outro lado, resume o papel da Estatística no método

científico em três funções principais. Segundo ele, “a maior parte das aplicações

ordinárias de uma teoria matemática (da estatística) pode ser classificada em

relação a três aspectos; descrição, análise e predição”. Essas funções da

Estatística coincidem com os objetivos das Ciências Experimentais, que segundo

HEMPEL(9) são: “descrever um particular fenômeno no mundo que percebemos e

6

estabelecer princípios gerais por meio dos quais esse fenômeno possa ser

explicado e previsto”.

Pode-se concluir, à base do que foi exposto, que da qualidade e correção da

metodologia estatística empregada decorre como conseqüência imediata a

validade das conclusões obtidas pelo método experimental. Evidentemente a

adequação e correção de métodos estatísticos não é condição suficiente, porém é

necessária para que conclusões derivadas de experimentos sejam válidas do ponto

de vista científico”.

7

REFERÊNCIAS BIBLIOGRÁFICAS

1 RUSSEL, B. A perspectiva científica. São Paulo. Companhia Editora

Nacional, 1956.

2 MACCOBY, N. Communication research methods I: course C- 217.

California, University of Stanford, School of Humanities and

Science, 1964 (Mimeografado).

3 PEARSON, K. apud CONANT, J. B. Science and common sense. London,

Yale University Press, p. 43, 1951.

4 CONANT, J. B. Science and common sense. London, Yale University

Press.,. 1951.

5 ENYCLOPAEDIA Britannica. Chicago, Enyclopaedia Britannica, 1961,

v. 12, p. 280.

6 POPPER, K. R. The logic of scientific discovery. New York, Science

Editions, 1961.

7 KEMPTHORNE, The design and analysis of experiments. London J.

Wiley & Sons, 1952.

8 CRAMER, H. Métodos matemáticos de estadística. Madrid, Aguilar,

1953.

9 HEMPEL, C. G. Fundamentals of concept formation in empirical sciences.

International Encyclopedia of Unified Science. Chicago, University of

Chicago Press, 1952.

8

Parte 1 METODOLOGIA DA PESQUISA

1.1. Natureza geral da ciência.

A ciência é um empreendimento preocupado exclusivamente com o conhecimento e a compreensão de fenômenos naturais. Os cientistas desejam conhecer e compreender as coisas. Eles querem poder dizer: se fizermos isto aqui, acontecerá aquilo ali. Eles querem poder dizer: se fizermos isto, acontecerá aquilo. Se frustrarmos as crianças, provavelmente elas agredirão outras, seus pais, seus professores e até a si próprias.

Os cientistas, então, querem "conhecer" os fenômenos. Eles querem saber, entre outras coisas, o que produz o comportamento agressivo em crianças e adultos. Querem saber se a frustração conduz à agressão... .Em resumo, querem "compreender" de que maneira se relacionam os fenômenos psicológicos, sociológicos, educacionais... .

1.1. Dois exemplos de pesquisa.

Examinemos dois estudos. Um estudo é um experimento, o outro estudo não é um experimento. Vamos considerar experimento um estudo no qual se fazem coisas diferentes com grupos diferentes de sujeito - pombos, ratos, crianças, adultos - para ver se o que se faz com eles produz efeitos diferentes nos diferentes grupos. Por exemplo, um pesquisador educacional pode pedir a professores que escrevam notas elogiosas nos testes de um grupo de alunos e nada de elogios nos testes de outro grupo de alunos. Então, o pesquisador vê como esta "manipulação", como é chamada, afeta o desempenho dos dois grupos em testes subsequentes.

Por outro lado, em um estudo não experimental, não há "manipulação", não há tentativa deliberada e controlada de produzir efeitos diferentes através de diferentes manipulações. As relações entre fenômenos são estudadas sem intervenção experimental. As características dos sujeitos, "como eles são", são observadas e as relações entre as características avaliadas sem tentar mudar nada.

1.2. Objetividade e pesquisa científica.

Objetividade é um acordo entre juizes "especialistas" em relação ao que é observado, ou o que deve ser ou o que foi feito em pesquisa. Suponhamos que um cientista observe alguma coisa e anote essa observação, digamos, em forma numérica. Outro, de igual competência, observa a mesma coisa, independentemente, e registra sua observação. Se o processo puder ser repetido

9

com resultado idêntico ou parecido - isto é, se há acordo entre as observações dos cientistas - consegue-se objetividade. Em algumas áreas da ciência, como na química e física, por exemplo, a objetividade não é problema sério, graças aos instrumentos de alta precisão, como os microscópios eletrônicos. Tais instrumentos aumentam a probabilidade de acordo entre os juizes, porque, ao usá- los, juizes diferentes provavelmente obterão e anotarão os mesmos resultados. Além disso, a máquina tem menos possibilidade de influenciar observações e de ser influenciada pela natureza do que estiver sendo observado.

A definição de objetividade como acordo entre juizes não deve ser interpretada com estreiteza: é bastante ampla. O que significa isto? A condição principal para satisfazer o critério de objetividade é, idealmente, que quaisquer observadores com um mínimo de competência concordem em seus resultados. Em psicologia e educação, por exemplo, usam-se testes e escalas objetivas. São chamados "objetivos" porque qualquer pessoa, devidamente orientada, pode avaliá-los e obter os mesmos resultados (com pequena margem de erro). A expressão "testes objetivos" não significa que os teste sejam em si mesmos "objetivos". Eles o são porque a contagem de pontos é a mesma, não importando quem os avalie.

A objetividade ajuda o pesquisador à "sair" de si mesmo, ajuda-o a conseguir condições publicamente replicáveis e, conseqüentemente, descobertas publicamente averiguáveis. A ciência é um empreendimento social e público, como tantos outros empreendimentos humanos, mas uma regra importantíssima do empreendimento científico é que todos os procedimentos sejam objetivos - feitos de tal forma que haja ou possa haver acordo entre juizes especialistas. Esta regra dá à ciência uma natureza distinta, quase remota, porque quanto maior a objetividade mais o procedimento se afasta das características humanas - e de suas limitações. Por exemplo, a objetividade quase glacial de partes das ciências naturais, cujos experimentos são feitos em laboratórios e em circunstâncias altamente controladas, cujas observações são feitas quase inteiramente por máquinas de alta precisão e fidedignidade, parece coisa muitíssimo distante de gente e de suas preocupações sociais e pessoais. (Isto não significa que os cientistas que pesquisam e controlam as máquinas sejam imunes a erros).

O cientista físico pode "sair de si mesmo" mais facilmente do que o cientista comportamental, porque é mais fácil para ele preparar uma pesquisa e testar hipótese "fora" e longe de suas próprias predileções e inclinações e de outros. Isto acontece porque os procedimentos são mais fáceis de ser "objetivados". Uma vez que o funcionamento de um processo físico fique compreendido, pode ser repetido e medido pela maioria de técnicos e cientistas competentes. Em outras palavras, há uma replicabilidade relativamente alta.

Em pesquisas sociológica, psicológica e educacional, entretanto, isto é verdadeiro em grau muito menor. A manipulação de variáveis psicológicas, como a coesão de grupo, a atmosfera em sala de aula, estilos de liderança e ansiedade, é muito mais difícil de ser feita objetivamente por causa da maior complexidade,

10

amplitude de variação e acessibilidade a influências outras que as do pesquisador. Igualmente, a mensuração de variáveis comportamentais, tais como a inteligência, realização, atitudes, classe social, motivações são mais sujeitas a influências sistemáticas e casuais, tornando mais difícil - embora não impossível, como pretendem alguns críticos - vários observadores concordarem em suas observações e mensurações. Isto não significa, entretanto, que os procedimentos do psicólogo não sejam objetivos. Na verdade, eles freqüentemente podem possuir um nível de objetividade relativamente alto. Eles são simplesmente menos objetivos do que os do cientista físico.

Não há qualquer diferença de princípio, por outro lado, entre o uso do critério de objetividade pelo cientista físico e pelo cientista comportamental. A única diferença está no grau de objetividade.

Algumas ciências têm condições de controle mais rigoroso por meio da experimentação. Diferentemente da observação, feita nas condições e apresentadas naturalmente, a experimentação é a verificação dos fenômenos em condições determinadas pelo experimentador.

A importância da experimentação é que ela se faz em condições privilegiadas, permitindo a repetição, variação das condições de experiências e simplificação dos fenômenos, o que torna o controle da investigação mais rigoroso.

A possibilidade de mensuração e a utilização de instrumentos dão maior precisão à ciência, pois permitem transformar as qualidades em quantidades. Por exemplo, o som é medido em decibéis, a temperatura é verificada em coluna de mercúrio, o peso é indicado pelo movimento da agulha na balança, o que supera as avaliações puramente subjetivas e imprecisas.

1. 3. Objetividade e explicação.

Sem objetividade a ciência e a pesquisa científica perdem seu caráter único e especial. Não haveria ciência sem objetividade. A objetividade em e por si própria tem pouca importância. Isto é, o objetivo básico da ciência é a explicação de fenômenos naturais; não é simplesmente ser objetiva. Objetividade é importante porque pode auxiliar a fornecer explicações mais exatas dos fenômenos naturais. Ser apenas objetivo não significa ser científico. Um procedimento pode ser altamente objetivo e conter observações enganosas e conclusões falsas.

Objetividade não significa importância. Uma pessoa pode ser muitíssima objetiva com problemas mais triviais do que com problemas mais importantes. Podemos, por exemplo, estudar a relação entre o número de carteiras nas classes e o aproveitamento verbal das crianças. Tanto o número de carteiras quanto o aproveitamento verbal podem ser medidos com um alto grau de objetividade. Mas e daí? A objetividade, entretanto, é uma característica indispensável e inseparável da ciência e da pesquisa científica.

11

1. 4. A abstração e a ciência.

A abstração, parte do poder da ciência, está sempre distante das preocupações comuns e do calor do relacionamento humano. Isto por definição; é parte da natureza da ciência. Sem tal abstração, não há ciência. O mesmo quanto a objetividade, que também tende a fazer a ciência parecer fria e distante. Parece distante e fria porque os testes das proposições científicas são feitos "lá fora", o mais longe possível das pessoas e suas emoções, desejos, valores e atitudes, incluindo os do próprio cientista. Mas é isto precisamente o que deve ser feito. Deve-se obedecer ao cânone da objetividade - ou abandonar a ciência.

1. 5. O caráter empírico da ciência.

Para o cientista, "empírico" significa guiado pela evidência obtida em pesquisa científica sistemática e controlada. Veremos um exemplo que nos ajudará a compreender o que "empírico" significa para a ciência.

Uma pesquisa científica foi feita para determinar se é possíveis animais e seres humanos aprenderem a controlar reações do sistema nervoso autônomo. Podem, por exemplo, diminuir batidas cardíacas ou aumentar a secreção da urina à vontade? Tanto velhas quanto novas crenças dizem que isso não é possível. Então, a generalização é: as pessoas não conseguem controlar reações governadas pelo sistema nervoso autônomo. Acontece que a afirmação talvez não seja verdadeira: descobriu-se que animais (e talvez pessoas) podem ser treinados para fazerem coisas tais como aumentar e diminuir as batidas cardíacas, aumentar e diminuir sua secreção urinária e até alterar sua pressão sangüínea. Um enunciado empiricamente orientado seria: os animais podem, dentro de certos limites, controlar reações do sistema nervoso autônomo, recebendo "instrução" apropriada. Os animais podem ser ensinados a, por exemplo, aumentar ou diminuir as batidas cardíacas e aumentar ou diminuir sua secreção urinária. Não é fácil, mas já foi feito. São afirmativas empíricas, já que estão baseadas em evidência científica.

Por ser empírica, não significa necessariamente que uma afirmativa seja verdadeira. Se baseada em pesquisa científica e evidência, é mais provavelmente verdadeira do que uma afirmativa baseada inteiramente em crenças. Entretanto, pode ainda não ser verdadeira. A afirmativa acima, de que é possível aprender a controlar o sistema nervoso autônomo até certo ponto, embora apoiada pela evidência da pesquisa científica, pode acabar sendo refutada em longo prazo. Pode não ser possível obter os mesmos resultados no próximo ou no ano seguinte, ou na Austrália assim como na América. É possível que as descobertas de pesquisa apoiando o enunciado fossem o resultado de alguma causa temporária e não reconhecida; característica apenas da situação particular em que foi feita a

12

pesquisa. Não obstante, a probabilidade de uma afirmativa baseada em evidência empírica ser verdadeira é maior do que a probabilidade de uma afirmativa não empírica ser verdadeira. Evidência empírica cuidadosamente obtida, como veremos, é um corretivo saudável e necessário para as crendices do homem e um meio salutar de diminuir sua ignorância. Evidência não-empírica, por outro lado, pode e às vezes ajuda a perpetuar a ignorância, como fazem os velhos provérbios. E, em resumo, a evidência empírica freqüentemente controla a nossa mania desenfreada de fazer afirmações sobre as coisas, afirmações que podem ou não ser verdadeiras.

A palavra "empírica" então é importante porque mostra uma maneira de olhar o mundo e as pessoas profundamente diferentes da maneira tradicional, que procura explicações apelando para a autoridade, senso comum, ou para a razão. O homem é basicamente egoísta? Podemos citar a Bíblia, Freud ou Shakespeare; podemos dizer que é auto-evidente ou óbvio que o homem é basicamente egoísta ou não egoísta; ou podemos raciocinar cuidadosamente na base da autoridade e da observação e concluir que o homem é basicamente egoísta ou não egoísta. Esta é mais ou menos a maneira tradicional.

Os cientistas, entretanto, não estão satisfeitos com essa maneira. Julgam que a questão é cientificamente respondível - muitas questões não podem ser respondidas cientificamente - então eles abordam o problema diferentemente. Embora possam apresentar uma explanação teórica, sempre fica em suas cabeças uma pergunta a importunar: O que dirá a evidência científica? Decidindo primeiro como definir e medir o egoísmo, o cientista preparará um estudo ou uma série de estudos para tentar determinar até onde o egoísmo motiva o comportamento humano e como isto é feito. Fará, então sob condições controladas e, depois de analisar os resultados obtidos, chegará a conclusões que parecerão saltar da evidência. A evidência, então, é o centro de todo o processo. Sem ela as conclusões geralmente não têm valor científico.

A primeira e última corte de apelação da ciência é a evidência empírica.

1. 6. O objetivo da ciência: teoria e explicação.

O propósito da ciência é a teoria. Uma teoria é uma exposição sistemática das relações entre um conjunto de variáveis. É uma explicação geralmente de um fenômeno particular, ainda que amplo. Um psicólogo poderá propor uma teoria da liderança em grupos e organizações ou, como Freud, uma teoria da motivação humana, ou, como o influente sociólogo europeu, Weber, uma teoria para esclarecer o capitalismo moderno ou, como o psicólogo suíço, Piaget, uma teoria do conhecer humano. Tais teorias são tentativas sistemáticas de "explicar" os vários fenômenos a serem explicados e um certo número de "variáveis explicativas" que também estão relacionadas entre si de modo sistemático. O

13

propósito básico da ciência é chegar à teoria, inventar e descobrir explicações válidas de fenômenos naturais.

Outras finalidades da ciência, além da teoria e explicação, foram propostas: - a finalidade da ciência é melhorar o destino do homem; - a finalidade da psicologia e sociologia é ajudar a melhorar a sociedade humana... .

Colocar o bem-estar humano como finalidade fundamental da ciência, conduz finalmente a um desgaste da própria ciência e à conseqüente diminuição da compreensão dos fenômenos físicos e humanos.

1. 7. Variáveis.

Uma das maiores dificuldades ao abordar um assunto novo é o seu vocabulário. Não se inventam e se usam palavras novas apenas; velhas palavras são usadas de maneira nova e diferente. Este, naturalmente, é o caso da ciência. Teremos que nos familiarizar com termos e expressões que são usados constantemente na pesquisa psicológica, sociológica, educacional... .

As definições raramente são interessantes para o leitor. Mas são essenciais porque é virtualmente impossível conversar inteligentemente sobre ciência e pesquisa sem usar termos abstratos e técnicos desconhecidos do leitor... Os cientistas comportamentais usam termos como “amostra casual”, "variáveis independentes", "manipulação experimental" e "significância estatística". Ao passo que tais expressões são fáceis e familiares para o cientista, podem ser estranhas, perturbadoras e mesmo assustadoras para o leigo.

Nosso objetivo, agora, nessa introdução é apresentar o conceito de variável: como qualquer coisa que podem ser classificadas em duas ou mais categorias. "Sexo" é uma variável, o tipo de variável mais simples porque existe apenas em duas categorias, masculina e feminina. "Preferência religiosa, “preferência política”, e "classe social" são variáveis com mais de duas categorias". Tais variáveis são chamadas de variáveis categóricas. Têm por característica o fato de todos membros de uma categoria - todos os do sexo feminino, por exemplo - serem considerados iguais no que diz respeito àquela variável. Outros exemplos são nacionalidade, raça, escolha ocupacional.

Se uma propriedade de objetos pode ser medida, ela pode ser uma variável. Ser "medida", por ora, significa que algarismos podem ser atribuídos a pessoas diferentes ou objetos diferentes com base na posse de quantidades de alguma propriedade ou característica. Altura e peso são exemplos fáceis e óbvios. Mas podemos atribuir os algarismos 1, 2, 3, 4 e 5 a determinadas crianças com base em sua suposta ansiedade, 5 significando muita ansiedade, 4 uma boa quantidade de ansiedade e assim até 1, que significa pouca ansiedade. Se pudermos fazer isso, temos a variável "ansiedade". Em termos de senso comum a variável é algo que varia. Ou pode ser dito que uma variável é uma propriedade que assume valores diferentes. A variável sexo foi mencionada acima. Pode-se atribuir 1 ou 0 aos

14

indivíduos, dependendo de serem homens ou mulheres. Mesmo atribuindo-lhe somente dois algarismos 1 e 0, sexo é uma variável.

Inteligência, ansiedade, autoritarismo, aptidão verbal, realização escolar... são variáveis medidas porque são medidas com um teste ou outro instrumento que produz resultados que vão de altos a baixos.

Sempre que os pesquisadores preparam condições experimentais, eles criam variáveis. Nós chamamos tais variáveis de variáveis experimentais ou manipuladas.

Há, então, três tipos gerais de variáveis na pesquisa comportamental: as categóricas, as medidas e as experimentais ou manipuladas.

1. 8. Relações.

"Relação" provavelmente é a palavra mais fundamental em ciência. É um ir junto de duas variáveis: é o que as duas variáveis têm em comum. A idéia é comparativa: uma relação é um elo, uma ligação entre dois fenômenos, duas variáveis. As relações são a essência da ciência. A ciência não é um conhecimento de simples particularidades, mas um conhecimento do modo de como essas classes estão relacionadas. “Fazemos a ciência com fatos, como fazemos uma casa com pedras; mas a acumulação de fatos não é ciência, assim como um monte de pedras não é uma casa”(Poincaré) .Sabemos, por exemplo, que coisas grandes são grandes apenas mediante a comparação com coisas menores. Os fatos científicos são relações. As relações entre inteligência e realização, entre pressão de grupo e conformidade, entre aptidão e motivação, são, quando estabelecidos, "fatos".

1. 9. Estudos e experimentos.

Estudo se refere tanto a investigações experimentais quanto não- experimentais e a tipos diferentes de pesquisa. Embora os experimentos sejam feitos na maioria em laboratórios, podem ser feitos em outros lugares - em escolas, lares, fábricas e até nas ruas. Mais importante, um experimento propriamente dito tem duas características básicas. Uma delas é uma característica que todo experimento deveria ter: designação aleatória dos sujeitos para os diferentes grupos experimentais. Isto quer dizer, simplesmente, que os sujeitos são designados para os grupos experimentais de tal forma que qualquer um possa se tornar membro de qualquer grupo, sem ser possível dizer de qual grupo ele participará.

A segunda característica básica de um experimento é a manipulação, isto é, a manipulação de variáveis independentes. (Variáveis dependentes quase nunca são manipuladas). Repetindo: isto significa que o pesquisador faz coisas diferentes

15

com grupos diferentes de indivíduos. Suponhamos que eu ensine quatro grupos de alunos do quarto ano com quatro métodos diferentes. Isto é uma manipulação. Suponhamos que eu queira estudar os efeitos dos tipos de tomada de decisão na produtividade do grupo. Tenho um grupo de 90 pessoas que divido em três grupos de 30, denominando-os A1, A2 e A3. As pessoas do grupo A1 terão o máximo de oportunidades de participar das decisões do grupo (as quais são uma parte da manipulação), as do grupo A2 uma ou outra oportunidade de participar, e as do grupo A3 nenhuma oportunidade. Isto também é uma manipulação.

Há vários tipos de estudos científicos. Um experimento é apenas um deles. Todos os outros são não experimentais. Um levantamento de opiniões é não- experimental. Assim é toda a investigação das relações entre variáveis quando não há manipulação.

A distinção entre um estudo experimental do não experimental é muito importante porque as conclusões de um experimento bem conduzido geralmente são mais fortes do que as conclusões de um estudo bem conduzido que não seja um experimento.

1. 10. Problemas, hipóteses e variáveis.

Problemas são perguntas a respeito de relações entre variáveis. O treino em uma função mental melhora a aprendizagem futura dessa função mental? Este problema é velho e conhecido. Se você treinar memorização, pode melhorar sua memória e sua futura memorização? (A resposta parece ser desanimadora?).

As mulheres difíceis são mais desejáveis para os homens do que as ansiosas por uma ligação?. Esse problema vem do folclore sobre as mulheres: as que são relativamente inacessíveis são mais desejáveis. As variáveis são: inacessibilidade, “difíceis” e desejabilidade.

"Um problema é uma questão que pergunta como as variáveis estão relacionadas".

São três as condições para que um problema seja considerado do ponto de vista científico: primeira: é uma questão, uma sentença em forma interrogativa; segunda: uma questão que geralmente pergunta alguma coisa a respeito das relações entre fenômenos ou variáveis; terceira: o problema seja tal que implique a possibilidade de testagem empírica, ou seja, que seja obtida evidência real sobre a relação apresentada no problema.

Uma hipótese é um enunciado conjetural das relações entre duas ou mais variáveis. Hipóteses são sentenças declarativas e relacionam de alguma forma variáveis a variáveis. São enunciados de relações, e, como os problemas, devem implicar a testagem das relações enunciadas. Problemas e hipóteses são semelhantes. Ambos enunciam relações, só que os problemas são sentenças interrogativas e as hipóteses sentenças afirmativas. Às vezes são quase idênticos em substância. Uma diferença importante, entretanto: as hipóteses geralmente são

16

mais específicas do que os problemas: geralmente estão mais próximas das operações de teste e pesquisa.

Eis algumas hipóteses: "Quanto maior a coesão de um grupo, maior sua influência sobre seus membros"; "Aprender coisa nova interfere com a lembrança de coisas já aprendidas"; "Privação na infância resulta em deficiência mental mais tarde". Observe que todas estas três hipóteses são relações e que sua testagem empírica está claramente implicada porque as variáveis podem ser manipuladas (interferência, coesão de grupo e até privação na infância) ou medidas (influência, lembrança, deficiência mental) ou ambas.

Vamos tomar a última: “Privação na infância resulta em deficiência mental mais tarde". "Privação na infância" é a variável independente. Pode significar falta de alimento nos primeiros anos. Ou pode significar uma falta prematura de amor ou afeição. Ou pode significar falta de estimulação adequada - conversa, brinquedos, outras pessoas ou outros animais, e assim por diante. Observe que pode ser uma variável manipulada: os animais podem ser privados sistematicamente de alimento, afeto ou estímulo. Pode ser também uma variável medida: determinamos, por exemplo, a magnitude de privação que teve uma criança ou um adulto nos seus primeiros anos, talvez perguntando a ele e a seus pais. Evidentemente, "privação nos primeiros anos" é acessível empiricamente. "Deficiência mental" é também acessível empiricamente. Pode ser medida com um ou mais dos muitos testes disponíveis de capacidade mental ou de deficiência mental. Naturalmente pode surgir um problema difícil em decidir o que é ou não é "deficiência". Mas o que interessa aqui é determinar se a variável pode ser medida.

A hipótese "Privação na infância produz deficiência mental mais tarde" é uma hipótese porque enuncia uma relação conjetural entre variáveis que podem ser manipuladas ou medidas. A relação é expressa pela palavra "produz".

1. 11. O valor das hipóteses.

As hipóteses são muito mais importantes na pesquisa científica do que parece, quando se considera apenas o que são e como são construídas. Elas têm o objetivo profundo e altamente significativo de tirar o homem de si mesmo, por assim dizer. Isto é, sua formulação apropriada e seu uso capacitam o homem a testar aspectos da realidade com um mínimo de distorção causada por suas predileções. As hipóteses são uma parte da metodologia da ciência associada ao critério de objetividade.

As hipóteses são uma ferramenta poderosa para o avanço do conhecimento porque, embora formuladas pelo homem, podem ser testadas e mostradas como provavelmente corretas ou incorretas à parte dos valores e crenças do homem.

17

Naturalmente, os cientistas querem que suas idéias sobre a realidade concordem com a "realidade".

As hipóteses são meios especialmente potentes de preencher objetivamente as lacunas entre uma crença pessoal e a realidade empírica. São ferramentas para testar a realidade e podem ser mostradas como provavelmente corretas ou incorretas, independentemente do investigador.

As hipóteses têm outras virtudes. Uma delas é que podem ser, e freqüentemente são, deduzidas da teoria. Qualquer teoria de importância terá um número de implicações empíricas que podem ser deduzidas dela. Foi escrito um livro inteiro sobre as implicações da hipótese geral de que a frustração produz agressão. Na verdade, esta hipótese geral é bastante ampla para ser o enunciado básico de uma teoria, a teoria da agressão. Tem implicações empíricas. Por exemplo, se frustrarmos as crianças, elas agredirão outras crianças, adultos ou elas próprias.

Qualquer teoria, se realmente for uma teoria, terá muitas implicações para serem testadas; ela gerará (com ajuda, naturalmente) muitas hipóteses testáveis. Sem dúvida é assim que as teorias são testadas.

1. 12. Hipóteses e testabilidade.

Para que as hipóteses sejam cientificamente úteis, elas precisam ser testáveis, ou no mínimo, conter implicações para teste. Uma hipótese não-testável não tem utilidade científica. Isto é, é preciso identificar clara e inteiramente as variáveis de uma hipótese - ou é preciso deduzir suas implicações em forma de variáveis - e depois ter um meio operacional de manipular ou medir as variáveis para poder estudar as relações entre elas. A hipótese agressão-frustração é um bom exemplo: já demos duas ou três possibilidades de teste - e há muitas mais.

Algumas teorias e enunciados teóricos, por outro lado, são não testáveis - pelo menos com os meios de que dispomos hoje. Assim, elas se colocam além da abordagem científica. Um caso clássico é o de algumas teorias freudianas. Por exemplo, a teoria de Freud sobre a ansiedade é não-testável, pelo menos como Freud a formulou, em parte porque inclui o conceito da repressão. Por repressão Freud quis dizer o ato de forçar idéias inaceitáveis no inconsciente. Deduções empíricas da teoria terão, naturalmente, que incluir o conceito de repressão, que está ligado ao conceito de inconsciente. Embora seja possível enunciar relações entre as variáveis da teoria da ansiedade, definir os conceitos de repressão (no sentido pretendido por Freud) e inconsciente, com o fim de medi-los, é extremamente difícil, se não impossível.

Para usar um conceito no teste de uma hipótese, deve-se deduzir, pelo menos até certo ponto, as implicações empíricas ou o significado do conceito. Quando se faz isto, tem-se a chamada definição operacional. No caso da variável (também dita pelos psicólogos como constructo) repressão, isto é difícil de fazer por que as

18

manifestações comportamentais de repressão são difíceis de compreender. Freud, por exemplo, apresenta várias. Uma famosa é o "lapso da língua". Mas será que todo lapso de língua indica uma repressão? E como podemos medi-los, assumindo que indiquem repressão?

1. 13. Explicação científica, teoria e relações.

Em ciência queremos explicar fenômenos naturais. Por exemplo, queremos explicar "preconceito", o que quer dizer que vamos dizer como nasce, por que nasce, como caminha, o que o afeta, o que ele afeta e assim por diante.

Explicar alguma coisa, pelo menos satisfatoriamente, certamente é uma das tarefas mais difíceis que podemos empreender. Mais que isto, é literalmente impossível explicar tudo sobre algum fenômeno, ou sobre conjunto de fenômenos. E explicar tudo sobre preconceitos, por exemplo, simplesmente não é possível, principalmente se quisermos que boa parte de nossa explanação venha apoiada em evidência empírica. Em outras palavras, a "verdade" absoluta é para sempre impossível. Mas aproximações razoáveis a explicações de fenômenos naturais podem ser dadas de maneira científica satisfatória.

O único meio, então, de explicar alguma coisa, é determinar de que maneira esta coisa se relaciona com outras coisas. Assim a explicação do preconceito significa descobrir como o preconceito se relaciona com outros fenômenos naturais.

1. 14. Probabilidade e estatística.

Vivemos num mundo probabilístico. Num mundo onde quase nada é absolutamente certo. Muita coisa é relativamente certo, claro. É quase certo que choverá em Londres ou em Amsterdã nos próximos 30 dias. Mas nunca se garante certeza absoluta. Há limites nas certezas: algumas coisas são virtualmente certas, entretanto, outras estão longe disso. Falamos probabilisticamente o tempo todo, embora freqüentemente vivamos como se os acontecimentos da vida fossem infalíveis. Os cientistas, entretanto, não apenas falam probabilisticamente; eles vivem probabilisticamente em seu mundo de pesquisas.

Uma das principais diferenças entre os vários ramos da ciência é o grau de certeza dos acontecimentos e relações. Nas ciências naturais, por exemplo, o grau de certeza é muito alto. Um físico pode expor uma lei física e pôr alta confiança no comportamento de corpos físicos e em acontecimentos. Aliás, muitas relações em física são chamadas "leis", em parte pelo alto grau de certeza a elas associadas.

19

Entretanto, sempre há uma margem de erro, embora a literatura popular e o próprio homem pareçam confiar plenamente nas leis físicas e no comportamento de objetos e acontecimentos.

Os acontecimentos e relações das ciências comportamentais nem sempre são certos. Um químico diz que, se certa quantidade do produto químico A for juntada a certa quantidade do produto químico B, haverá uma explosão. A afirmativa é probabilística, embora sua probabilidade de estar correta (na maioria dos casos) seja muito alta. Os psicólogos, por outro lado, podem dizer que se as crianças forem frustradas elas mostrarão agressão, mas a probabilidade da afirmativa estar correta não é tão alta assim.

A despeito das diferenças de graus de certeza, é importante compreender que todas as ciências são probabilísticas. O pensamento do cientista em todos campos é fundamentalmente o mesmo. Entretanto, os cientistas discordam radicalmente nos níveis de probabilidade que comumente se associam aos fenômenos e relações com que trabalham. Se quisermos compreender ciências como a psicologia e a sociologia é importante termos capacidade de pensar e viver em paz com as afirmações probabilísticas. Precisamos entender perfeitamente que cada asserção, cada afirmativa de relação vem acompanhada de uma "etiqueta" probabilística. Sempre que dizemos "Se p, então q", o que dizemos é "Se p, então provavelmente q". O que acontece na vida se repete na ciência: a certeza é um mito, para sempre fora do nosso alcance.

A estatística utiliza-se da probabilidade. Em parte é um instrumento que mostra aos cientistas em que medida o resultado de suas pesquisas é seguro, e, assim, quanto suas asserções são dignas de confiança.

Quando obtemos o resultado de uma pesquisa, queremos saber se podemos confiar nele. Se repetirmos o experimento várias vezes, obteremos os mesmos resultados a cada repetição? Se a resposta for sim, os resultados são confiáveis.

A estatística e a probabilidade lidam essencialmente com incertezas; na pesquisa, entretanto, elas nos ajudam a ter mais certeza dos resultados que obtemos! Isto não significa que podemos ter certeza dos próprios resultados, dos resultados em si, mas que podemos atribuir graus de certeza aos resultados com bastante precisão. Se fizer uma experiência com um grupo experimental e um grupo de controle, por exemplo, e obtive a diferença entre os dois grupos na direção prevista, posso garantir que esta diferença seja suficientemente grande para justificar minha confiança de que é "uma diferença verdadeira?” Poderei dizer algo como: "A probabilidade de que a diferença de média de pontos dos dois grupos não é fortuita, não é devida ao acaso, é alta. Há apenas uma possibilidade em cem de que a diferença seja devida ao acaso". Embora probabilística, é uma afirmativa forte.

“A variação está presente em toda parte: os indivíduos variam, medidas repetidas no mesmo indivíduo variam. Portanto as conclusões são incertas. A nossa intuição sobre incertezas é fraca – por exemplo, tendemos a tirar

20

conclusões não confiáveis das irregularidades. Os métodos estatísticos levam em conta a incerteza e corrigem a nossa intuição”.

(David S. Moore, Teaching Beginners as a Mirror of the Discipline, p.3)

1. 15. Casualização.

Todo experimento tem uma idéia fundamental por detrás: testar o efeito de uma ou mais variáveis independentes sobre uma variável dependente.

Suponhamos que um educador queira testar a eficácia relativa de dois métodos de ensino de certas operações aritméticas. A variável independente é métodos de ensino e a dependente o desempenho em aritmética. Digamos que o experimentador disponha de um bom teste de realização aritmética, a medida da variável dependente. Ele especifica cuidadosamente o que fará com os dois métodos de ensino - denominando-os método A1 e método A2. Isto é, ele define operacionalmente Y, a medida de desempenho em aritmética e as condições experimentais, A1 e A2. Nada disto é novo para nós.

Agora, entretanto, ele precisa dar um jeito de preparar dois grupos de alunos e deve fazer isso de tal forma que possa assumir que, antes do experimento começar, os grupos sejam estatisticamente "iguais" em todas as variáveis possíveis, que possam afetar a variável dependente (desempenho em aritmética). Se ele não puder garantir que os grupos sejam iguais antes de começar o experimento, as conclusões que tirar depois serão questionáveis. Se os grupos não forem iguais, então o resultado final poderá ser devido a outra influência ou influências outras que a manipulação da variável independente. Suponhamos que a inteligência afete o desempenho em matemática - o que de fato acontece - e que um dos dois grupos, sem o conhecimento do pesquisador, tenha crianças que em média sejam mais inteligentes do que as do outro grupo. Daí, depois de feito o experimento, suponhamos que a média de realização aritmética do primeiro grupo seja maior que a média do segundo grupo. Esta média mais alta pode ser devida à inteligência superior do grupo e não à manipulação experimental. Efeitos indesejáveis como este devem ser controlados se o pesquisador quiser chegar a resultados em que possa confiar.

Suponhamos ainda que inteligência e sexo afetem a realização em aritmética. Um meio usado para “equalizar” grupos experimentais, para controlar efeitos indesejáveis, foi “equalizar” os grupos designando-lhes sujeitos sistematicamente de sorte que as variáveis independentes ficassem distribuídas igualmente entre os grupos. No caso particular de sexo e inteligência, por exemplo, o pesquisador pode medir a inteligência das crianças com um teste de inteligência e distribuir as crianças de inteligência comparável entre os dois grupos, igualmente. Se ele tiver um total de seis crianças (muito pouco, claro), e seus QIs forem 121, 119, 106, 109, 94 e 95 ele poderá colocar as de QI 121, 106 e 94 em A1 e as de QI 119, 109 e 95 em A2. Com isto os grupos ficarão aproximadamente iguais em inteligência.

21

Depois, poderá distribuir meninos e meninas igualmente entre os grupos. Naturalmente ele poderá ter que mudar a primeira distribuição com base na inteligência; pois pode ser que as medidas de inteligência das meninas sejam maiores (ou as dos meninos), tornando impossível equilibrar os dois grupos na base de ambas as variáveis.

Este método de designação de sujeitos a grupos está sendo abandonado por causa de uma grande limitação: controla apenas duas variáveis, inteligência e sexo. E as outras variáveis que possam afetar o desempenho em aritmética: aptidão numérica, classe social, atitudes e assim por diante? Tais variáveis continuam sem controle. O que se pode fazer?

1. 16. Designação aleatória e casualização.

O método de designarem sujeitos a grupos experimentais que (teoricamente, pelo menos) evita as dificuldades que acabamos de discutir é a designação aleatória. Se há apenas dois grupos, pode-se jogar uma moeda para escolher cada um dos membros: dando cara, grupo A1; dando coroa, grupo A2. Isto deve funcionar se jogar a moeda adequadamente. Mas o método de números aleatórios funciona com dois, três ou qualquer número de grupos. Encontram-se facilmente tabelas de números aleatórios e, realmente, elas se tornaram indispensáveis em muitas operações de pesquisa. Os números aleatórios têm a característica essencial de serem imprevisíveis: se forem aleatórios, não há maneira de prever sua seqüência, se são pares ou ímpares, sua magnitude e assim por diante.

Os números aleatórios são usados para designar sujeitos para os grupos. Este processo de designar sujeitos aleatoriamente a grupos experimentais é

um aspecto importante da casualização. Casualização é a designação de objetos (sujeitos, tratamentos, grupos) de um universo a subconjuntos do universo de tal maneira que, para qualquer designação dada a um subconjunto, todo membro do universo tem igual probabilidade de ser escolhido para a designação. Não há total garantia de que a casualização "igualará" os grupos, mas a probabilidade de igualar é relativamente alta.

Uma das grandes forças dos experimentos é poderem usar a casualização. É o único método defensável inventado para aumentar a probabilidade da validade dos experimentos e das inferências feitas a partir deles, aumentando a probabilidade de "igualdade" dos grupos experimentais em todas as variáveis independentes possíveis. Seu uso dá grande força ao pesquisador para fazer inferências partindo de dados e chegar a conclusões sobre teorias e hipóteses.

Se nós fossemos seres omniscientes, conhecêssemos todas as causas que contribuem a um evento, então não haveria necessidade de casualização (randomness). A beleza da casualização está em que o homem aproveita-se da sua "ignorância" e transforma-a em conhecimento.

22

1. 17. Tamanho da amostra.

Uma regra "curta e grossa" que Kerlinger ensina a seus estudantes iniciantes em pesquisa é: "Use tamanhos de amostra tão grande quanto possível". Quer seja uma média, uma proporção, ou outra estatística que seja calculada da amostra: - um valor populacional estará sendo estimado.

A pergunta que deverá ser respondida é: Qual a magnitude do erro existente em estatísticas calculadas de amostras de diferentes tamanhos?

Quanto menor a amostra maior o erro, ou seja, maior o desvio do valor estimado em relação ao valor populacional.

As estatísticas calculadas de amostras grandes são mais exatas do que aquelas calculadas de pequenas amostras.

Amostras grandes são preferíveis. Porque elas dão oportunidade ao princípio de casualização (ou casualização) de atuarem: "They are advocate in order to give the principle of randomization, or simply randomness, a chance 'to work', to speak somewhat anthropomorphically".

1. 18. Delineamento da pesquisa.

O delineamento da pesquisa é a disciplina dos dados. Sua finalidade implícita é impor restrições controladas às observações de fenômenos naturais. Um modelo de pesquisa, com efeito, diz ao pesquisador: "Faça isto e aquilo; não faça isto ou aquilo; cuidado com isto; esqueça aquilo", e assim por diante. Em resumo, é uma planta da pesquisa. Se o delineamento for bem concebido, o produto resultante da pesquisa tem maior probabilidade de ser válido empiricamente e merecer atenção científica séria. Sem conteúdo - boa teoria, bons problemas, boas hipóteses - o delineamento de qualquer pesquisa é vazio. Mas sem forma, sem estrutura adequadamente concebida e criada para os propósitos da pesquisa pouca coisa de valor pode ser realizada.

1. 19. Pesquisa experimental e não-experimental.

A pesquisa experimental pode ser considerada o ideal da ciência porque as respostas às questões de pesquisa obtidas em experimentos são mais claras e menos ambíguas do que as respostas obtidas em pesquisas não-experimentais. Mas há um grande corpo de pesquisas importantes e significativas que é não- experimental, ou estudo observacional. Pode-se até argumentar que o estudo observacional é mais importante que a pesquisa experimental. Os dois tipos de pesquisa são importantes e necessários. Ambos têm valor. Ambos devem ser feitos.

23

1. 20. Controle

O experimento científico é uma das maiores invenções de todos os tempos. É também a fonte mais segura de conhecimentos e de compreensão dos fenômenos naturais, outras coisas mantidas constantes.

Os motivos não são difíceis de compreender. O principal e central é expresso pela palavra "controle". Num experimento bem conduzido, o controle é relativamente grande. Mas o que significa "controle" em um contexto experimental? Basicamente significa a definição, delimitação, restrição e isolamento das condições da situação de pesquisa de maneira a maximizar a confiança na validade empírica dos resultados. As possibilidades de explanações alternativas dos fenômenos em estudo são minimizadas.

Mas, testar explicações ou hipóteses alternativas, uma forma poderosa e indispensável de controle científico, não é uma prerrogativa exclusivamente experimental. Tal teste pode ser e é feito em pesquisa não-experimental. Entretanto, é mais característico e mais exeqüível na pesquisa experimental que na pesquisa não experimental, porque os pesquisadores podem ter controle quase total sobre o que podem fazer e como o fazem.

1. 21. Definição e características dos experimentos. Steve Miller, Planejamento Experimental e Estatística, Ed. Zahar, 1977 p. 22-24

Em termos formais, um experimento é o meio de coletar provas para mostrar o efeito de uma variável sobre uma outra. No caso ideal, o experimentador manipula a VI, mantém todas as outras variáveis constantes e depois observa as mudanças na VD. Neste hipotético experimento perfeito, quaisquer mudanças na VD devem ser causadas pela manipulação da VI.

Vamos supor, por exemplo, que estejamos diante da seguinte teoria: a privação de sono causa um aumento no tempo de reação aos sinais visuais. Dada a cooperação de um grupo de sujeitos, poderemos testar experimentalmente essa predição. Metade dos sujeitos seria privada de sono por uma noite, enquanto à metade restante se permitiria que dormisse normalmente. Na manhã seguinte, mediríamos o tempo de reação de cada sujeito e veríamos se o grupo privado de sono apresentava tempos de reação visivelmente mais longos. No caso afirmativo – e desde que os dois grupos fossem semelhantes em todos os demais aspectos, - estaríamos justificados em concluir que a privação de sono causa um retardamento das reações e estímulos visuais. Esse procedimento qualifica-se como experimento porque manipulamos realmente a variável independente (quantidade

24

de sono) e observamos as mudanças conseqüentes na variável dependente (tempo de reação). Este é o mais simples tipo de experimento – aquele em que a variável independente assume apenas dois valores ou níveis (nenhum sono – sono normal).

Consideremos agora um segundo exemplo. Temos desta vez uma teoria que prediz a existência de uma relação entre, digamos, a inteligência e o tempo de reação; espera-se que sujeitos inteligentes reajam mais depressa do que sujeitos menos inteligentes. Poderíamos, uma vez mais, dividir o nosso grupo de voluntários em dois subgrupos, de acordo com os seus respectivos QIs. Formaríamos, assim, um grupo mais inteligente e um grupo menos inteligente. Se encontrássemos a diferença prevista nos tempos de reação, talvez, fossemos tentados a concluir que a inteligência determina a rapidez das reações de um sujeito, tal como a privação de sono no exemplo anterior. Contudo, a analogia é enganadora, pois a inteligência não pode ser deliberadamente manipulada da mesma forma que a privação do sono. Os sujeitos levam consigo para o laboratório o seu próprio nível de inteligência e tudo o que podemos fazer é observar a relação entre inteligência e tempo de reação. Mas não podemos passar depois a inferir uma relação de causa e efeito entre as duas variáveis porque ambas são susceptíveis de receber a influência de uma terceira variável, esta incontrolável. Por exemplo, pode ser que os sujeitos inteligentes sejam acentuadamente mais saudáveis que os menos inteligentes, ou mais jovens, ou mais altamente motivados, ou mais atentos, etc; qualquer dessas variáveis pode ser a causa real da variação no tempo de reação. Seria um equívoco atribuir um papel causal à inteligência e não a uma das outras variáveis que sucede estar relacionada com a inteligência. Este exemplo destaca o principal ponto fraco de toda a pesquisa não experimental; nunca podemos estar certos de que a variável independente que medimos é realmente aquela que produz mudanças na variável dependente.

Lamentavelmente muitas variáveis que gostaríamos de investigar não podem ser submetidas a controle experimental. Não podemos manipular as características pessoais de um sujeito: sua idade, sexo, status social, inteligência, personalidade, crenças religiosas, atitudes sociais, etc. Tampouco queremos interferir com aspectos críticos do estado fisiológico ou emocionais de um sujeito, se bem que, em princípio, isso fosse possível. Em tais casos, o pesquisador tem de apoiar-se nas variações naturais que observa nas variáveis de interesse. Compara o desempenho de sujeitos idosos e jovens, dos sexos masculino e feminino ou, como no exemplo acima, de sujeitos mais ou menos inteligentes. Recorrerá depois a procedimentos estatísticos para eliminar as possíveis influências de fatores incontrolados que possam estar mudando em conjunto com a variável sob estudo. Os procedimentos usados nesse tipo de estudo são discutidos em maior detalhe em outros textos sob a designação geral de planejamento correlacional (ver, por exemplo, Krausz, E. e Miller, S.H., Social Research Design, Longman, 1974; Blalock, H. M. Social Statistics, McGraw-Hill, 1972). São de importância crítica em áreas tais como a Psicologia Social, a Sociologia e a Economia, onde o

25

controle experimental das variáveis independentes é usualmente impossível ou irrealista. Mas o psicólogo experimental pode evitar as complicações dos estudos correlacionais se estiver preparado para limitar a sua pesquisa àquelas variáveis que podem ser experimentalmente manipuladas. Isso significará, com efeito, que ele se interessará mais pela influência de condições externas sobre o desempenho do que pelo efeito das características peculiares dos seus sujeitos. Também significa que será menos importunado pelos problemas de medição psicológica. A manipulação de variáveis independentes, como o brilho de um estímulo ou o comprimento de uma palavra, é muito mais direta do que a medição de variáveis independentes como a inteligência ou o neuroticismo.

Características essencias de um experimento

O experimento tem duas características essenciais: a manipulação de variáveis independentes e a casualização.

A casualização não é absolutamente essencial em um experimento, embora muito desejável. O verdadeiro significado da qualidade essencial da casualização, na definição, é simplesmente que a casualização pode ser usada apenas em experimentos. Como veremos mais adiante, a designação aleatória é completamente impossível em pesquisa não-experimental.

Um experimento é um estudo no qual uma ou mais variáveis independentes são manipuladas e no qual a influência de todas ou quase todas as variáveis relevantes possíveis não pertinentes ao problema da investigação é reduzida a um mínimo.

1. 22. Forças e fraquezas da pesquisa experimental.

A força básica da pesquisa experimental está no controle relativamente alto da situação experimental e conseqüentemente das possíveis variáveis independentes que possam afetar as variáveis dependentes. Isto significa que as relações podem ser estudadas isoladas da cacofonia do mundo exterior; as relações "puras" podem ser estudadas. Uma segunda força é que as variáveis podem ser manipuladas sozinhas ou em conjunto com outras variáveis. Terceira força, as situações experimentais são flexíveis no sentido de que muitos e variados aspectos da teoria podem ser testados quase à vontade. Freqüentemente, a única restrição é o limite da habilidade.

A quarta força: os experimentos podem ser replicados com ou sem variações. É muito mais fácil replicar pesquisa experimental que não-experimental, porque grande parte da situação de pesquisa se encontra sob controle do pesquisador.

26

Replicação significa repetir um estudo, geralmente com variações. Num sentido estrito, a duplicação simples jamais é possível, porque são usados sujeitos diferentes, pode ser acrescentada uma variável, outra pode ser excluída, a replicação terá que ser feita em outra ocasião, quando as condições podem ter mudado e o local da pesquisa pode, e muitas vezes deve, ser mudado. Em todo caso, se as relações obtidas são as mesmas, ou semelhantes sob replicação, sua validade empírica fica reforçada. Fraquezas. Os experimentos têm fraquezas. Uma delas é que as variáveis independentes dos experimentos de laboratório raramente têm muita força se comparadas à força de variáveis "naturais" fora do laboratório.

A experimentação é freqüentemente criticada com base em duas acusações relacionadas: artificialidade e falta de generalidade. É difícil saber se a artificialidade dos experimentos é realmente uma fraqueza. Há muita pouca dúvida de artificialidade. Sem dúvida, já que variáveis manipuladas são inventadas, são quase por definição "artificiais". Por outro lado, muitas vezes é incrível até que ponto os experimentos podem ser tornados realísticos.

Em geral os resultados de experimentos de laboratórios não podem ser generalizados além do laboratório. Só porque certos resultados foram obtidos em laboratórios não se pode dizer que resultado idêntico ou semelhante ocorrerá fora do laboratório - embora possa, e muito bem. Deve-se mostrar, através de pesquisas posteriores, que os resultados se aplicam ao campo. Isto falando num sentido estrito.

Ao pensar na aplicabilidade da experimentação de laboratório à vida real, deve-se ter em mente que o objetivo básico da experimentação não é descobrir o que acontecerá ou o que funcionará em situações de vida. O objetivo básico é estudar as relações e testar hipóteses derivadas da teoria. Muita pesquisa - um exemplo claro é a medicina - é feita em laboratório, principalmente para determinar o que aconteceu ou o que acontecerá. Por exemplo, tal ou tal método de terapia surtirá efeito? Embora muitíssimo útil tal experimentação, cientificamente falando, é periférica à base conceitual da experimentação científica. Se esta interpretação assaz purística está ou não completamente correta não é, entretanto, importante. O que importa é não esperarmos que a experimentação em laboratório faça o que não foi encarregada de fazer: generalizar para situações de vida real.

Os experimentos e seus resultados não foram feitos para serem aplicados à vida real. O experimento é uma invenção especializada cujo propósito está quase totalmente divorciado da vida real. Seu propósito é especificamente ficar separado e protegido do "barulho" exterior. Seu propósito científico é estudar as relações e testar as proposições derivadas da teoria no ambiente menos contaminado que se possa conseguir. Seu propósito não é melhorar as condições humanas e sociais. Portanto, uma crítica à pesquisa experimental com base na generalização é, rigorosamente falando, irrelevante. É como criticar alguma coisa por não ser o que não pode ser de forma alguma.

27

1. 23. Pesquisa não-experimental.

Nenhum tipo de pesquisa pode ou deve gozar de qualquer monopólio de validade e prestígio. Não há nada inerentemente meritório em se fazer tanto pesquisa experimental quanto não-experimental, como tais. Pesquisam-se problemas de interesse e alguns problemas podem ser experimentais, enquanto outros não.

Pesquisa não-experimental é qualquer pesquisa onde não seja possível manipular as variáveis ou de designar sujeitos ou condições aleatoriamente.

Efetuam-se inferências e tiram-se conclusões tanto em um tipo de pesquisa quanto no outro, e a lógica básica da investigação é a mesma. Mas as conclusões não são empiricamente tão fortes quanto na segunda.

Na pesquisa não experimental, a manipulação de variáveis independentes não é possível. Esta é a característica fundamental da pesquisa não-experimental: variáveis independentes chegam ao pesquisador como estavam, já feitas. Já exerceram seus efeitos, se os havia.

Nos experimentos, já que temos controle virtual das variáveis independentes e da situação na qual as variáveis independentes operam, podemos ter mais certeza - nunca total, claro - de que variações concomitantes observadas numa variável dependente são devidas à influência das variáveis independentes. Em estudos que não são experimentais, nossa confiança, outras coisas mantidas constantes, deve ser menor, principalmente por causa da falta de controle manipulador das variáveis independentes.

Alguns pesquisadores e autores parecem crer que a diferença fundamental entre pesquisa experimental e não experimental é que na primeira podem ser feitas inferências casuais, enquanto na segunda não. Isto está simplificado demais. Estritamente falando, nenhum tipo de pesquisa pode afirmar que uma coisa causa outra. O máximo que se pode dizer é que tal ou qual relação existe e que é de tal ou qual natureza. A questão, entretanto, é realmente acadêmica, já que não há necessidade de fazermos afirmativas causais em ciência. As afirmativas denominadas condicionais, tipo se p, então q, que não têm implicações causais, são suficientes.

Em muitas pesquisas não-experimentais observamos y, a variável dependente e depois "voltamos" para encontrar o X ou os XX que provavelmente tenham influenciado y.

28

1. 24. O fumo e o câncer do pulmão.

A pesquisa da suposta relação entre o fumo e o câncer do pulmão gerou muita controvérsia. Muitos não-fumantes estão absolutamente convictos de que o cigarro causa o câncer do pulmão e citam pesquisas que parecem apoiar sua convicção. Muitos fumantes não se convencem - talvez porque não desejam serem convencidos. Quais são os fatos? Parece haver pouca dúvida de que, como ficou dito, haja uma relação estatística entre o fumo e o câncer do pulmão. Mais simplesmente, muitas pesquisas descobriram que o câncer é mais comum entre fumantes que entre não fumantes. Há, então, um acordo nas descobertas. Mas pode-se concordar com a conclusão que é, não nos esqueçamos, "o cigarro causa câncer de pulmão?”.

Primeiro, vamos nos desembaraçar da palavra "causa”. Os cientistas não usam essa palavra principalmente porque é virtualmente impossível - estritamente falando, dizer que uma coisa causa outra - e sustentar a afirmação. Sempre existe a possibilidade de a suposta causa de alguma coisa não vir a ser a causa real. Vejamos um exemplo meio ridículo. É fácil verificar que quando chove contam-se mais guarda-chuvas do que quando não chove, exceto, talvez, em Londres. Portanto, os guarda-chuvas causam chuva! O exemplo só é ridículo porque é muito óbvio e porque sabemos as causas da chuva. O exemplo câncer/fumo é mais sutil. Difere apenas em não sabermos o que causa o câncer dos pulmões e o fumar cigarros parecer uma causa plausível.

Suponhamos que possamos reunir um grupo de pessoas como amostra aleatória, digamos, do povo de um país ou de parte do país. Dividimos o grupo em três subgrupos ao acaso. Instruímos os membros de um grupo a fumar dois maços de cigarro por dia, cuidando para que eles realmente fumem. Pedimos aos membros do segundo grupo que fumem um maço por dia. Os membros do terceiro grupo ficam proibidos de fumar. Este "experimento" continua durante 10 anos, ao fim dos quais medimos a variável dependente, a presença do câncer de pulmões ou mesmo a morte pelo câncer. Deixando de lado duas ou três dificuldades técnicas no delineamento da pesquisa, poderíamos ter consideravelmente mais confiança no resultado do que podemos ter no resultado de um estudo não experimental. Tais experimentos, naturalmente, são impossíveis por motivos óbvios. Então vamos abandonar a pesquisa sobre câncer pulmonar e fumo? De forma nenhuma. Mas estamos tolhidos pela principal dificuldade da pesquisa não experimental.

É possível que o cigarro não seja realmente uma "causa" do câncer pulmonar? Vamos imaginar que houvesse uma síndrome psicológica chamada "discombulismo". E as pessoas discombulistas fossem altamente propensas ao câncer pulmonar. Suponhamos que os discombulistas, além de outras características - hiperatividade, nervosismo, insônia, temperamento volúvel e uma leve paranóia tivessem uma forte predisposição a contrair câncer pulmonar e

29

fumassem cigarros, violentamente. Em outras palavras, o discombulismo é a causa básica do câncer, não o cigarro. Fumar é simplesmente uma característica concomitante. Acontece aparecer na síndrome discombulístico. O pesquisador, não sabendo nada a respeito do discombulismo, nota repetidamente a presença do câncer entre pacientes que fumam demais. A correlação entre câncer e fumo é alta e o pesquisador é conduzido a acreditar que o fumo causa o câncer de pulmões.

Fantástico? Um pouco. Mas não impossível certamente. O fato é que a pesquisa não experimental é mais vulnerável a conclusões errôneas do que a pesquisa experimental.

1. 25. A natureza das variáveis na pesquisa não-experimental.

Num mundo científico comportamental perfeito, os pesquisadores sempre deveriam poder extrair amostras aleatórias, manipular variáveis independentes e designar sujeitos a grupos aleatoriamente.

Pena, pois nem sempre as três coisas são possíveis, e na pesquisa não experimental as últimas duas jamais o são. Mas isto não significa que tal pesquisa não seja importante e significativa. Longe disso.

Uma das principais diferenças entre os dois tipos de pesquisa está na natureza das variáveis. A pesquisa não experimental lida com variáveis que, por natureza, não são manipuláveis: classe social, sexo, inteligência, preconceito, autoritarismo, ansiedade, aptidão, e realização, ou em classe social e valores, deve fazer (geralmente) pesquisa não experimental. Enfrentará problemas mais difíceis de inferência do que quem estiver interessado em problemas que incluam variáveis manipuláveis.

Todas as variáveis que são características de pessoas (chamemos essas variáveis de status) não são manipuláveis comumente. Consideremos a inteligência. Não se pode dizer a um grupo de indivíduos: "Sejam inteligentes" e a um outro grupo: "Não sejam inteligentes". As pessoas trazem muitas variáveis de status para as situações de pesquisa. E as diferenças entre pessoas com tais variáveis já estão relativamente fixadas.

Variáveis Irrelevantes

Existe um grande número de variáveis que, em princípio, é suscetível de afetar a variável dependente num experimento. Para os fins do experimento – vamos considerar o exemplo daquela teoria sobre a privação do sono – todos os outros fatores podem ser considerados variáveis irrelevantes. Assim, seriam variáveis irrelevantes os fatores: (i) será que todos os sujeitos possuem uma visão igualmente aguda?; (ii) será que todos os sujeitos estão igualmente atentos e bem motivados?; (iii) podemos ter a certeza que o aparelho permanecerá igualmente sensível durante todo o experimento; (iv) os ruídos e distrações do ambiente serão

30

os mesmos para cada sujeito? (v) haverá influência das atitudes do experimentador para com os sujeitos ou ainda será que o seu tom de voz pode influenciar?

O efeito das variáveis irrelevantes Seria útil podermos manter constantes todas essas variáveis irrelevantes e

manipular apenas a variável independente. Obteríamos, então, um quadro perfeitamente claro do seu efeito sobre o comportamento do sujeito. Mas um completo controle sobre todas as variáveis irrelevantes jamais pode ser conseguido. Ou é fisicamente impossível (por exemplo, como manter constante a sensibilidade do aparelho?) o é praticamente inconveniente (por exemplo, imagine-se tentar constantes: o ruído, a temperatura, a umidade, a iluminação). E, em todos o caso, existem razões pelas quais um excesso de controle é realmente indesejável. Assim, temos de nos resignar à presença de algumas variáveis irrelevantes em todos os experimentos que empreendemos. A questão é se tais variáveis poderão abalar a lógica do próprio experimento.

A única maneira como isso pode acontecer é uma variável irrelevante mudar sistematicamente seu valor de uma condição experimental para outra. Temos então a VI e a variável irrelevante mudando juntas, pelo que qualquer diferença entre os escores obtidos nas duas condições fica impossível de interpretar; poderá ser causada pela variável irrelevante, ou a VI, ou os efeitos combinados de ambas. Suponhamos, por exemplo, que os nossos sujeitos no experimento de privação do sono tenham de ser testados em duas salas, uma das quais é mais quente do que a outra. Portanto, a temperatura do recinto converte-se numa variável irrelevante que poderá influenciar o tempo de reação do sujeito. Se, por alguma razão, testamos todos os sujeitos privados de sono no recinto mais quente e todos os sujeitos não privados na mais frio, não saberemos então como interpretar uma diferença entre o desempenho nos dois grupos. Se os nossos resultados mostram que o grupo privado de sono tem, digamos, tempos de reação mais demorados do que o grupo não privado, então, seremos incapazes de dizer a quem coube a responsabilidade, se à privação de sono ou ao ambiente ao ambiente mais tépido. O ponto é que nunca poderemos destrinçar os efeitos de duas variáveis que mudam juntas. A variável irrelevante é conhecida, em tais casos, como um fator de confusão porque confunde literalmente a nossa interpretação do experimento.

É claro, a confusão não acontece por acaso; é criação nossa e normalmente pode ser evitada. Assim, no exemplo prévio, poderíamos decidir randomicamente para cada sujeito a sala que seria por ele usada. Isso não removeria totalmente o efeito da variável irrelevante – as mudanças na temperatura do recinto ainda estariam causando variações no tempo de reação – mas os efeitos se dispersariam de um modo mais ou menos uniforme pelas duas condições experimentais. Esta é, portanto, a segunda maneira em que as variáveis irrelevantes podem influenciar os resultados de um experimento, isto é, variando randomicamente de sujeito para sujeito, mas sem tendência alguma para influenciar mais ou menos uma condição

31

em vez de qualquer outra. Os efeitos não sistemáticos deste gênero são chamados de efeitos randômicos e não abalam a lógica de um experimento. Tendem, porém, a obscurecer os efeitos da VI porque aumentam a variabilidade em cada conjunto de escores. Assim, quando se trata de comparar os dois conjuntos, não vemos tão claramente os efeitos da VI (vide Tabela abaixo).

Resultados Imaginários(*) do Experimento de Privação do sono (a) com e (b) sem Efeitos Randômicos

Tempo de reação a estímulos visuais em milisegundos (a) Com efeitos randômicos (b) Sem efeitos randômicos

Privados de sono Sono Normal Privados de sono Sono Normal 450 420 450 420 470 450 450 420 430 400 450 420 420 440 450 420 480 390 450 420

Média = 450 Média = 420 Média = 450 Média = 420 (*) S. Miller, op.cit., p26

Métodos de Contrôle das Variáveis Irrelevantes

A principal finalidade do controle experimental é evitar a confusão, quer dizer, assegurar que a única variável que muda sistematicamente de uma condição para a outra é a VI. Sem isso, o nosso experimento não será interpretável. A segunda finalidade é minimizar a variação randômica nos dados, de forma a “destacar” o efeito da VI. Com estes objetivos em mente, apresentaremos agora os vários métodos de controle.

Um ponto preliminar: é preciso distinguir entre as variáveis irrelevantes que estão associadas aos sujeitos – inteligência, motivação, personalidade, etc – e aquelas associadas às condições em que o experimento se realiza – ruídos de fundo, instruções, tom de voz do experimentador, etc. Chamaremos as primeiras de variáveis do sujeito e as segundas de variáveis de situação. Embora ambas as classes de variáveis irrelevantes possam ameaçar o nosso experimento da mesma maneira, elas são controladas de modo diferente.

O Controle das Variaveis do Sujeito

Ao controlarmos as VS, queremos assegurar-nos de que os grupos de sujeitos testados sob cada condição experimental sejam tão semelhantes quanto possíveis em todas as dimensões em que as pessoas podem diferir. Isso é feito mediante o cuidados controle da forma de alocação dos sujeitos às condições experimentais. Existem três métodos possíveis:

32

(1) Plano de medidas repetidas; (2) Plano dos sujeitos pareados; (3) Plano de grupos independentes.

Plano de medidas repetidas É a única maneira de garantir que os nossos dois grupos de sujeitos terão

características idênticas é usar os mesmos sujeitos em cada grupo. É isso que fazemos num plano de medidas repetidas; cada sujeito executa sua tarefa em ambasas condições experimentais, de modo que os efeitos das variáveis do sujeito se equilibrem exatamente. Este é o método mais efetivo de controle; analisando-se a diferença entre os dois escores pertencentes a cada sujeito, obtemos uma medida muito precisa dos efeitos da VI, medida essa que não está contaminada por quaisquer variações nas características do sujeito.

Suponhamos, por exemplo, que estejamos investigando o efeito do comprimento das palavras obre a facilidade de recordar uma lista de dez vocábulos. Usando um plano de medidas repetidas, o nosso grupo de sujeitos seria testado por sua memória para uma lista de palavras curtas, e o mesmo grupo seria testado com uma lista de palavras compridas (ver Tabela abaixo).

VI Nível I: palavras compridas Nível II: palavras curtas

S1 S1 S2 S2 S3 S3 . . . . . .

Nota: S1 , S2, S3 etc representam diferentes sujeitos

Este arranjo dar-nos-ia o perfeito controle sobre variáveis tão importunas como as diferenças na capacidade de aprendizagem dos sujeitos ou os níveis de motivação que poderiam, caso contrário, contaminar os resultados. Mas, em contrapartida, temos agora de lidar com uma nova variável irrelevante, isto é, se uma tarefa é desempenhada em primeiro ou segundo lugar. A tarefa que é executada pode beneficiar-se da prática adquirida na primeira ou pode, talvez, sofrer os efeitos de fadiga ou tédio. Os efeitos de ordem deste gênero podem facilmente acarretar confusão. Assim, se todos os nossos sujeitos desempenharem as duas tarefas na mesma ordem, quaisquer diferenças que surjam poderão ser causadas ou pela mudança no tamanho da palavra, ou por uma mudança no estado de fadiga, ou por mudanças decorrentes da prática, etc. Por conseguinte, temos de certificar-nos que a ordem em que as tarefas são executadas é contrabalançada

33

entre uns e outros sujeitos – quer dizer, metade dos sujeitos segue uma ordem e a outra metade, a ordem inversa. Alternativamente, podemos decidir a ordem de maneira randômica para cada sujeito, digamos, jogando uma moeda no cara-ou- coroa. Normalmente, tais passos são dados para garantir que os efeitos da ordem se equilibrarão ao longo do experimento como um todo, mas não há garantia alguma disso. Se os efeitos da ordem são assimétricos – por exemplo, uma tarefa produz mais fadiga do que a outra – então não podemos esperar que os efeitos da ordem sejam neutralizados pelo contrabalanço ou qualquer dispositivo semelhante. Assim, o plano de medidas repetidas só deve ser usado quando reputamos que os efeitos da ordem são simétricos ou insignificantes.

Plano dos sujeitos pareados

É possível, por vezes, “imitar” o plano de medidas repetidas sem usar realmente os mesmos sujeitos em cada condição. Isso pode ser feito quando temos pares de indivíduos muito semelhantes (por exemplo, gêmeos idênticos), ou quando podemos selecionar pares muito similares nas variáveis que influenciam o comportamento em estudo. Suponhamos, por exemplo, que estivéssemos realizando um experimento para comparar os efeitos de dois diferentes tipos de instruções sobre a rapidez com que um problema é resolvido. Seria ótimo se pudéssemos igualar as duas condições nas variáveis do sujeito usando um plano de medidas repetidas. Mas, como não podemos testar um sujeito duas vezes no mesmo problema, esse plano é inadequado. Assim sendo a melhor coisa a fazer é usar o plano de sujeitos pareados, em que cada par de sujeitos é combinado, por exemplo, em inteligência e criatividade. Alocamos então um membro de cada par à primeira condição e o outro membro à segunda condição, sendo a alocação realizada numa base randômica. A diferença entre cada par de escores refletirá, portanto, a influência do tipo de instruções e estaria largamente livre de efeitos do sujeito. Mas note-se que isso só seria verdadeiro se os sujeitos fossem pareados nas variáveis corretas – isto é, aquelas que têm grande efeito sobre o comportamento de resolução de problemas. Se parearmos os sujeitos em variáveis sem relação alguma com a variável dependente, o plano torna-se extremamente insensível aos efeitos experimentais que estamos investigando.

Uma importante desvantagem do plano de sujeitos pareados é a dificuldade em saber que variáveis de sujeito devem formar a base do pareamento. E mesmo que possamos identificar as variáveis mais influentes, é muitas vezes difícil e consumidor de tempo recrutar pares de sujeitos cujos escores nessas variáveis estejam rigorosamente acasalados. Por conseguinte, este plano não é empregado com muita freqüência, fora da literatura sobre estudos de gêmeos.

Plano de grupos independentes

34

Deve estar claro, a esta altura, que o rigoroso controle das variáveis do sujeito, esboçado nas seções prévias, nem sempre pode ser realizado. Temos de recorrer muitas vezes a um terceiro método de controle – o plano de grupos independentes – o qual é geralmente menos sensível aos efeitos da VI, mas pode ser livremente usado em quase todo e qualquer experimento.

Nesse plano, os sujeitos são divididos em dois grupos inteiramente separados, na base de um procedimento estritamente randômico; isto é, cada sujeito tem uma probabilidade igual de ser colocado num grupo ou no outro. Isso pode ser feito pedindo a cada sujeito que retire um número de um chapéu, havendo tantos números quantos sujeitos. Os sujeitos que retirarem números pares são então designados para uma condição e os que ficaram com os números ímpares ficam na outra condição. Alternativamente, poder-se-ia usar uma tabela de números aleatórios ou uma série de lançamentos de uma moeda para alcançar os mesmos fins. Uma técnica obviamente não randômica seria colocar todos os sujeitos do sexo feminino numa condição e todos os do sexo masculino na outra. Não tão óbvio, mas igualmente não randômico é o procedimento de destinar as primeiras filas de uma sala cheia de sujeitos a uma condição e, as filas de trás, à outra condição. Pode-se facilmente admitir-se a existência de uma diferença sistemática, digamos, em personalidade, entre sujeitos que preferem os lugares da frente numa sala e os que se sentam atrás.

Desde que os sujeitos sejam alocados ao acaso às duas condições, é possível esperar que os grupos estejam razoavelmente bem equilibrados no tocante às variáveis de sujeito. Quer dizer, eles devem ter aproximadamente os mesmos níveis gerais de inteligência, extroversão, atenção, entusiasmo, criatividade, etc. Note-se que a randomização de forma alguma assegura que os dois grupos estejam perfeitamente equilibrados em qualquer variável de sujeito (ao contrário dos planos de medidas repetidas e de sujeitos pareados). Tudo o que podemos dizer é que não haverá um viés sistemático em favor de um grupo contendo, por exemplo, mais extrovertidos que um outro. Em longo prazo, se continuássemos indefinidamente a distribuição randômica, todas as diferenças seriam equilibradas. Mas, dado o pequeno número de sujeitos tipicamente disponíveis para experimentos psicológicos, não podemos esperar que isso aconteça. Portanto, cumpre-nos procurar decidir se a diferença entre os nossos dois grupos de escores é devida à VI ou, simplesmente, às variáveis irrelevantes que não se equilibram totalmente no processo de randomização. Quanto maior for a variação causada pelas variáveis de sujeito, mais difícil se torna essa decisão. Daí a nossa anterior advertência de que a variação randômica pode “absorver” os efeitos da VI.

Ao contrário dos planejamentos prévios, o plano de grupos independentes não nos permite remover os efeitos das variáveis de sujeito da variação randômica de fundo. Logo, este planejamento é algo impreciso. Usando técnicas mais avançadas, é possível aperfeiçoar o plano básico de grupos independentes. Um aperfeiçoamento que pode ser realizado, entretanto, mesmo pelo principiante, consiste em remover os efeitos aleatórios de algumas variáveis de sujeito

35

mantendo-as constantes. Assim, se pressentirmos que as variações na acuidade visual independe num experimento de percepção visual, é possível melhorar a precisão do nosso plano mantendo a acuidade visual constante – isto é, limitando o estudo a sujeitos cuja acuidade visual se situa entre alguns limites específicos. Desse modo, as flutuações na acuidade visual não contribuiriam para a variação aleatória nos dados.

Um resumo sobre o controle das variáveis de sujeito.

Do mais eficaz para o menos eficaz, podemos colocar os três métodos na seguinte ordem:

1º) medidas repetidas; 2º) sujeitos pareados; 3º) grupos independentes.

Todos os três métodos eliminam diferenças sistemáticas entre as condições de um experimento, no que se refere às características do sujeito. Mas diferem na quantidade de variação randômica que remanesce para obscurecer o efeito experimental. O plano de medidas repetidas permite-nos remover toda a variação randômica entre sujeitos quando se analisa o efeito experimental; o plano de sujeitos pareados elimina uma parte, mas não toda essa variação randômica; e o plano de grupos independentes não elimina nenhuma (embora se selecionarmos os sujeitos com uma classificação uniforme, em certas variáveis, talvez, possamos remover a variação randômica que, de outro modo, eles teriam produzido).

Conquanto a nossa ordem de preferência entre essas técnicas esteja agora esclarecida, a verdadeira escolha consistirá em encontrar o método mais adequado a um estudo específico.

O Controle de Variáveis Situacionais

As variações nas características dos nossos sujeitos não são os únicos fatores que podem comprometer um experimento. Também é preciso controlar as variáveis associadas à própria situação experimental: ruídos de fundo, mudanças de aparelhagem, comportamento do experimentador, etc. Tais fatores podem facilmente confundir os efeitos da VI se mudarem de maneira sistemática de uma condição para outra. O modo mais eficaz de evitar é mantermos como constantes as variáveis em questão durante todo o experimento. Assim, é possível eliminar as variações no ruído de fundo se o experimento for realizado numa cabina acusticamente isolada. E poderemos manter constante o comportamento do experimentador se as instruções forem gravadas em fita. Se forem mantidas tais variáveis como constantes, elas não poderão interferir, de forma alguma, nos efeitos à VI; são eliminados o viés sistemático e os efeitos aleatórios. Mas o esforço envolvido para manter constantes as variáveis situacionais tende a tornar- nos relutantes quanto ao seu uso, exceto para variáveis suscetíveis de produzirem

36

grandes flutuações no desempenho. Por exemplo, manteríamos provavelmente constante o ruído de fundo num experimento sobre a percepção de sons fracos; mas talvez não considerássemos valer a pena fazê-lo num experimento de memória ou um estudo de solução de problemas.

Além do esforço envolvido, haverá algumas variáveis que não podem simplesmente, serem mantidas constantes. Por exemplo, pode ser necessário testar sujeitos em dias diferentes da semana ou utilizar muitos experimentadores no decurso de um experimento. Podemos até mudar algumas variáveis intencionalmente, digamos, os veículos usados num experimento de condução, a fim de dar uma aplicabilidade mais geral às conclusões. O modo de lidar com tais variáveis é equilibrar os seus efeitos em ambas as condições do experimento; quer dizer, aplicar o mesmo padrão de mudanças a cada condição. Assim, se dois experimentadores foram empregados, devemos assegurar-nos de que a metade dos sujeitos, em cada grupo, foi testada por cada experimentador. Esse procedimento elimina a variável “experimentador” como fonte de viés , mas os seus efeitos não são completamente eliminados; alguns sujeitos serão testados por um experimentador e alguns pelo outro. Se a variação causada por isso é suscetível de obscurecer o efeito experimental, podemos tomar providência para “removê-la” da análise – mas isso requer técnicas mais avançadas. O ponto importante, porém, é que as variáveis controladas desse modo não podem produzir mudanças sistemáticas na variável dependente.

Tal como no caso das varáveis de sujeito, existe um limite para o número de fatores que podem ser autocontrolados por esses métodos mais rigorosos. Num experimento típico, seria apenas viável controlar uma pequena proporção das variáveis situacionais por equilibração ou mantendo-as constantes. Por conseguinte, precisamos de uma técnica para “limpar” todas as variáveis situacionais impossíveis de controlar de outras formas. Essa técnica é, naturalmente, a randomização. No caso das variáveis situacionais, isso significa testar os nossos sujeitos numa ordem randômica em vez de lidar com uma condição de cada vez. Desta forma, quaisquer variáveis que possam mudar sistematicamente com o decorrer do tempo, como o estado de ânimo do experimentador ou o funcionamento do aparelho, afetarão por igual as duas condições. Ao assegurarmo-nos de que todas essas variáveis situacionais estão mudando aleatoriamente de um sujeito para outro, evitamos quaisquer diferenças sistemáticas entre as condições, mas os efeitos randômicos subsistem para obscurecer o principal efeito experimental. Não há muita coisa que possamos fazer a esse respeito – existem alguns fatores randômicos operando em todos os experimentos – e temos simplesmente de esperar que os efeitos da variável independente sejam suficientemente robustos para suplantar as variações aleatórias nos dados.

37

1.26. Experimento sem o grupo controle (ou outro grupo para comparação): - é possível?

Um experimento requer, no mínimo, dois grupos experimentais. Esses dois grupos podem ser designados como "experimental" e de "controle", ou de A1 e A2, ou de outra maneira conveniente. Os dois grupos são dois aspectos de alguma variável. Se a variável, por exemplo, for reforçamento, então os dois grupos podem ser “reforçamento regular" e “reforçamento casual", ou “reforçamento maciço" e "reforçamento regular". Naturalmente, um experimento pode ter mais de dois grupos experimentais.

A base da exigência de no mínimo dois grupos experimentais é muitíssimo importante. Um verdadeiro experimento deve ter no mínimo uma comparação. Sem dúvida, em qualquer estudo tem que haver ao menos uma comparação. Digamos que um pesquisador deseje aumentar a habilidade de resolver problemas por um método especial. Ele usa o método com um grupo de estudantes, por um método especial. Ele usa o método com um grupo de estudantes, talvez sua própria classe, e observa, depois que o usou, que a solução de problemas do grupo melhorou. Embora este procedimento seja satisfatório para demonstrações práticas, é inadequado cientificamente. O motivo é: com apenas um grupo não há segurança de que algo além do método do pesquisador não tenha influenciado e ajudado a melhorar a capacidade de resolver problemas.

Por exemplo, o mero fato de ensinar alguma coisa aos alunos no que se refere a resolver problemas pode ter um efeito salutar. Ou o método usado pelo pesquisador pode simplesmente ter sido um bom veículo para seu estilo pessoal de ensino, e foi seu estilo pessoal de ensino que ajudou na solução de problemas, e não o método. Qualquer método que o pesquisador, como professor, achasse adequado funcionaria da mesma forma. Além disso, é muito provável que a habilidade de os sujeitos resolverem problemas tenha melhorado como resultado de sua exposição ao problema. Ou, depois de um certo período de tempo, os sujeitos poderiam ter melhorado com qualquer método; sua compreensão dos vários aspectos da solução de problemas pode ter amadurecido.

Pode bem ter sido o método que tenha ajudado na solução de problemas, mas jamais isso poderá ser dito sem ambigüidade enquanto não for usado pelo menos mais um grupo. Aí então, pode-se comparar os resultados obtidos com o método com os resultados obtidos sem o método - com todas as outras condições mantidas iguais.

Em resumo, um delineamento de pesquisa tendo apenas um grupo experimental é sempre insatisfatório teoricamente. Se eu disser ao pesquisador que não foi o método que melhorou a solução de problemas, antes, que foi sua personalidade e entusiasmo, para os quais o método funcionou como veículo, o que ele poderá dizer? Nada! Pelo menos nada convincente. Se ele tivesse usado um segundo grupo experimental, cujos membros tivessem todos as mesmas condições do primeiro grupo, menos o método, e os resultados favorecessem o

38

primeiro grupo, então o pesquisador teria uma base sólida para me responder. Ele poderia dizer: “Não, não foi a minha personalidade nem meu entusiasmo, porque eu também ensinei o segundo grupo e tentei fazê-lo exatamente do mesmo jeito que fiz com o primeiro grupo. Portanto, a diferença de resultado entre os grupos deve ser creditada ao método?”.

Embora o argumento ainda tenha fraquezas, é muito mais forte do que era. Virtualmente todas as conclusões científicas, então, exigem comparações. A função das comparações é isolar o efeito da variável independente crucial, por assim dizer. Isto significa, essencialmente, mostrar que alguma outra influência não produziu o efeito observado; apenas a influência prevista na hipótese o produziu.

PIADAS sobre Grupo Controle ------------------------------------------------------------------------------------------------------------ Quando perguntaram a um estatístico como era a esposa dele. Ele respondeu: "comparado com quem"? ------------------------------------------------------------------------------------------------------------ A esposa de um estatístico teve filhos gêmeos. Ele ficou emocionado. Telefonou para o padre, que também ficou emocionado. “Traga-os para a igreja, neste domingo, e nós os batizamos”, disse o padre. “Não”, respondeu o estatístico. "Batize um. Vamos manter o outro como controle". ------------------------------------------------------------------------------------------------------------

Sobre a necessidade imperiosa de um Grupo Controle Encontramos, na internet, numa lista de discussão sobre ensino de estatística:

http://forum.swarthmore.edu/epigone/apstat-l dias 3 e 4, dezembro de 1998

Tim Hill: Timwis@aol.com Hello all, As I finished up the topic of experimental design, a student asked me if all experiments should have a control group for comparison purposes. My feeling was that the answer should be yes but then I thought that it may not always be possible to have a control. Any thoughts on this matter would be appreciated.

Robert W. Hayden (Bob Hayden): hayden@oz.plymouth.edu

It may depend in part on what you mean by a control group. Medical studies often compare a new treatment to the “standard” treatment rather than to no treatment at all.

Then I think of the ANOVA example in Snedecor and Cochran that compared the amount of fat retained in donuts fried in various fats. As far as I known, no fat was “standard”, and trying to cook the donuts in no fat at all would not make for a very good reference point!

39

Or you could think about testing different brands of parachutes.

Richard Scheaffer (Dick): scheaffe@stat.ufl.edu I agree with Bob’answer, but let me add a little since I think that a clear understanding of experimental design and how it differs from sample survey design is one of the important issue of intro statistics. The most clever data analysis you can muster will not often help you recover from a bad design.

In an experiment, the experimental units generally are not selected at random from some population In medicine, they are the patients that give informed consent; in agriculture, they are the plots that happen to be available; in industry, they are the materials available on the day set aside to run the experiment. So, they goal of an experiment is not, and usually cannot be, the estimation of some population parameter or parameters. The goal is to see if treatment A differs from treatment B. If it does differ on these experimental units, the question of generalizability to different experimental units is still open. That is why scientists do not take a result too seriously until it is replicated a number of times. If you read carefully (in good newspapers) you will see cautios like “This result comes from a single study, so do not stop eating charcoaled hamburgers until more information is available”.

Sample surveys, on the other hand, usually involve random samples from a well- defined population, with a goal of estimating some parameter of that population, like a proportion or mean. Comparisons can be made in surveys, like comparing the proportions of Democrats and Republicans favoring a certain issue, but these comparisons have a different flavor from those in an experiment. In the survey example, you are actually estimating the difference between two population parameters.

The distinction between random ASSIGNMENT in an experiment and random SELECTION in a sample survey is fundamentally important to the understanding of these basic designs, and mostly glossed over (or stated incorrectly) in introductory books. (I have just been reading the draft NCTM Standards 2000 and they get it mixed up as well. One statement says “In repeated experiments, infer the structure of the population through drawing repeated samples”. I understand the intent here, but mixing experiments with sampling to infer something about a population lends to the confusing of these two designs and their intended purposes).

1.27. Investigação sociológica ( survey , “levantamentos”)

40

A investigação sociológica é um termo amplo que significa um conjunto e formas relacionadas de investigação não-experimental dirigidas para o estudo das relações entre “variáveis sociais”. A investigação sociológica é feita principalmente, mas não exclusivamente, por sociólogos e inclui diversas variáveis caracterizadas por sua orientação social: status social, preferência política, preferência religiosa, afiliação a associações, escolaridade, renda, ocupação, raça, sexo, e assim por diante. Estas variáveis sociais são atributos de indivíduos (ou grupos) que têm a característica comum de serem membros sociais grandes e pequenos e assim de serem compartilhados por muitos ou pela maioria dos indivíduos. Por exemplo, todos nós temos ocupações, renda, sexo, preferência religiosa, e assim por diante, e elas nascem, pelo menos em parte, de nossa participação em diversos grupos. É o material básico de uma grande parte da investigação sociológica.

Não quero implicar que os sociólogos usem apenas essas variáveis e que os psicólogos ou economistas não as usem. Sem dúvida, ultimamente os sociólogos vêm usando cada vez mais “variáveis psicológicas” e os psicólogos vêm usando “variáveis sociológicas”- e é assim que deve ser. Estou usando os termos “investigação sociológicas” e “variáveis sociais” em parte por conveniência e em parte por eles refletirem a realidade da pesquisa. Outro motivo é por termos que nos dirigir a um grande corpo de estudos variados que parecem ter as características comuns de usar variáveis sociológicas, ser não-experimentais, dirigir-se freqüentemente parra problemas sociais importantes e usar um conjunto de técnicas relacionadas. Muitas dessas pesquisas foram chamadas “levantamentos” (survey research) ou “estudos de campo”.

Levantamentos

Nos levantamentos as pequenas e as grandes populações são estudadas através de amostras para descobrir a incidência relativa, a distribuição e inter- relações de variáveis psicológicas e sociológicas. Os levantamentos são parte da pesquisa sócio-científica e têm influenciado fortemente a pesquisa nas ciências comportamentais. Têm sido usados principalmente, mas não exclusivamente, para descobrir o que existe e como existe no ambiente social de um grupo, uma área geográfica ou política e mesmo um país inteiro. Uma de suas principais virtudes, principalmente para administradores, líderes de governo, dos negócios e da política, é sua surpreendente capacidade de fornecer informação exata sobre populações inteiras usando amostras relativamente pequenas. A tecnologia dos levantamentos – e formas relacionadas de investigação – encontra-se altamente desenvolvida. A sociedade moderna tem uma arma poderosa para colecionar fatos e testar teorias e hipóteses.

41

A maioria dos levantamentos não é para testar relações entre as variáveis, porém, para descrevê-las. Os levantamentos descritivos procuram determinar a incidência e distribuição das características e opiniões de populações de pessoas, obtendo e estudando as características e opiniões de amostras pequenas e presumivelmente representativas de tais populações. São usadas amplamente pelo governo, pelas firmas e organizações. O propósito básico dos levantamentos usados desta forma não é científico, mas antes orientado para ação e parra diretrizes de ação. Entretanto, os levantamentos descritivos têm tido efeitos muito fortes sobre a pesquisa comportamental em geral, principalmente através de seu procedimento sofisticadíssimos de amostragem e entrevista. Já discutimos amostragem aleatória e suas características. Para fins práticos é altamente desejável que as amostras estudadas sejam representativas. Desejamos dizer que o resultado obtido em um estudo de grande escala é representativo. Se a amostra for sem dúvida representativa, então, os resultados obtidos por meio dela podem ser generalizados para toda a população. Se 80 por cento de uma amostra respondem favoravelmente a uma questão sobre uma possível diretriz do governo, por exemplo, acredita-se que, se se fizesse a mesma pergunta a todas as pessoas de um país, um estado, uma cidade ou uma organização, perto de 80 por cento delas seriam favoráveis.

Há várias maneiras de tirar amostras para fins de levantamento, mas a única que dá uma razoável garantia geral de ser representativa é alguma forma de amostra aleatória. Freqüentemente os levantamentos usam o que se denomina procedimento de amostragem aleatória estratificada, que mostrou várias vezes ter uma alta probabilidade de ser representativa.

A importância dos levantamentos

Tanto para os objetivos científicos de estudar relações quanto para objetivos de ação prática e orientada para a tomada de decisões, mas particularmente parra o último.

Levantamentos em geral são pesquisas aplicadas: são feitos para objetivos práticos e específicos, comumente para obter informação na qual basear decisões ou ações.

........................................................................................................

42

Dear Ivan,

An experiment involves random assignment of treatments to experimental units for the purpose of comparing treatments. The classical clinical trial used to compare treatments on humans is a good example.

A sample survey involves the random selection of units from a well-defined population for the purpose of estimating some parameter that describes that population, such as a mean or proportion. The common opinion or election poll is a good example.

An observational study looks at data as it becomes available, with no assignment of treatments and often no random selection of units.

Experiments can be used to prove cause and effect; observational studies cannot because of the potential biases and confounding effects.

There is not general agreement on the definition of observational study. Most would say, I think, that a sample survey is not the same as an observational study, especially if it was based on a good design.

hope this helps. Dick Scheaffer

………………………………………………………………

43

1.28. Pesquisa básica e pesquisa aplicada

Definição de pesquisa aplicada (Kerlinger, p.321)

Pesquisa aplicada é pesquisa dirigida para a solução de problemas práticos especificados em áreas delineadas e da qual se espera melhoria ou progresso de algum processo ou atividade, ou o alcance de metas práticas. As pesquisas denominadas programáticas e dirigidas são pesquisa aplicada. Tais pesquisas são dirigidas para determinados objetivos que prometem solução de problemas geralmente aflitivos. É o tipo citado freqüentemente pelos jornais quando se discute pesquisa, porque são fáceis de compreender as razões e a motivação de pesquisadores aplicados e suas fontes de recursos financeiros. Como sempre os exemplos podem nos ajudar a entender as diferenças importantes entre pesquisa básica e aplicadas.

O estudo de Aronson e Mills {Aronson, E. and Mills, J. – The effect of severity initiation on liking for a group. Journal of Abnormal and Social Psychology, v. 59, (1959), p.177-181} é um bom exemplo de pesquisa básica em psicologia. Os pesquisadores estavam interessados na influência da privação e dificuldade de entrada em grupos, no valor que os membros do grupo colocavam na participação no grupo. Eles procuravam também lançar mais luz sobre a teoria sócio-psicológica para ajudar a explicar certos fenômenos ligados à participação em grupos. Os estudos sobre obediência à autoridade de Milgram (1974) {Obedience to authority. New York: Harper & Row}, também é um bom exemplo de pesquisa básica. Nesse estudo foi pedido aos sujeitos que aplicassem choques supostamente dolorosos a outra pessoa num suposto experimento sobre aprendizagem. A questão era: até onde irão os sujeitos experimentais? Até onde infligiriam dor a outra pessoa sob o comando de “um investigador científico”? A relação estudada foi entre as variáveis autoridade e obediência.

Nenhuma dessas pesquisas parece ter sido feita com o pesquisador pensando em conseqüências práticas. Eles estavam à procura de explicações explícitas ou implícitas para fenômenos naturais: o valor presumivelmente mais alto colocado na participação em um grupo quando a pessoa experimentou privação ou dificuldade em fazer parte do grupo e obediência à autoridade.

44

5) Exemplo de pesquisa aplicada (Kerlinger, p.11)

É a pesquisa aplicada que se dirige para resolver problemas particulares de pesquisa que não desenvolveram bases teóricas. Um exemplo excelente dessa pesquisa é a de Walster. E, Cleary, T.A. , & Clifford, M.M. (The effect of race and sex on college admission. Journal of Educational Sociology, v.44, p.237-244, 1971). Tem várias virtudes, duas das quais são a sua hábil manipulação de variáveis usualmente não-manipuláveis e sua grande possibilidade de generalização. Um aspecto metodológico interessante foi a unidade de análise do estudo: em vez de indivíduos, escolas, que formaram uma amostra casual das escolas norte-americanas. [O leitor deve confiar em que a seguinte proposição é correta: O uso de seleção aleatória (de indivíduos ou instituições) permite ao pesquisador assumir que a probabilidade de que a amostra seja representativa é substancial. Assim é alta a probabilidade de que os resultados obtidos em tais amostras sejam aproximadamente aplicáveis à população da qual foi tirada tal amostra. Esta conclusão vale apenas para amostras grandes. Em palavras mais simples, isto significa que amostras aleatórias grandes possibilitam ao pesquisador generalizar para as populações de onde as amostras foram tiradas. Entretanto, o pesquisador jamais poderá ter certeza. Poderá, apenas assumir que suas amostras são representativas porque tem fé na proposição enunciada acima].

O estudo de Walster, Cleary & Clifford foi dirigido no sentido de descobrir uma resposta para um problema social e educacional difícil, complexo e importante: a discriminação na admissão às universidades. Walster e associados perguntaram: “As faculdades discriminam candidatas (mulheres)? Discriminam (contra ou a favor) candidatos negros?” Selecionaram aleatoriamente 240 faculdades nos Estados Unidos e enviaram pedidos de admissão preparados a cada uma dessas escolas. Usaram um delineamento fatorial do tipo 2 x 2 x 3. As variáveis independentes eram sexo, raça e nível de capacidade. Estas variáveis são interessantes e incomuns porque são todas experimentais ou manipuladas. Comumente estas variáveis são não-experimentais, ou variáveis -, atributos- variáveis que não podem ser manipuladas. Mas Walster e outros manipularam-nas de maneira inteligente e imaginativa, embora simples [Devemos enfatizar um ponto, entretanto. Os bons experimentadores exigem, além de conhecimento e competência, habilidade, imaginação e até criatividade. O experimento de Walster e colegas é um bom exemplo. Suas idéias parecem simples, depois de conhecidas. Que eu saiba, não fora feito ainda um experimento controlado para testar preferência em admissões].

Prepararam um formulário guia para admissão à universidade, que procurava responder a todas as perguntas que a instituição pudesse fazer. Estes formulários foram enviados às 240 escolas escolhidas ao acaso. (Foram escolhidas aleatoriamente em um guia de escolas). Cada formulário era enviado por um

45

candidato supostamente legítimo. Um quarto deles indicava que o candidato era homem branco, outro quarto homem preto, outra mulher branca e a última mulher negra. Além disso, incluíram-se três níveis de capacidade do aluno. Na verdade, havia então três variáveis independentes, raça, sexo e capacidade e 12 tipos de formulários, correspondentes à um delineamento fatorial 2 x 2 x 3. As 240 escolas foram designadas aleatoriamente às 12 células do modelo. Havia, então, 20 escolas por célula. A principal variável dependente era aceitação ou rejeição do suposto candidato: uma escala de cinco pontos, partindo da rejeição direta (1) a aceitação com apoio ou oferecimento de ajuda financeira (5). Foram incluídas outras variáveis dependentes e independentes, também, mas não vamos nos preocupar com elas.

Os pesquisadores esperavam que os homens fossem preferidos às mulheres e pretos a brancos. (Na época do estudo as escolas estavam procurando alunos pretos). Estavam errados. Pôde-se verificar, por meio da análise de variância (fatorial) que os efeitos principais de raça e sexo não eram significativos, nem a diferença entre médias de brancos e pretos (3,38 versus 3,18). Foi descoberta uma interação muito mais interessante e não antecipada, aliás. Isto está apresentado na Tabela abaixo, valores de média obtida para os homens e para as mulheres (resultados médios na variável aceitação, homens e mulheres) de acordo com os três níveis de capacidade.

Médias da variável aceitação em faculdades por sexo e nível de capacidade: estudo de Walster, Cleary e Clifford.

SEXO

Capacidade Alta Média Baixa

Masculino 3,75 3,48 3,00 3,41 Feminino 4,05 3,48 1,93 3,15

3,90 3,48 2,47

Estude cuidadosamente esta tabela: é importante metodológica e socialmente. As médias dos três níveis de capacidade foram significativamente diferentes. Mas isto é uma descoberta não muito importante, já que reflete meramente o costumeiro hábito de rejeitar candidatos de capacidade inferior. A diferença entre a média de homens e mulheres de 3,41 e 3,15 não foi significativa. Evidentemente não houve discriminação global com base em sexo. A interação de capacidade e sexo em seu efeito conjunto na aceitação, entretanto, foi estatisticamente significante. Para interpretar a interação, podemos omitir as médias do nível médio de capacidade (3,48 e 3,48), já que são iguais. As médias de alta capacidade são 3,75 e 4,05 não muito diferentes. No nível ato de capacidade não há discriminação de sexo. Veja, agora, as médias de baixa capacidade, 3,00 e 1,93. Esta diferença relativamente grande é o principal motivo para a interação significativa. Evidentemente os candidatos homens de baixa capacidade são significativamente mais aceitos do que as mulheres de baixa capacidade. A discriminação parece ser exercida sobre o nível baixo de

46

capacidade. Os autores afirmam que esta descoberta concorda com a observação feminista de que apenas mulheres excepcionais podem transcender estereótipos sexuais e serem julgadas objetivamente. Mulheres de capacidade mais modestas são julgadas, sobretudo, como mulheres – e assim como “inferiores’”.

Este é um excelente exemplo da força do delineamento fatorial e da utilidade de estudar interações. Provavelmente não teria sido possível revelar a descoberta importante e interessante deste estudo sem a idéia de interação das variáveis independentes em seu efeito sobre uma variável dependente.

47

Parte 2 EXPERIMENTO

2.1) A FINALIDADE DE UM EXPERIMENTO

A finalidade de um experimento (referimo-nos ao experimento comparativo e não ao experimento absoluto*) é identificar uma relação causal entre a variável independente** e a variável dependente***. Ao manipular uma variável independente e ao medir os seus efeitos sobre a variável dependente: isto é, após obtivermos a resposta ao estímulo provocado pela variável independente - temos como caracterizar um experimento.

* ...um experimento absoluto tem por finalidade determinar a grandeza absoluta de alguma constante física ou a absoluta existência ou não existência de algum fenômeno. Um experimento comparativo****, pelo contrário, é efetuado para comparar os valores relativos de várias constantes e restringe-se às diferenças, ou talvez às razões, entre elas. Por exemplo, a primeira transmissão da voz humana sem fio, já foi suficiente para estabelecer absolutamente que os programas de rádio eram possíveis. Pelo contrário, muitos experimentos comparativos foram efetuados a fim de se chegar aos modelos atuais de aparelhos transmissores e receptores. Em experimentos comparativos, o objetivo é comparar dois ou mais estímulos chamados de tratamentos. Os tratamentos são designados às unidades do material experimental, que resultam em respostas, em observações.

** Variável independente: é aquela variável cujo valor o investigador controla diretamente. Por exemplo, se você alimenta um grupo de crianças com dietas à base de baixo ou alto teor de cálcio e então mede o índice CPO, a quantidade de cálcio é uma variávelindependente. É uma variável que se supõe influenciar outra variável, chamada de dependente. Os cientistas fazem predições a partir de variáveis independentes para variáveis dependentes. Eles dizem, por exemplo, "Se os professores elogiarem as crianças, o trabalho escolar das crianças melhorará". Os termos vêm da matemática, da expressão: y = a + bx. Onde y é a var. dependente e x é a independente.

*** Variável dependente: é a variável em análise, é aquela variável cujo valor o investigador mede, mas não a controla diretamente. Por exemplo, se você alimenta um grupo de crianças com dietas à base de baixo ou alto teor de cálcio e então mede o índice CPO, a variável dependente é o índice CPO. Poderíamos dizer, também, que a variável dependente é a saúde bucal definida operacionalmente mediante o índice CPO.

Tratamentos unidade Observações (var. indep.) experimental (var. depend.)

Teor de Cálcio crianças Índice CPO

Delineamento de um experimento comparativo **** **** Dois delineamentos são comumente empregados: (i) "parallel groups design" onde as

amostras são independentes, aleatórias e designadas aleatoriamente aos grupos

48

experimentais; (ii) "cross-over design" ou experimento rotacional onde os mesmos indivíduos servem como o seu próprio controle.

2.2) FATORES DE UM EXPERIMENTO

2.1) As variáveis independentes de um experimento são chamadas fatores, que podem ser quantitativos ou qualitativos. No exemplo acima, o teor de cálcio corresponde à variável independente quantitativa.

2.2) Fator quantitativo é aquele que pode tomar valores reais. Exemplos: as temperaturas de um forno (em um experimento para cozimento de bolos), os quilogramas de nitrogênio e de fosfato (em um experimento sobre fertilizantes de milho). Os fatores não quantitativos são chamados de qualitativos. Assim, em um experimento para comparar dois tipos de pneus de fabricantes diferentes: Goodyear e Pireli. Cada conjunto pneu/roda testado é uma unidade experimental, e cada um dos tipos de pneu representa um tratamento. Os fabricantes são fatores qualitativos porque não podem ser representados por números reais.

2.3) A intensidade de um fator é chamada de nível. Assim, as temperaturas de 180 ºC, 200 ºC e 230 ºC representam três níveis do fator quantitativo "temperatura do forno".

2.4). Tratamento é uma combinação específica de níveis de um fator. É aquilo que se faz com relação às unidades experimentais, tornando-as diferentes de uma população para outra. Em geral, à variável independente dá-se o nome de tratamento.

2.3) VARIÁVEL DEPENDENTE

2.3.1) Uma variável dependente é a variável medida no experimento. Ela é operacionalmente definida para concretamente representar algum conceito. Em Odontologia, a variável dependente é muitas vezes a saúde bucal que é definida operacionalmente por vários índices: CPO, IHO... .Em psicologia, a variável dependente é muitas vezes o comportamento do sujeito. O comportamento do sujeito pode depender da situação experimental. Não é o comportamento geral do sujeito, mas um comportamento específico, uma resposta comportamental claramente definida que é observada, medida e geralmente quantificada. Por exemplo, suponha que um psicólogo esteja interessado em ensinar às pessoas técnicas de autocontrole para aumentar a resistência à dor. O psicólogo apresenta o conceito tolerância à dor como operacionalmente definido: tempo de duração que as pessoas conseguem manter as duas mãos debaixo d'água gelada. A

49

tolerância à dor é observada e medida como uma resposta à uma outra variável: - técnicas de autocontrole. Como tal, a tolerância à dor serve como variável dependente no experimento. Enquanto o sujeito mantém as suas mãos na água, há um grande número de respostas comportamentais também ocorrendo: ansiedade, memórias do passado com água fria... Serão essas outras respostas comportamentais variáveis dependentes? Não, porque o psicólogo não observou essas respostas e nem as mediu de forma sistemática. A tolerância à dor poderia, também, ser definida operacionalmente de outra forma, caberia à sua imaginação defini-la de outra forma.

2.4) VARIÁVEL INDEPENDENTE

2.4.1) Uma variável independente é selecionada e manipulada pelo experimentador para observar seus efeitos sobre a variável dependente. A manipulação é efetuada pelo uso de níveis qualitativo e quantitativo da variável independente.

2.4.2) Uma variável independente quantitativa indica que os sujeitos estão expostos a diferentes quantidades da variável independente. Por exemplo, suponha que um biólogo estabeleça a hipótese: o tempo que os ratos aprendem a sair de um determinado labirinto é proporcional à grandeza da recompensa prevista ao final do labirinto. Três grupos de ratos são usados, cada grupo recebendo uma quantidade crescente de recompensa: 5 "food pellets", 10 "food pellets", e 15 "food pellets". Neste exemplo, os três níveis da variável independente são definidos mediante uma dimensão quantitativa.

2.4.3) Uma variável independente qualitativa estabelece os seus níveis pela presença ou ausência de um procedimento: tratamento. Usando o exemplo da tolerância à dor; um grupo de sujeitos recebeu treinamento de autocontrole (nível 1) e o outro não recebeu (nível 2). Os grupos não diferem na quantidade da variável independente, mas em relação à presença ou ausência de uma condição tratamento.

2.4.4) A experimentação requer que as condições sejam mantidas constantes de modo que as variáveis estranhas (extrínsecas) ou de confundimento não possam oferecer explicações alternativas aos resultados obtidos. É um experimento ideal manter tudo constante apenas variando os níveis da variável independente. Nesse caso as diferentes respostas entre os grupos de sujeitos só pode ser atribuída à variável independente. Quando as condições não são mantidas constantes, há a possibilidade de que alguma outra variável seja responsável pelas diferentes respostas entre os grupos de sujeitos. Essa variável leva o nome de estranha ou de confundimento.

50

2.5) EXERCÍCIOS SOBRE OS TIPOS DE VARIÁVEIS EM UM EXPERIMENTO

Identifique as variáveis dependentes e independentes nos seguintes estudos:

2.5.1) Um psicólogo que atua no meio esportivo está interessado nos efeitos da vitamina E sobre a resistência física. Um grupo de atletas recebe 20 unidades de vitamina E, um outro grupo recebe 60 unidades, e um terceiro grupo recebe um placebo. A resistência é avaliada pela duração do tempo que os atletas são capazes de pedalar uma bicicleta estacionária (ergonométrica).

2.5.2) Um professor avalia a eficácia de diferentes programas educacionais sobre a velocidade e compreensão na leitura (leitura dinâmica) ?

2.5.3) Um psicólogo que atua no meio industrial estabelece a hipótese: a quantidade de luz natural existente no local de trabalho aumenta a produtividade. Na primeira quinzena de um mês, as venezianas são fechadas e a luz elétrica é a única fonte de luz. Nos outros 15 dias do mês, as venezianas são abertas. A produtividade é medida pelo número de itens produzidos.

Respostas

2.5.1) Variável independente: Vitamina E ou quantidade de vitamina E. Variável dependente: Tempo que os sujeitos gastam pedalando a bicicleta.

2.5.2) Variável independente: Programas educacionais. Variável dependente: Há duas variáveis dependentes: a compreensão do

texto e a velocidade de leitura.

2.5.3) Variável independente: Quantidade de luz natural. Variável dependente: Número de itens produzidos.

51

2.6) VARIÁVEIS INDIVIDUAIS

Variáveis individuais, também conhecidas como variáveis do sujeito, são aquelas características fixas, pré-determinadas antes que os indivíduos entrem no experimento. São atributos físicos, demográficos, intelectuais e psicológicos. A tabela 1 apresenta algumas variáveis mais comuns:

______________________________________________________________ Atributos físicos Demográficos QI / Personalidades ____________________________________________________

________ Altura Renda QI Peso Tamanho da família Necessidade de Aprovação Destreza manual Etnia Introvertido Sexo Educação Ansiedade Força Religião Desejo de dominar Veloz ao correr Ocupação Personalidade marcante

As variáveis de sujeito podem criar problemas na interpretação dos resultados de um experimento. Porque essas variáveis não são manipuladas pelo pesquisador ao realizar o experimento. Quando em um experimento tivermos duas variáveis independentes: uma controlada pelo pesquisador (porque este designa de forma aleatória os indivíduos aos grupos) e outra de sujeito (essa variável não é designada pelo pesquisador aos grupos, é fixada antes que os indivíduos entrem no experimento), então, as relações de causa-efeito, relações causais só poderão ser estabelecidas entre a variável dependente e aquela outra variável independente não de sujeito.

Exemplo de um experimento com variável individual (de sujeito).

Um psicólogo está interessado em conhecer a eficácia relativa de duas formas de terapia: a comportamental e a de psicanálise; frente aos problemas de ansiedade e depressão. Ele seleciona pacientes com depressão e com ansiedade, aleatoriamente, da população. Depois, cria as variáveis terapia comportamental e psicanálise, ou seja, designa de forma causal, simultaneamente, um grupo de pacientes com ansiedade para serem submetidos aos dois tipos de terapia, e, um grupo de pacientes com depressão para serem submetidos aos dois tipos de terapia.

O psicólogo não designou os pacientes às duas formas de terapia, e, então, criou a ansiedade e a depressão. Os sujeitos foram selecionados para o experimento porque eles já se encontravam ansiosos ou deprimidos. Se o

52

pesquisador tivesse efetuado uma ação experimental para induzir a ansiedade e a depressão, então essas não seriam variáveis individuais (de sujeito).

A tabela, mostrada a seguir, apresenta como variável dependente o rating médio de melhoria atribuído por um observador independente a um grupo de cinco pacientes. As maiores médias indicam maiores melhorias.

______________________________________ Terapia Comportamental

Terapia Psicanálise

Média Média Ansiedade ... 7,4 Ansiedade ... 3,2 Depressão... 5,0 Depressão ... 7,8

Médias... 6,2 Médias... 5,5 _______________________________________

Ao considerarmos o resultado do teste estatístico, empregado para analisar esses dados (ANOVA, 2 fatores), devemos comparar as médias das variáveis independentes que foram controladas pelo pesquisador, no caso, a média 6,2 (fator terapia, nível comportamental) versus 5,5 (fator terapia, nível psicanálise).

Surge uma questão delicada, quando houver interação entre uma variável de sujeito e uma experimental. Poderemos, nessa situação, estabelecer relações de causa-efeito? Sim e não, é a resposta. Poderemos, apenas, especular a resposta. Porque essa variável de sujeito pode apresentar um número desconhecido de outras variáveis de sujeito que estão correlacionadas com ela. Por exemplo, pessoas deprimidas têm pensamento negativo: são pessimistas, autocríticas, não sentem auto-estima quando fazem bem algo. Daí que se pode julgar que essas variáveis exercem papel causador da depressão, porém, pode ocorrer o contrário. Pelo fato de estarem deprimidas é que pensam de modo negativo. Estão correlacionados o pensamento negativo e a depressão. Não há necessariamente uma relação causal entre essas variáveis. Elas podem aparecer, ocorrer juntas devido à uma terceira variável: perda de controle de si. Essa perda de controle pode causar tanto a depressão como o pensamento negativo.

Voltando à delicada questão da interação entre uma variável de sujeito com uma variável manipulada... . Se representarmos de modo gráfico (em colunas) as médias 7,4 e 3,2 obtidas para os pacientes com ansiedade veremos a superioridade da terapia comportamental (7,4) frente a psicanálise (3,2). Essa superioridade não se mantém para os pacientes depressivos, ou seja, representando graficamente (em colunas) as médias 7,8 e 5,0, vemos a inferioridade da terapia comportamental (5,0) em relação à psicanálise (7,8). Essa mudança de comportamento da variável terapia comportamental diante da variável de sujeito representa uma interação.

53

Esse aspecto do delineamento de um experimento fatorial, com uma variável independente (terapia) e uma de sujeito (ansiedade/depressão) é chamado de correlacional.

O pesquisador sempre deve determinar o status metodológico de cada variável independente em um experimento fatorial. Pode haver inclusive o caso de as duas variáveis independentes serem do tipo de sujeito. Neste caso o todo o estudo é do tipo correlacional.

A interpretação causal (relação causa-efeito) dos resultados de uma pesquisa reside no delineamento de um experimento e não no tipo de análise estatística efetuada para analisar os dados obtidos.

2.7) IDENTIFICAÇÃO DE VARIÁVEIS DE CONFUNDIMENTO

2.7.1) Para identificar uma relação causal entre as variáveis, é essencial que a variável de interesse (variável controlada, ou variável independente intencionalmente introduzida no estudo) seja isolada durante o experimento. A importância de identificarem variáveis de confundimento em um experimento é grande. Quando as variáveis de confundimento são controladas, o pesquisador é capaz de isolar as variáveis independentes para determinar se elas têm um efeito causal sobre a variável dependente. A variáveis individuais (de sujeito) podem ser confundidas com uma variável independente: quando são desigualmente representadas nos grupos e quando elas influenciam a variável dependente.

2.7.2) Como um pesquisador sabe qual (is) variável (eis) devem estar sob controle em um experimento? Não há nenhuma resposta padrão, nenhuma fórmula para sempre aplicar. Um conhecimento geral, amplo, de outras pesquisas na mesma área constitui, talvez, a maior proteção contra a falha de não controlar uma variável estranha, extrínseca, de confundimento. Os pesquisadores confiam nos artigos de revisão metodológica relacionados com o fenômeno sob investigação. Eles constantemente se perguntam: Quem mais está variando de forma sistemática no experimento além da variável independente?

54

2.8) MEIOS PARA ISOLAR A VARIÁVEL DE INTERESSE

2.8.1) Podemos isolar a variável de interesse, intrínseca, ou seja a independente, por diversos modos: (i) o ideal : mantendo constantes todas as demais variáveis possíveis de influência; (2) por utilizar o grupo controle: - que serve como 'baseline', referência em relação ao grupo experimental, grupo tratado, que recebe o tratamento que é de interesse para o pesquisador.; (3) mediante a casualização, 'randomization': método de designar os sujeitos aos grupos tratados e controle a fim de isolar os efeitos da variável independente.

2.8.2) Variáveis do sujeito podem criar problemas quando elas se confundem com uma variável independente. Isso ocorre quando: elas são desigualmente representadas nos grupos, e quando elas influenciam a variável dependente. Exemplos de variáveis do sujeito (variações individuais): peso, altura, sexo, habilidade manual, força física, etnia, educação, raça, ocupação, renda, tamanho da família, nível de inteligência, introversão...

2.8.3) Podemos controlar as variáveis do sujeito (variações individuais) e eliminá-las como variáveis estranhas. Se os sujeitos forem designados aleatoriamente às condições experimentais e de controle, isto é, aos grupos tratados e controle, as variáveis do sujeito teriam sido eliminadas como variáveis de confundimento.

2.8.4) A aleatorização, (ou casualização, ou randomization), é uma estratégia para controlar as variáveis do sujeito (variações individuais) com base no conceito estatístico da lei das médias. Randomization indica que cada sujeito possui uma igual probabilidade de ser designado para qualquer condição de tratamento. Se uma importante variação individual estende-se igualmente através das condições do grupo tratado e controle, então essa variação individual não pode criar uma tendenciosidade. Por meio de uma designação aleatória do sujeito às condições experimentais, admite-se que o efeito da variável é mantido constante. Contudo, a aleatorização pode ainda falhar para igualmente distribuir as variáveis do sujeito (variações individuais). Esta situação frustrante ocorre na sua maior parte quando é pequeno o número de sujeitos utilizados no experimento.

2.8.5) Uma vez que a designação aleatória tende a espalhar as variáveis do sujeito (variações individuais) igualmente nas várias condições, o pesquisador tem uma chance maior de eliminar as variações individuais como uma explicação alternativa dos resultados encontrados. Portanto a randomization (casualização) ajuda a isolar a variável independente como uma causa das mudanças na variável dependente:

55

"Casualize onde seja possível:

- selecione os sujeitos ao acaso;

- designe os sujeitos aos grupos ao acaso;

- designe os tratamentos experimentais aos grupos ao acaso".

56

2.9) VALIDADE INTERNA DE UM EXPERIMENTO

2.9.1) Validade interna de um experimento. Na prática não há um experimento perfeito; não há nenhum modo de controlar cadavariável em potencial estranha, extrínseca, de confundimento. Não obstante, os pesquisadores tentam com muito afinco controlar aquelas variáveis potencialmente estranhas mantendo constantes aqueles fatores mais óbvios, que podem oferecer uma explicação competitiva aos resultados do experimento. O grau de confiança obtido pelo pesquisador ao estabelecer a relação causa-efeito entre as variáveis que estão sendo consideradas (sob controle ou intencionalmente introduzidas no experimento) representa a validade interna de um experimento. Ao efetuar um experimento algumas variáveis (as intencionalmente introduzidas) foram manipuladas, medidas e selecionadas, enquanto outras não o foram. O que deseja o pesquisador é estabelecer hipóteses alternativas plausíveis, que podem explicar os resultados obtidos no estudo, mediante as variáveis intencionalmente introduzidas. As hipóteses alternativas razoáveis que competem para explicar os resultados do estudo, mediante a consideração das variáveis não intencionalmente introduzidas no experimento, podem variar em número e em persuasão. Conforme aumenta o número e a credibilidade de explicações alternativas diminui a validade interna do experimento.

2.10) VALIDADE EXTERNA DE UM EXPERIMENTO

2.10.1) Validade externa de um experimento. A validade externa refere-se à extensão com a qual os resultados da pesquisa podem ser generalizados para outras populações, além da situação experimental. É muito difícil julgar a validade externa de um experimento. Falando claro, não há nenhum modo de determinar se os resultados de uma pesquisa se manteriam se o experimento fosse conduzido com sujeitos de uma diferente população, em uma diferente localidade, ou usando outros meios de manipular a variável independente e de medir a variável dependente.

2.10.2) Podemos aumentar o grau de confiança da nossa generalização, validade externa, mediante um método de amostragem de sujeitos. É o método da amostragem aleatória. Consiste em escolher sujeitos ao acaso de uma população definida. O pesquisador assume que as características individuais dos sujeitos da população estão representadas na amostra. (Observe que isto é diferente da designação aleatória. Randomization é empregada para designar os participantes da pesquisa às condições experimentais e afeta a validade interna do estudo). Mesmo com a amostragem aleatória (random sampling) os pesquisadores nunca estão certos sobre a extensão com a qual podem generalizar os resultados (achados) do estudo. Cautela é sempre necessária quando são estabelecidas as

57

conclusões gerais sobre os resultados de um estudo. Por exemplo, em 1954 nos Estados Unidos, houve uma campanha de vacinação para erradicar a poliomielite. O experimento envolveu grupos tratados e controle (placebo). As crianças de 1ª, 2ª e 3ª série do primário foram designadas aos grupos de forma aleatória. A generalização das conclusões obtidas para crianças de séries superiores, ou seja, de mais idade pertencem a imunologia e a virologia, não à estatística.

58

2.11) EXERCÍCIO DE REVISÃO

2.11.1) Qual é a variável mais óbvia de confundimento que afeta a validade interna do seguinte estudo?

Uma agência de publicidade e de marketing foi contratada para avaliar a preferência das pessoas pelos tipos de cerveja: Skol ou Brahma. Para impedir a tendenciosidade, todos os testes com as garrafas enlatadas das cervejas foram cobertas com papel, revelando apenas as letras M (para o caso da cerveja Skol) ou Z (para o caso da cerveja Brahma). Metade das pessoas provaram primeiro a Skol, depois provaram a Brahma; para a outra metade das pessoas mudou a ordem: primeiro a Brahma e depois a Skol. Os resultados mostram que as pessoas preferem a Skol na razão de 2 para 1.

Resposta

2.11.1) A letra sobre a lata de cerveja confunde-se com a cerveja. Skol sempre tem a letra M e a Brahma a letra Z. É ao sabor que os sujeitos estão respondendo ou eles simplesmente seguem, mostram uma preferência pela letra M?

2.12. Bibliografia principal.

Fred N. Kerlinger - Metodologia da Pesquisa em Ciências Sociais. Um tratamento conceitual, E.P.U.; EDUSP, 1980.

Grimm, Lawrence G. - Statistical Applications For The Behavioral Sciences, Ed. John Wiley & Sons, 1993.

Folkes, J. Leroy - Ideas of Statistics, Ed. John Wiley & Sons, 1985.

59

Parte 3 ESTUDOS OBSERVACIONAIS

(Sonia Vieira, Metodologia Científica)

3.1) O QUE SÃO ESTUDOS OBSERVACIONAIS ?

Para introduzir o conceito de estudo observacional vamos imaginar que um pesquisador pretenda verificar se os alcoólatras crônicos estão mais sujeitos à tuberculose do que os não-alcoólatras. É claro que o pesquisador precisa de dois grupos de indivíduos: um, de alcoólatras crônicos e outro, de não-alcoólatras.

O "tratamento", que neste exemplo é o alcoolismo crônico, não pode ser sorteado. Ninguém se torna alcoólatra, ou deixa de se tornar, para obedecer a um planejamento experimental. Então, para fazer este estudo, o pesquisador precisaria de uma amostra de indivíduos, já caracterizados como alcoólatras crônicos (grupo tratado), para comparar com uma amostra de não alcoólatras (grupo controle). Com este exemplo pretendemos deixar claro que os indivíduos nem sempre podem ser sorteados para os grupos, tratado e controle.

Toda vez que os indivíduos da amostra não tiverem sido designados aos grupos por processo aleatório, mas já estiverem classificados nos respectivos grupos, no início da pesquisa, dizemos que foi feito um estudo observacional (não é experimento).

3.2) RAZÕES DESSES ESTUDOS

Existem tratamentos que não podem ser sorteados às unidades experimentais, devido a sua natureza. Como exemplo, vamos imaginar que um pesquisador pretenda estudar o efeito de hábitos orais nocivos (como chupar o polegar) sobre a má oclusão dentária. Ora, não é possível sortear as crianças que deverão adquirir o hábito oral nocivo e as que não deverão adquirir esse hábito, para construir os grupos tratado e controle. Para um estudo deste tipo, o pesquisador precisa observar indivíduos que têm, ou tiveram o hábito, e indivíduos que não têm, ou nunca tiveram esse hábito.

Os tratamentos sabidamente prejudiciais não devem ser sorteados às unidades experimentais, mesmo que o sorteio seja tecnicamente possível. Como exemplo, lembremos que nos estudos dos efeitos da subnutrição sobre o crescimento não se sorteiam as crianças que irão receber dieta deficiente. No entanto, existem vários estudos que comparam o crescimento de crianças subnutridas com o crescimento de crianças adequadamente alimentadas.

60

Por outro lado, é preciso lembrar que os estudos observacionais constituem a única forma de estudar efeitos colaterais das diferentes terapias. Como exemplo, basta lembrar que os testes de drogas são feitos com ratos de laboratório. Estes testes podem mostrar se uma quantidade grande de droga, administrada durante um curto período de tempo, provoca reação adversa em ratos de laboratório. A constatação de reação indesejável constitui aviso contra o uso da droga. No entanto, a segurança da droga não fica garantida pelo simples fato de que não se observou reação adversa nos ratos em experimentos de laboratório. Ainda, esses testes não são suficientes para mostrar se doses pequenas da droga, administradas por um período longo de tempo a doentes com determinada patologia, têm efeitos colaterais indesejáveis. Então só existe uma forma de estudar os efeitos colaterais de uma droga: submeter os indivíduos à ação dessa droga. No entanto, os experimentos clínicos não são suficientemente grandes para detectar pequenos desvios da normalidade ou para detectar efeitos colaterais que ocorram apenas raramente. Então, algumas contra-indicações só podem ser detectadas através de estudos observacionais.

3.3) CUIDADOS NA INFERÊNCIA

Nos estudos observacionais os indivíduos não são designados para o grupo tratado por processo aleatório: pertencem ao grupo tratado, pelo fato de serem portadores de determinada característica. Então, nos estudos observacionais, os efeitos do tratamento estão confundidos com os efeitos de fatores que levaram o indivíduo a pertencer ao grupo tratado(*). Conseqüentemente, a discussão dos efeitos de um tratamento, com base num estudo observacional, exige mais senso crítico do que a discussão dos efeitos de um tratamento, estudado através de um experimento planejado.

Vejamos, com base num exemplo, alguns aspectos que podem ser levantados na discussão dos resultados de um estudo observacional. Vamos supor que um pesquisador pretenda verificar se a fluoretação da água de abastecimento público diminui a incidência de cáries dentárias em crianças. São necessários dois grupos: o grupo tratado (composto por indivíduos que residem em local onde a água de abastecimento público é fluoretada) e o grupo controle (composto por indivíduos que residem em local onde a água de abastecimento público não é fluoretada). Neste caso o estudo observacional é, evidentemente, o único possível, porque não se pode designar, ao acaso, onde a criança deverá residir.

Vamos supor que o pesquisador examinou dois grupos de crianças, residentes em locais diferentes e verificou que a prevalência de cáries era menor no grupo tratado do que no grupo controle. Isto prova que a fluoretação da água de abastecimento público previne a incidência de cáries em crianças?

61

Antes de nos apressarmos para uma conclusão, é conveniente lembrar que, embora a fluoretação da água de abastecimento público seja um fator importante na prevenção de cáries dentárias, existem outros fatores que afetam o índice de cárie, como idade, sexo e cor: as crianças mais velhas têm mais cáries; as meninas têm mais cáries do que os meninos; os brancos têm mais cáries do que os negros(**). Ainda, cuidados odontológicos, higiene oral, quantidade de flúor natural na água são alguns dos vários fatores que ajudam na prevenção de cáries. Então, é razoável concluir que a fluoretação da água de abastecimento público diminui a incidência de cáries dentárias, apenas quando o pesquisador puder garantir que os dois grupos são similares em relação a todos esses fatores(***).

(*) Este exemplo é claro: a idade de morte dos bispos é maior do que a dos padres, porque poucos homens se tornam bispos antes da meia-idade. Então, promover os padres a bispos não os fará viver mais. O exemplo é de Farr, um estatístico inglês do século passado. In HILL, A. B. - Short textbook of medical statistics. London, Hodder and Stoughton, 1977, p. 278.

(**) Veja: MOREIRA, B.W. & VIEIRA, S. - Prevalence of dental caries in permanent teeth of white andblack school-children in Brazil. Community Dental Oral Epidemiol. 5: 129-31, 1977. (***) Embora não haja dúvida de que a fluoretação da água de abastecimento público seja um método para a prevenção de cárie, as pesquisas sobre o assunto devem ser feitas com base em "grandes amostras". A prevalência de cárie, no Brasil, é muito alta e a variabilidade dos índices de cárie é muito grande. Então, amostras com 50 ou 100 crianças dão resultados apenas casuísticos.

3.4) TIPOS DE ESTUDOS OBSERVACIONAIS

Nem sempre é possível estudar a variação de uma variável em função da outra, através de experimentos planejados. Lembremos que para estudar o crescimento das crianças em função da idade são necessários estudos observacionais. Nesses estudos, a variação de uma variável, em função de outra, pode ser observada através de dois tipos de procedimento: o longitudinal e o transversal. Nos estudos longitudinais o pesquisador observa o mesmo grupo de indivíduos, ao longo do tempo; nos estudos transversais o pesquisador observa diferentes grupos de indivíduos ao mesmo tempo (*). Vejamos um exemplo.

Para descrever o crescimento ponderal de crianças no primeiro ano de vida, o pesquisador tanto pode fazer um estudo longitudinal quanto um estudo transversal. Para um estudo longitudinal basta pesar o mesmo grupo de crianças, em intervalos regulares de tempo - por exemplo, mensalmente, durante um ano. Para um estudo transversal seria preciso pesar, na mesma ocasião, diversas crianças, com idades entre zero e 12 meses.

Os estudos transversais exigem amostras grandes, mas podem ser feitos em pouco tempo. Como exemplo, vamos imaginar que um pesquisador pretenda

62

verificar se a pressão arterial aumenta com a idade. Um estudo transversal exigiria medir a pressão arterial de um grande número de pessoas, de diferentes idades, enquanto que, num estudo longitudinal, bastaria medir a pressão arterial de um grupo relativamente menor de pessoas, e segui-las durante certo tempo. No entanto, medir a pressão arterial de um grande número de pessoas é perfeitamente possível, enquanto medir a pressão arterial do mesmo grupo de pessoas durante vários anos pode ser difícil, ou mesmo impossível (**). Para tornar mais clara nossa argumentação, vamos imaginar que o estudo transversal foi feito com uma amostra de 3100 indivíduos, de 30 a 60 anos de idade. É claro que, no estudo longitudinal, poderia ser estudado um grupo menor de indivíduos, mas durante muito mais tempo.

É interessante lembrar, neste ponto, que os estudos transversais têm mais valor descritivo do que os estudos longitudinais, porque levantam dados de maior número de indivíduos, o que permite estimar melhor a variabilidade. Vejamos um exemplo. Vamos supor que um investigador pretenda estabelecer a curva de crescimento para crianças portadoras da síndrome de Down (mongolismo). Tanto pode ser adotado o procedimento longitudinal - seguir um grupo de crianças durante o período de crescimento - quanto o transversal - observar crianças em diferentes idades. O segundo procedimento é preferível, se a finalidade do estudo é descritiva, porque permite avaliar melhor a variabilidade do crescimento das crianças portadoras da síndrome de Down.

(*) Nos estudos longitudinais os dados são diacrônicos e nos estudos transversais os dados são sincrônicos

(**) É claro que ocorreriam "perdas", por morte, por mudança, por desistência em cooperar etc.

3.5) ALGUNS ASPECTOS DA REGRESSÃO

"Um único estudo - principalmente quando é observacional - não é suficiente para estabelecer relações de causa e efeito"

"Com um estudo observacional, o coeficiente angular e o intercepto da equação da reta de regressão são apenas medidas descritivas. Eles apenas dizem como o valor médio da variável dependente está relacionado para determinados valores da variável independente, na população que está sendo observada. Não podemos confiar nesta equação de regressão, se quisermos predizer o comportamento da variável dependente, no caso do pesquisador mudar os valores da variável independente".

63

Vimos que pode ser estudado o crescimento ponderal de crianças em função da idade. Pode haver interesse, no entanto, em comparar o crescimento de crianças pertencentes a famílias de diferentes classes de renda. Nesse caso, podem ser estabelecidas as "curvas de crescimento", para cada classe de renda, e ser feitas comparações dessas curvas (*). Isto significa que pode ser estudada a variação de uma variável em função da outra, em situações distintas.

Por outro lado, é preciso ter em mente que se uma variável cresce em função de outra, é razoável concluir que o crescimento dessa variável causa o crescimento da outra apenas quando os dados são obtidos em experimentos planejados. Nos estudos observacionais o fato de uma variável crescer em função da outra não significa, necessariamente, que o crescimento de uma seja a causa do crescimento da outra: pode significar apenas que as variáveis estão sendo simultâneamente influenciadas por uma terceira variável (**). Vejamos um exemplo.

Antes da introdução da vacina contra a poliomelite, a venda de refrigerantes e a incidência dessa doença tinham, nos Estados Unidos, correlação positiva, isto é, quando vendiam mais refrigerantes ocorriam mais casos de poliomielite. Essa correlação, entretanto, nunca foi considerada "prova" de que os refrigerantes causavam poliomielite, porque se sabia que uma terceira variável - a temperatura - influenciava as duas variáveis. No verão se consomem mais refrigerantes e ocorrem mais casos de poliomielite, como mostra a figura (***):

(*) A comparação do crescimento, em estatura, de adolescentes do sexo masculino, com idades variando entre 10 e 19 anos, mostra que existe diferença no crescimento de indivíduos pertencentes a diferentes classes de renda. Veja: PRANDI, R. - Retrato do Brasil em carne e osso. Novos Estudos Cebrap, 1(3):10-5, 1982. MARQUES, R.M.; TARDELLI, A.O. & Dias, S.V. - O modelo Spillman - modificado para regressão assintótica. Rev. Bras. Estat. 42:3-16, 1981.

(**) Este exemplo é clássico: nas cidades dos países escandinavos o número de nascimentos é tanto maior quanto maior é o número de cegonhas. Isto entretanto não prova que as cegonhas são responsáveis pelo nascimento de crianças: prova apenas que quanto maior é a cidade, maior

Número de casos de poliomielite

0.00 4.00 8.00 12.00 Refrigerantes vendidos (milhões)

0.00

10.00

20.00

30.00

verão

in v e r n o

64

é o número de nascimentos de crianças e maior o número de telhados, onde as cegonhas podem fazer seus ninhos. In: WALLIS, A.W. & ROBERTS, H.V. - Statistics: A new approach. Chicago, Free Press, 1956.

(***) In: FREEDMAN, D. ; PISANI, R. & PURVES, R. - Statistics. New York, Norton, 1978, pp. 136- 137.

Os estudos observacionais são indicadores seguros de causa apenas quando outras possíveis explicações - que não a relação de causa entre as variáveis - tiverem sido todas descartadas. Como exemplo, lembremos que diversos trabalhos têm apontado o aumento de desemprego como causa do aumento de suicídios, de prisões e de homicídios(****). É difícil escapar à conclusão de que o aumento do índice de desemprego causa o aumento de suicídios, de prisões e de homicídios por que, afinal, que outra variável estaria influenciando, simultaneamente, o índice de desemprego e o número de suicídios, de prisões e de homicídios?

(****) Para melhor discussão sobre o assunto veja: LANDMANN, J. - Medicina não é saúde. Rio de Janeiro, Nova Fronteira, 1983, pp. 288-98.

65

Parte 4

ESTUDOS OBSERVACIONAIS versus EXPERIMENTO (Nick Black - Why we need observational studies to evaluate the effectiveness of

health care, BMJ,vol. 312, may 1996, 1215-8)

4.1. AS LIMITAÇÕES DOS EXPERIMENTOS

Os experimentos apresentam limitações. Eles podem ser desnecessários, inapropriados, impossíveis ou inadequados.

A experimentação pode ser desnecessária.

Quando o efeito de uma intervenção é dramático, a probabilidade de fatores de confundimento desconhecidos serem importantes é tão pequena que esses fatores podem ser ignorados. Há muitos e bens conhecidos exemplos de tais intervenções: penicilina para infecções bacteriológicas; vacinação contra a varíola; anestesia para operações cirúrgicas. Em todos esses exemplos os estudos observacionais mostraram-se adequados para demonstrar a efetividade da intervenção.

A experimentação pode ser inapropriada.

Há quatro situações nas quais os experimentos casualizados podem ser inapropriados:

Primeira situação: Raramente eles apresentam tamanho de amostra suficientemente grande para medir com exatidão resultados adversos infreqüentes. Exemplo, a droga Opren (benoxaprofen) (vide referência: Opren scandal. Lancet 1983: i:210-220). Esta droga foi lançada em 1980 após haver sido submetidos a experimentos casualizados em 3000 pessoas. Ela teve de ser retirada dois anos depois. Responsabilizam-na pela morte de 61 pessoas.

Segunda situação: surge da dificuldade do tamanho da amostra no estudo, quando se deseja avaliar intervenções previamente delineadas para impedir a ocorrência de eventos raros. Um experimento poderia necessitar um número muitíssimo grande, da ordem de milhões.

Terceira situação: Quando os resultados do experimento só hão de aparecer num momento futuro e distante. Exemplos: as conseqüências dos contraceptivos orais que podem manifestar-se após algumas décadas; o uso da terapia de reposição de hormônio para impedir fraturas do fêmur; e o enfraquecimento das juntas artificiais do quadril, que podem aparecer só após 10 a 15 anos de

66

acompanhamento. As dificuldades práticas em manter tais estudos prospectivos prolongados (seja experimental ou observacional) são consideráveis, também pelo custo.

Quarta situação: O experimento pode ser inapropriado porque o ato de casualização pode reduzir a efetividade da intervenção. Isto ocorre quando a efetividade da intervenção depende da participação ativa da pessoa, que, por sua vez, depende da opinião e da preferência de outras pessoas.

A experimentação pode ser impossível.

Há pessoas que acreditam que toda e qualquer intervenção pode ser sujeita ao experimento casualizado, e de que aqueles que desafiam este credo não tomaram as suficientes medidas, foram displicentes, e são metodologicamente incompetentes.

Uma visão deste tipo minimiza o impacto de seis sérios obstáculos que todos os pesquisadores devem enfrentar com muita freqüência.

Primeiro obstáculo. Falta de colaboração das pessoas que de alguma maneira estão envolvidas. Segundo obstáculo. Objeções éticas. Terceiro obstáculo. Dificuldades políticas para efetuar o experimento. Quarto obstáculo. Obstáculos legais. Quinto obstáculo. Algumas intervenções não podem ser alocadas de forma aleatória. Sexto obstáculo. Complexidade para efetuar uma intervenção médica: há vários fatores envolvidos.

A experimentação pode ser inadequada.

A validade externa, ou generalização dos resultados do experimento é com freqüência baixa. Há três razões para isso:

Primeira razão. Os profissionais de saúde envolvidos podem não ser representativos. Segunda razão. Os pacientes que participam podem ser atípicos. Terceira razão. Os tratamentos podem ser atípicos.

Os experimentos casualizados, geralmente, oferecem, vamos dizer, mais uma indicação da eficácia de uma intervenção do que a sua efetividade na prática do dia a dia.

67

A maioria dos experimentos casualizados são explicatórios, isto é, eles proporcionam evidência do que se poderia obter nas circunstâncias mais favoráveis.

A questão da validade externa tem recebido pouca atenção por parte daqueles que propõem a experimentação casualizada como padrão "gold".

4.2. A GRANDE DESVANTAGEM DOS ESTUDOS OBSERVACIONAIS

A baixa validade interna dos estudos observacionais constitui a sua grande desvantagem em relação aos experimentos casualizados.

4.3. A GRANDE VANTAGEM DOS ESTUDOS OBSERVACIONAIS

Quando os estudos experimentais casualizados não puderem ser efetuados, estudos observacionais oferecem uma alternativa ao seguinte dilema: ... então, neste caso, que não pudemos efetuar o padrão "gold": - não fazemos nada!

Os estudos observacionais oferecem a oportunidade de estabelecer uma alta validade externa, coisa que é difícil de conseguir em experimentos casualizados.

4.4. CONCLUSÃO

Em vez de só aprovar um método e de desaprovar o outro, todo pesquisador deve ser rigoroso na execução da pesquisa. Porque nenhum método é perfeito; cada método apresenta seus pontos fortes e as suas fraquezas. As duas abordagens devem ser vistas como complementares.

........................... ........................... ....................................

68

Para Reflexão

#1) “É importante ter em mente que a análise estatística e o delineamento de uma pesquisa estão intimamente ligados. Pode-se dizer que, se muitas vezes uma análise malfeita põe a perder um bom delineamento, é bastante difícil qualquer tipo de análise estatística remediar um delineamento malfeito”.

Sobre possíveis vantagens de estudos experimentais em relação a estudos não experimentais, é necessário assinalar que existem situações em que é impossível se propor um experimento, algumas vezes por razões de ordem ética, outras simplesmente por razões de ordem técnica.

É verdade que as relações de causa e efeito são mais consubstanciadas quando testadas através de experimentação; deve-se lembrar, contudo, que em experimentos há sempre o risco de artificialidade, ganhando-se em validade interna, mas às custas, às vezes, da validade externa. Na verdade, o progresso científico é feito por ambas as vias, dependendo ainda (e talvez principalmente) de pesquisadores capazes de formular hipóteses a serem testadas, experimentalmente ou não”(BERQUÓ, E. S. et al. - Bioestatística, E.P.U. 1980, p. 146-7).

#2) Almost all observed associations between two variables are influenced by other variables lurking in the background. Therefore association does not imply causation. In assessing evidence for causation, the key question is “How were the data produced?” and the gold standard is the randomized comparative experiment.

“Quase todas associações entre duas variáveis são influenciadas por outras variáveis de confundimento (estranhas). Portanto associação não implica causalidade. Ao avaliar a evidência de causalidade, a questão decisiva é:“Como os dados foram produzidos?” E a prova de ouro é o experimento comparativo casualizado”.

(David S. Moore, Teaching Beginners as a Mirror of the Discipline, p.3) http://www.stat.purdue.edu/~dsmoore/articles/ http://www.stat.purdue.edu/~dsmoore/articles/NewZealand.pdf

#3) Variation is everywhere: individuals vary, repeated measurements on the same individual vary. Therefore conclusions are uncertain. Our intuition about uncertainty is weak – for example, we tend to draw unwarranted conclusions from short-term irregularity. Statistical methods take account of uncertainty and correct our intuition.

“A variação está presente em toda parte: os indivíduos variam, medidas repetidas no mesmo indivíduo variam. Portanto as conclusões são incertas. A nossa intuição sobre incertezas é fraca – por exemplo, tendemos a tirar conclusões não confiáveis das variabilidades de curta duração. Os métodos estatísticos levam em conta a incerteza e corrigem a nossa intuição”.

69

(David S. Moore, Teaching Beginners as a Mirror of the Discipline, p.3) http://www.stat.purdue.edu/~dsmoore/articles/NewZealand.pdf

#4) “random" portion of statistical models is our way of describing unexplained individual variation and that we have no idea whether this variation really is random."

“A parte aleatória dos modelos estatísticos é o nosso modo de descrever a variação individual não explicada (pelo modelo) e nós não sabemos se essa variação é realmente aleatória”.

http://www.stat.purdue.edu/~dsmoore/articles/ http://www.stat.purdue.edu/~dsmoore/articles/WildPfannkuch.pdf

#5) “I find that “unexplained individual variation" is clearer to students (because more concrete) than random variation." (David S. Moore)

“Eu julgo que a “variação não explicada individual” é uma expressão mais compreensível aos estudantes (porque é mais concreta) do que “ variação aleatória””.

http://www.stat.purdue.edu/~dsmoore/articles/ http://www.stat.purdue.edu/~dsmoore/articles/WildPfannkuch.pdf

#6) “Variation is at the heart of the process of statistical thinking… variation is that which is not pattern”.

“Educators think about how to move students from their naive conceptions of variation towards a more “professional” view”

“It is fair to say that statisticians have a complex relationship with variability. Statisticians sometimes attempt to minimize variability, sometimes to maximize, sometimes to estimate or simply to “analyze” variance. Many statistics educators claim variability to be one of the fundamental concepts of statistics….Yet when most students first encounter statistics, they find that variability plays second fiddle to “central tendency”. The conceptualization of data as “signal versus noise”, which according to Pfannkuch (1997) some statisticians consider one the major contributions of Statistics to Science, teaches students that the central tendency, however it’s measured, is of primary importance and variability is simply a nuisance. A noise one at that.

“College level statistics does not completely ignore variability, of course. Many texts and one hopes many instructors discuss the importance of examining the shape of the distributions before making any conclusions about the data. DeVeux, Velleman and Bock (2004) write in their introductory statistics textbook that “the three rules of data analysis are 1) make a picture 2) make a picture and 3)make a picture”. Most students learn, often in the first weeks of the course, that

70

the mean by itself is not a sufficient summary of a distribution. But after that variability is brushed aside as attention focuses on estimating the mean, and students are taught that standard deviation is a nuisance parameter that must be estimated if one is to do a proper hypothesis test on the men or calculate a confidence interval for the mean or perform a comparison of means. Some introductory courses teach ANOVA, which although it pays tribute to variability in its name, is really about the simultaneous comparison of means from several populations”.

“falls on educators to consider how conceptions of variation aid or hinder how students learn statistical thinking … variation is the fuel to statistical imagination… Statistical imagination begins when variation is observed”.

www.stat.auckland.ac.nz/serj Statistics Education Research Journal 3(2), 7-16, 2004. (SERJ3(2)_Gould.pdf)

#7) “many texts: as following a descriptive statistics-probability-inference sequence. Schield (1996) suggested that introductory courses, of this ilk, are too narrow in focus, lacking real world breadth:

When we think of statistics, most of us think of the subject as having several parts: descriptive, probability, inference and possibly modeling. But the essence of statistics is not readily determined by knowing these parts... The distinction is more than just a difference between theory and application. It is the difference in method (deductive versus inductive) and a difference in subject matter (formal probability theory vs. the material aspects of real data found in observational studies). (pp. 3-4).

(Anne Porter: “ Improving Statistical Education through the Experience of Reflective practice” Thesis. Chapter 3- Unpacking Statistical Expertise (p.121)) Schield, M. (1996, ). The goal of Introductory Statistics: Reasoning about data. Paper presented at the Statistical Education Workshop, Sydney International Statistical Congress (SISC-96), University of Technology, Sydney.

#8) http://mathforum.org/kb/thread.jspa? forumID=67&threadID=208332&messageID=741338#741338 Date: Feb 9, 2003 10:10 AM Author: Steve Peterson Subject: [ap-stat] Re: Is this an experiment?

It is easy to distinguish types of studies by understanding their purposes.

If the goal is to ask what this population is like (or to compare two populations), you are looking at an observational study.

If you are trying to determine whether a given treatment has some specified effect, you should be conducting an experiment.

71

Observational studies and experiments can also be distinguished by the role of randomization.

The role of randomization in an observational study lies in the sampling.

In statistical inference for observational studies we ask how likely it would be to observe such data by random variability due to the random sampling.

In an experiment, randomization is used to create experimental groups that are similar by randomly assigning subjects to treatments. In an experiment, we ask how likely it would be to observe such differences in the experimental groups if the difference were only a result of the random assignment (e.g. All the smart folks just happened to get assigned to the same group or all the folks who were going to recover from a disease regardless of treatment happened to get assigned to the treatment group.)

(A common misconception is to think that we need a random sample of subjects to participate in an experiment. Not true.) …………………………………………………………………………………………………………………………………………………………………………………………………………… #9) http://mathforum.org/kb/thread.jspa?forumID=67&threadID=203965&messageID=736368#736368

Date: Dec 4, 2001 8:27 AM Author: Olsen, Chris Subject: [ap-stat] RE: Experimental Design or observational study?

… what constitutes an experiment.I think this is one of thosequestions that are wonderful, in that one has an opportunity to create ambiguity due to the

plethora of answers!

I think the historical / philosophical development is something like this:

Aristotle makes observations and ignores them. Roger Bacon says we really ought to pay attention to observations. Descartes says no, to get knowledge we only need to be rational.

John Stuart Mill says that to get knowledge we must observe. David Hume says that neither actually works perfectly.

Isaac Newton blows everybody out of the water with the Principia and says experimentation is the way to go, period.

Note: At this time, c. 1700, experimentation = observation The psychologists in the 19th centuryand the agriculture people in the late 19th & early 20th century gathered all sorts of data and did experiments (= made observations) on people and peas. Fisher, in the first quarter of the 20th century, hired to analyze years of the fruits of labor (so to speak)of agriculture experiments ( =observations &

72

comparisons), suggested that all of that uncontrolled observation was essentially worthless, invented randomization, and took on the whole world to make randomization an essential component of experimentation.

Fisher and Friends Following impose their ideas on the scientific community and as a result, no experiment worth its salt is regarded as such unless there is a comparison and some sort randomization, e.g. assignment of subjects to treatments.

Thus, to the applied statistics community, observations not done under the color of comparison and random assignment of treatments is just NOT an experiment!

But to the science teachers, Newtonians all, an experiment still carries its historical meaning as an observation.

So maybe I could suggest this sort of dichotomy: To the non-statistical scientist , there are experiments (= observations of a primitive nature) and there are randomized comparative experiments (observations of a nature to establish cause)?

To the statistical scientist there are interesting but unhelpful observations, and there are experiments (i.e. with randomization and treatment assignment.) (Aside: I don't think those observations constitute an observational study as we understand it, since they scientist IS intervening.)

It would seem to me that this is not a question of who is right, but a suggestion that the traditions -- complete with inertia at this point – are different. This difference is compounded, IMHO, by the physical scientists who, given their incredible capability of direct control in the lab, may not need to rely on randomization as a method of increased control.

Now, all of this is arm-chair history and philosophy on my part – what we REALLY need is a Renaissance Man to address this question. -- Chris Olsen George Washington High School ………………………………………………………………………………………………………………………….

73

Questões de Estatística by Carl James Schwarz

Delineamento Experimental

http://www.stat.sfu.ca/~cschwarz/MultipleChoice/exper.design.sol.pdf

1. There is a positive association between the number of drownings (afogamentos) and ice cream sales. This is an example of an association likely caused by: (a) coincidence (b) cause and effect relationship (c) confounding factor (d) common cause (e) none of the above Solution: d .................................................................................................................................................

2. A new headache remedy was given to a group of 25 subjects who had headaches. Four hours after taking the new remedy, 20 of the subjects reported that their headaches had disappeared. From this information you conclude: (a) that the remedy is effective for the treatment of headaches. (b) nothing, because the sample size is too small. (c) nothing, because there is no control group for comparison. (d) that the new treatment is better than aspirin. (e) that the remedy is not effective for the treatment of headaches. Solution: c .................................................................................................................................................

3. A nutritionist wants to study the effect of storage time (6, 12, and 18months) on the amount of vitamin C present in freeze dried fruit when stored for these lengths of time. Vitamin C is measured in milligrams per 100 milligrams of fruit. Six fruit packs were randomly assigned to each of the three storage times. The treatment, experimental unit, and response are respectively: (a) a specific storage time, amount of vitamin C, a fruit pack (b) a fruit pack, amount of vitamin C, a specific storage time (c) random assignment, a fruit pack, amount of vitamin C (d) a specific storage time, a fruit pack, amount of vitamin C (e) a specific storage time, the nutritionist, amount of vitamin C Solution: d ............................................................................................................. 4. We wish to investigate if a new medicine is effective in reducing the length and severity of the flu. We take the next 20 patients that come to the walk-in clinic complaining of flu and, after a medical exam to verify that the patients do have the flu, we give them the new medicine and tell them about the new drug we are giving them. One week later, the patients are contacted and 15 patients state the new remedy was helpful in reducing the severity and length of the illness. Which of the following is NOT CORRECT? (a) This is a poor experiment because there is no control group. We do not know how many would feel better in a week without treatment. (b) This is a poor experiment because it is not double-blinded. The patients may feel relief because they thought the drug should work.

74

(c) This is a poor experiment because a convenience sample was selected. Patients who come to the a walk-in clinic may have more severe flu than people who do not. (d) This is a poor experiment because we didn’t give the remedy to people without the flu to assess its effect in a control group. (e) This is a poor experiment because the sample size is likely to be too small to detect anything but a gross improvement in measuring the proportion of people reporting an improvement. Solution: d .....................................................................................................................................................

5. A survey is to be undertaken of recent nursing graduates in order to compare the starting salaries of women and men. For each graduate, three variables are to be recorded (among others) u sex, starting salary, and area of specialization. (a) Sex and starting salary are explanatory variables; area of specialization is a response variable. (b) Sex is an explanatory variable; starting salary and area of specialization are response variables. (c) Sex is an explanatory variable; starting salary is a response variable; area of specialization is a possible confounding variable. (d) Sex is a response variable; starting salary is an explanatory variable; area of specialization is a possible confounding variable. (e) Sex and area of specialization are response variables; starting salary is an explanatory variable. Solution: c ........................................................................................................................................

6. Which of the following is CORRECT? (a) We do not need to randomize if our sample size is sufficiently large. (b) A large sample size always ensures that our sample is representative of the population. (c) If all other things are equal, we need a larger sample size for a larger population. (d) In a properly chosen sample, an estimate will be less variable with a large sample size and hence more precise. (e) In random samples, the randomization ensures that we get precise and accurate estimates. Solution: d ........................................................................................................................................ 7. An experimenter wishes to test whether or not two types of fish food (a standard fish food and a new product) work equally well at producing fish of equal weight after a 2- month feeding program. The experimenter has 2 identical fish tanks (1 & 2) to put fish in and is considering how to assign the 40 tagged fish to the tanks. To properly assign the fish, one step would be to: (a) put all the odd tagged numbered fish in one tank, the even in the other, and give the standard food type to the odd numbered ones (b) obtain pairs of fish whose weights are virtually equal at the start of the experiment and randomly assign one to the group tank 1, the other to tank 2 with the feed assigned at random to the tanks. (c) to proceed as in as in (b), but put the heavier of the pair into tank 2. (d) assign the fish at random to the two tanks and give the standard feed to tank 1. (e) not to proceed as in (b) because using the initial weight in (b) is a non-random process. Use the initial length of the fish instead. Solution: d

75

………………………………………………………………………………………… 8. A researcher wishes to compare the effects of 2 fertilizers on the yield of a soybean crop. She has 20 plots of land available and she decides to use a paired experiment – using 10 pairs of plots. Thus, she will: (a) use a table of random numbers to divide the 20 plots into 10 pairs and then, for each pair, flip a coin to assign the fertilizers to the 2 plots. (b) subjectively divide the 20 plots into 10 pairs (making the plots within a block as similar as possible) and then, for each pair, flip a coin to assign the fertilizers to the 2 plots. (c) use a table of random numbers to divide the 20 plots into 10 pairs and then use the table of random numbers a second time to decide upon the fertilizer to be applied to each pair. (d) flip a coin to divide the 20 plots into 10 pairs and then, for each pair, use a table of random numbers to assign the fertilizers to the 2 plots. (e) use a table of random numbers to assign the 2 fertilizers to the 20 plots and then use the table of random numbers a second time to place the plots into 10 pairs. Solution: b ……………………………………………………………………..

9. A student wishes to examine the effect of wing width and wing length on the length of flight of a paper airplane. There are 4 different models of airplanes. Which of the following is NOT correct? (a) A factor (such as wing width) is an experimental variable under control of the experimenter. (b) The order of flights was randomized to remove the influence of any other variables upon the flight distance of each flight. (c) It would be better to make four copies of each model of plane to give some feel for the plane-to-plane variations. Flying a single copy four times gives information about the internal variation. (d) Interaction between two factors means that the effect of a factor at one level depends on the level of the second factor. (e) Planned experiments (where randomization can take place) is one of the strongest pieces of evidence in try to establish a causal relationship.

Solution: b - randomization does not remove influences - makes them equal in all groups ……………………………………………………………………………………

10. An experiment was conducted where you flew paper airplanes after modifying wing depth and wing length. There were four different models of airplane. One design consideration was the choice between flying each plane four times or making four copies of each model, each of which is flown once. Which of the following is NOT correct? (a) Flying multiple copies of each model (i.e. separate planes of each model) could give information on variability in flight due to fabrication effects (i.e. how you made the plane). (b) Flying a single copy of each model four times could give information on variability in flight due to changes in initial launch conditions. (c) The differences in flight length among the different models gives information on the “effects” of the design factors - wing depth and wing length. (d) The response variable is flight length; the explanatory variables are wing depth and wing width. (e) Interaction between the effects of wing depth and wing width implies that the effects of wing depth are the same for all wing widths. Solution: e ……………………………………………………………………………………….

76

11. An experiment was designed an experiment to investigate the effect of the amount of water and seed variety upon subsequent growth of plants. Each plant was potted in a clay plot, and a measured amount of water was given weekly. The height of the plant at the end of the experiment was measured. Which of the following is not correct? (a) The response variable is the plant height. (b) The explanatory variables are the amount of water and seed variety. (c) Randomization was used to eliminate the effect of other possible factors upon the growth of the plants. (d) A possible uncontrollable factor in this experiment is any nutrients that might be present in the clay pots. (e) Designed experiments give the best evidence of “cause-and-effect” relationships. Solution: c - randomization does not remove influences - makes them equal in all groups …………………………………………………………………………………………. 12. A survey was conducted by visiting a student parking lot to estimate the proportion of cars that were red. Which of the following is NOT correct? (a) If the sampled stall was empty, we can simply choose another stall, at random, to take its place because it is not likely that the stall being vacant is related to a car being red. (b) The sample would be representative of the population if 100 cars were chosen regardless if randomization was used or not. (c) Even though a random sample was taken from cars in the parking lot, the sample may not be representative of the cars driven by SFU students because the decision to park in B-lot is self- selected. (d) If another sample of cars was chosen, it is likely that a different proportion of cars that are red would be obtained. (e) The confidence interval computed gave a 95% confidence interval for the true proportion of cars that were red in the population of cars that park in B-lot (assuming that the sample was selected using the 3 R’s). Solution: b ………………………………………

13. A survey was done to estimate the proportion of cars that are red and are Japanese made in the City of Vancouver by taking a random sample of size 25 from a student parking lot at Simon Fraser University. Which of the following is NOT CORRECT: (a) This sample may not be representative of the cars in Vancouver because mainly students park at SFU. (b) If the particular stall is vacant, we can simply select another stall at random because it is unlikely that a stall is vacant is related to the color or manufacturer of the car. (c) It would be dangerous to simply select the first 25 stalls in the lot closest to the Applied Science Building because there are a number of stall reserved for service vehicles whose primary color is white. (d) Different students obtained different answers for their sample proportions. This is an example of a sampling distribution for an estimator. (e) The margin of error will depend upon the total number of cars in the lot when we did the sample. Solution: e

……………………………………………………………………………..

77

16. An experiment was conducted where you analyzed the results of the plant growth experiment after you manipulated the amount of water and seed variety. Which of the following is correct? (a) We randomized the plants to plots to eliminate any effect of hidden variables. (b) We could determine the best combination of water and seed variety by examining the difference in the plant height in the final week of the experiment. (c) The variability in growth among plants of the same variety who received the same amount of water was constant over time. (d) The growth of a particular plant in week 3 is likely to be independent (unrelated) of the growth of the same plant in week 2. (e) The growth of the plants was linear over time. Solution: b …………………………………………………………………………….. 19. An experiment to measure the effect of giving growth hormones to girls affected by Turner’s Syndrome was carried out recently in Vancouver. All 34 girls in the study were given the growth hormone and their heights were measured at the time the hormone was given and again one year later. No measurements were made on their final adult heights. Which of the following is NOT a problem with this experiment? (a) there was no blinding (b) there was no control group (c) nonresponse bias (d) there was insufficient attention to the placebo effect (e) Because final heights were not measured, it would be impossible to tell if the hormone affected final height or only accelerated growth and made no difference to final height. Solution: c …………………………………………………………………………………….

22. An experiment was conducted by the Schwarz family to look at the yield of popcorn (total grams that popped when 15g of popcorn were heated) when two variables (the type of popcorn: gourmet or plain) and the amount of oil (little or lots) was used. A profile plot of the results is below:

Which of the following is NOT CORRECT:

78

(a) Because the lines are not parallel, there appears to be evidence of interaction between the two variables. (b) The two explanatory factors are the amount of oil and the type of popcorn. The response variable is the yield of popcorn. (c) The difference in yield between gourmet and plain popcorn is estimated to increase by about 6 g when lots of oil was used. (d) There was little change in the yield for plain popcorn when either little or lots of oil were used. (e) An interaction would exist if the increase in yield from going from little to lots of oil were the same for both types of popcorn. Solution: e …………………………………………………………………………………… 28. Consider an experiment to investigate the efficacy of different insecticides in controlling pests and their effects on subsequent yield. What is the best reason for randomly assigning treatment levels (spraying or not spraying) to the experimental units (farms)? (a) Randomization makes the experiment easier to conduct because we can apply the insecticide in any pattern rather than in a systematic fashion. (b) Randomization makes the analysis easier because the data can be collected and entered into the computer in any order. (c) Randomization is required by statistical consultants before they will help you analyze the experiment. (d) Randomization implies that it is not necessary to be careful during the experiment, during data collection, and during data analysis. (e) Randomization will tend to average out all other uncontrolled factors such as soil fertility so that they are not confounded with the treatment effects. Solution: e ................................................................................................................................................................................

79

Teste da lista de discussão (site AP-stat)

http://mathforum.org/kb/thread.jspa?forumID=67&threadID=1496711&messageID=5397416#5397416

In one study subjects were randomly given either 500 or 1000 milligrams of vitamin C daily, and the number of colds they came down with during a winter season was noted. In a second study people responded to a questionnaire asking about the average number of hours they sleep per night and the number of colds they came down with during a winter season. a. The first study was an experiment while the second was an observational study. b. The first study was an observational study while the second was a controlled experiment. c. Both studies were controlled experiments. d. Both studies were observational studies. e. None of the above is a correct statement. What is the correct answer? And why?

The answer is a. The first study has randomization and a treatment imposed. This is an experiment.The second study is only asking question not imposing a treatment. With out a treatment, this is an observational study.

80

dóga =/
Esta é apenas uma pré-visualização
3 mostrados em 80 páginas