











Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Encontra documentos específicos para os exames da tua universidade
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Alguns exercícios resolvidos.
Tipologia: Exercícios
1 / 19
Esta página não é visível na pré-visualização
Não perca as partes importantes!












Delineamento Inteiramente Casualizado
mais simples dos delineamentos. Os tratamentos se distribuem ao acaso em todas as unidades experimentais e o número de repetições por tratamento pode ser igual ou diferente. É muito útil para o estudo de métodos e técnicas de trabalho de laboratório, ensaios de vegetação e em experimentos com animais. Para sua aplicação, há necessidade que o meio atue de forma uniforme em todas as unidades experimentais e que estas sejam facilmente identificadas para receber o tratamento. Vamos começar com um exemplo:
Tratamento Repetições 1 2 3 4
Nº de repetições ri
Total Média Variância
Nível baixo (T 1 ) Nível médio (T 2 ) Nível alto (T 3 )
1, 3, 3,
1, 4, 4,
3, 3, 3,
1, 2, 5,
4 4 4
8, 13, 18,
2, 3, 4,
0, 0, 0, Total 12 40,
Este é um estudo experimental com 12 unidades experimentais (amostras de tecido pancreático) e k=3 tratamentos. Cada tratamento é um nível de fator simples: concentração de glicose. Existem 4 repetições para cada tratamento. Os dados, quantidade de insulina liberada pelo tecido pancreático podem ser considerados como três amostras aleatórias, cada uma com r=4 repetições, ou de tamanho r=4 sorteadas de três populações. Dado que os tratamentos são designados às unidades experimentais completamente ao acaso, este delineamento é denominado de DELINEAMENTO INTEIRAMENTE AO ACASO (DIC). Em geral em um DIC, um número fixo de k tratamentos são sorteados às N unidades experimentais de tal forma que o i-ésimo tratamento é sorteado a exatamente ri unidades experimentais. Assim, ri é o número de repetições do i-ésimo tratamento e r 1 ++++ r 2 ++++ r 3 ++++ ... ++++ rk ==== N. No caso em que ri são
iguais, i.é., r 1 ==== r 2 ==== r 3 ==== ... ==== rk ==== r , então N ==== rk e o delineamento é
balanceado. Notação:
Delineamento Inteiramente Casualizado
Repetições Tratamento 1 2 3 ... j ... r Total Média (^1) y 11 y 12 y 13 ... ... ... y1r (^) + y (^1) +++ y 1 ++++ (^2) y 21 y 22 y 23 ... ... ... y2r (^) + y (^2) +++ y 2 ++++ 3 y 31 y 32 y 33 ... ... ... y3r (^) y (^2) ++++ y 2 ++++
... i... ....... ....... ....... ....... ... ... ... y ij . . . ....... ....... ....... .......
k yk1 yk2 yk3 ... ... ... ykr (^) y (^) k ++++ yk ++++
N=rk ++++++++
y y ++++++++
Convenções:
sendo,
r
k
i 1
Delineamento Inteiramente Casualizado
6. PARTIÇÃO DA SOMA DE QUADRADOS. Voltemos ao quadro de representação das observações no DIC
Repetições Tratamento 1 2 3 ... j ... r Total Média 1 y 11 y 12 y 13 ... ... ... y1r (^) y 1 ++++ y 1 ++++ 2 y 21 y 22 y 23 ... ... ... y2r (^) y (^2) ++++ y 2 ++++ 3 y 31 y 32 y 33 ... ... ... y3r (^) y (^2) ++++ y 2 ++++
... i... ....... ....... ....... ....... ... ... ... y ij . . . ....... ....... ....... .......
k yk1 yk2 yk3 ... ... ... ykr (^) y (^) k ++++ yk ++++
N=rk ++++++++
y y ++++++++
Podemos identificar os seguintes desvios:
( y (^) ij −−−− y ++++ ++++ ) ==== ( yij −−−− yi ++++ ) ++++ ( yi ++++−−−− y ++++++++ ) , a qual diz que a “ a variação de uma observações em relação à média geral amostral é igual à soma variação desta observação em relação à média de seu grupo com a variação da média do i-ésimo tratamento em que se encontra esta observação em relação à média geral amostral “. Elevando-se ao quadrado os dois membros da identidade acima e somando em relação aos índices i e j, obtemos:
2 i
k
i 1
i
2
k
i 1
r
j 1
k
i 1
r
j 1
ij i
2 yij y y y r y y
i i ( ) ( ) ( ++++ ++++++++ ) ==== ==== ==== ==== ====
os duplos produtos são nulos. O termo
==== ====
k
i 1
r
j 1
2 ij
i ( y y ) ,
Delineamento Inteiramente Casualizado
é denominado de Soma de Quadrados Total e vamos denotá-lo por SQT .O número de graus de liberdade associado à SQT é kr - 1, ou N – 1, pois temos N observações e a restrição
==== ====
k
i 1
r
j 1
ij
i ( y y ) 0.
A parcela:
==== ====
k
i 1
r
j 1
ij i
i ( y y ) ,
É denominada de Soma de quadrados Residual , representada por SQR, e é uma medida da homogeneidade interna dos tratamentos. Quanto mais próximas estiverem as observações dentro de cada grupo (tratamento), menor é a SQR. Notem que a magnitude da SQR não depende da diferença entre as médias dos tratamentos. Considerando apenas o i-ésimo tratamento, temos que
====
r i
j 1
2 ( y (^) ij yi )
Possui ri – 1 graus de liberdade. Assim, o número de graus de liberdade associado à SQR é:
====
jk
i 1
( ri 1 ) kr k N k.
A componente (^) i^2
k
i 1
tratamentos e por isso é denominada de Soma de Quadrados Entre Tratamentos , representada por SQTr. Quanto mais diferentes entre si forem as médias dos tratamentos, maior será a SQTr. Desde que temos k tratamentos e a restrição de que
r yi y 0
k
i 1
A SQTr possui k - 1 graus de liberdade. Com esta notação, podemos escrever que:
SQT = SQR + SQTr.
6. QUADRADOS MÉDIOS. Dividindo a SQR e SQTr pelos correspondentes graus de liberdade, obtemos, respectivamente o Quadrado Médio Residual ( QMR ) e o Quadrado Médio Entre Tratamentos ( QMTr ), isto é,
k 1
SQTr e QMTr N k
Delineamento Inteiramente Casualizado
8. QUADRO DA ANÁLISE DE VARIÂNCIA (ANOVA). Dispomos as expressões necessárias ao teste na Tabela abaixo denominada de Quadro de Análise de Variância (ANOVA).
Fonte de g.l. SQ QM Fc variação
Entre Tratamentos
k - 1 (^) N
r
r Y 2
i (^1) i
2 i (^) i ( (^) ++++++++ )
====
SQTr QMTr −−−−
QMTr
Resíduo (dentro dos tratamentos)
==== (^) ==== ====
k
i 1
r
j 1
k
i 1
2 2 i ij (^) r
N k
==== ====
k
i 1
r
j 1
2 2 ij (^) N
Pode-se provar que:
k
i 1
i
2 k 1
r
( ) , ou seja, QMTr é um estimador não
verdadeira.
9. DETALHES COMPUTACIONAIS. Apresentaremos alguns passos que facilitam os cálculos das somas de quadrados da ANOVA. - Calcule a correção para a média N
y CM
SQT y CM
k
i 1
r
j 1
2 ij
i
==== ====
CM r
SQTr
ri
i (^1) i
2 ==== i^ −−−−
====
++++ (^) ;
Quadrado Médio Residual ( QMR ) N k
eQMR k 1
SQTr QMTr −−−−
QMTr Fc ====
Notem que estas fórmulas computacionais assumem que existe ri repetições para o i-ésimo tratamento; consequentemente, para um
Delineamento Inteiramente Casualizado
experimento balanceado com r repetições para cada tratamento, ri deve ser substituído por r. Estas várias soma de quadrados obtidas nestes cinco passos podem ser resumidas no quadro da ANOVA apresentado no item 8.
10. EXEMPLO 1: Vamos considerar os dados apresentados no item 1. Desejamos testar a hipótese nula
H parapelo menosumpari j
1 i j
0 1 2 3 ≠≠≠≠ ≠≠≠≠
Os cálculos para montar-mos o quadro da ANOVA são: temos k = 3, r = 4, e N = 3x4 =12. Então
s N k 12 3 9
Total N 1 12 1 11 Trat k 1 3 1 2 ==== −−−− ==== −−−− == ==
Re
2 ,
SQTr
2 2 2 , , ,
515 e QMR 2
QMTr ,
QMTr Fc , ,
O quadro da ANOVA para a variável insulina liberada é o seguinte:
Fonte de g.l. SQ QM Fc variação Entre Tratamentos
2 10,30 5,15 9,
Resíduo (dentro dos tratamentos)
9 4,98 0,
Das tabelas das distribuições F, temos que F (^) ( 2 , 9 , 0 , 05 ) ==== 4 , 257 e F ( 2 , 9 , 0 , 01 ) ==== 8 , 022. O valor Fc =9,31 é maior do que
estes valores tabelados, então rejeitamos a hipótese nula H 0 a um nível
significativo a 5%).
Delineamento Inteiramente Casualizado
11. EXEMPLO 2: Em um experimento em que se mediu o peso corporal (kg), 19 porcos foram distribuídos aleatoriamente a 4 grupos. Cada grupo foi alimentado com dietas diferentes. Deseja-se testar se oos pesos dos porcos são os mesmos para as 4 dietas. Desejamos testar a hipótese nula
H parapelo menosumpari j
1 i j
0 1 2 3 4 ≠≠≠≠ ≠≠≠≠
As observações obtidas são
Tratamento Repetições 1 2 3 4 5
Nº de repetiç ões ri
Total
Dieta 1 Dieta 2 Dieta 3 Dieta 4
60, 68, 102, 87,
57, 67, 102, 84,
65, 74, 100, 83,
58, 66, 96, 85,
61, 69,
90,
5 5 4 5
303, 346, 401, 431, Total 19 1482,
Temos um experimento desbalanceado com número de repetições desigual para os tratamentos. Então, os cálculos para montar-mos o quadro da ANOVA são:
Total N 1 19 1 18 Trat k 1 4 1 3 ==== −−−− ==== −−−− ====
Re
2 ,
SQTr
2 2 2 2
1408783 e QMR 3
QMTr ,
QmR
QMTr Fc ==== ==== ==== ,
Delineamento Inteiramente Casualizado
O quadro da ANOVA para a variável peso (kg) é o seguinte:
Fonte de g.l. SQ QM Fc variação Entre Tratamentos
3 4226,348 1408,783 165
Resíduo (dentro dos tratamentos)
15 128,50 8,
Das tabelas das distribuições F, temos que F (^) ( 3 , 15 , 0 , 05 ) ==== 3 , 287 e F ( 3 , 15 , 0 , 01 ) ==== 5 , 417. O valor Fc =165 é maior que estes
probabilidade (se é significativo a 1%, logo também é significativo a 5%). Graficamente a regra de decisão fica
dos porcos são diferentes para pelo menos duas dietas. Atenção!!!! Com um pouco de prática, estes cálculos simples são facilmente e rapidamente feitos com o uso de uma calculadora de mão. Mais facilmente, ainda, com um bom programa computacional estatístico, e claro, juntamente com um computador. (Fazer este exemplo no Minitab)
Delineamento Inteiramente Casualizado
y 146 parai 3 4
IC 95 y 21314
y 131 parai 12 e 4 5
IC 95 y 21314
i i i
i i i
++++ ++++
++++ ++++
Dieta 1 Dieta 2 Dieta 3 Dieta 4
Problema: identificar quais as Dietas (tratamentos) que tiveram efeitos não nulos sobre o peso dos suínos.
Como segundo exemplo, vamos considerar os dados do experimento apresentado no item 1, cujos cálculos foram mostrados no item 10. As médias destes dados são:
y 339
450 e 4
344 y 4
223 ; y 4
y (^123)
,
++++ ++++
0372 4
r
Assim, os intervalos são:
y 0841 4
IC (^) i 95 yi (^2262) i ,
( μ ; %) ==== (^) ++++±±±± , ==== ++++±±±±
Nível baixo de glicose
Nível médio de glicose
Nível alto de glicose μ (^) i 2,23^ 3,44^ 4, IC ( μ i , 95 %) (1,389; 3,071)^ (2,599; 4,281)^ (3,659; 5,341)
Problema: identificar quais os níveis de glicose (tratamentos) que tiveram efeitos não nulos sobre a liberação de insulina dos tecidos.
13 COEFICIENTES DE DETERMINAÇÃO ( R^2 ) E DE VARIAÇÃO ( CV ). A parte da Soma de Quadrados Total ( SQT ), a variação total nas observações , que pode ser explicada pelo modelo matemático do DIC, é denominada de coeficiente de determinação. Assim, o coeficiente de
SQTr R 2 ====.
Delineamento Inteiramente Casualizado
Pode ser verificado que 0 ≤≤≤≤ R^2 ≤≤≤≤ 1 e que R 2 ==== 1 quando toda variabilidade nas observações esta sendo explicada pelo modelo matemático do DIC. A variabilidade entre as unidades experimentais de experimentos envolvendo diferentes unidades de medidas e/ou tamanhos de parcelas pode ser comparada pelos coeficientes de variação , os quais expressam o desvio padrão por unidade experimental como uma porcentagem da média geral do experimento, ou seja,
100 y
++++ ++++
mas, da ANOVA sabemos que S ==== QMR , daí resulta que
100 y
++++ ++++
Como exemplo vamos considerar os dados do experimento apresentado no item 1, cujos cálculos foram mostrados no item 10. Neste exemplo temos:
SQTr SQT 1528 eSQTr 1030 entãoR^2 , ,
y
++++++ ++ Concluímos que 67,4% da variabilidade que existe nas observações deste experimento são explicadas pelo modelo matemático do DIC e que este experimento apresenta um coeficiente de variação de aproximadamente 22%.
14. CHECANDO AS VIOLAÇÕES DAS SUPOSIÇÕES DA ANOVA. Falando de um modo geral, o teste F da ANOVA não é muito sensível às violações da suposição de distribuição normal. Ele também é moderadamente insensível às violações de variâncias iguais, se os tamanhos das amostras são iguais e não muito pequenas em cada tratamento. Entretanto, variâncias desiguais podem ter um efeito marcante no nível do teste, especialmente se amostras pequenas estão associadas com tratamentos que têm as maiores variâncias. Existe uma série de procedimentos para se testar se as suposições da ANOVA são violados. Entre estes temos o teste de Anderson-Darling, teste de Shapiro-Wilks e teste de Kolmogorov-Smirnov, que testam a normalidade da população. A igualdade das variâncias (homocedasticidade) pode ser testada pelos testes de Bartlett e de Levene. Com o advento dos modernos computadores, métodos gráficos são ferramentas muito populares para checar as violações das hipóteses da ANOVA. Alguns destes métodos gráficos mais comumente usados para checar as suposições da ANOVA são baseados em gráficos denominados gráficos dos resíduos. Resíduos. O resíduo correspondente a uma observação y (^) ij é definido
como:
Delineamento Inteiramente Casualizado
O Quadro abaixo apresenta os dados, o valor estimado pelo modelo, os resíduos e os percentis associados:
i j Yij Yest eij R(eij) Pij qij 1 1 1.59 2.23 -0.64 1 0.077 -1. 1 2 1.73 2.23 -0.50 5 0.385 -0. 1 3 3.64 2.23 1.41 12 0.923 1. 1 4 1.97 2.23 -0.26 6 0.462 -0. 2 1 3.36 3.44 -0.08 7 0.538 0. 2 2 4.01 3.44 0.57 10 0.769 0. 2 3 3.49 3.44 0.05 8 0.615 0. 2 4 2.89 3.44 -0.55 4 0.308 -0. 3 1 3.92 4.50 -0.58 3 0.231 -0. 3 2 4.82 4.50 0.32 9 0.692 0. 3 3 3.87 4.50 -0.63 2 0.154 -1. 3 4 5.39 4.50 0.89 11 0.846 1.
e o gráfico q q normal ( e (^) ij xqij ) fica sendo:
P-Value: 0. A-Squared: 0. Anderson-Darling Normality Test N: 12 StDev: 0. Average: 0.
-0.5 0.0 0.5 1.0 1.
. . . . . . . . .
Probability
eij
Normal Probability Plot
Delineamento Inteiramente Casualizado
e os gráficos do Histograma e do Box – Plot dos resíduos fica:
-0.6 0.0 0.6 1.
95% Confidence Interval for Mu
-0.5 0.0 0.
95% Confidence Interval for Median
Variable: eij
A-Squared:P-Value: MeanStDev VarianceSkewness KurtosisN Minimum1st Quartile Median3rd Quartile Maximum -0.
-0.
0.5490. 0.0000000. 0.4526680. 1.89E-02 12 -0.64250-0. -0.170000.
Anderson-Darling Normality T est
95% Confidence Interval for Mu 95% Confidence Interval for Sigma 95% Confidence Interval for Median
Descriptive Statistics
Pelos gráficos q q normal , pelo histograma e pelo Box-Plot é razoável supor a normalidade para os dados de liberação de insulina. Pelo teste de
normalidade de Anderson-Darling , A^2 ==== 0 , 549 ep ==== 0 , 123 ( p >>>> 0 , 05 ) , o
qual testa a hipótese
2 1 ij
2 0 ij
1
0
H e nãotemN 0
H e N 0
ou
H apopulaçãoamostradanãotemdistruiçãonormal
H apopulaçãoamostradatemdistruiçãonormal
σ
σ
Concluímos que não rejeitamos H 0 , logo é razoável supor a normalidade
para os dados de liberação de insulina. Para o teste da homogeneidade da variância somente apresentaremos os resultados dos testes de Bartlett e Levene fornecidos pelo Minitab:
Delineamento Inteiramente Casualizado
15. RESUMO. O DIC é mais útil onde não existe nenhuma fonte de variação identificável entre as unidades experimentais, exceto às dos efeitos dos tratamentos. É o mais flexível com respeito ao arranjo físico das unidades experimentais. Ele maximiza os graus de liberdade para a estimação da variância por unidade experimental (erro experimental ou erro residual) e minimiza o valor da estatísca F requerido para a significância estatística.
Leitura complementar: