Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas


trabalho de estatistica experimental, Manuais, Projetos, Pesquisas de Estatística Aplicada

trabalho realizado com avaliações de estatistica experimental

Tipologia: Manuais, Projetos, Pesquisas

2019

Compartilhado em 20/12/2019

abel-alves-de-souza-1
abel-alves-de-souza-1 🇧🇷

3 documentos

1 / 27

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
Experimentação Agrícola – Trabalho – Entrega em 13/07/18
Mestrando: Abel Alves de Souza
Karl Haruo Kimura de Moraes
1. [Baseado em Devore, 2006] Em um experimento em Blocos Casualizados (DBC), foi
avaliado o efeito de pequenas quantidades de Básico-H na permeabilidade do solo à
água. Os tratamentos foram (A) água com 0,001% de Básico-H derramada sobre o solo
controle, (B) água sem Básico-H em solo controle, (C) água com Básico-H derramada
sobre solo pré-tratado com Básico-H e (D) água sem Básico-H sobre solo pré-tratado
com Básico-H.
Tabela 1. Permeabilidade do solo à água nos diferentes tratamentos
Tratamento Bloco Permeabilidade
A 1 27,1
A 1 31,2
A 1 28,0
A 1 25,9
A 1 25,3
A 2 25,3
A 2 23,7
A 2 24,4
A 2 21,7
A 2 26,8
B 1 23,2
B 1 22,3
B 1 20,7
B 1 20,3
B 1 17,3
B 2 19,3
B 2 17,3
B 2 17,0
B 2 19,7
B 2 18,3
Tratamento Bloco Permeabilidade
C 1 58,9
C 1 54,2
C 1 49,2
C 1 47,9
C 1 38,2
C 2 48,8
C 2 47,8
C 2 40,2
C 2 44,0
C 2 46,4
D 1 46,7
D 1 49,6
D 1 46,1
D 1 40,9
D 1 39,4
D 2 37,1
D 2 37,5
D 2 29,6
D 2 35,1
D 2 36,2
Faça uma análise completa do experimento: faça uma análise descritiva, apresente
comentários, apresente o teste de hipóteses, o modelo matemático associado, as
suposições do modelo, teste as suposições, comente estes resultados, apresente a tabela
de análise de variância, comente o resultado, discuta a necessidade de fazer teste de
comparação de médias, se for necessário, cite o teste escolhido e faça o teste, apresente
o resultado do teste em uma tabela e faça a conclusão do experimento.
O resumo descritivo é apresentado na seguinte tabela:
Mínimo 1º quartil Mediana Média 3º quartil Máximo
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b

Pré-visualização parcial do texto

Baixe trabalho de estatistica experimental e outras Manuais, Projetos, Pesquisas em PDF para Estatística Aplicada, somente na Docsity!

Experimentação Agrícola – Trabalho – Entrega em 13/07/

Mestrando: Abel Alves de Souza

Karl Haruo Kimura de Moraes

  1. [Baseado em Devore, 2006] Em um experimento em Blocos Casualizados (DBC), foi avaliado o efeito de pequenas quantidades de Básico-H na permeabilidade do solo à água. Os tratamentos foram (A) água com 0,001% de Básico-H derramada sobre o solo controle, (B) água sem Básico-H em solo controle, (C) água com Básico-H derramada sobre solo pré-tratado com Básico-H e (D) água sem Básico-H sobre solo pré-tratado com Básico-H.

Tabela 1. Permeabilidade do solo à água nos diferentes tratamentos

Tratamento Bloco Permeabilidade A 1 27, A 1 31, A 1 28, A 1 25, A 1 25, A 2 25, A 2 23, A 2 24, A 2 21, A 2 26, B 1 23, B 1 22, B 1 20, B 1 20, B 1 17, B 2 19, B 2 17, B 2 17, B 2 19, B 2 18, Tratamento Bloco Permeabilidade C 1 58, C 1 54, C 1 49, C 1 47, C 1 38, C 2 48, C 2 47, C 2 40, C 2 44, C 2 46, D 1 46, D 1 49, D 1 46, D 1 40, D 1 39, D 2 37, D 2 37, D 2 29, D 2 35, D 2 36, Faça uma análise completa do experimento: faça uma análise descritiva, apresente comentários, apresente o teste de hipóteses, o modelo matemático associado, as suposições do modelo, teste as suposições, comente estes resultados, apresente a tabela de análise de variância, comente o resultado, discuta a necessidade de fazer teste de comparação de médias, se for necessário, cite o teste escolhido e faça o teste, apresente o resultado do teste em uma tabela e faça a conclusão do experimento. O resumo descritivo é apresentado na seguinte tabela: Mínimo 1º quartil Mediana Média 3º quartil Máximo

Desvio padrão: 12, Variância: 145, Coeficiente de variação: 36,2818% O coeficiente de variação observa que é de 36.2818% , assim apresenta alta dispersão. Demonstrando que os dados são heterogêneos, sendo observado no boxplot a seguir. Uma grande discrepância é notada entre a mediana e o valor máximo, o que complementa a afirmação de que há uma dispersão dos dados elevado. No entanto, pode ser influenciado pelo sistema do tratamento, em complemento são demonstrados os resumos descritivos para cada tratamento. (A) água com 0,001% de Básico-H Mínimo 1º quartil Mediana Média 3º quartil Máximo 21,70 24,62 25,60 25,94 27,02 31, Desvio padrão: 2, Variância: 6, Coeficiente de variação: 9,96894% , como vemos os dados segundo a classificação de Pimentel Gomes (1985) apresenta uma baixa dispersão dos dados. (B) água sem Básico-H Mínimo 1º quartil Mediana Média 3º quartil Máximo 17,00 17,55 19,50 19,54 20,60 23, Desvio padrão: 2, Variância: 4, Coeficiente de variação: 10,92%, também apresentando praticamente uma baixa dispersão dos dados segundo Pimentel Gomes (1985). (C) água com Básico-H Mínimo 1º quartil Mediana Média 3º quartil Máximo

H 1 : T i ≠ 0. Pelo menos um i.

Para o Delineamento em Bloco ao Acaso o modelo matemático é dado por:

Y ij = μ + T i + β j + eij

Para i = 1,2,3,...,k e j = 1,2,3,...,b

Y ij a j-ésima observação correspondente ao i-ésimo tratamento

(valor da variável resposta);

μ é a média geral, comum a todas as observações;

T i é o efeito do i-ésimo tratamento em Y e mede o desvio da média 𝜇𝑖

em relação a 𝜇;

eij representa o erro não observado associado a 𝑌𝑖𝑗;

E onde β^ j é o efeito do j-ésimo bloco e eij o erro associado à

observação Y^ ij.

As suposiçães associadas aos componentes do modelo são que os erros são variáveis aleatórias que atendem a:  São identicamente distribuídos;  Apresentam distribuição normal;  Apresentam a mesma variância em todos os tratamentos.  São identicamente distribuídos; Pelo teste de Bartlett e pelo software R, foi encontrado o p-valor de 0,003184<0,05, indicando que as variâncias não foram homogêneas,  Apresentam distribuição normal; Pelo teste de Shapiro-Wilk, apresentando-se o p-valor de 0,182>0,05, resultou que houve normalidade nos dados.  Apresentam a mesma variância em todos os tratamentos. Já em relação à independência, com algumas restrições, pode ser analisada graficamente, como a seguir.

Pela figura, os resíduos se distribuíram aleatoriamente em torno de zero. Não se observou nenhum padrão, o que indica que a variância foi constante e a relação entre as variáveis foi linear. A tabela de análise da variância é apresentada a seguir: GL SQ QM F0 Pr(>F) Tratamento 3 4893,4 1631,12 105,89 2,2e-16*** Bloco 1 231,4 231,36 15,02 0,0004468*** Resíduos 35 539,1 15, Pela tabela, seja Pr é menos que 0.05, por tanto, rejeita a hipótese nula. Isto é, houve influência dos tratamentos, sendo assim os tratamentos foram diferentes. Como isso, houve a necessidade de realizar um teste de comparação de média para identificar quais tratamentos foram diferentes entre si. Foi realizado o teste Tukey a 5% de significância, em que será apresentado a seguir. O teste Tukey foi proposto por John W. Tukey, e serve para comparar as médias após realizado teste de interação, que é a análise de variância (ANOVA). Para tanto é utilizado um valor conhecido como DMS, que é a diferença mínima significativa; assim calcula-se a diferença entre as médias. Tratamento Média Resultado C 47,56 A D 39,82 B A 25,94 C B 19,54 D Logo, a conclusão do experimento é que o tratamento C foi o tratamento com a média de permeabilidade maior, enquanto os outros tratamentos não apresentaram médias iguais, sendo assim todos os tratamentos são diferentes.

2. [Baseado em Devore, 2006] A resistência do concreto usado em construções comerciais tende a variar entre um lote e outro. Os dados a seguir resultam de um experimento de comparação de três métodos de tratamento em relação à resistência à compressão (MPa): Tabela 2. Resistência do concreto à compressão em função do método de tratamento Método A Método B Método C 34,7 23,7 34, 39,1 30,6 34, 32,6 32,2 35,

Desvio padrão: 0, Variância: 0, Coeficiente de variação: 3.80% Método (B) Mínimo 1º quartil Mediana Média 3º quartil Máximo 4,733 4,891 5,371 5,224 5,507 5, Desvio padrão: 0, Variância: 0, Coeficiente de variação: 6,944% Método (C) Mínimo 1º quartil Mediana Média 3º quartil Máximo 5,805 5,842 5,882 5,876 5,914 5, Desvio padrão: 0, Variância: 0. Coeficiente de variação: 0,779% Os quatros tratamentos são apresentados nos boxplots a seguir: Os valores encontrados de máximos e mínimos são razoavelmente mais próximos dos interquartis. Ainda mais, os coeficientes de variação dos tratamentos apresentam baixo dispersão, ou seja, os dados foram homogêneos. O teste da hipótese consiste em

H 0 : os efeitos dos tratamentos são nulos

Versus

H 1 : existe efeito do fator dos tratamentos

Assim sendo, matematicamente:

H 0 : T 1 = T 2 = T 3 = … = T K = 0

Versus

H 1 : T i ≠ 0. Pelo menos um i.

Para o Delineamento Experimental Inteiramente ao Acaso o modelo matemático é dado por:

Y ij = μ + T i + eij

Para i = 1,2,3,...,k e j = 1,2,3,...,b

Y ij a j-ésima observação correspondente ao i-ésimo tratamento

(valor da variável resposta);

μ é a média geral, comum a todas as observações;

T i é o efeito do i-ésimo tratamento em Y e mede o desvio da média 𝜇𝑖

em relação a 𝜇;

eij representa o erro não observado associado a 𝑌𝑖𝑗;

As suposiçães associadas aos componentes do modelo são que os erros são variáveis aleatórias que atendem a:  São identicamente distribuídos;  Apresentam distribuição normal;  Apresentam a mesma variância em todos os tratamentos.  São identicamente distribuídos; Pelo teste de Bartlett e pelo software R, foi encontrado o p-valor de 0,000005758<0,05, indicando que as variâncias não foram homogêneas,  Apresentam distribuição normal; Pelo teste de Shapiro-Wilk, apresentando-se o p-valor de 0,2751>0,05, resultou que houve normalidade nos dados.  Apresentam a mesma variância em todos os tratamentos. Já em relação à independência, com algumas restrições, pode ser analisada graficamente, como a seguir.

Portanto para obter resistência à compressão (Mpa) maior do concreto pode ser usado tanto o tratamento A ou C, pois os dois são significativamente iguais, tendo como decisão qual tratamento usar, observando outros parâmetros como o custo ou aplicação.

3. Dados os delineamentos experimentais estudados nesta disciplina (DIC, DBC e Fatorial): a. Cite o modelo associado a cada delineamento; O modelo associado a um delineamento experimental inteiramente ao acaso com um fator fixo é dado por: 𝑌𝑖𝑗=𝜇+𝑇𝑖+𝑒𝑖𝑗 Para 𝑖=1,2,…,𝑘 e 𝑗=1,2,…,𝑟𝑘 𝑌𝑖𝑗 é a j-ésima observação correspondente ao i-ésimo tratamento (valor da variável resposta); 𝜇 é a média geral, comum a todas as observações

N

i = 1 K

ri μi

Sendo 𝜇𝑖 a média populacional de Y no i-ésimo tratamento. E 𝑟𝑖 o número de unidades experimentais ou parcelas submetidas ao i-ésimo tratamento. Se 𝑟1=𝑟2=⋯=𝑟𝑘 temos

k

i = 1 K

μi

𝑇𝑖 é o efeito do i-ésimo tratamento em Y e mede o desvio da média 𝜇𝑖 em relação a 𝜇: 𝑇𝑖= 𝜇𝑖−𝜇 Já 𝑒𝑖𝑗 representa o erro não observado associado a 𝑌𝑖𝑗 𝑒𝑖=𝑌𝑖𝑗−𝑌𝑖∙̅ O modelo associado a um delineamento experimental em bloco ao acaso com um fator fixo é dado por: 𝑌𝑖𝑗=𝜇+𝑇𝑖+𝛽𝑗+𝑒𝑖𝑗 Para 𝑖=1,2,3,…,𝑘 e 𝑗=1,2,…,𝑏 E onde 𝛽𝑗 é o efeito do j-ésimo bloco e 𝑒𝑖𝑗 o erro associado à observação 𝑌𝑖𝑗. O modelo estatístico associado a um delineamento experimental fatorial com um fator fixo é dado por: 𝑌𝑖𝑗𝑘=𝜇+𝛼𝑖+𝛽𝑗+𝛼𝛽𝑖𝑗+𝑒𝑖𝑗𝑘 Para 𝑖=1,2,…,𝑎;𝑗=1,2,…,𝑏 e 𝑘=1,2,…,𝑟. Na equação, 𝛼𝑖 é o efeito do i-ésimo nível do fator A, definido por 𝛼𝑖=𝜇𝑖.-𝜇.

Enquanto 𝛽𝑗 é o efeito do j-ésimo nível do fator B, definido por 𝛽𝑗=𝜇.𝑗-𝜇. 𝛼𝛽𝑖𝑗 é o efeito da interação entre o i-ésimo nível do fator A e o j-ésimo nível do fator B, definido por 𝛼𝛽𝑖𝑗=𝜇𝑖𝑗−𝜇𝑖∙−𝜇∙𝑗+𝜇 𝑒𝑖𝑗𝑘 é o erro associado à observação 𝑌𝑖𝑗𝑘. b. Apresente as suposições associadas a cada modelo; Delineamento Inteiramente ao Acaso: As suposições associadas aos componentes do modelo são que os erros 𝑒𝑖𝑗 são variáveis aleatórias que atendem a:  São identicamente distribuídos;  Apresentam distribuição normal;  Apresentam a mesma variância em todos os tratamentos. Delineamento em Bloco ao Acaso: As suposições associadas aos componentes do modelo são que os erros 𝑒𝑖𝑗 são variáveis aleatórias que atendem a:  São identicamente distribuídos;  Apresentam distribuição normal;  Apresentam a mesma variância em todos os tratamentos. Delineamento Fatorial: As suposições associadas aos componentes do modelo são que os erros 𝑒𝑖𝑗 são variáveis aleatórias que atendem a:  São identicamente distribuídos;  Apresentam distribuição normal. c. Apresente um script do R que faça a validação das suposições de cada modelo (não esqueça de citar o pacote).  Delineamento Inteiramente ao Acaso dados <- read.table("pasta onde está o arquivo até o arquivo", header = T) ## lendo um conjunto de dados em txt, header = T tem nome das colunas na 1ª linha ## dados ## o R apresenta os dados após ter lido

ANÁLISE DAS PRESSUPOSIÇÕES DO MODELO

##Para facilitar a manipulação dos dados podemos attachar (anexar) o objeto "dados" que contém nossa ##variáveis de interesse, após este comando as variáveis ficarão na memória do R. Para apagar #o attach, preciso limpar lá no Environment.

#então existe normalidade. qqline(ex01$res) title("Grafico Normal de Probabilidade dos Resíduos") #Teste de Shapiro-Wilk para Normalidade shapiro.test(ex01$res)

O teste de Shapiro-Wilk é somente um dos vários testes para

normalidade dos dados, para este teste

H_0: os dados possuem distribuição normal de probabilidades

versus H_1: os dados não possuem distribuição

normal de probabilidades. A decisão é feita a partir do valor de p-

value, se este for menor que alpha%, rejeita-se

H_0, geralmente, se p-value <0.05 os dados não têm distribuição

normal de probabilidades. E neste caso,

transforma-se os dados.

#Independência: A independência, com algumas restrições, pode ser analisada graficamente, através de plot(ex01$fit, ex01$res, xlab="valores ajustados", ylab="resíduos") title("resíduos vs Preditos") #Ainda é possível avaliar algum tipo de dependência através da ordenação dos resíduos, caso exista uma ordem de obteção dos dados conhecida: plot(ex01$fit, order(ex01$res), xlab="valores ajustados", ylab="resíduos") title("resíduos vs Preditos") A ANOVA pode ser realizada através dos comandos abaixo: anv <- aov(dados$res ~ dados$metdo) ## cálculo da análise de variância ## anova(anv) ## demonstrativo da Tabela ANOVA

ou

summary(anv) qf(0.95, GLR,GLtrat) o teste de médias TUKEY é verificado através de: qtukey(0.95,3,27) ## valor da tabela de Tukey, para 5% ##

teste tukey

TukeyHSD(anv) ## teste Tukey, sem pacote "laercio" ## O teste de Scott Knott que também é um teste de médias é tido através dos comandos: ##ScottKnoot, também disponível do pacote laercio ##instalação de pacotes para o teste de Tukey e Scott-Knott install.packages("agricolae", dep=TRUE) install.packages("ScottKnott", dep=TRUE) install.packages("contrast", dep=TRUE) install.packages("multcomp", dep=TRUE) require(ScottKnott)

aplicando o teste de ScootKnott

sk <- SK(x=dados, y=dados$res, model="y~metdo", which="metdo", sig.level=0.05) summary(sk)  Delineamento em Bloco ao Acaso

Primeiramente, se faz a leitura dos dados. Note que o "endereço"

dos dados deve estar correto. dados <- read.table("D:/Mestrado - UNIOESTE Eng. de Energia na Agrícultura/Experimentação Agrícola/Dados/dados2.txt", header =

que alpha%, normalmente 5%, assim se p-value<0.05 rejeita H_

e os dados não são homocedásticos. #Normalidade: Graficamente, pode-se avaliar a normalidade dos resíduos fazendo hist(ex01$res, main="Histograma dos Resíduos") #ou stem(ex01$res) #ou qqnorm(ex01$res,ylab="Resíduos", main=NULL) #se o gráfico se assemelhar a uma reta crescente, #então existe normalidade. qqline(ex01$res) title("Grafico Normal de Probabilidade dos Resíduos") #Teste de Shapiro-Wilk para Normalidade shapiro.test(ex01$res)

O teste de Shapiro-Wilk é somente um dos vários testes para

normalidade dos dados, para este teste

H_0: os dados possuem distribuição normal de probabilidades

versus H_1: os dados não possuem distribuição

normal de probabilidades. A decisão é feita a partir do valor de p-

value, se este for menor que alpha%, rejeita-se

H_0, geralmente, se p-value <0.05 os dados não têm distribuição

normal de probabilidades. E neste caso,

transforma-se os dados.

#Independência: A independência, com algumas restrições, pode ser analisada graficamente, através de plot(ex01$fit, ex01$res, xlab="valores ajustados", ylab="resíduos") title("resíduos vs Preditos")

#Ainda é possível avaliar algum tipo de dependência através da ordenação dos resíduos, caso exista uma ordem de obteção dos dados conhecida: plot(ex01$fit, order(ex01$res), xlab="valores ajustados", ylab="resíduos") title("resíduos vs Preditos") a ANOVA de blocos é realizada através de : anv <- aov(Perm ~ Trat + Bloco) ## cálculo da análise de variância

já a verificação da interação entre tratamento e bloco:

Verificando a interação entro Bloco e Tratamento

interaction.plot(Trat, Bloco, Perm) interaction.plot(Bloco, Trat, Perm) residuos <- (anv$residuals) residuos  Delineamento Fatorial

Primeiramente, se faz a leitura dos dados.

dados <- read.table("D:/Mestrado - UNIOESTE Eng. de Energia na Agrícultura/Experimentação Agrícola/Dados/dados3.txt", header = T) ## lendo um conjunto de dados em txt, header = T tem nome das colunas na 1ª linha ## dados ## o R apresenta os dados após ter lido

ANÁLISE DAS PRESSUPOSIÇÕES DO MODELO

##Para facilitar a manipulação dos dados podemos attachar (anexar) o objeto "dados" que contém nossa

stem(ex01$res) #ou qqnorm(ex01$res,ylab="Resíduos", main=NULL) #se o gráfico se assemelhar a uma reta crescente, #então existe normalidade. qqline(ex01$res) title("Grafico Normal de Probabilidade dos Resíduos") #Teste de Shapiro-Wilk para Normalidade shapiro.test(ex01$res)

O teste de Shapiro-Wilk é somente um dos vários testes para

normalidade dos dados, para este teste

H_0: os dados possuem distribuição normal de probabilidades

versus H_1: os dados não possuem distribuição

normal de probabilidades. A decisão é feita a partir do valor de p-

value, se este for menor que alpha%, rejeita-se

H_0, geralmente, se p-value <0.05 os dados não têm distribuição

normal de probabilidades. E neste caso,

transforma-se os dados.

#Independência: A independência, com algumas restrições, pode ser analisada graficamente, através de plot(ex01$fit, ex01$res, xlab="valores ajustados", ylab="resíduos") title("resíduos vs Preditos") #Ainda é possível avaliar algum tipo de dependência através da ordenação dos resíduos, caso exista uma ordem de obteção dos dados conhecida: plot(ex01$fit, order(ex01$res), xlab="valores ajustados", ylab="resíduos") title("resíduos vs Preditos") a verificação quanto a igualdade ou diferença entre as variâncias é realizada pela ANOVA:

anv <- aov(dados$res ~ dados$metdo) ## cálculo da análise de variância ## anova(anv) ## demonstrativo da Tabela ANOVA ##

ou

summary(anv) qf(0.95, 2,27) ## encontra o valor da tabela F para o nível de 5% de significância com os graus de liberdade dos resíduos e dos tratamentos model.tables(anv,"means") ## médias geral e por tratamento ## o teste de igualdade ou diferença entre as médias dos tratamentos é realizado pelo teste TUKEY: qtukey(0.95,2,27) ## valor da tabela de Tukey, para 5% ##

teste tukey

TukeyHSD(anv) ## teste Tukey, sem pacote "laercio" ##

4. Em um planejamento experimental, foi realizado um estudo sobre o rendimento de grãos de crambe, considerando a influência de dois fatores: preparo do solo (Fator A) e variedade da semente (Fator B). A Tabela 3 apresenta os valores do rendimento (valores fictícios): Tabela 3. Rendimento de grãos do crambe [Mg/ha] sob diferentes variedades de semente e preparo do solo Prepar o Variedade Rendimento PDRC V1 3, PDRC V2 2, PDRC V3 3, PDRC V1 2, PDRC V2 2, PDRC V3 2, PD V1 1, PD V2 1, PD V3 2, PD V1 1, PD V2 2, PD V3 2,

  • PDRC: Plantio Direto com Rotação de Culturas, PD: Plantio Direto