






Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Encontra documentos específicos para os exames da tua universidade
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Burrice e profissao
Tipologia: Trabalhos
1 / 12
Esta página não é visível na pré-visualização
Não perca as partes importantes!







Identificação do problema e das duas variáveis.
Quer-se testar se existe ou não correlação linear entre X = toneladas de adubo orgânico por ha e Y = produção da cultura A por ha. Para tanto é realizado um experimento com duração de 25 anos que mostrou os resultados da tabela. Verificar se existe relacionamento linear entre as duas variáveis.
N X Y 1 5 56 2 7 16 3 12 78 4 4 63 5 45 12 6 13 43 7 1 0 8 65 29 9 54 90 10 18 12 11 9 17 12 3 7 13 34 13 14 2 32 15 0 0 16 53 27 17 11 42 18 56 75 19 23 87 20 33 100 21 35 80 22 36 81 23 37 82 24 38 83 25 39 84
Mediana, moda e média
Mediana – é o valor que divide o conjunto de dados ordenados em duas partes iguais, ou seja, 50% das unidades observadas possuem valores menores ou iguais ao valor mediano e as demais 50% possuem valores acima da mediana. Para se obter o valor da mediana são necessários os seguintes passos:
Agora, se, de um total de n valores observados (ou observações), , então a média de X pode ser reescrita como:
Onde: ni – é frequência absoluta do valor observado X1; é o total de observações;
A partir das variáveis X e Y, temos:
Desvio padrão (S)
É a medida de dispersão mais geralmente empregada, pois leva em consideração a totalidade dos
valores da variável em estudo. É um indicador de variabilidade bastante estável. O desvio padrão baseia-se nos desvios em torno da média aritmética e a sua fórmula básica pode ser traduzida
como: a raiz quadrada da média aritmética dos quadrados dos desvios e é representada por S.
Observação: Quando nosso interesse não se restringe à descrição dos dados mas, partindo da amostra , visamos tirar inferências válidas para a respectiva população, convém efectuar uma modificação,
Correlação entre as variáveis X e Y.
Para saber se há ou não correlação linear entre estas duas variáveis na população de onde foi retirada esta amostra é necessário realizar um teste de hipóteses, ou seja, é preciso testar: (Não existe relacionamento linear na população); (Existe relacionamento linear na população).
A tabela abaixo mostra os cálculos necessários para se obter o coeficiente de correlação para esta amostra das variáveis X e Y.
N 1 5 56 280 25 3136 2 7 16 112 49 256 3 12 78 936 144 6084 4 4 63 252 16 3969 5 45 12 540 2025 144 6 13 43 559 169 1849 7 1 0 0 1 0 8 65 29 1885 4225 841 9 54 90 4860 2916 8100 10 18 12 216 324 144 11 9 17 153 81 289 12 3 7 21 9 49 13 34 13 442 1156 169 14 2 32 64 4 1024 15 0 0 0 0 0 16 53 27 1431 2809 729 17 11 42 462 121 1764 18 56 75 4200 3136 5625 19 23 87 2001 529 7569 20 33 100 3300 1089 10000 21 35 80 2800 1225 6400 22 36 81 2916 1296 6561 23 37 82 3034 1369 6724 24 38 83 3154 1444 6889 25 39 84 3276 1521 7056 Total 633 1209 36894 24314 85366
É mais conveniente usar para medida de correlação, o coeficiente de correlação linear de Pearson, como estimador de , definido por:
Logo:
O coeficiente de correlação rXY linear é um número puro que varia de – 1 a +1 e sua interpretação dependerá do valor numérico e do sinal, como segue:
Tal que a correlação das variáveis X = toneladas de adubo orgânico por ha e Y = produção da cultura A por ha é correlação positiva, porque o coeficiente rXY é igual a 0,000421 e encontra- se em , tal pensamento fica.
Com o resultado obtido do coeficiente de correlação pode-se ainda usar-se o seu valor aproximando, logo , dai que a sua análise será traduzindo uma correlação nula.
Análise do diagrama de dispersão
O diagrama de dispersão mostrará que a correlação será tanto mais forte quanto mais próximo estiver o coeficiente de – 1 ou +1, e será tanto mais fraca quanto mais próximo o coeficiente estiver de zero. a) Correlação perfeita negativa (rxy = -1): quando os pontos estiverem perfeitamente alinhados, mas em sentido contrário, a correlação é denominada perfeita negativa; b) Correlação negativa (-1 < rxy < 0): a correlação é considerada negativa quando valores crescentes da variável X estiverem associados a valores decrescentes da variável Y, ou valores decrescentes de X associados a valores crescentes de Y; c) Correlação nula (rxy = 0): Quando não houver relação entre as variáveis X e Y, ou seja, quando os valores de X e Y ocorrerem independentemente, não existe correlação entre elas;
Coeficiente de determinação ou de explicação
Indica a proporção de variação da variável independente que é explicada pela variável dependente, ou seja, é uma ferramenta que avalia a qualidade do ajuste.
Quanto mais próximo da unidade o R² estiver, melhor a qualidade do ajuste. O seu valor fornece a proporção da variável y explicada pela variável x através da função ajustada. Se R^2 for igual a 1, isto significa que todos os pontos observados se situam “exactamente” sobre a recta de regressão. Tendo-se, neste caso, um ajuste perfeito. As variações da variável Y são 100% explicadas pelas variações da variável X, não ocorrendo desvios em torno da função estimada. Por outro lado, se R^2 = 0, isto quer dizer que as variações de Y são exclusivamente aleatórias e explicadas pelas variações de outros factores que não X.
Dados: Seja e um outro caso seja dado por devido o arredondamento do primeiro resultado. Se tem-se: Se tem-se:
É a proporção que Y é explicada por X; ou seja; 0% da variação da produção da cultura A por ha é explicado pelas toneladas de adubo orgânico por ha. Como o coeficiente de explicação para o problema identificado a prior é igual a zero, significa que as variações de Y = produção da
0
20
40
60
80
100
120
0 10 20 30 40 50 60 70
Y = produção da cultura A por ha
X = toneladas de adubo orgânico por ha
cultura A por ha não são explicadas pelas variações de X = toneladas de adubo orgânico por ha, mas sim por outros factores.