



Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Encontra documentos específicos para os exames da tua universidade
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
aulas basicas de estatistica
Tipologia: Notas de aula
1 / 6
Esta página não é visível na pré-visualização
Não perca as partes importantes!




Aula 6
Coeficiente de Correlação linear e Regressão
Introdução Estudamos ate aqui experimentos onde é envolvida apenas 1 variável aleatória. Em muitas situações. no entanto precisamos observar duas ou mais variáveis em simultaneamente para analisarmos características em conjunto. Por exemplo, experimentos com misturas de mistas de cimento e cal hidratada para analisar resistência a compressão ou ainda modulo de deformação. Nestes casos podemos experimentar diferentes dosagens de cal/cimento e submeter o produto a testes de compressão e resistência a deformação e analisar o comportamento das amostras. Definição: Sejam – um experimento e S um espaço amostral associado a –
Sejam ᡐ 㐄 ᡶ䙦ᡱ䙧 ᡗ ᡑ 㐄 ᡷ䙦ᡱ䙧 duas funções cada uma associada um número real a um resultado do experimento ᡱ ᒈ ᡅ. Denominamos (X;Y) uma variável aleatória bidimensional (algumas vezes chamada de vetor aleatório).
Coeficiente de Correlação Um parâmetro importante associado a uma variável aleatória bidimensional é o coeficiente de correlação. Este parâmetro expressa o grau de dependência linear entre duas vaiáveis aleatórias. Dado um conjunto de n pares de duas variáveis aleatórias X e Y, do ponto de vista amostral o coeficiente de correlação é definido por:
‥〥,〦 㐄
↖↑⢀❸ 䙦ᡦ ㎘ 1䙧ᡅ〥ᡅ〦
Exemplo: A quantidade de chuva é um fator importante na produtividade agrícola. Para medir esse efeito um experimento foi feito. Oito diferentes regiões produtoras de soja foram estudadas, o índice pluviométrico, em milímetros (X) e a produção, em toneladas (Y) foram anotadas. Vamos determinar o coeficiente de variação. i 1 2 3 4 5 6 7 8 X 120 140 122 150 115 190 130 118 Y 40 46 45 37 25 54 33 30
Com auxilio de uma calculadora obtemos:
㔳 ᡶ〶 㐄 1085
⡶
〶⢀⡩
⡶
〶⢀⡩
⡶
〶⢀⡩
⡶
〶⢀⡩
⡶
〶⢀⡩
Substituindo os valores na expressão temos:
‥〥,〦 㐄 43245 ㎘ 8 㐁 135,63 㐁 38, 㒓䙰151533 ㎘ 8 㐁 䙦135,63䙧⡰䙱䙰12640 ㎘ 8 㐁 䙦38,75䙧⡰䙱^
Portanto, a correlação entre o índice pluviométrico e a produção de soja é positiva e satisfatória. Isto indica que regiões com maiores índices de chuva tendem a produzir mais soja.
Exercício
i 1 2 3 4 5 6 X 0 0,10 0,20 0,30 0,40 0, Z 22,1 20,7 17,3 15,9 14,2 12,
Determine os coeficientes de correlação linear e analise os resultados.
Um estudo foi feito junto a um escritório de engenharia civil para relacionar as variáveis anos de estudo (X) e o número de diferentes empregos nos últimos 5 anos (Y). Determine e interprete o coeficiente de correlação linear. X 5 6 7 8 9 10 Y 5 4 2 3 2 1
(Magalhães) - Está sendo estudado o efeito do teor de ferro na capacidade de carga de vigas de concreto. Os dados abaixo representam os resultados de medidas obtidas em uma amostra. Obtenha e interprete o coeficiente de correlação linear.
De acordo com o coeficiente de correlação, percebemos que a substancia influencia positivamente no aumento de peso do gado. Para analisar a maneira como estas variáveis se comportam construímos um gráfico de dispersão.
Note que a disposição dos pontos no plano cartesiano sugere uma reta. Podemos estimar uma reta que minimize os erros entre a reta estimada e os pontos. Um modelo teórico pode ser construído para ajustar esta reta através do método dos Mínimos Quadrados. Observe ainda que podemos associar o coeficiente de correlação linear a tendência de alinhamento dos pontos, sendo assim, coeficiente de correlação próximo de 1 (um) indicam a tendência a uma reta crescente, coeficiente de correlação próximos de -1 indicam a tendência a uma reta decrescente e coeficientes de correlação próximos de zero não indicam uma reta.
‥〥,〦 㐄 0,97 ‥〥,〦 㐄 0,01 ‥〥,〦 㐄 ㎘0, ‐ 㐈 0 ‐ 㐇 0
Modelo teórico de ajuste da reta ᡑ 㐄 ㎗ ‐ᡐ ㎗ ᡗ Onde: 㐄 ᡕᡧᡗᡘᡡᡕᡡᡗᡦᡲᡗ ᡤᡡᡦᡗᡓᡰ ᡖᡓ ᡰᡗᡲᡓ 䙦ᡡᡦᡲᡗᡰᡕᡗᡨᡲᡧ䙧 ‐ 㐄 ᡕᡧᡗᡘᡡᡕᡡᡗᡦᡲᡗ ᡓᡦᡙᡳᡤᡓᡰ ᡖᡓ ᡰᡗᡲᡓ 䙦ᡡᡦᡕᡤᡡᡦᡓçãᡧ䙧 ᡗ 㐄 ᡗᡰᡰᡧ ᡖᡧ ᡓᡢᡳᡱᡲᡗ A variável aleatória “e” representa o desvio entre as observações Y e a reta teórica ( ㎗ ‐ᡐ䙧. A variável Y é denominada variável dependente e a variável X é chamada variável independente ou explicativa. Os parâmetros do modelo são desconhecidos e precisam ser estimados de acordo com algum critério.. Um dos critérios utilizados é o dos mínimos quadrados. Utilizando recursos matemáticos é possível escrever os estimadores de mínimos quadrados para ᡗ ‐. Temos então:
0
4
8
12
16
20
24
28
0 1 2 3 4 5 6 7 Concentração (mg/L)
Ganho de pes
o (kg)
y = -2,4449x + 23,
0
4
8
12
16
20
24
28
0 1 2 3 4 5 6 7
y = 2,5681x + 9,
0
4
8
12
16
20
24
28
0 1 2 3 4 5 6 7 0
(^105) 1520
2530
3540
45
0 2 4 6 8
Com base nos valores da concentração de substancia oferecida ao gado e ganho de peso estimamos a reta. X 0,2 0,5 0,6 0,7 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0 5,5 6, Y 9,4 11,4 12,3 10,2 11,9 13,6 14,2 16,2 16,2 17,7 18,8 19,9 25,5 24,7 23,
㔳 ᡶ〶
ぁ
〶⢀⡩
ᡷ〶 㐄 800,55 㔳 ᡶ〶⡰
ぁ 〶⢀⡩
㐄 163,
ᡶ 㐄 2,7 ᡷ 㐄 16,34 ᡦ 㐄 15
Calculo da inclinação
‐䘲 㐄 ∑^ ᡶ〶
Calculo do intercepto 㕈 㐄 ᡷ ㎘ ‐䘲ᡶ 㐄 16,34 ㎘ 2,57 㐁 2,7 㐄 9,
Equação da reta estimada ᡑ 㐄 ㎗ ‐ᡐ ㎗ ᡗ 㙂 ᡷ 㐄 9,41 ㎗ 2,57ᡶ
Gráfico da reta estimada
Com base na equação estimada da reta podemos prever o ganho de peso do gado em função da concentração de substancia. O ganho esperado de peso do gado que não recebe a sustância é de 9,51kg. Vemos ainda que um aumento de 1 mg/L na concentração de X implica um ganho médio de 2,57 kg.
Exercícios
0
4
8
12
16
20
24
28
0 1 2 3 4 5 6 7 Concentração (mg/L)
Ganho de pes
o (kg)