Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas


Estatistica aula IIIII, Notas de aula de Engenharia Civil

aulas basicas de estatistica

Tipologia: Notas de aula

Antes de 2010

Compartilhado em 14/02/2010

albery-vilela-7
albery-vilela-7 🇧🇷

5

(2)

8 documentos

1 / 6

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
Aula 6
Coeficiente de Correlação linear e Regressão
Introdução
Estudamos ate aqui experimentos onde é envolvida apenas 1 variável aleatória. Em muitas situações. no
entanto precisamos observar duas ou mais variáveis em simultaneamente para analisarmos características
em conjunto. Por exemplo, experimentos com misturas de mistas de cimento e cal hidratada para analisar
resistência a compressão ou ainda modulo de deformação. Nestes casos podemos experimentar diferentes
dosagens de cal/cimento e submeter o produto a testes de compressão e resistência a deformação e analisar o
comportamento das amostras.
Definição: Sejam um experimento e S um espaço amostral associado a
Sejam    duas funções cada uma associada um número real a um resultado do
experimento . Denominamos (X;Y) uma variável aleatória bidimensional (algumas vezes chamada de
vetor aleatório).
Coeficiente de Correlação
Um parâmetro importante associado a uma variável aleatória bidimensional é o coeficiente de
correlação. Este parâmetro expressa o grau de dependência linear entre duas vaiáveis aleatórias. Dado um
conjunto de n pares de duas variáveis aleatórias X e Y, do ponto de vista amostral o coeficiente de correlação
é definido por:
,











 
,


1
Exemplo:
A quantidade de chuva é um fator importante na produtividade agrícola. Para medir esse efeito um
experimento foi feito. Oito diferentes regiões produtoras de soja foram estudadas, o índice pluviométrico, em
milímetros (X) e a produção, em toneladas (Y) foram anotadas. Vamos determinar o coeficiente de variação.
i 1 2 3 4 5 6 7 8
X 120 140 122 150 115 190 130 118
Y 40 46 45 37 25 54 33 30
S
s ·
·
x(s)
·
y(s)
pf3
pf4
pf5

Pré-visualização parcial do texto

Baixe Estatistica aula IIIII e outras Notas de aula em PDF para Engenharia Civil, somente na Docsity!

Aula 6

Coeficiente de Correlação linear e Regressão

Introdução Estudamos ate aqui experimentos onde é envolvida apenas 1 variável aleatória. Em muitas situações. no entanto precisamos observar duas ou mais variáveis em simultaneamente para analisarmos características em conjunto. Por exemplo, experimentos com misturas de mistas de cimento e cal hidratada para analisar resistência a compressão ou ainda modulo de deformação. Nestes casos podemos experimentar diferentes dosagens de cal/cimento e submeter o produto a testes de compressão e resistência a deformação e analisar o comportamento das amostras. Definição: Sejam – um experimento e S um espaço amostral associado a –

Sejam ᡐ 㐄 ᡶ䙦ᡱ䙧 ᡗ ᡑ 㐄 ᡷ䙦ᡱ䙧 duas funções cada uma associada um número real a um resultado do experimento ᡱ ᒈ ᡅ. Denominamos (X;Y) uma variável aleatória bidimensional (algumas vezes chamada de vetor aleatório).

Coeficiente de Correlação Um parâmetro importante associado a uma variável aleatória bidimensional é o coeficiente de correlação. Este parâmetro expressa o grau de dependência linear entre duas vaiáveis aleatórias. Dado um conjunto de n pares de duas variáveis aleatórias X e Y, do ponto de vista amostral o coeficiente de correlação é definido por:

‥〥,〦 㐄

㒕㐧∑ ぁ〶⢀⡩ ᡶ〷⡰^ ㎘ ᡦᡶあ〩う⡰ 㐱㐧∑ ぁ〶⢀⡩ ᡷ〷⡰^ ㎘ ᡦᡷあ〩う⡰ 㐱

ᡧᡳ ‥〥,〦 㐄 ∑^ 䙦∆↑^ ㎘ ∆䙧䙦∇↑^ ㎘ ∇䙧

↖↑⢀❸ 䙦ᡦ ㎘ 1䙧ᡅ〥ᡅ〦

Exemplo: A quantidade de chuva é um fator importante na produtividade agrícola. Para medir esse efeito um experimento foi feito. Oito diferentes regiões produtoras de soja foram estudadas, o índice pluviométrico, em milímetros (X) e a produção, em toneladas (Y) foram anotadas. Vamos determinar o coeficiente de variação. i 1 2 3 4 5 6 7 8 X 120 140 122 150 115 190 130 118 Y 40 46 45 37 25 54 33 30

S

s ·

· x(s)

· y(s)

Com auxilio de uma calculadora obtemos:

㔳 ᡶ〶 㐄 1085

〶⢀⡩

㔳 ᡶ〶⡰^ 㐄 151533

〶⢀⡩

〶⢀⡩

㔳 ᡷ〶⡰^ 㐄 12640

〶⢀⡩

〶⢀⡩

Substituindo os valores na expressão temos:

‥〥,〦 㐄 43245 ㎘ 8 㐁 135,63 㐁 38, 㒓䙰151533 ㎘ 8 㐁 䙦135,63䙧⡰䙱䙰12640 ㎘ 8 㐁 䙦38,75䙧⡰䙱^

Portanto, a correlação entre o índice pluviométrico e a produção de soja é positiva e satisfatória. Isto indica que regiões com maiores índices de chuva tendem a produzir mais soja.

Exercício

  1. Um experimento foi realizado com o objetivo de analisar ” o comportamento da resistência a compressão e modulo de deformação do composto utilizando diferentes misturas de cal hidratada e cimento em traços de massa. Queremos, portanto, analisar o comportamento da resistência a compressão (Y) e modulo de deformação (Z) variando a concentração de cal hidratada (X) no traço da massa. Os resultados dos testes são dados: i 1 2 3 4 5 6 X 0 0,10 0,20 0,30 0,40 0, Y 9 7,8 7,0 6,5 5,8 5,

i 1 2 3 4 5 6 X 0 0,10 0,20 0,30 0,40 0, Z 22,1 20,7 17,3 15,9 14,2 12,

Determine os coeficientes de correlação linear e analise os resultados.

  1. Um estudo foi feito junto a um escritório de engenharia civil para relacionar as variáveis anos de estudo (X) e o número de diferentes empregos nos últimos 5 anos (Y). Determine e interprete o coeficiente de correlação linear. X 5 6 7 8 9 10 Y 5 4 2 3 2 1

  2. (Magalhães) - Está sendo estudado o efeito do teor de ferro na capacidade de carga de vigas de concreto. Os dados abaixo representam os resultados de medidas obtidas em uma amostra. Obtenha e interprete o coeficiente de correlação linear.

De acordo com o coeficiente de correlação, percebemos que a substancia influencia positivamente no aumento de peso do gado. Para analisar a maneira como estas variáveis se comportam construímos um gráfico de dispersão.

Note que a disposição dos pontos no plano cartesiano sugere uma reta. Podemos estimar uma reta que minimize os erros entre a reta estimada e os pontos. Um modelo teórico pode ser construído para ajustar esta reta através do método dos Mínimos Quadrados. Observe ainda que podemos associar o coeficiente de correlação linear a tendência de alinhamento dos pontos, sendo assim, coeficiente de correlação próximo de 1 (um) indicam a tendência a uma reta crescente, coeficiente de correlação próximos de -1 indicam a tendência a uma reta decrescente e coeficientes de correlação próximos de zero não indicam uma reta.

‥〥,〦 㐄 0,97 ‥〥,〦 㐄 0,01 ‥〥,〦 㐄 ㎘0, ‐ 㐈 0 ‐ 㐇 0

Modelo teórico de ajuste da reta ᡑ 㐄 ㎗ ‐ᡐ ㎗ ᡗ Onde: 㐄 ᡕᡧᡗᡘᡡᡕᡡᡗᡦᡲᡗ ᡤᡡᡦᡗᡓᡰ ᡖᡓ ᡰᡗᡲᡓ 䙦ᡡᡦᡲᡗᡰᡕᡗᡨᡲᡧ䙧 ‐ 㐄 ᡕᡧᡗᡘᡡᡕᡡᡗᡦᡲᡗ ᡓᡦᡙᡳᡤᡓᡰ ᡖᡓ ᡰᡗᡲᡓ 䙦ᡡᡦᡕᡤᡡᡦᡓçãᡧ䙧 ᡗ 㐄 ᡗᡰᡰᡧ ᡖᡧ ᡓᡢᡳᡱᡲᡗ A variável aleatória “e” representa o desvio entre as observações Y e a reta teórica ( ㎗ ‐ᡐ䙧. A variável Y é denominada variável dependente e a variável X é chamada variável independente ou explicativa. Os parâmetros do modelo são desconhecidos e precisam ser estimados de acordo com algum critério.. Um dos critérios utilizados é o dos mínimos quadrados. Utilizando recursos matemáticos é possível escrever os estimadores de mínimos quadrados para ᡗ ‐. Temos então:

0

4

8

12

16

20

24

28

0 1 2 3 4 5 6 7 Concentração (mg/L)

Ganho de pes

o (kg)

y = -2,4449x + 23,

0

4

8

12

16

20

24

28

0 1 2 3 4 5 6 7

y = 2,5681x + 9,

0

4

8

12

16

20

24

28

0 1 2 3 4 5 6 7 0

(^105) 1520

2530

3540

45

0 2 4 6 8

‐䘲 㐄 ∑^ ᡶ〶

Com base nos valores da concentração de substancia oferecida ao gado e ganho de peso estimamos a reta. X 0,2 0,5 0,6 0,7 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0 5,5 6, Y 9,4 11,4 12,3 10,2 11,9 13,6 14,2 16,2 16,2 17,7 18,8 19,9 25,5 24,7 23,

㔳 ᡶ〶

〶⢀⡩

ᡷ〶 㐄 800,55 㔳 ᡶ〶⡰

ぁ 〶⢀⡩

㐄 163,

ᡶ 㐄 2,7 ᡷ 㐄 16,34 ᡦ 㐄 15

Calculo da inclinação

‐䘲 㐄 ∑^ ᡶ〶

163,39 ㎘ 15 㐁 2,7⡰^ 㐄 2,

Calculo do intercepto 㕈 㐄 ᡷ ㎘ ‐䘲ᡶ 㐄 16,34 ㎘ 2,57 㐁 2,7 㐄 9,

Equação da reta estimada ᡑ 㐄 ㎗ ‐ᡐ ㎗ ᡗ 㙂 ᡷ 㐄 9,41 ㎗ 2,57ᡶ

Gráfico da reta estimada

Com base na equação estimada da reta podemos prever o ganho de peso do gado em função da concentração de substancia. O ganho esperado de peso do gado que não recebe a sustância é de 9,51kg. Vemos ainda que um aumento de 1 mg/L na concentração de X implica um ganho médio de 2,57 kg.

Exercícios

0

4

8

12

16

20

24

28

0 1 2 3 4 5 6 7 Concentração (mg/L)

Ganho de pes

o (kg)