Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas


Regressão Linear em SPSS, Esquemas de Estatística

Da observação do gráfico de dispersão é razoável afirmar que existe uma relação linear entre as duas variáveis. Page 2. Linear Regression. 50000. 100000. 150000.

Tipologia: Esquemas

2023

Compartilhado em 16/01/2023

Nazareth85
Nazareth85 🇵🇹

4.4

(39)

3.2K documentos

1 / 8

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
500 00 100 000 150 000 2 000 00
Calor Consumido (milhões de UBT)
5,00 0
7,50 0
10,0 00
12,5 00
15,0 00
Unidades fornecidas
A
A
A
A
A
AA
A
A
A
A
A
A
A
A
A
A
A
A
A
A
A
Regressão Linear em SPSS
1. No ficheiro
Calor.sav
encontram-se os valores do consumo mensal de energia, medido em
milhões de unidades termais britânicas, acompanhados de valores de output, em milhões de
kWh, de electricidade fornecida por uma central termo-eléctrica em Inglaterra.
1.1. Construa um gráfico de dispersão que permita relacionar ambas as variáveis com a intenção
de identificar uma possível relação linear.
em SPSS: Graph / Interactive /Scatterplot
Da observação do gráfico de dispersão é
razoável afirmar que existe uma relação linear
entre as duas variáveis.
pf3
pf4
pf5
pf8

Pré-visualização parcial do texto

Baixe Regressão Linear em SPSS e outras Esquemas em PDF para Estatística, somente na Docsity!

5 00 0 0 1 00 0 00 1 50 0 00 2 00 0 00 Calor Consumido (milhões de UBT)

5 ,00 0

7 ,50 0

1 0,0 0 0

1 2,5 0 0

1 5,0 0 0

Unidades fornecidas

A A

A A

A

AA

A A A

A A

A

A A

A

A

A A

A

A

A

Regressão Linear em SPSS

  1. No ficheiro Calor.sav encontram-se os valores do consumo mensal de energia, medido em milhões de unidades termais britânicas, acompanhados de valores de output, em milhões de kWh, de electricidade fornecida por uma central termo-eléctrica em Inglaterra.

1.1. Construa um gráfico de dispersão que permita relacionar ambas as variáveis com a intenção de identificar uma possível relação linear.

em SPSS: Graph / Interactive /Scatterplot

Da observação do gráfico de dispersão é razoável afirmar que existe uma relação linear entre as duas variáveis.

Linear Regression

50000 100000 150000 200000 Calor Consumido (milhões de UBT)

5,

7,

10,

12,

15,

Unidades fornecidas

A A

A A

A

AA

A A A

A A

A A A

A

A

A A

A

A

A

Unidades fornecidas = -0,87 + 0,00 * calor R-Square = 0,

1.2. Estabeleça o modelo a ajustar aos dados

Como do gráfico de dispersão podemos constatar que existe uma relação linear entre as duas variáveis podemos usar um modelo de regressão linear para ajustar estes dados.

Note que se seleccionamos no menu: Graph / Interactive /Scatterplot , o tab Fit como método para ajustar os dados Regression podemos obter o gráfico de dispersão com a recta de regressão desenhada e a sua equação.

Note que o valor do declive na recta de regressão é 0.00, mas isto é devido à aproximação usada. Como poderemos verificar logo este valor é diferente de 0, porem é um valor muito pequeno, da ordem de 10-

Mas de uma forma mais geral, a análise de regressão linear no SPSS é efectuada através do menu:

em SPSS: Analize / Regression /Linear

1.3. Com base nos resultados obtidos responda as seguintes questões:

a. Quais as estimativas do declive (b 1 ) e da ordenada na origem (b 0 ) da recta de regressão?

0

b^ ˆ = -0, 869

1

b^ ˆ = 7,20 x 10-

b. Qual a equação da recta de regressão?

y = -0, 869 + 7,20 x 10-5^ x

c. O valor do declive é significativamente diferente de 0, ao nível de significância 5%?

i. Escreva as hipóteses em causa

H 0 : b 1 = 0 vs H 1 : b 1 ≠ 0

ii. Indique o valor do p-value do teste p-value = 0

iii. Conclua A hipótese nula é rejeitada para q.q nível de significância. Conclui- se que o declive não é nulo para q.q. nível de significância

d. A ordenada na origem é significativamente diferente de 0, ao nível de significância 5%?

i. Escreva as hipóteses em causa

H 0 : b 0 = 0 vs H 1 : b 0 ≠ 0

ii. Indique o valor do p-value do teste: 0

iii. Conclua: A hipótese nula é rejeitada para q.q nível de significância. Conclui- se que a ordenada na origem não é nula para q.q. nível de significância

1.4. Efectue os cálculos necessários para obter os p-values dos testes para os coeficientes de regressão mostrados na tabela dos coeficientes Descriptive Statistics

22 3,173 15,852 10,91527 3, 22 55266 233603 163559,41 52698, 22

Unidades fornecidas Calor Consumido (milhões de UBT) Valid N (listwise)

N Minimum Maximum Mean Std. Deviation

Da tabela das estatísticas descritivas obtemos n=

O p-value para um teste bilateral é igual a:

2P(T < tobs|H 0 ) se tobs for reduzido

2P(T > tobs|H0) se tobs for elevado

O valor observado da estatística do teste tobs considera-se reduzido (elevado) se a estimativa que se obtém para o parâmetro a testar é inferior (superior) ao valor especificado em H 0

 Teste de hipótese para a ordenada na origem b 0 da recta de regressão:  H 0 : b 0 = 0 vs. H 1 : b 0 ≠ 0  t0obs = -4,329 (valor observado da estatística do teste, ver tabela dos coeficientes )  o valor observado da estatística do teste é reduzido pois a estimativa que se obtém para b 0 (-0.869) é um valor inferior a 0 (o valor especificado em H 0 ).

Assim: p-value = 2 P(T<-4.329) = 2 tn-2(-4.329) = 2 (1- tn-2(4.329)) = 2 (1- CDF.T(4.329, 20)) = 2 x 0 = 0

 Teste de hipótese para o declive b 1 da recta de regressão:  H 0 : b 1 = 0 vs. H 1 : b 1 ≠ 0  t1obs = 61,777 (valor observado da estatística do teste, ver tabela dos coeficientes)  o valor observado da estatística do teste é elevado pois a estimativa que se obtém para b 1 (7,20 x 10-5^ ) é um valor superior a 0 (o valor especificado em H 0 ).

Assim: p-value = 2 P(T>61.777) = 2 (1- P(T <61.557) = 2 (1- tn-2(61.557)) = 2 (1-CDF.T(61.557, 20)) = 2 x 0 = 0

1.5. Qual é a proporção de variabilidade de Y explicada por x?

Da tabela de ANOVA podemos obter o coeficiente de determinação R^2 = , 995 (ver R square). Este coeficiente mede a quantidade de variabilidade explicada por x, isto é, pelo modelo de regressão já que consiste na razão entre a soma dos quadrados devido aos resíduos (SSR) e a soma dos quadrados total (SYY ).

Então, R^2 = , 995 quer dizer que 99.5% da variabilidade encontrada para y é explicada por x e apenas os restantes 0,5% se devem a outros factores. Um bom ajuste do modelo deve reflectir-se num valor de R^2 próximo de 1. Como neste caso o coeficiente de determinação é bastante elevado (muito próximo de 1), podemos concluir que a relação linear entre as duas variáveis é forte.

Observed Cum Prob

0,0 0,2 0,4 0,6 0,8 1,

Expected Cum Prob

1,

0,

0,

0,

0,

0,

Normal P-P Plot of Regression Standardized Residual

Dependent Variable: Unidades fornecidas

 O PP-plot não nos dá qualquer indicação que contrarie o pressuposto da normalidade dos resíduos  O gráfico de dispersão dos resíduos em função dos valores preditos estandardizados mostra-se bastante aleatório

Também podemos fazer um QQ-plot ou um teste de ajustamento de K-S para validar os pressupostos de normalidade dos resíduos. Para isto devemos guardar os resíduos numa nova variável, usando a opção Save do menu de Linear Regression

Depois podemos escolher o menu Analyze \ Descriptive Statistics \ Explore com a opção Normality plots with tests

Usando a variável RES-1 (os resíduos guardados) e fazendo um QQ-plot e os testes de ajustamento de Kolmogorov-Smirnov e de Shapiro Wilk podemos concluir que os resíduos têm distribuição Normal (o QQ-plot identifica um ajuste entre os quantis amostrais e os quantis de distribuição Normal e os testes de ajustamentos fornecem valores de p-values superiores aos níveis usuais de significância.

Tests of Normality

Kolmogorov-Smirnov(a) Shapiro-Wilk Statistic df Sig. Statistic df Sig. Unstandardized Residual (^) ,085 22 ,200()* (^) ,982 22 ,

  • This is a lower bound of the true significance. a Lilliefors Significance Correction