




Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Encontra documentos específicos para os exames da tua universidade
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Da observação do gráfico de dispersão é razoável afirmar que existe uma relação linear entre as duas variáveis. Page 2. Linear Regression. 50000. 100000. 150000.
Tipologia: Esquemas
1 / 8
Esta página não é visível na pré-visualização
Não perca as partes importantes!





5 00 0 0 1 00 0 00 1 50 0 00 2 00 0 00 Calor Consumido (milhões de UBT)
5 ,00 0
7 ,50 0
1 0,0 0 0
1 2,5 0 0
1 5,0 0 0
Unidades fornecidas
A A
A A
A
AA
A A A
A A
A
A A
A
A
A A
A
A
A
1.1. Construa um gráfico de dispersão que permita relacionar ambas as variáveis com a intenção de identificar uma possível relação linear.
em SPSS: Graph / Interactive /Scatterplot
Da observação do gráfico de dispersão é razoável afirmar que existe uma relação linear entre as duas variáveis.
Linear Regression
50000 100000 150000 200000 Calor Consumido (milhões de UBT)
5,
7,
10,
12,
15,
Unidades fornecidas
A A
A A
A
AA
A A A
A A
A A A
A
A
A A
A
A
A
Unidades fornecidas = -0,87 + 0,00 * calor R-Square = 0,
1.2. Estabeleça o modelo a ajustar aos dados
Como do gráfico de dispersão podemos constatar que existe uma relação linear entre as duas variáveis podemos usar um modelo de regressão linear para ajustar estes dados.
Note que se seleccionamos no menu: Graph / Interactive /Scatterplot , o tab Fit como método para ajustar os dados Regression podemos obter o gráfico de dispersão com a recta de regressão desenhada e a sua equação.
Note que o valor do declive na recta de regressão é 0.00, mas isto é devido à aproximação usada. Como poderemos verificar logo este valor é diferente de 0, porem é um valor muito pequeno, da ordem de 10-
Mas de uma forma mais geral, a análise de regressão linear no SPSS é efectuada através do menu:
em SPSS: Analize / Regression /Linear
1.3. Com base nos resultados obtidos responda as seguintes questões:
a. Quais as estimativas do declive (b 1 ) e da ordenada na origem (b 0 ) da recta de regressão?
0
1
b. Qual a equação da recta de regressão?
c. O valor do declive é significativamente diferente de 0, ao nível de significância 5%?
i. Escreva as hipóteses em causa
H 0 : b 1 = 0 vs H 1 : b 1 ≠ 0
ii. Indique o valor do p-value do teste p-value = 0
iii. Conclua A hipótese nula é rejeitada para q.q nível de significância. Conclui- se que o declive não é nulo para q.q. nível de significância
d. A ordenada na origem é significativamente diferente de 0, ao nível de significância 5%?
i. Escreva as hipóteses em causa
H 0 : b 0 = 0 vs H 1 : b 0 ≠ 0
ii. Indique o valor do p-value do teste: 0
iii. Conclua: A hipótese nula é rejeitada para q.q nível de significância. Conclui- se que a ordenada na origem não é nula para q.q. nível de significância
1.4. Efectue os cálculos necessários para obter os p-values dos testes para os coeficientes de regressão mostrados na tabela dos coeficientes Descriptive Statistics
22 3,173 15,852 10,91527 3, 22 55266 233603 163559,41 52698, 22
Unidades fornecidas Calor Consumido (milhões de UBT) Valid N (listwise)
N Minimum Maximum Mean Std. Deviation
Da tabela das estatísticas descritivas obtemos n=
O p-value para um teste bilateral é igual a:
2P(T < tobs|H 0 ) se tobs for reduzido
2P(T > tobs|H0) se tobs for elevado
O valor observado da estatística do teste tobs considera-se reduzido (elevado) se a estimativa que se obtém para o parâmetro a testar é inferior (superior) ao valor especificado em H 0
Teste de hipótese para a ordenada na origem b 0 da recta de regressão: H 0 : b 0 = 0 vs. H 1 : b 0 ≠ 0 t0obs = -4,329 (valor observado da estatística do teste, ver tabela dos coeficientes ) o valor observado da estatística do teste é reduzido pois a estimativa que se obtém para b 0 (-0.869) é um valor inferior a 0 (o valor especificado em H 0 ).
Assim: p-value = 2 P(T<-4.329) = 2 tn-2(-4.329) = 2 (1- tn-2(4.329)) = 2 (1- CDF.T(4.329, 20)) = 2 x 0 = 0
Teste de hipótese para o declive b 1 da recta de regressão: H 0 : b 1 = 0 vs. H 1 : b 1 ≠ 0 t1obs = 61,777 (valor observado da estatística do teste, ver tabela dos coeficientes) o valor observado da estatística do teste é elevado pois a estimativa que se obtém para b 1 (7,20 x 10-5^ ) é um valor superior a 0 (o valor especificado em H 0 ).
Assim: p-value = 2 P(T>61.777) = 2 (1- P(T <61.557) = 2 (1- tn-2(61.557)) = 2 (1-CDF.T(61.557, 20)) = 2 x 0 = 0
1.5. Qual é a proporção de variabilidade de Y explicada por x?
Da tabela de ANOVA podemos obter o coeficiente de determinação R^2 = , 995 (ver R square). Este coeficiente mede a quantidade de variabilidade explicada por x, isto é, pelo modelo de regressão já que consiste na razão entre a soma dos quadrados devido aos resíduos (SSR) e a soma dos quadrados total (SYY ).
Então, R^2 = , 995 quer dizer que 99.5% da variabilidade encontrada para y é explicada por x e apenas os restantes 0,5% se devem a outros factores. Um bom ajuste do modelo deve reflectir-se num valor de R^2 próximo de 1. Como neste caso o coeficiente de determinação é bastante elevado (muito próximo de 1), podemos concluir que a relação linear entre as duas variáveis é forte.
Observed Cum Prob
0,0 0,2 0,4 0,6 0,8 1,
Expected Cum Prob
1,
0,
0,
0,
0,
0,
Normal P-P Plot of Regression Standardized Residual
Dependent Variable: Unidades fornecidas
O PP-plot não nos dá qualquer indicação que contrarie o pressuposto da normalidade dos resíduos O gráfico de dispersão dos resíduos em função dos valores preditos estandardizados mostra-se bastante aleatório
Também podemos fazer um QQ-plot ou um teste de ajustamento de K-S para validar os pressupostos de normalidade dos resíduos. Para isto devemos guardar os resíduos numa nova variável, usando a opção Save do menu de Linear Regression
Depois podemos escolher o menu Analyze \ Descriptive Statistics \ Explore com a opção Normality plots with tests
Usando a variável RES-1 (os resíduos guardados) e fazendo um QQ-plot e os testes de ajustamento de Kolmogorov-Smirnov e de Shapiro Wilk podemos concluir que os resíduos têm distribuição Normal (o QQ-plot identifica um ajuste entre os quantis amostrais e os quantis de distribuição Normal e os testes de ajustamentos fornecem valores de p-values superiores aos níveis usuais de significância.
Tests of Normality
Kolmogorov-Smirnov(a) Shapiro-Wilk Statistic df Sig. Statistic df Sig. Unstandardized Residual (^) ,085 22 ,200()* (^) ,982 22 ,