












Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Encontra documentos específicos para os exames da tua universidade
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Regressão e Correlação
Tipologia: Notas de estudo
1 / 20
Esta página não é visível na pré-visualização
Não perca as partes importantes!













Notas preparadas por L.A. Bertolo
Termos básicos e conceitos ................................................................................................................... Regressão simples ................................................................................................................................ Regressão Múltipla .............................................................................................................................. Terminologia de Regressão .................................................................................................................. Fórmulas de Regressão .......................................................................................................................
variáveis. Num gráfico de espalhamento de duas variáveis x e y, cada ponto no gráfico é um par x-y.
Variação = 㔳䙦x − x㍤䙧⡰
⢘
⤙⢀⡩ B. A variação é o numerador da variância de uma amostra:
Variância =
∑ ⢘⤙⢀⡩䙦x − x㍤䙧⡰ N − 1
C. Ambas, a variação e a variância, são medidas da dispersão de uma amostra.
onde N é o tamanho da amostra xi é a i-ésima observação da variável x, ᡶᆑ é a média das observações da variável x, yi é a i-ésima observação da variável y, e ᡷ㍤ é a média das observações da variável y.
D. O valor real da covariância não é significante porque ele não é afetado pela a escala das duas variáveis. Isto é o porquê de se calcular o coeficiente de correlação – para tornar algo interpretável da informação da covariância. E. O coeficiente de correlação, r, é uma medida da intensidade da relação entre ou dentre as variáveis.
Cálculo:
Exemplo1: Preços de vendas de casas e pés quadrados Preços de venda de casas (eixo vertical) v. pés quadrados para uma amostra de 34 casas em Setembro de 2005 em St. Lucie County.
de 22 - Notas sobre Regressão, Preparadas por L. A. Bertolo
Preparadas por L. A. Bertolo
r =
⤓⤥⤲⤑⤨⤙â⤤⤓⤙⤑ ⤕⤤⤰⤨⤕ ⤴ ⤕ ⤵ 䙲ㄶㅣㅷㆀㅧㅳ ㅴㅙㅢㅶㅢㅣ ㆂ ãㅳ䙳䙲ㄶㅣㅷㆀㅧㅳ ㅴㅙㅢㅶㅢㅣ ㆃ ãㅳ䙳
r =
㐵∑^ 䙦x⤙ − x㍤䙧䙦y⤙ − y㍤䙧
⤙⢀⡩ 㐹 N − 1
㒕 ∑ ⢘⤙⢀⡩:䙦x⤙ − x㍤䙧:⡰ N − 1
㒕 ∑ ⢘⤙⢀⡩:䙦y⤙ − y㍤䙧:⡰ N − 1
i. O tipo de relação está representada pelo coeficiente de correlação: r =+1 correlação perfeitamente positiva +1 >r > 0 relação positiva r = 0 nenhuma relação 0 > r > −1 relação negativa r = −1 correlação perfeitamente negativa ii. Você pode determinar o grau de correlação observando o gráfico de espalhamento.
Observação (^) x y
Desvio de x x - xMédio
Desvio Quadrado de x (x - xMédio)^2
Desvio de y y - yMédio
Desvio Quadrado de y (y - yMédio)^2
Produto dos desvios (x - xMédio)(y - yMédio) 1 12 50 -1,50 2,25 8,40 70,56 -12, 2 13 54 -0,50 0,25 12,40 153,76 -6, 3 10 48 -3,50 12,25 6,40 40,96 -22, 4 9 47 -4,50 20,25 5,40 29,16 -24, 5 20 70 6,50^ 42,25 28,40 806,56 184, 6 7 20 -6,50 42,25 -21,60 466,56 140, 7 4 15 -9,50 90,25 -26,60 707,56 252, 8 22 40 8,50 72,25 -1,60 2,56 -13, 9 15 35 1,50 2,25 -6,60 43,56 -9, 10 23 37 9,50 90,25 -4,60 21,16 -43, Soma 135 416 0,00 374,50 0,00 2342,40 445, Cálculos xMédio= (^) 135/10 = 13, yMédio= 416/10 = 41, s^2 x= (^) 374,5/9 = 41, s^2 y= (^) 2.342,4/9 = 260, r = (445/9)/((41,611) 1/ (260,267) 1/ ) = 49,444/(6,451*16,133) = 0,
Nota: A correlação não implica que um causa o outro. Podemos dizer que duas variáveis X e Y estão correlacionadas, mas não que X causa Y ou que Y causa X, na média – eles simplesmente estão relaciona- dos ou associados um com o outro.
de 22 - Notas sobre Regressão, Preparadas por L. A. Bertolo
Preparadas por L. A. Bertolo
F. Um valor afastado (outlier^1 ) é um valor extremo de uma variável. O valor afastado deve ser bem grande ou bem pequeno (onde grande e pequeno são definidos relativamente ao restante da amostra). i. Um valor afastado deve afetar a estatística da amostra, tanto quanto um coeficiente de correlação. É possível para um valor afastado afetar o resultado, por exemplo, tal que concluímos que existe uma relação significante quando de fato não existe nenhuma ou concluir que não existe relação quando de fato há uma relação. ii. O pesquisador deve exercitar o julgamento (e cuidado) quando decidir se inclui ou exclui uma observação. G. Correlação espúria é uma aparência de uma relação quando de fato não existe relação. Valores afastados podem resultar numa correlação espúria.
i. O coeficiente de correlação não indica uma relação causal. Certos itens dados podem estar altamente correlacionados, mas não necessariamente um resultado de uma relação causual. ii. Um bom exemplo de uma correlação espúria é a caída de neve e os preços de ações em Janeiro. Se fizermos uma regressão histórica dos preços de ações versus o total de caída de neve em Minnesota, obteremos uma relação estatística significante – especialmente para os meses de Janeiro. Desde que não existe uma razão econômica para esta relação, este seria um exemplo de correlação espúria.
Regressão Simples
A. O propósito é explicar a variação numa variável (isto é, como uma variável difere do seu valor médio) usando a variação em uma ou outras mais variáveis. B. Suponha que queremos descrever, explicar, ou predizer porque uma variável difere de sua média. Seja a i- ésima observação desta variável representada como Yi, e seja n indicando o número de observações. A variação nos Yi's (os quais queremos explicar) é:
⢘
⤙⢀⡩
C. O princípio dos mínimos quadrados é que a linha de regressão é determinada minimizando a soma dos quadrados das distâncias verticais entre os valores reais de Y e os valores previstos de Y.
(^1) Uma observação extrema que está bem separada do restante dos dados. Em análise de regressão, nem todos os valores outlying terão uma influência na função de ajuste. Estes outlying com respeito a seus valores X ( alavancagem alta), e aqueles com valores Y que não são consistentes com a relação de regressão para outros valores ( resíduos altos) espera-se que sejam influentes. Para testar a influência de tais valores é usada a estatística Cook
Notas sobre Regressão, Preparadas por L. A. Bertolo 5 de 22
Preparadas por L. A. Bertolo
Uma linha é um ajuste através dos pontos XY tal que a soma dos resíduos quadráticos (isto é, a soma dos quadrados da distância vertical entre as observações e a linha) seja minimizada.
yi = b 0 + b 1 xi + εi
onde yi é a i-ésima observação da variável dependente, xi é a i-ésima observação da variável independente, b 0 é um intercepto. b 1 é o coeficiente de inclinação, εi é um resíduo para a i-ésima observação.
D. A inclinação, b 1 , é a variação em Y para uma variação de uma unidade em X. A inclinação pode ser positiva, negativa, ou zero, calculados como:
b⡩ =
=
∑ ㅆㅧㄨㄗ㐵ㆃㅧㄧㆃ㍥㐹㐵ㆂㅧㄧㆂ㍥㐹 ㅆㄧㄗ ∑ 㐵ㆂㅧㄧㆂ㍥㐹 ㅆ ㄘ ㅧㄨㄗ ㅆㄧㄗ
Suponha que:
b
Então
b⡩ =
ㄗ.ㄖㄖㄖ ㄘㄥ ㄠㄡㄖ ㄘㄥ
=
E. O intercepto, b 0 , é a intersecção da linha com o Y- em X=0. O intercepto pode ser positivo, negativo ou zero. O intercepto é calculado como:
Sugestão: Pense na linha de regressão como a média da relação entre a variável independente e a variável dependente. O resíduo representa a distância de quanto um valor observado da variável dependente (i.e., Y) está longe da relação média como descrito pela linha de regressão.
⡰
Uma fórmula atalho para o coeficiente de correlação:
Se isto é realmente um atalho ou não depende do método de realizar os cálculos: manualmente, usando o Microsoft Excel , ou usando uma calculadora.
Notas sobre Regressão, Preparadas por L. A. Bertolo 7 de 22
Preparadas por L. A. Bertolo
A. O erro padrão da estimativa ajuda-nos calibrar o "ajuste" da linha de regressão; isto é, quão bem temos descrito a variação na variável dependente. i. Quanto menor o erro padrão, melhor o ajuste. ii. O erro padrão da estimativa é uma medida da proximidade dos valores estimados (usando a regressão estimada), os yˆ 's, estão dos valores reais, os Y's. iii. Os εi’s (a.k.a. os termos distúrbios; a.k.a. os resíduos) são as distâncias verticais entre o valor observado de Y e aquele previsto pela equação, os yˆ ' iv. Os εi’s estão nos mesmos termos (unidades de medidas) que os Y’s (p.ex, dollars, pounds, billions)
A. O coeficiente de determinação é calculado como:
⤆⤑⤨⤙⤑çã⤥ ⤕⤴⤦⤢⤙⤓⤑⤔⤑ ⤆⤑⤨⤙⤑çã⤥ ⤰⤥⤰⤑⤢
⤆⤑⤨⤙⤑çã⤥ ⤰⤥⤰⤑⤢⡹⤆⤑⤨⤙⤑çã⤥ ⤕⤴⤦⤢⤙⤓⤑⤔⤑ ⤆⤑⤨⤙⤑çã⤥ ⤰⤥⤰⤑⤢
⤃⤃ㅒㅳㅸㅙㅰ⡹ ⤃⤃ㅐㅣㅷㅧㅢㅹㅙㅰ ⤃⤃ㅒㅳㅸㅙㅰ
⤃⤃ㅐㅣㅥㅶㅣㅷㅷãㅳ ⤃⤃ㅒㅳㅸㅙㅰ
B. Um R^2 de 0,49 indica que as variáveis independentes explicam 49% da variação da variável dependente.
Exemplo 2, continuação:
Considere as seguintes observações sobre X e Y:
A linha de regressão estimada é: Yi = 25,559 + 1,188 xi E os resíduos são calculados como:
Observação x y ^y y-^y e^2 1 12 50 39,82 10,18 103, 2 13 54 41,01 12,99 168, 3 10 48 37,44 10,56 111, 4 9 47 36,25 10,75 115, 5 20 70 49,32 20,68 427, 6 7 20 33,88 -13,88 192, 7 4 15 30,31 -15,31 234, 8 22 40 51,70 -11,70 136, 9 15 35 43,38 -8,38 70, 10 23 37 52,89 -15,89 252, 0,00 1.813, Portanto, SSResidual = 1.813,63/8 = 226, SEE = (226,70) 1/ = 15,
de 22 - Notas sobre Regressão, Preparadas por L. A. Bertolo
Preparadas por L. A. Bertolo
Ou ᡔ㕒⡩ − ᡲ〰ᡱ〩㕒 ㄗ < ᡔ⡩<ᡔ㕒⡩ + ᡲ〰ᡱ〩㕒 ㄗ
onde tc é um valor-t crítico para o nível de confiança selecionado. Se existirem 30 graus de liberdades e um nível de confiança 95%, o tc é 2,042 [tomado de uma tabela-t]. B. A interpretação do intervalo de confiança é que ele é um intervalo que acreditamos que incluirá o parâmetro
1
A. Teste de hipóteses: uma variável explicativa individual
i. Para testar hipótese do coeficiente de inclinação (isto é, para ver se a inclinação estimada é igual a um valor hipotético, b 0 , Ho: b = b 1 , calculamos a estatística t-distribuída:
Exemplo 2, continuação
Continuando o exemplo de regressão anterior, podemos calcular o R^2.
R^2 = 528,77/ 2.342,40 = 22,57% ou
R^2 = 1 – (1.813,63/2.342,40) = 1 – 0,7743 = 22,57%.
de 22 - Notas sobre Regressão, Preparadas por L. A. Bertolo
Preparadas por L. A. Bertolo
Exemplo 4 Suponha que você estimou um modelo de regressão com as seguintes estimativas: yˆ = 1,50 + 2,5 X 1 Além disso, você tem valores projetados para a variável independente, X 1 =20. O valor projetado para y é 51,5: yˆ = 1,50 + 2,50 (20) = 1,50 + 50 = 51,
Rejeitar H 0 Falha para rejeitar H 0 Rejeitar H 0 Portanto, rejeitamos a hipótese nula, concluindo que a inclinação é diferente de zero.
Exemplo 3: Testando a significância de um coeficiente de inclinação
Suponha que o coeficiente de inclinação estimado seja 0,78, o tamanho da amostra seja 26, o erro padrão da coeficiente seja 0.32, e o nível de significância seja 5%. A inclinação é diferente de zero?
O teste estatístico calculado é : tb =
=
= 2 , 4375
Os valores-t críticos são = 2,
Notas sobre Regressão, Preparadas por L. A. Bertolo 11 de 22
Preparadas por L. A. Bertolo
onde yˆ é um valor previsto da variável dependente, e xp é um valor previsto da variável independente (input).
Fonte de variação Graus de Liberdade
Soma dos quadrados Média Quadrática
Regressão (Explicada) 1 Soma das regressões ao quadrado (SSRegressão)
Regressão Quadrática Média = SSRegressão+/ Erro (não explicado) N – 2 Soma dos resíduos ao quadrado (SSResidual)
Erro quadrático médio = SSResiduo+/N- Total N – 1 Soma dos quadrados total (SSTotal)
Exemplo 5 Fonte de variação
Graus de Liberdade
Soma dos quadrados Média Quadrática
Regressão (Explicada) 1 5.050 5050 Erro (não explicado) 28 600 21. Total R^2 = 5.050/5.650 = 0,8938 ou 89,38%
SEE = (600/28)1/2^ = (21.429)1/2^ = 4,
Notas sobre Regressão, Preparadas por L. A. Bertolo 13 de 22
Preparadas por L. A. Bertolo
B. As variáveis independentes não estão correlacionadas com os resíduos; isto é, a variável independente não é aleatória. Além disso, não existe relação linear entre duas ou mais variáveis independentes. [Nota: isto é ligeiramente modificado das hipóteses do modelo de regressão simples.] C. O valor esperado do termo distúrbio é zero; isto é, E(εi)= D. Há uma variância constante do termo distúrbio; isto é, os termos distúrbio ou resíduo são todos extraídos de uma distribuição com uma variância idêntica. Em outras palavras, os termos distúrbios são
E. Os resíduos são distribuídos independentemente; isto é, o resíduo ou distúrbio para uma observação não está correlacionado com aquele de outra observação. [Uma violação disto is referida como auto-correlação.]
F. O termo distúrbio (a.k.a. resíduo, a.k.a. error term) é normalmente distribuído. G. O resíduo (a.k.a. termo distúrbio, a.k.a. error term) éo que não é explicado pelas variáveis independentes.
∑ ㅆㅧㄨㄗ䙦⤕㕈ㅧ䙧ㄘ ⢘⡹⤡⡹⡩
⤃⤃⢉ ⢘⡹⤡⡹⡩
A. Os graus de liberdade são o número de pedaços de informações independentes que são usadas para estimar os parâmetros de regressão. No cálculo dos parâmetros de regressão, usamos os seguintes pedaços de informações:
2 Em estatística, uma seqüência ou um vetor de variáveis aleatórias é heteroscedástico (heteroskedastistic) se as variaveis aleatórias tiverem variâncias diferentes. O conceito complementar é chamado homocedasticidade (homoscedasticity). (Nota: A ortografia alternativa homo- ou heteroskedasticity é igualmente correta e também é usada freqüentemente). O termo significa "variância diferindo" e vem do Grego "hetero" ('diferente') e "skedastios" ('dispersão'). Quando usar algumas técnicas estatísticas, tais como mínimos quadrados ordinários (ordinary least squares - OLS), várias hipóteses são geralmente feitas. Uma delas é que o termo erro tenha uma variância constante. Isto será verdadeiro se as observações do termo erro forem assumidas serem extraídas de distribuições idênticas. Heteroscedasticidade é uma violação desta hipótese. Por exemplo, o termo erro poderá variar ou aumentar com cada observação, de certa forma este é o caso freqüente com medidas de seção cruzada ou séries temporais. Heteroscedasticidade é freqüentemente estudada como parte da econometria, que freqüentemente lida com dados exibindo ela. Com o advento de erros padrões robustos permitindo-nos fazer inferência sem especificar o segundo momento condicional do termo erro, testar a homoscedasticidade condicional não é tão importante quanto no passado. O econometricista Robert Engle ganhou o 2003 Nobel Memorial Prize for Economics pelos seus estudos sobre análise de regressão na presença de heteroscedasticidade, que conduziu à sua formulação da técnica de modelagem ARCH (Auto Regressive Conditional Heteroscedasticity).
de 22 - Notas sobre Regressão, Preparadas por L. A. Bertolo
Preparadas por L. A. Bertolo
A. Valores Preditos são valores da variável dependente baseados na regressão estimada dos coeficientes e uma predição acerca dos valores das variáveis independentes. B. Para uma regressão simples, o valor de y é previsto como: yˆ = bˆ 0 + bˆ 1 xˆ 1 + bˆ 2 xˆ (^2) onde yˆ é o valor previsto da variável dependente, b (^) i ˆ é o parâmetro estimado, e xˆ (^) i é o valor previsto da variável independente C. Quanto melhor for o ajuste da regressão (isto é, quanto menor for o SEE), mais confiantes estamos nas nossas predições.
A. A estatística-F é calculada como:
F =
⤂⤕⤗⤨⤕⤩⤩ã⤥ ⤧⤱⤑⤔⤨á⤰⤙⤓⤑ ⤣é⤔⤙⤑ ⢉⤨⤨⤥ ⤣é⤔⤙⤥ ⤧⤱⤑⤔⤨á⤰⤙⤓⤥
=
=
ㅑㅑㅐㅣㅥㅶㅣㅷㅷãㅳ ㅩ ㅑㅑㅐㅣㅷㅧㅢㅹㅙㅰ ㅆㄧㅩㄧㄗ
䙦ㆃ㕉ㅧㄧㆃ䙧㍤㍤㍤ ㅩ
ㅆ ㅧㄨㄗ
∑
䙦ㆃㅧㄧㆃ㕉䙧㍤㍤㍤ ㅆㄧㅩㄧㄗ
ㅆ ㅧㄨㄗ
mais comum). Por exemplo, se existirem quatro variáveis independentes no modelo, as hipóteses são:
Ha: no mínimo um bi ≠ 0 C. A Estatística-F pode ser formulada para testar subconjuntos de variáveis independentes (para ver se elas tem poder de explicação incremental (incremental explicativa power). Por exemplo se existirem quatro variáveis independentes no modelo, um subconjunto poderia ser examinado: H 0 : b 1 =b 4 = Ha: b 1 ou b 4 ≠ 0
Exemplo 6: Usando informação da análise de variância Suponha que estamos estimando com o modelo de regressão múltipla que tem cinco variáveis independentes usando uma de 65 observações. Se a soma dos resíduos quadráticos é 789, qual é o erro padrão da estimativa? Solução Dado: SSResidual = 789 N = 65 k = 5 SEE =
⡵⡶⡷
⡵⡶⡷
Suponha que você está estimando um modelo de regressão com as seguinte estimativas: ^Y = 1,50 + 2,5 X 1 − 0,2 X 2 + 1,25 X 3 Além disso, você tem os valores previstos para as variáveis independentes: X 1 =20 X 2 =120 X 3 = Qual é o valor previsto de y?
O valor previsto para Y é 90: ^Y = 1,50 + 2,50 (20) − 0,20 (120) + 1,25 (50) = 1,50 + 50 − 24 + 62,50 = 90
Cuidado: O intercepto estimado e todas as inclinações estimadas são usadas na predição do valor da variável dependente, mesmo se uma inclinação não for estatisticamente significantemente diferente de zero.
de 22 - Notas sobre Regressão, Preparadas por L. A. Bertolo
Preparadas por L. A. Bertolo
Tabela de Análise da Variância (ANOVA)
Fonte df Graus de Liberdade
Soma dos quadrados
SS/df Média Quadrática
Regressão k SSRegressão MSR Erro (não explicado) N – k - 1 SSResidual MSE Total N – 1 SSTotal
〠〠㉧㊀㊂㊓㊀㊔㊔ã㊐ 〠〠㉩㊐㊕㉶㊇
〠〠㉧㊀㊔㊄㉹㊖㉶㊇ 〠〠㉩㊐㊕㉶㊇
A. A maioria das variáveis independentes representa um fluxo contínuo de valores. Entretanto, Alguma vezes a variável independente é de natureza binária (ela é ou ON ou OFF).
muitos casos, você aplica o conceito de variável dummy para quantificar o impacto de uma variável
hipótese da violação [2]).
nova variável. A inclinação desta nova variável diz-nos a inclinação incremental.
A. Auto-correlação aparece geralmente em dados de séries temporais. Se o lucro do ano passado foi maior, isto significa que o lucro deste ano pode ter uma probabilidade maior de ser alto do que ser baixo. Isto é um exemplo de auto-correlação positiva. Quando um ano bom for sempre seguido por uma ano ruim, isto é um exemplo de auto-correlação negativa. B. Auto-correlação é um problema porque os estimadores não tem a menor variância possível e portanto oerro padrão dos coeficientes não seriam corretos.
Notas sobre Regressão, Preparadas por L. A. Bertolo 17 de 22
Preparadas por L. A. Bertolo
A. Os coeficientes de inclinação indicam a variação da variável dependente para uma variação de uma unidade na variável independente. Esta inclinação pode ser então interpretada como uma medida da elasticidade; isto é, a variação em uma variável corresponde a uma variação em outra variável. B. É possível ter significância estatística, apesar de que não tenha significância econômica (p.ex., retornos anormais significantes associados com um anúncio, mas estes retornos não são suficientes para cobrirem custos de transações).
Para… Testar o papel de uma única variável na explicação da variação da variável dependente Testar o papel de todas as variáveis na explicação da variação da variável dependente Estimar a variação na variável dependente para uma variação de uma unidade na variável independente Estimar a variável dependente se todas as variáveis independentes tomarem um valor zero
Estimar a porcentagem das variações explicadas das variáveis dependentes pelas variáveis independentes
Prever o valor da variável dependente dados os valores estimados da variável independente(s)
use… a estatística-t.
a estatística-F.
o coeficiente de inclinação.
o intercepto.
o R^2.
A equação de regressão, substituindo os valores estimados da variável independente(s) na equação.
Notas sobre Regressão, Preparadas por L. A. Bertolo 19 de 22
Preparadas por L. A. Bertolo
⢘ ⡰ ⤙⢀⡩
1
ᡔ㕓 1 − ᡔ 1
1
F =
Regressão quadrática média
Erro médio quadrático
=
MSR
MSE
=
SS⤂⤕⤗⤨⤕⤩⤩ã⤥ k SS⤂⤕⤩⤙⤔⤱⤑⤢ N − k − 1
∑
䙦y㕈⤙ − y䙧㍥ k
∑
䙦y⤙ − y㕈䙧㍥ N − k − 1
yˆ = bˆ 0 + bˆ 1 xˆ 1 + bˆ 2 xˆ (^2)
⢘
⤙⢀⡩
⢘
⤙⢀⡩
SS⤂⤕⤗⤨⤕⤩⤩ã⤥ = 㔳䙦y㕈⤙ − y㍤䙧⡰
⢘
⤙⢀⡩
F =
Regressão quadrática média
Erro médio quadrático
=
MSR
MSE
=
SS⤂⤕⤗⤨⤕⤩⤩ã⤥ k SS⤂⤕⤩⤙⤔⤱⤑⤢ N − k − 1
∑
䙦y㕈⤙ − y䙧㍥ k
∑
䙦y⤙ − y㕈䙧㍥ N − k − 1
Regressão
de 22 - Notas sobre Regressão, Preparadas por L. A. Bertolo
Preparadas por L. A. Bertolo
yi = b 0 + b 1 xi + εi y = b 0 + b 1 x 1 + b 2 x 2 + b 3 x 3 + b 4 x 4 + εi