Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas


Regressão linear e correlação, Notas de estudo de Cultura

noções básicas a respeito de regressão linear

Tipologia: Notas de estudo

2012

Compartilhado em 13/07/2012

daniela-lourenco-12
daniela-lourenco-12 🇧🇷

1 documento

1 / 16

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
REGRESSÃO LINEAR E CORRELAÇÃO
Daniela Lourenço da Silva ([email protected])
Daniela Santos de Almeida ([email protected])
Josué Lourenço ([email protected])
Kláuter Lima da Silva ([email protected])
Prof. Edel Alexandre da Silva
Universidade Estadual de Alagoas - UNEAL – Estatística Voltada para a Educação
RESUMO
A Regressão Múltipla é um dos inúmeros modelos estatísticos explanatórios causais referentes ao tratamento de séries temporais de dados. Sua
base estatística advém da Regressão Linear, que se restringe a duas variáveis e a apenas uma equação funcional do primeiro grau. Quanto mais
significativo for o peso de uma variável isolada, ou de um conjunto de variáveis explicativas, tanto mais se poderá afirmar que alguns fatores afetam
mais o comportamento de uma variável de resposta especificamente procurada, do que outros.
Palavras-chave: Regressão, Séries temporais, variáveis
.
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff

Pré-visualização parcial do texto

Baixe Regressão linear e correlação e outras Notas de estudo em PDF para Cultura, somente na Docsity!

REGRESSÃO LINEAR E CORRELAÇÃO

Daniela Lourenço da Silva ([email protected])

Daniela Santos de Almeida ([email protected])

Josué Lourenço ([email protected])

Kláuter Lima da Silva ([email protected])

Prof. Edel Alexandre da Silva

Universidade Estadual de Alagoas - UNEAL – Estatística Voltada para a Educação

RESUMO

A Regressão Múltipla é um dos inúmeros modelos estatísticos explanatórios causais referentes ao tratamento de séries temporais de dados. Sua base estatística advém da Regressão Linear, que se restringe a duas variáveis e a apenas uma equação funcional do primeiro grau. Quanto mais significativo for o peso de uma variável isolada, ou de um conjunto de variáveis explicativas, tanto mais se poderá afirmar que alguns fatores afetam

mais o comportamento de uma variável de resposta especificamente procurada, do que outros.

Palavras-chave: Regressão, Séries temporais, variáveis

.

1 INTRODUÇÃO

Quando se consideram observações de 2 ou mais variáveis surge um ponto novo:

“O estudo das relações porventura existentes entre as variáveis.”

A análise de regressão e correlação compreendem a análise de dados amostrais para saber se e como um certo conjunto de variáveis está relacionado com

outra variável.

A análise de dados através do modelo clássico de regressão, também, denominado modelo normal linear, é uma das técnicas mais usadas de es�mação.

Porém, em muitas situações prá�cas, algumas de suas suposições, como a normalidade e a linearidade nos parâmetros, não são sa�sfeitas. Este fato, alavancou o

desenvolvimento de novas técnicas esta�s�cas para os modelos de regressão, surgindo, então, novas classes de modelos, os modelos de regressão não-linear e os

modelos lineares generalizados.

Assim sendo, a análise de regressão e correlação serve realizar previsões futuras sobre algum fenômeno da realidade. Neste caso, extrapolam-se

para o futuro as relações de causa-efeito já observadas no passado entre as variáveis. Pesquisadores interessados em "simular" os efeitos causados

sobre uma variável Y em decorrência de alterações introduzidas nos valores de uma variável X também usam este modelo. Por exemplo: de que modo

altera a produtividade (Y) de uma área agrícola quando se aplica certa quantidade (X) de fertilizante sobre a terra.

Neste estudo, pretende-se estabelecer uma comparação entre os modelos de regressão lineares e os modelos não lineares, definindo qual é mais

importante.

2 MODELOS DE REGRESSÃO LINEARES E NÃO LINEARES

transformação. Por exemplo, aplicando-se logaritmo em ambos os membros da equação (1) pode-se reduzi-la à forma linear. Em geral, na prá�ca, um modelo não- linear é linearizado para facilitar a obtenção das es�ma�vas dos parâmetros. O inconveniente de uma transformação é que, além do parâmetro perder sua interpretação intrínseca, pudesse alterar a estrutura e distribuição do erro, ou seja, se os erros do modelo original sa�sfizerem as suposições usuais de normalidade, independência e homogeneidade da variância, os erros do novo modelo, em geral, não sa�sfarão tais suposições (Khuri e Cornell, 1987). Caso não seja possível obter uma reparametrização ou uma transformação apropriada, que reduza o modelo a forma linear, tem-se os chamados modelos “intrinsecamente não lineares”.

2.1 Método dos Mínimos Quadrados

O Método dos Mínimos Quadrados , ou Mínimos Quadrados Ordinários (MQO) ou OLS (do inglês Ordinary Least Squares ) é uma técnica de

otimização matemática que procura encontrar o melhor ajuste para um conjunto de dados tentando minimizar a soma dos quadrados das diferenças

entre o valor estimado e os dados observados (tais diferenças são chamadas resíduos).

Um requisito para o método dos mínimos quadrados é que o fator imprevisível (erro) seja distribuído aleatoriamente, essa distribuição seja

normal e independente. O Teorema Gauss-Markov garante (embora indiretamente) que o estimador de mínimos quadrados é o estimador não-

enviesado de mínima variância linear na variável resposta.

Outro requisito é que o modelo é linear nos parâmetros, ou seja, as variáveis apresentam uma relação linear entre si. Caso contrário, deveria ser

usado um modelo de regressão não-linear.

Credita-se Carl Friedrich Gauss como o desenvolvedor das bases fundamentais do método dos mínimos quadrados, em 1795, quando Gauss

tinha apenas dezoito anos. Entretanto, Adrien-Marie Legendre foi o primeiro a publicar o método em 1805, em seu Nouvelles méthodes pour la

détermination des orbites des comètes. Gauss publicou suas conclusões apenas em 1809.

É o método de computação matemática pelo qual se define a curva de regressão. Esse método definirá uma reta que minimizará a soma das

distâncias ao quadrado entre os pontos plotados (X, Y) e a reta (X’,Y’). Pelo método dos mínimos quadrados se calcula os parâmetros “a“ e “b” da

reta que minimiza estas distâncias ou as diferenças (ou o erro) entre Y e Y’. Esta reta é chamada de curva de regressão.

(1) Erro = (Y - Y’) Diferença entre o valor levantado Y (na amostra) e o

estimado Y’(pela reta de regressão)

(2) E 12 , E 22 , E 32 , .....En^2 = Mínimo Objetivo do modelo de regressão

(3) Erro Total = Σ (Y-Y’) 2 Hipótese de trabalho

(4) Y’ = a + bX Equação da reta de regressão que minimiza o erro

Substituindo (4) em (3)

(5) Σ (Y- a - bX) 2

Para que a soma dos quadrados dos erros tenha um valor mínimo, devem-se aplicar os conceitos de cálculo diferencial com derivadas parciais.

Como as incógnitas do problema são os coeficientes "a" e "b" formamos um sistema de duas equações. Assim aplicando os conceitos acima referidos

montamos o sistema de equações normais que nos permitirá extrair os valores de a e b,

∂ e

------ = - 2 Σ (Y- a - bX)

∂ a

  • 2 Σ Y + 2 Σ a + 2 Σ bX

Σ Y = Σ a + Σ bX

(6) Σ Y = Na + b Σ X Equação Normal

são todos não-lineares e o operador E(⋅) denota a função esperança ou função de regressão (ver Mazucheli e Achcar (2002).

3.1 Regressão Exponencial

Em determinados experimentos, em sua maioria biológicos, a dependência entre as variáveis X e Y é de forma exponencial, neste caso se quer ajustar à

tabela de pontos uma função do tipo:

Mediante uma transformação linear, usando logaritmos neperianos, o problema pode ser convertido em uma questão de regressão linear:

onde:

b =

a =

4 CORRELAÇÃO LINEAR

Em teoria da probabilidade e estatística, correlação , também chamada de coeficiente de correlação , indica a força e a direção do

relacionamento linear entre duas variáveis aleatórias. No uso estatístico geral, correlação ou co-relação se refere a medida da relação entre duas

variáveis, embora correlação não implique causalidade. Neste sentido geral, existem vários coeficientes medindo o grau de correlação, adaptados à

natureza dos dados.

Vários coeficientes são utilizados para situações diferentes. O mais conhecido é o coeficiente de correlação de Pearson, o qual é obtido

dividindo a covariância de duas variáveis pelo produto de seus desvios padrão. Apesar do nome, ela foi apresentada inicialmente por Francis Galton.

A correlação falha em capturar dependência em algumas instancias. Em geral é possível mostrar que há pares de variáveis aleatórias com forte

dependência estatística e que no entanto apresentam correlação nula. Para esse caso devem-se usar outras medidas de dependência.

A análise de regressão é um método que visa estabelecer relações funcionais entre variáveis relacionadas por leis esta�s�cas, isto é, procura encontrar

uma função que descreve da melhor forma possível o comportamento de alguma variável que estamos interessados em analisar.

Análise de correlação : dedica-se a inferências esta�s�cas das medidas de associação linear que se seguem:

  • coeficiente de correlação simples : mede a “força” ou “grau” de relacionamento linear entre 2 variáveis.
    • coeficiente de correlação múl�plo : mede a “força” ou “grau” de relacionamento linear entre uma variável e um conjunto de outras

variáveis.

4.1 Coeficiente de Correlação

σ X – desvio padrão da variável X

σ Y – desvio padrão da variável Y

Cov (X,Y) – Covariância de X e Y.

4.2 Interpretação do coeficiente de correlação

O valor de está sempre entre -1 e +1, com correspondendo à não associação.

Usamos o termo correlação positiva quando , e nesse caso à medida que cresce também cresce , e correlação negativa quando , e nesse caso à medida que cresce, decresce (em média).

Quanto maior o valor de (positivo ou negativo), mais forte a associação. No extremo, se ou então todos os pontos no gráfico de

dispersão caem exatamente numa linha reta. No outro extremo, se não existe nenhuma associação linear.

O seguinte quadro fornece um guia de como podemos descrever uma correlação em palavras dado o valor numérico. É claro que as

interpretações dependem de cada contexto em particular.

Note que correlações não dependem da escala de valores de ou .(Por exemplo, obteríamos o mesmo valor se medíssemos altura e peso em metros e kilogramas ou em pés e libras.)

5 MODELO

  • (^) Análise de Regressão e Correlação com duas variáreis X 1 e X 2.

RESUMO DOS

RESULTADOS

Estatística de regressão

R múltiplo 0,

R-Quadrado 0,

R-quadrado ajustado 0,

Erro padrão 0,

Observações 20

ANOVA

gl SQ MQ F F de significação

Regressão 2 117,1104549 58,55523 159,6522315 9,58492E-

Resíduo 17 6,235045117 0,

Total 19 123,

Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores Inferior 95,0% Superior 95,0%

Interseção 0,659418116 0,288116903 2,288717 0,035169701 0,051544591 1,267291642 0,051544591 1,

Variável X 1 1,276506929 0,206218639 6,190066 9,88392E-06 0,841423636 1,711590222 0,841423636 1,

Variável X 2 0,451429679 0,091782848 4,918454 0,00013001 0,257784798 0,645074559 0,257784798 0,

a=0, b1=1, b2=0,

http://pt.wikipedia.org/wiki/Regress%C3%A3o_n%C3%A3o_linear. 04/05/2012.