Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Análisis de Regresión Multivariable: Predicción de Precios de Vivendas en Boston, Apuntes de Arqueología

El análisis de regresión multivariable permite obtener información que no existe comparando variables individualmente, sino interactuando entre ellas. En este documento, se explica cómo usar la regresión multiple para predicción de precios de viviendas en boston, mediante el uso de la tabla boston. Se detallan los pasos para eliminar variables no relevantes, comparar regresiones y seleccionar la mejor, cumplir requisitos de independencia de residuos y evitar multicolinealidad. Se presentan ejemplos de regresión aditiva y interactiva.

Tipo: Apuntes

2018/2019

Subido el 26/03/2019

sigma_fuckinway
sigma_fuckinway 🇪🇸

4

(4)

5 documentos

1 / 1

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
REGRESION MULTIVARIABLE
La cantidad de info que existe en cada variable por separado, cuando interactúan generan info
que no existe simplemente comparándolas y no por separado: gestión multivariable.
Regresion multiple: predicción
Variable depediente
Variables independientes.
Tabla Boston (data(Boston)): se usa para predecir los precios de la vivienda en Boston según las
variables.
y<-lm(medv =variable que deseamos~.,data=Boston)
x3<-update(y,~.-age-indus)# remove variables que no son buenas para la predicción
anova(x,x2) : comparación de 2 regresiones. = por debajo de 0.05 para que sean
diferentes.
AIC(x,x2): selecciona la mejor regresión porque es mas fiable (la que tiene el índice
menor)
Hay que cumplir unos requisitos para que la regresión sea fiable. (library(car))
Los residuales (diferencias entre los valores que se eligen y los reales) tienen que ser
independientes = cada punto tiene que variar independientemente.
durbinWatsonTest(modelo de regresión = regresión que tengamos y/x3)#the closer to 2
the better. values <1 and >3 malos. = hipótesis nula: independientes = +0.05
La regresión tiene que evitar la multicolinealidad (cada variable debería ser
independiente pero si están correlacionadas = sesgadas = no son independientes)
vif(modelo)#malo si mayor de 10 =ver si hay multicolinealdiad o no. Cada variable con
una serie de valores = todas las que tengan +6 = sospechosas de multicolinealidad = no
validas
Deberian ser similares
Regresion aditiva = elijo variables que yo quiero y las sumo
x<-lm(medv~lstat+age,data=Boston)
Regresion interactiva = quelas variables interactúen para generar información
x2<-lm(medv~lstat*age,data=Boston)
model<-step(full_model,direction="backward")#R cookbook = hace regresiones con
todas las variables para ver cual es la mejores, desprendiendose de las variables menos validas

Vista previa parcial del texto

¡Descarga Análisis de Regresión Multivariable: Predicción de Precios de Vivendas en Boston y más Apuntes en PDF de Arqueología solo en Docsity!

REGRESION MULTIVARIABLE

La cantidad de info que existe en cada variable por separado, cuando interactúan generan info que no existe simplemente comparándolas y no por separado: gestión multivariable. Regresion multiple: predicción Variable depediente Variables independientes. Tabla Boston (data(Boston)): se usa para predecir los precios de la vivienda en Boston según las variables.

  • y<-lm(medv =variable que deseamos~.,data=Boston)
  • x3<-update(y,~.-age-indus)# remove variables que no son buenas para la predicción
  • (^) anova(x,x2) : comparación de 2 regresiones. = por debajo de 0.05 para que sean diferentes.
  • AIC(x,x2): selecciona la mejor regresión porque es mas fiable (la que tiene el índice menor) Hay que cumplir unos requisitos para que la regresión sea fiable. (library(car))
  • (^) Los residuales (diferencias entre los valores que se eligen y los reales) tienen que ser independientes = cada punto tiene que variar independientemente. durbinWatsonTest(modelo de regresión = regresión que tengamos y/x3)#the closer to 2 the better. values <1 and >3 malos. = hipótesis nula: independientes = +0.
  • La regresión tiene que evitar la multicolinealidad (cada variable debería ser independiente pero si están correlacionadas = sesgadas = no son independientes) vif(modelo)#malo si mayor de 10 =ver si hay multicolinealdiad o no. Cada variable con una serie de valores = todas las que tengan +6 = sospechosas de multicolinealidad = no validas
  • Deberian ser similares Regresion aditiva = elijo variables que yo quiero y las sumo
  • x<-lm(medv~lstat+age,data=Boston) Regresion interactiva = quelas variables interactúen para generar información
  • x2<-lm(medv~lstat*age,data=Boston)

model<-step(full_model,direction="backward")#R cookbook = hace regresiones con todas las variables para ver cual es la mejores, desprendiendose de las variables menos validas