



Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: Fonaments de computadors, Profesor: Xavier Xarles, Carrera: Enginyeria Informàtica, Universidad: UAB
Tipo: Apuntes
1 / 7
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!




Los datos del fichero EdadPesoGrasas.txtcorresponden a tres variables medidas en 25 individuos: edad, peso y
cantidad de grasas en sangre. Para leer el fichero de datos y saber los nombres de las variables:
grasas <- read.table("http://www.uam.es/joser.berrendero/datos/EdadPesoGrasas.txt", header = TRUE) names(grasas)
Con el fin de conocer las relaciones existentes entre cada par de variables podemos representar una matriz de diagramas de dispersión. Al parecer existe una relación lineal bastante clara entre la edad y las grasas, pero no entre los
otros dos pares de variables. Por otra parte el fichero contiene un dato atípico.
pairs(grasas)
Para cuantificar el grado de relación lineal, calculamos la matriz de coeficientes de correlación:
cor(grasas)
El comando básico es lm(linear models). El primer argumento de este comando es una fórmula y ~ xen la que se especifica cuál es la variable respuesta o dependiente ( ) y cuál es la variable regresora o independiente ( ). El
segundo argumento, llamado dataespecifica cuál es el fichero en el que se encuentran las variables. El resultado lo guardamos en un objeto llamado regresion. Este objeto es una lista que contiene toda la información relevante sobre el análisis. Mediante el comando summaryobtenemos un resumen de los principales resultados:
regresion <- lm(grasas ~ edad, data = grasas) summary(regresion)
Los parámetros de la ecuación de la recta de mínimos cuadrados que relaciona la cantidad de grasas en la sangre en
función del peso vienen dados por la columna ´Estimate´ de la tabla ´Coefficients´ de la salida anterior. Por lo tanto, en este ejemplo la ecuación de la recta de mínimos cuadrados es:
Los siguientes comandos representan la nube de puntos (comando plot) y añaden la representación gráfica de la recta
de mínimos cuadrados (comando ablineaplicado al objeto generado por lm):
plot(grasas$edad, grasas$grasas, xlab = "Edad", ylab = "Grasas") abline(regresion)
El coeficiente de determinación (es decir, el coeficiente de correlación al cuadrado) mide la bondad del ajuste de la
recta a los datos. A partir de la salida anterior, vemos que su valor en este caso es Multiple R-squared: 0. 701.
nuevas.edades <- data.frame(edad = seq( 20 , 6 0 ))
plot(grasas$edad, grasas$grasas, xlab = "Edad", ylab = "Grasas") abline(regresion)
ic <- predict(regresion, nuevas.edades, interval = "confidence") lines(nuevas.edades$edad, ic[, 2], lty = 2) lines(nuevas.edades$edad, ic[, 3], lty = 2)
ic <- predict(regresion, nuevas.edades, interval = "prediction") lines(nuevas.edades$edad, ic[, 2], lty = 2, col = "red") lines(nuevas.edades$edad, ic[, 3], lty = 2, col = "red")
La tabla de análisis de la varianza de los errores se obtiene con el comando anova:
anova(regresion)
Los valores ajustados y los residuos se pueden obtener con los comandos residualsy fitted
respectivamente. Los residuos estandarizados se obtienen con rstandard. Por ejemplo, el siguiente código obtiene
una representación de los residuos estandarizados frente a los valores ajustados, que resulta útil al llevar a cabo el diagnóstico del modelo:
residuos <- rstandard(regresion) valores.ajustados <- fitted(regresion) plot(valores.ajustados, residuos)
No se observa ningún patrón especial, por lo que tanto la homocedasticidad como la linealidad resultan hipótesis razonables.
La hipótesis de normalidad se suele comprobar mediante un QQ plot de los residuos. El siguiente código sirve para obtenerlo:
qqnorm(residuos) qqline(residuos)
x = seq( 1 , 1 0 ) beta0 <- 0 beta1 <- 1 sigma <- 0. 3
y <- beta0 + beta1 * x + rnorm(length(x), sd = sigma)
reg <- lm(y ~ x)
coefficients(reg)[ 2 ]
summary(reg)