








































Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: Disseny Experimental i Anàlisi de Dades, Profesor: , Carrera: Biotecnologia, Universidad: UB
Tipo: Apuntes
1 / 48
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!









































Introducció dades forma manual
l'acumulació de 4 vectors en columna
col1 <- c(1.1, 2.2, 3.3, 4.4, 5.5, 6, 7.7, 8, 9, 10) # dades exemple col 1, observeu la utilització del punt decimal i no la coma
col2 <- c(-1E3, -2E-2, -300E4, 4, -5, -6, -7, -8, NA, -10) # dades exemple col 2, amb exponents, la 9na dada missing
col3 <- rep(1,10) # dades exemple col 3, repetició 10 cops "1"
col4 <- 1:10 # dades exemple col 4, seqüència 1 a 10
myData <- data.frame(col1, col2, col3, col4)
colnames(myData) <- c("Variable_1", "Variable_2", "Repetició", "Seqüència")
rownames(myData) <- c("Cas 1", "Cas 2", paste("Cas",seq(3,10))) # observeu la generació dels noms 3 a 10
Introducció dades amb taula
l'encapçalament
que continguin aquesta tira
myHeader <- TRUE # posar FALSE si no hi ha fila d'encapçalament myPath <- '' # per defecte el directori on apunta RGui, si s'ha d'especificar seguir
documentos/Exemples dead' myFile <- 'ExempleInicial.csv' # nom de l'arxiu, extensió inclosa myNAspec <- ' ' # així els NA corresponen a un espai en blanc
myData <- read.table(paste(myPath,myFile,sep=""),sep=";",header=myHeader, dec=",", na.strings=myNAspec);
boxplot(myData[,myVars],main=myTitle,col=myColours)
hist(myData[,1],main='Histograma',col='palegreen')
plot(myData[,1],myData[,4],main='Diagrama de dispersió',col='red',xlab='una variable',ylab='una altra variable')
Proves amb 1 y 2 muestras (siguen una normal)
el nom de la variable
de les 2 variables
de les 2 variables
myVar <- 1 # 1ra variable del dataFrame myH0 <- 3 # testem si mu0 = 3 myConfLev <- 0.95 # interval del 95% mySide <- 'g' # H1 unilateral dreta (altres possibilitats 't'=bilateral, 'l'=unit. esquerra)
t.test(myData[,myVar],mu=myH0,alternative=mySide,conf.level=myConfLev)
t.test(myData$Variable_1,mu=myH0,alternative=mySide,conf.level=myConfLev)
myX <- 10 # 10 succesos myN <- 20 # 20 repeticions myH0 <- 0.4 # testem si p0 = 0. myConfLev <- 0.95 # interval del 95% mySide <- 'g' # H1 unilateral dreta (altres possibilitats 't'=bilateral, 'l'=unit. esquerra)
prop.test(x=myX,n=myN,p=myH0,alternative=mySide,conf.level=myConfLev)
myX <- c(10,15) # 10 i 15 succesos myN <- c(26,32) # 26 i 32 repeticions myConfLev <- 0.95 # interval del 95% mySide <- 't' # H1 bilateral (altres possibilitats 'g'=unit. dreta, 'l'=unit. esquerra)
Pruebas chi cuadrado
myData <- data.frame(c(89,37,30,28,2))
myVar <- 1 # 1ra variable del dataFrame myProbs <- c(40,20,20,15,5) # vector probabilitats, es reescala tot a 1
chiTest <- chisq.test(myData[,myVar],correct = FALSE,p=myProbs,rescale.p= TRUE) print(chiTest$expected) print(chiTest)
col1 <- c(100, 200, 300, 400) # dades categoria B1: els valors son els comptatges de A1, A2 A3 i A4 en B col2 <- c(15, 25, 70, 10) # dades categoria B2: els valors son els comptatges de A1, A2 A3 i A4 en B myData <- data.frame(col1,col2) colnames(myData) <- c('B1','B2') rownames(myData) <- c('A1','A2','A3','A4')
myVars <- c(1,2) # 1ra i segona variables del dataFrame. Si B té k categories, posar c(1:k) chiTest <- chisq.test(myData[,myVars],correct = FALSE) print(chiTest$observed) print(chiTest$expected) print(chiTest)
y <- myData[,myVars[2]]
reg <- lm (y ~ x)
summary(reg) # resum general del ajust
anova(reg) # test coeficient de correlació reg$coefficients[1] # ordenada a l'origen reg$coefficients[2] # pendent
reg$residuals # residus
confint(reg,level=0.95) # interval de confiança dels coeficients. Canviar el 0.95 per altres confiances si s'escau
predict(reg,data.frame(x=c(7,-2)),interval='prediction') # cerquem la predicció dels valors x=7 i després x=- predict(reg,data.frame(x=c(7,-2)),interval='confidence') # cerquem la predicció dels valors x= i després x=-
plot(x,y,main='Exemple scatterplot')
plot(reg)
cor.test(x,y)
segona la variable resposta
columnes i noms)
instrucció rep concatenada
respectivament 4, 3, 5 i 6 rèpliques es genera amb
l'ANOVA
colnames(myData) <- c('factor', 'resp')
columna 'resp'
columnes), nom del anova etc
plot(data.aov)
bartlett.test(resp ~ factor, myData)
shapiro.test(data.aov$residuals)
columna 'resp'
les columnes)
summary(myData$factor) # rèpliques en cada nivell summary(myData$resp) # summary global by(myData$resp,myData$factor, summary) # summary per nivell by(myData$resp,myData$factor, sd) # desv. estandard per nivell
boxplot(resp ~ factor, myData)
plot(tapply(myData$resp, myData$factor, var), tapply(myData$resp, myData$factor, mean), xlab='Variància resposta segons factor',
segona la variable resposta
columnes i noms)
instrucció rep concatenada
respectivament 4, 3, 5 i 6 rèpliques es genera amb
l'ANOVA
colnames(myData) <- c('factor', 'resp')
columna
myIndFactor <- 1 myData[,myIndFactor] <- as.factor(myData[,myIndFactor])
library(nlme)
d'efecte fix data.aov <- aov(resp ~ factor, myData) # generem l'objecte data.aov, un ANOVA 1F anova(data.aov)
data.lme <- lme(resp ~ 1, random = ~ 1 | factor, data = myData,method = "REML") varcomp <- VarCorr(data.lme) varcompN <- as.double(varcomp)
paste('Component variància factor', round(varcompN[1]/sum(varcompN[1:2])100,4),'%') paste('Component variància residual',round(varcompN[2]/sum(varcompN[1:2])100,4),'%')