
















































Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: Análisis de Datos, Profesor: camen camen, Carrera: Biología, Universidad: UAM
Tipo: Apuntes
1 / 56
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!

















































1
"Del rigor en la ciencia", micro relato de Jorge Luis Borges En aquel Imperio, el Arte de la Cartografía logró tal Perfección que el Mapa de una sola Provincia ocupaba toda una Ciudad, y el Mapa del Imperio, toda una Provincia. Con el tiempo, estos Mapas Desmesurados no satisficieron y los Colegios de Cartógrafos levantaron un Mapa del Imperio, que tenía el Tamaño del Imperio y coincidía puntualmente con él. Menos Adictas al Estudio de la Cartografía, las Generaciones Siguientes entendieron que ese dilatado Mapa era Inútil y no sin Impiedad lo entregaron a las Inclemencias del Sol y los Inviernos. En los Desiertos del Oeste perduran despedazadas Ruinas del Mapa, habitadas por Animales y por Mendigos; en todo el País no hay otra reliquia de las Disciplinas Geográficas. Suárez Miranda: Viajes de varones prudentes, libro cuarto, cap. XLV, Lérida, 1658. Un modelo matemático (como un mapa) es una idealización de la realidad. Un modelo matemático (como un mapa) tiene que ser útil para el propósito que se persigue y representar la realidad al nivel de precisión necesario… 2
Modelos, datos y métodos La Inferencia estadística o Estadística matemática combina las propiedades de un modelo matemático teórico (formulación matemática de como creemos que se comportan las variables aleatorias de interés) con la información obtenida a partir de la observación repetida de dichas variables (es decir, de los datos) El modelo teórico representa a toda la población Los datos son los valores observados en una muestra Los métodos estadísticos utilizan las propiedades teóricas del modelo para evaluar la fiabilidad y confianza que tenemos en las conclusiones extraídas de los datos de una muestra y medir el tamaño de los posibles errores. 4
Elementos básicos del procedimiento estadístico
intervienen y sus propiedades teóricas. Parámetros del modelo.
realizarse, procedimiento a seguir. Modelo teórico para la toma de datos y sus propiedades.
realizar efectivamente las observaciones previstas.
diseño establecido: estimación de los parámetros, intervalos de confianza, contrates de hipótesis,… 5
7 7
8 8
10
Tema 1: Análisis de la varianza unifactorial Analiza y compara el comportamiento de una variable continua Y en distintos niveles (poblaciones o grupos o tratamientos) de un factor (variable explicativa) Ejemplo: producción de un cultivo en parcelas iguales con distintos fertilizantes Tema 2: Análisis de la varianza con varios factores Analiza y compara el comportamiento de una variable continua Y en distintos niveles de varios factores (variables explicativas) y las posibles interacciones entre ellos. Ejemplo: altura de una especie de árboles en distintos suelos y distintos climas. 10
REGRESIÓN Las variables explicativas son cuantitativas Tema 3: Regresión lineal simple Analiza el comportamiento de una variable continua Y a través de los valores de otra variable continua X (variable explicativa) Ejemplo: peso de un caimán en relación a su longitud medida por fotos desde el aire. Tema 4: Regresión lineal múltiple Analiza el comportamiento de una variable continua Y a través de los valores de otras variables continuas X 1
k (variables explicativas) Ejemplo: crecimiento de un tipo de cultivo en función de las cantidades de distintas sustancias en el agua que lo riega. 11
Planteamiento del problema Deseamos estudiar el efecto sobre una misma variable de distintas poblaciones (IMC de hombres y mujeres, producción de trigo con distintos abonos, contenido en proteínas de distintos grupos de alimentos, etc.) Supongamos que la variable de interés (IMC, producción, contenido en proteínas, etc.) sigue una distribución Normal con, posiblemente, distintas medias en las distintas poblaciones
Por razones de simplicidad, supondremos que las varianzas son
común. Nos interesa decidir si las medias son, en realidad, todas iguales o algunas son distintas 13
14 Planteamiento del Modelo Definición de la variable a explicar (también llamada variable respuesta o variable dependiente) Definición de la variable explicativa (factor) y de sus I distintos niveles (poblaciones, grupos, tratamientos...) Modelo: Y i = m i
i representa los posibles valores de la variable en el i-ésimo nivel del factor explicativo. Sigue una distribución N( m i , s)
i es la variación aleatoria de las Yi no debida a los niveles del factor (v.a. independientes y con la misma distribución N(0, s ) para todo i )
i es el valor medio (esperado) de Y i
i
i
i
i
14
Muestra aleatoria y datos
ij resultado que obtendremos en la j-ésima observación dentro del i-ésimo nivel del factor explicativo. i = 1,2,…,I; j = 1,2,…,n i (ni es el tamaño de la muestra en el nivel i) Y 13 = kilos de trigo que obtendremos en la 3ª parcela tratada con el abono 1
ij resultado obtenido en la j-ésima observación dentro del i-ésimo nivel del factor explicativo. y 13 = kilos de trigo finalmente obtenidos en la 3ª parcela tratada con el abono 1 nº total de datos: n = n 1 +...+n I Si todas las muestras tienen el mismo tamaño (n 1 =...= n I ) el diseño se llama equilibrado. 16
17 Factor 1 2 3 20 18 21 22 19 25
n i
s i 2 6.2 17.7 16. Muestra aleatoria Datos (ejemplo: kilos de trigo producidos en 15 parcelas iguales con 3 abonos diferentes) y 34 17
Intervalos de confianza para los parámetros En el ejemplo de la diapositiva 17: S R 2 = 12, 19
20 Contraste de igualdad de medias H 0 : m 1
2
I (todas las medias son iguales, el factor no influye) H 1 : m i
j
(al menos una de las medias es diferente, el factor influye) También podemos escribir las hipótesis equivalentemente como: H 0 : a 1 = a 2 =...= a I = 0 (el factor no influye) H 1 : a i ≠ 0 para algún i (algún nivel del factor influye) La técnica para resolver este contraste se llama ANOVA (Analysis Of Variance) 20