Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Libro análisis de datos, Apuntes de Análisis de Datos y Métodos Estadísticos

Es el libro de analisis de datos

Tipo: Apuntes

2019/2020

Subido el 15/02/2020

upf-1
upf-1 🇪🇸

6 documentos

1 / 879

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51
pf52
pf53
pf54
pf55
pf56
pf57
pf58
pf59
pf5a
pf5b
pf5c
pf5d
pf5e
pf5f
pf60
pf61
pf62
pf63
pf64

Vista previa parcial del texto

¡Descarga Libro análisis de datos y más Apuntes en PDF de Análisis de Datos y Métodos Estadísticos solo en Docsity!

ÍNDICE DE CONTENIDO

Prólogo XVII

  • PARTE I: COMPRENSIÓN DE LOS DATOS Razonamiento estadístico XXVII
  • 1 Análisis de distribuciones
    • 1.1 Introducción
    • 1.2 Gráficos de distribuciones - sectores 1.2.1 Variables categóricas: diagramas de barras y diagramas de
      • 1.2.2 Variables cuantitativas: histogramas
      • 1.2.3 Interpretación de los histogramas
      • 1.2.4 Variables cuantitativas: diagramas de tallos
      • 1.2.5 Gráficos temporales
      • Resumen de la sección 1.2
      • Ejercicios de la sección 1.2
    • 1.3 Descripción de las distribuciones con números
      • 1.3.1 Una medida de centro: la media
      • 1.3.2 Una medida de centro: la mediana
      • 1.3.3 Comparación entre la media y la mediana
      • 1.3.4 Una medida de dispersión: los cuartiles
      • 1.3.5 Los cinco números resumen y los diagramas de caja
      • 1.3.6 Una medida de dispersión: la desviación típica
      • 1.3.7 Elección de medidas de centro y de dispersión
        • Resumen de la sección 1.3 VIII / ESTADÍSTICA APLICADA BÁSICA
        • Ejercicios de la sección 1.3
      • 1.4 Distribuciones normales
        • 1.4.1 Curvas de densidad
        • 1.4.2 Mediana y media de una curva de densidad
        • 1.4.3 Distribuciones normales
        • 1.4.4 Regla del 68-95-99,
        • 1.4.5 Distribución normal estandarizada
        • 1.4.6 Cálculos con distribuciones normales
        • 1.4.7 Cómo hallar un valor dada una proporción
        • Resumen de la sección 1.4
        • Ejercicios de la sección 1.4
    • Repaso del capítulo
    • Ejercicios de repaso del capítulo
  • 2 Análisis de relaciones - 2.1 Introducción - 2.2 Diagramas de dispersión - 2.2.1 Interpretación de los diagramas de dispersión - de dispersión 2.2.2 Inclusión de variables categóricas en los diagramas - Resumen de la sección 2.2 - Ejercicios de la sección 2.2 - 2.3 Correlación - 2.3.1 Correlación r - 2.3.2 Características de la correlación - Resumen de la sección 2.3 - Ejercicios de la sección 2.3 - 2.4 Regresión mínimo-cuadrática - 2.4.1 Recta de regresión mínimo-cuadrática - 2.4.2 Características de la regresión mínimo-cuadrática - 2.4.3 Residuos - 2.4.4 Observaciones influyentes - Resumen de la sección 2.4 - Ejercicios de la sección 2.4 - 2.5 Precauciones con la correlación y la regresión - 2.5.1 Extrapolación - 2.5.2 Utilización de medias Índice de contenido / IX - 2.5.3 Variables latentes - 2.5.4 Asociación no implica causalidad - Resumen de la sección 2.5 - Ejercicios de la sección 2.5 - 2.6 Relaciones entre variables categóricas - 2.6.1 Distribuciones marginales - 2.6.2 Descripción de relaciones - 2.6.3 Distribuciones condicionales - 2.6.4 Paradoja de Simpson - Resumen de la sección 2.6 - Ejercicios de la sección 2.6
    • Repaso del capítulo
    • Ejercicios de repaso del capítulo
  • 3 Obtención de datos - 3.1 Introducción - 3.2 Diseño de muestras - 3.2.1 Muestra aleatoria simple - 3.2.2 Otros diseños muestrales - 3.2.3 Muestreo en etapas múltiples - 3.2.4 Precauciones con las encuestas - 3.2.5 Inferencia sobre la población - Resumen de la sección 3.2 - Ejercicios de la sección 3.2 - 3.3 Diseño de experimentos - 3.3.1 Experimentos comparativos - 3.3.2 Experimentos completamente aleatorizados - 3.3.3 Experimentos completamente aleatorizados - 3.3.4 Lógica de los diseños comparativos aleatorizados - 3.3.5 Precauciones con los experimentos - 3.3.6 Diseños por pares - 3.3.7 Diseño en bloques - Resumen de la sección 3.3 - Ejercicios de la sección 3.3
    • Repaso del capítulo
    • Ejercicios de repaso del capítulo
    • PARTE II: COMPRENSIÓN DE LA INFERENCIA X / ESTADÍSTICA APLICADA BÁSICA
  • 4 Distribuciones muestrales y probabilidad - 4.1 Introducción - 4.2 Aleatoriedad - 4.2.1 Concepto de probabilidad - 4.2.2 Pensando en la aleatoriedad - Resumen de la sección 4.2 - Ejercicios de la sección 4.2 - 4.3 Modelos de probabilidad - 4.3.1 Reglas de la probabilidad - 4.3.2 Asignación de probabilidades: número finito de resultados - 4.3.3 Asignación de probabilidades: intervalos de resultados - 4.3.4 Distribuciones normales de probabilidad - Resumen de la sección 4.3 - Ejercicios de la sección 4.3 - 4.4 Distribución de la media muestral - 4.4.1 La estimación estadística y la ley de los grandes números - 4.4.2 Distribuciones muestrales - 4.4.3 Media y desviación típica de x¯ - 4.4.4 Teorema del límite central - Resumen de la sección 4.4 - Ejercicios de la sección 4.4 - 4.5 Gráficos de control - 4.5.1 Gráficos de medias - 4.5.2 Control estadístico de procesos - 4.5.3 Utilización de gráficos de control - 4.5.4 El mundo real: gráficos de medias y desviaciones - Resumen de la sección 4.5 - Ejercicios de la sección 4.5 - Repaso del capítulo - Ejercicios de repaso del capítulo
  • 5 Teoría de probabilidad - 5.1 Introducción - 5.2 Reglas generales de la probabilidad - 5.2.1 La independencia y la regla de la multiplicación - 5.2.2 Aplicación de la regla de la multiplicación Índice de contenido / XI - 5.2.3 Regla general de la suma - Resumen de la sección 5.2 - Ejercicios de la sección 5.2 - 5.3 Distribuciones binomiales - 5.3.1 Situación binomial - 5.3.2 Probabilidades binomiales - 5.3.3 Media y desviación típica binomiales - 5.3.4 Aproximación normal a distribuciones binomiales - Resumen de la sección 5.3 - Ejercicios de la sección 5.3 - 5.4 Probabilidad condicional - 5.4.1 Generalización de la regla de la multiplicación - 5.4.2 Probabilidad condicional y independencia - Resumen de la sección 5.4 - Ejercicios de la sección 5.4
    • Repaso del capítulo
    • Ejercicios de repaso del capítulo
  • 6 Introducción a la inferencia estadística - 6.1 Introducción - 6.2 Estimación con confianza - 6.2.1 Confianza estadística - 6.2.2 Intervalos de confianza para la media μ - 6.2.3 Comportamiento de los intervalos de confianza - 6.2.4 Elección del tamaño de la muestra - 6.2.5 Algunas precauciones - Resumen de la sección 6.2 - Ejercicios de la sección 6.2 - 6.3 Pruebas de significación - 6.3.1 Razonamientos de las pruebas de significación - 6.3.2 Terminología de las pruebas de significación - 6.3.3 Más detalles: planteamiento de las hipótesis - 6.3.4 Más detalles: valores P y significación estadística - 6.3.5 Pruebas de significación para una media poblacional - 6.3.6 Pruebas con un nivel de significación predeterminado - 6.3.7 Pruebas derivadas de los intervalos de confianza - Resumen de la sección 6.3 XII / ESTADÍSTICA APLICADA BÁSICA - Ejercicios de la sección 6.3 - 6.4 Utilización de las pruebas de significación - 6.4.1 ¿Cuál tiene que ser el valor P? - 6.4.2 Significación estadística y significación práctica - conjunto de datos 6.4.3 La inferencia estadística no es válida para cualquier - 6.4.4 Cuidado con los análisis múltiples - Resumen de la sección 6.4 - Ejercicios de la sección 6.4 - 6.5 Tipos de error y potencia - 6.5.1 Errores tipo I y errores tipo II - 6.5.2 Probabilidades de error - 6.5.3 Potencia - Resumen de la sección 6.5 - Ejercicios de la sección 6.5
    • Repaso del capítulo
    • Ejercicios de repaso del capítulo
  • 7 Inferencia para medias y desviaciones típicas - 7.1 Introducción - 7.2 Inferencia para la media de una población - 7.2.1 Distribuciones t - 7.2.2 Intervalos y pruebas t - 7.2.3 Utilización de procedimientos t de una muestra - 7.2.4 Procedimientos t para diseños por pares - 7.2.5 Robustez de los procedimientos t - Resumen de la sección 7.2 - Ejercicios de la sección 7.2 - 7.3 Comparación de dos medias - 7.3.1 Problemas de dos muestras - 7.3.2 Comparación de dos medias poblacionales - 7.3.3 Procedimientos t de dos muestras - 7.3.4 Ejemplos de procedimientos t de dos muestras - 7.3.5 Otra vez la robustez - 7.3.6 Procedimientos t de dos muestras más precisos - 7.3.7 Procedimientos t de dos muestras con varianza común - Resumen de la sección 7.3 Índice de contenido / XIII - Ejercicios de la sección 7.3 - 7.4 Inferencia para la dispersión poblacional - 7.4.1 Evita la inferencia sobre desviaciones típicas - 7.4.2 Prueba F para comparar dos desviaciones típicas - Resumen de la sección 7.4 - Ejercicios de la sección 7.4
    • Repaso del capítulo
    • Ejercicios de repaso del capítulo
  • 8 Inferencia para proporciones - 8.1 Introducción - 8.2 Inferencia para una proporción poblacional - 8.2.1 Distribución de pˆ - 8.2.2 Supuestos para la inferencia - 8.2.3 Procedimientos z - 8.2.4 Elección del tamaño de la muestra - Resumen de la sección 8.2 - Ejercicios de la sección 8.2 - 8.3 Comparación de dos proporciones - 8.3.1 Distribución de pˆ 1 − pˆ - 8.3.2 Intervalos de confianza para p 1 − p - 8.3.3 Pruebas de significación para p 1 − p - Resumen de la sección 8.3 - Ejercicios de la sección 8.3
    • Repaso del capítulo
    • Ejercicios de repaso del capítulo
  • PARTE III: TEMAS RELACIONADOS CON LA INFERENCIA
  • 9 Inferencia para tablas de contingencia - 9.1 Introducción - 9.1.1 El problema de las comparaciones múltiples - 9.2 Tablas de contingencia - 9.2.1 Recuentos esperados - 9.3 Prueba Ji cuadrado XIV / ESTADÍSTICA APLICADA BÁSICA - 9.3.1 Distribuciones Ji cuadrado - 9.3.2 Más aplicaciones de la prueba Ji cuadrado - 9.3.3 Recuentos exigidos en las celdas para la prueba Ji cuadrado - 9.3.4 Prueba Ji cuadrado y prueba z - Resumen de la sección 9.3
    • Repaso del capítulo
    • Ejercicios de repaso del capítulo
  • 10 Análisis de la varianza de un factor: comparación de varias medias - 10.1 Introducción - 10.1.1 El problema de las comparaciones múltiples - 10.2 Prueba F del análisis de la varianza - 10.2.1 La idea del análisis de la varianza - 10.2.2 Supuestos del ANOVA - 10.3 Algunos detalles sobre el ANOVA*
    • Resumen
    • Repaso del capítulo
    • Ejercicios de repaso del capítulo
  • 11 Inferencia para regresión - 11.1 Introducción - 11.1.1 Modelo de la regresión - 11.2 Inferencia para el modelo - 11.2.1 Intervalos de confianza para la pendiente de la regresión - 11.2.2 Contraste de hipótesis para una relación no lineal - 11.3 Inferencia para la predicción - 11.4 Comprobación de los supuestos de la regresión
    • Resumen
    • Repaso del capítulo
    • Ejercicios de repaso del capítulo
  • 12 Pruebas no paramétricas - 12.1 Introducción - 12.2 Prueba de Wilcoxon de suma de rangos - 12.2.1 Rangos - 12.2.2 Prueba de Wilcoxon de suma de rangos Índice de contenido / XV - 12.2.3 Aproximación normal - 12.2.4 ¿Qué hipótesis plantea la prueba de Wilcoxon? - 12.2.5 Empates - 12.2.6 Limitaciones de las pruebas no paramétricas - Resumen de la sección 12.2 - Ejercicios de la sección 12.2
    • 12.3 Prueba de Wilcoxon de suma de rangos de diferencias
      • 12.3.1 Aproximación normal
      • 12.3.2 Empates
      • Resumen de la sección 12.3
      • Ejercicios de la sección 12.3
    • 12.4 Prueba de Kruskal-Wallis
      • 12.4.1 Supuestos e hipótesis
      • 12.4.2 Prueba de Kruskal-Wallis
      • Resumen de la sección 12.4
      • Ejercicios de la sección 12.4
  • Repaso del capítulo
  • Ejercicios de repaso del capítulo
    • Repaso del pensamiento estadístico
    • Apéndice
    • Tabla A: Probabilidades normales estandarizadas
    • Tabla B: Dígitos aleatorios
    • Tabla C: Valores críticos de la distribución t
    • Tabla D: Valores críticos de la distribución F
    • Tabla E: Valores críticos de la distribución Ji cuadrado
    • Soluciones de ejercicios seleccionados
    • Índice analítico

PRÓLOGO

Estadística aplicada básica (versión en castellano de The Basic Practice of Statistics) es una introducción a la estadística para estudiantes universitarios que enfatiza el trabajo con datos y las ideas estadísticas. En este prólogo describo el contenido del libro con el objeto de ayudar a los profesores a juzgar si este libro es adecua- do para sus alumnos. Principios básicos Hasta ahora, los cursos de introducción a la estadística se centraban en la probabi- lidad y en la inferencia. Estadística aplicada básica refleja una nueva corriente en la enseñanza de la estadística en la que el análisis de datos y el diseño de métodos para su obtención constituyen, junto con los métodos de inferencia basados en la probabilidad, los temas principales. Los estadísticos han llegado a un amplio consenso sobre los contenidos de cursos universitarios de introducción a la esta- dística. Tal como dice Richard Schaffer: “con relación al contenido de un curso de introducción a la estadística, los estadísticos están mucho más de acuerdo ahora que cuando yo empecé a trabajar”.^1 La figura 1 es un esquema de este consen- so de acuerdo con la Sociedad Americana de Estadística (ASA) y la Asociación Americana de Matemáticas (MAA).^2 Como miembro que fui del comité conjunto de la ASA/MAA, estoy de acuer- do con sus conclusiones: aunque el trabajo con datos puede suponer una ayuda, fomentar el aprendizaje activo es tarea del profesor. Por ello, las dos primeras recomendaciones son los principios directores de este texto. Si bien el libro es (^1) D. S. Moore et al., “New pedagogy and new content: the case of statistics”, International Statistical Review, 65, 1997, págs. 123-165. El comentario de Richard Scheaffer aparece en la página 156. (^2) George Cobb, “Teaching statistics” en L. A. Steen (ed.), Heeding the Call for Change: Suggestions for Curricular Action, Mathematical Association of America, Washington, D.C., 1990, págs. 3-43.

XVIII / ESTADÍSTICA APLICADA BÁSICA

elemental con relación al nivel de matemáticas exigido y a los procedimientos es- tadísticos que se presentan, aspira a facilitar a los estudiantes tanto la compren- sión de las principales ideas de la estadística como la adquisición de una serie de habilidades útiles para trabajar con datos. Los ejemplos y los ejercicios que se pre- sentan, aunque están pensados para principiantes, utilizan datos reales y dan una información general que permite a los estudiantes comprender el significado de sus cálculos. A menudo pido a los alumnos conclusiones que son algo más que un número (o “rechazar H 0 ”). Aparte de hacer cálculos y sacar conclusiones correctas o erróneas, algunos ejercicios exigen hacer valoraciones. Espero que los profeso- res fomenten en clase un amplio debate sobre los resultados de los ejercicios.

  1. Ayudar a pensar como estadísticos: (a) La necesidad de tener datos. (b) La importancia de la obtención de datos. (c) La omnipresencia de la variabilidad. (d) La medición y calibración de la variabilidad.
  2. Ofrecer más datos y conceptos, y menos teoría y fórmulas. Siempre que sea posible automatiza los cálculos y las representaciones gráficas. Un curso introductorio debe: (a) Confiar plenamente en datos reales (no que solamente lo parezcan). (b) Enfatizar los conceptos estadísticos; por ejemplo, causalidad frente a asociación, experimental versus observacional. (c) Apoyarse más en los ordenadores que en las fórmulas de cálculo. (d) No dar demasiada importancia a las demostraciones matemáticas.
  3. Fomentar la enseñanza activa, a través de las siguientes alternativas al es- tudio individual: (a) Discutir y resolver problemas en grupo. (b) Hacer ejercicios con ordenadores. (c) Trabajar con datos obtenidos en clase. (d) Presentar ejercicios por escrito y exponerlos en el aula. (e) Diseñar proyectos estadísticos de forma individual y en grupo. Figura 1. Recomendaciones de la Sociedad Americana de Estadística (ASA) y de la Asociación Americana de Matemáticas (MAA).

Prólogo / XIX Los capítulos 1 y 2 presentan los métodos y las ideas que unifican el análisis de datos. Los estudiantes agradecen la utilidad del análisis de datos, y el hecho de que realmente puedan hacerlo alivia un poco su inquietud sobre la estadística. Es- pero que los estudiantes se acostumbren a examinar los datos y que sigan reali- zando este análisis aun cuando el objetivo principal del análisis sea dar respuesta a una pregunta concreta mediante inferencia. El capítulo 3 trata sobre el muestreo aleatorio y los experimentos comparativos aleatorizados. Éstos, pese a encontrar- se entre las ideas más importantes de la estadística, suelen omitirse injustamente al iniciar su enseñanza. El capítulo 4 se basa en las ideas del capítulo 3 y en las herramientas del análisis de datos del capítulo 1 para presentar el concepto de distribución muestral y, de una manera informal, el lenguaje de la probabilidad. El capítulo 5, que es opcional, presenta material adicional para cursos que exijan presentar la probabilidad de una manera más formal. El capítulo 6, que describe los razonamientos en los que se basa la inferencia estadística, es la piedra angular del resto del libro. Los restantes capítulos presentan métodos de inferencia apli- cables a diversas situaciones, dando especial énfasis a los aspectos prácticos de la utilización de dichos métodos. Los capítulos 7 y 8 presentan los procedimientos básicos para hacer inferencia a partir de una y de dos muestras. Los capítulos 9, 10 y 11 (que se pueden leer de forma independiente y en cualquier orden) ofrecen una selección de algunos temas más avanzados. El capítulo 12 es una introduc- ción a los métodos inferenciales no paramétricos. Tecnología Los cálculos automáticos aumentan la capacidad de los estudiantes para resol- ver problemas, reducen su frustración y les ayudan a concentrarse en las ideas y en la identificación del problema más que en la mecánica de su resolución. Este libro exige de los estudiantes que dispongan de una calculadora que pue- da hallar la correlación y la regresión lineal simple, así como la media y la des- viación típica. Como los estudiantes tienen calculadoras, el texto no discute las fórmulas de cálculo de la desviación típica muestral o de la recta de regresión mínimo-cuadrática. Los programas estadísticos tienen considerables ventajas so- bre las calculadoras: la introducción y la edición de los datos es más fácil, y los gráficos son mucho mejores. Animo al empleo de programas estadísticos siem- pre que los recursos y el tiempo disponible para desarrollar el curso lo permitan. Este libro, sin embargo, no da por supuesto que los estudiantes utilizarán estos programas.