¡Descarga Libro análisis de datos y más Apuntes en PDF de Análisis de Datos y Métodos Estadísticos solo en Docsity!
ÍNDICE DE CONTENIDO
Prólogo XVII
- PARTE I: COMPRENSIÓN DE LOS DATOS Razonamiento estadístico XXVII
- 1 Análisis de distribuciones
- 1.1 Introducción
- 1.2 Gráficos de distribuciones - sectores 1.2.1 Variables categóricas: diagramas de barras y diagramas de
- 1.2.2 Variables cuantitativas: histogramas
- 1.2.3 Interpretación de los histogramas
- 1.2.4 Variables cuantitativas: diagramas de tallos
- 1.2.5 Gráficos temporales
- Resumen de la sección 1.2
- Ejercicios de la sección 1.2
- 1.3 Descripción de las distribuciones con números
- 1.3.1 Una medida de centro: la media
- 1.3.2 Una medida de centro: la mediana
- 1.3.3 Comparación entre la media y la mediana
- 1.3.4 Una medida de dispersión: los cuartiles
- 1.3.5 Los cinco números resumen y los diagramas de caja
- 1.3.6 Una medida de dispersión: la desviación típica
- 1.3.7 Elección de medidas de centro y de dispersión
- Resumen de la sección 1.3 VIII / ESTADÍSTICA APLICADA BÁSICA
- Ejercicios de la sección 1.3
- 1.4 Distribuciones normales
- 1.4.1 Curvas de densidad
- 1.4.2 Mediana y media de una curva de densidad
- 1.4.3 Distribuciones normales
- 1.4.4 Regla del 68-95-99,
- 1.4.5 Distribución normal estandarizada
- 1.4.6 Cálculos con distribuciones normales
- 1.4.7 Cómo hallar un valor dada una proporción
- Resumen de la sección 1.4
- Ejercicios de la sección 1.4
- Repaso del capítulo
- Ejercicios de repaso del capítulo
- 2 Análisis de relaciones - 2.1 Introducción - 2.2 Diagramas de dispersión - 2.2.1 Interpretación de los diagramas de dispersión - de dispersión 2.2.2 Inclusión de variables categóricas en los diagramas - Resumen de la sección 2.2 - Ejercicios de la sección 2.2 - 2.3 Correlación - 2.3.1 Correlación r - 2.3.2 Características de la correlación - Resumen de la sección 2.3 - Ejercicios de la sección 2.3 - 2.4 Regresión mínimo-cuadrática - 2.4.1 Recta de regresión mínimo-cuadrática - 2.4.2 Características de la regresión mínimo-cuadrática - 2.4.3 Residuos - 2.4.4 Observaciones influyentes - Resumen de la sección 2.4 - Ejercicios de la sección 2.4 - 2.5 Precauciones con la correlación y la regresión - 2.5.1 Extrapolación - 2.5.2 Utilización de medias Índice de contenido / IX - 2.5.3 Variables latentes - 2.5.4 Asociación no implica causalidad - Resumen de la sección 2.5 - Ejercicios de la sección 2.5 - 2.6 Relaciones entre variables categóricas - 2.6.1 Distribuciones marginales - 2.6.2 Descripción de relaciones - 2.6.3 Distribuciones condicionales - 2.6.4 Paradoja de Simpson - Resumen de la sección 2.6 - Ejercicios de la sección 2.6
- Repaso del capítulo
- Ejercicios de repaso del capítulo
- 3 Obtención de datos - 3.1 Introducción - 3.2 Diseño de muestras - 3.2.1 Muestra aleatoria simple - 3.2.2 Otros diseños muestrales - 3.2.3 Muestreo en etapas múltiples - 3.2.4 Precauciones con las encuestas - 3.2.5 Inferencia sobre la población - Resumen de la sección 3.2 - Ejercicios de la sección 3.2 - 3.3 Diseño de experimentos - 3.3.1 Experimentos comparativos - 3.3.2 Experimentos completamente aleatorizados - 3.3.3 Experimentos completamente aleatorizados - 3.3.4 Lógica de los diseños comparativos aleatorizados - 3.3.5 Precauciones con los experimentos - 3.3.6 Diseños por pares - 3.3.7 Diseño en bloques - Resumen de la sección 3.3 - Ejercicios de la sección 3.3
- Repaso del capítulo
- Ejercicios de repaso del capítulo
- PARTE II: COMPRENSIÓN DE LA INFERENCIA X / ESTADÍSTICA APLICADA BÁSICA
- 4 Distribuciones muestrales y probabilidad - 4.1 Introducción - 4.2 Aleatoriedad - 4.2.1 Concepto de probabilidad - 4.2.2 Pensando en la aleatoriedad - Resumen de la sección 4.2 - Ejercicios de la sección 4.2 - 4.3 Modelos de probabilidad - 4.3.1 Reglas de la probabilidad - 4.3.2 Asignación de probabilidades: número finito de resultados - 4.3.3 Asignación de probabilidades: intervalos de resultados - 4.3.4 Distribuciones normales de probabilidad - Resumen de la sección 4.3 - Ejercicios de la sección 4.3 - 4.4 Distribución de la media muestral - 4.4.1 La estimación estadística y la ley de los grandes números - 4.4.2 Distribuciones muestrales - 4.4.3 Media y desviación típica de x¯ - 4.4.4 Teorema del límite central - Resumen de la sección 4.4 - Ejercicios de la sección 4.4 - 4.5 Gráficos de control - 4.5.1 Gráficos de medias - 4.5.2 Control estadístico de procesos - 4.5.3 Utilización de gráficos de control - 4.5.4 El mundo real: gráficos de medias y desviaciones - Resumen de la sección 4.5 - Ejercicios de la sección 4.5 - Repaso del capítulo - Ejercicios de repaso del capítulo
- 5 Teoría de probabilidad - 5.1 Introducción - 5.2 Reglas generales de la probabilidad - 5.2.1 La independencia y la regla de la multiplicación - 5.2.2 Aplicación de la regla de la multiplicación Índice de contenido / XI - 5.2.3 Regla general de la suma - Resumen de la sección 5.2 - Ejercicios de la sección 5.2 - 5.3 Distribuciones binomiales - 5.3.1 Situación binomial - 5.3.2 Probabilidades binomiales - 5.3.3 Media y desviación típica binomiales - 5.3.4 Aproximación normal a distribuciones binomiales - Resumen de la sección 5.3 - Ejercicios de la sección 5.3 - 5.4 Probabilidad condicional - 5.4.1 Generalización de la regla de la multiplicación - 5.4.2 Probabilidad condicional y independencia - Resumen de la sección 5.4 - Ejercicios de la sección 5.4
- Repaso del capítulo
- Ejercicios de repaso del capítulo
- 6 Introducción a la inferencia estadística - 6.1 Introducción - 6.2 Estimación con confianza - 6.2.1 Confianza estadística - 6.2.2 Intervalos de confianza para la media μ - 6.2.3 Comportamiento de los intervalos de confianza - 6.2.4 Elección del tamaño de la muestra - 6.2.5 Algunas precauciones - Resumen de la sección 6.2 - Ejercicios de la sección 6.2 - 6.3 Pruebas de significación - 6.3.1 Razonamientos de las pruebas de significación - 6.3.2 Terminología de las pruebas de significación - 6.3.3 Más detalles: planteamiento de las hipótesis - 6.3.4 Más detalles: valores P y significación estadística - 6.3.5 Pruebas de significación para una media poblacional - 6.3.6 Pruebas con un nivel de significación predeterminado - 6.3.7 Pruebas derivadas de los intervalos de confianza - Resumen de la sección 6.3 XII / ESTADÍSTICA APLICADA BÁSICA - Ejercicios de la sección 6.3 - 6.4 Utilización de las pruebas de significación - 6.4.1 ¿Cuál tiene que ser el valor P? - 6.4.2 Significación estadística y significación práctica - conjunto de datos 6.4.3 La inferencia estadística no es válida para cualquier - 6.4.4 Cuidado con los análisis múltiples - Resumen de la sección 6.4 - Ejercicios de la sección 6.4 - 6.5 Tipos de error y potencia - 6.5.1 Errores tipo I y errores tipo II - 6.5.2 Probabilidades de error - 6.5.3 Potencia - Resumen de la sección 6.5 - Ejercicios de la sección 6.5
- Repaso del capítulo
- Ejercicios de repaso del capítulo
- 7 Inferencia para medias y desviaciones típicas - 7.1 Introducción - 7.2 Inferencia para la media de una población - 7.2.1 Distribuciones t - 7.2.2 Intervalos y pruebas t - 7.2.3 Utilización de procedimientos t de una muestra - 7.2.4 Procedimientos t para diseños por pares - 7.2.5 Robustez de los procedimientos t - Resumen de la sección 7.2 - Ejercicios de la sección 7.2 - 7.3 Comparación de dos medias - 7.3.1 Problemas de dos muestras - 7.3.2 Comparación de dos medias poblacionales - 7.3.3 Procedimientos t de dos muestras - 7.3.4 Ejemplos de procedimientos t de dos muestras - 7.3.5 Otra vez la robustez - 7.3.6 Procedimientos t de dos muestras más precisos - 7.3.7 Procedimientos t de dos muestras con varianza común - Resumen de la sección 7.3 Índice de contenido / XIII - Ejercicios de la sección 7.3 - 7.4 Inferencia para la dispersión poblacional - 7.4.1 Evita la inferencia sobre desviaciones típicas - 7.4.2 Prueba F para comparar dos desviaciones típicas - Resumen de la sección 7.4 - Ejercicios de la sección 7.4
- Repaso del capítulo
- Ejercicios de repaso del capítulo
- 8 Inferencia para proporciones - 8.1 Introducción - 8.2 Inferencia para una proporción poblacional - 8.2.1 Distribución de pˆ - 8.2.2 Supuestos para la inferencia - 8.2.3 Procedimientos z - 8.2.4 Elección del tamaño de la muestra - Resumen de la sección 8.2 - Ejercicios de la sección 8.2 - 8.3 Comparación de dos proporciones - 8.3.1 Distribución de pˆ 1 − pˆ - 8.3.2 Intervalos de confianza para p 1 − p - 8.3.3 Pruebas de significación para p 1 − p - Resumen de la sección 8.3 - Ejercicios de la sección 8.3
- Repaso del capítulo
- Ejercicios de repaso del capítulo
- PARTE III: TEMAS RELACIONADOS CON LA INFERENCIA
- 9 Inferencia para tablas de contingencia - 9.1 Introducción - 9.1.1 El problema de las comparaciones múltiples - 9.2 Tablas de contingencia - 9.2.1 Recuentos esperados - 9.3 Prueba Ji cuadrado XIV / ESTADÍSTICA APLICADA BÁSICA - 9.3.1 Distribuciones Ji cuadrado - 9.3.2 Más aplicaciones de la prueba Ji cuadrado - 9.3.3 Recuentos exigidos en las celdas para la prueba Ji cuadrado - 9.3.4 Prueba Ji cuadrado y prueba z - Resumen de la sección 9.3
- Repaso del capítulo
- Ejercicios de repaso del capítulo
- 10 Análisis de la varianza de un factor: comparación de varias medias - 10.1 Introducción - 10.1.1 El problema de las comparaciones múltiples - 10.2 Prueba F del análisis de la varianza - 10.2.1 La idea del análisis de la varianza - 10.2.2 Supuestos del ANOVA - 10.3 Algunos detalles sobre el ANOVA*
- Resumen
- Repaso del capítulo
- Ejercicios de repaso del capítulo
- 11 Inferencia para regresión - 11.1 Introducción - 11.1.1 Modelo de la regresión - 11.2 Inferencia para el modelo - 11.2.1 Intervalos de confianza para la pendiente de la regresión - 11.2.2 Contraste de hipótesis para una relación no lineal - 11.3 Inferencia para la predicción - 11.4 Comprobación de los supuestos de la regresión
- Resumen
- Repaso del capítulo
- Ejercicios de repaso del capítulo
- 12 Pruebas no paramétricas - 12.1 Introducción - 12.2 Prueba de Wilcoxon de suma de rangos - 12.2.1 Rangos - 12.2.2 Prueba de Wilcoxon de suma de rangos Índice de contenido / XV - 12.2.3 Aproximación normal - 12.2.4 ¿Qué hipótesis plantea la prueba de Wilcoxon? - 12.2.5 Empates - 12.2.6 Limitaciones de las pruebas no paramétricas - Resumen de la sección 12.2 - Ejercicios de la sección 12.2
- 12.3 Prueba de Wilcoxon de suma de rangos de diferencias
- 12.3.1 Aproximación normal
- 12.3.2 Empates
- Resumen de la sección 12.3
- Ejercicios de la sección 12.3
- 12.4 Prueba de Kruskal-Wallis
- 12.4.1 Supuestos e hipótesis
- 12.4.2 Prueba de Kruskal-Wallis
- Resumen de la sección 12.4
- Ejercicios de la sección 12.4
- Repaso del capítulo
- Ejercicios de repaso del capítulo
- Repaso del pensamiento estadístico
- Apéndice
- Tabla A: Probabilidades normales estandarizadas
- Tabla B: Dígitos aleatorios
- Tabla C: Valores críticos de la distribución t
- Tabla D: Valores críticos de la distribución F
- Tabla E: Valores críticos de la distribución Ji cuadrado
- Soluciones de ejercicios seleccionados
- Índice analítico
PRÓLOGO
Estadística aplicada básica (versión en castellano de The Basic Practice of Statistics) es una introducción a la estadística para estudiantes universitarios que enfatiza el trabajo con datos y las ideas estadísticas. En este prólogo describo el contenido del libro con el objeto de ayudar a los profesores a juzgar si este libro es adecua- do para sus alumnos. Principios básicos Hasta ahora, los cursos de introducción a la estadística se centraban en la probabi- lidad y en la inferencia. Estadística aplicada básica refleja una nueva corriente en la enseñanza de la estadística en la que el análisis de datos y el diseño de métodos para su obtención constituyen, junto con los métodos de inferencia basados en la probabilidad, los temas principales. Los estadísticos han llegado a un amplio consenso sobre los contenidos de cursos universitarios de introducción a la esta- dística. Tal como dice Richard Schaffer: “con relación al contenido de un curso de introducción a la estadística, los estadísticos están mucho más de acuerdo ahora que cuando yo empecé a trabajar”.^1 La figura 1 es un esquema de este consen- so de acuerdo con la Sociedad Americana de Estadística (ASA) y la Asociación Americana de Matemáticas (MAA).^2 Como miembro que fui del comité conjunto de la ASA/MAA, estoy de acuer- do con sus conclusiones: aunque el trabajo con datos puede suponer una ayuda, fomentar el aprendizaje activo es tarea del profesor. Por ello, las dos primeras recomendaciones son los principios directores de este texto. Si bien el libro es (^1) D. S. Moore et al., “New pedagogy and new content: the case of statistics”, International Statistical Review, 65, 1997, págs. 123-165. El comentario de Richard Scheaffer aparece en la página 156. (^2) George Cobb, “Teaching statistics” en L. A. Steen (ed.), Heeding the Call for Change: Suggestions for Curricular Action, Mathematical Association of America, Washington, D.C., 1990, págs. 3-43.
XVIII / ESTADÍSTICA APLICADA BÁSICA
elemental con relación al nivel de matemáticas exigido y a los procedimientos es- tadísticos que se presentan, aspira a facilitar a los estudiantes tanto la compren- sión de las principales ideas de la estadística como la adquisición de una serie de habilidades útiles para trabajar con datos. Los ejemplos y los ejercicios que se pre- sentan, aunque están pensados para principiantes, utilizan datos reales y dan una información general que permite a los estudiantes comprender el significado de sus cálculos. A menudo pido a los alumnos conclusiones que son algo más que un número (o “rechazar H 0 ”). Aparte de hacer cálculos y sacar conclusiones correctas o erróneas, algunos ejercicios exigen hacer valoraciones. Espero que los profeso- res fomenten en clase un amplio debate sobre los resultados de los ejercicios.
- Ayudar a pensar como estadísticos: (a) La necesidad de tener datos. (b) La importancia de la obtención de datos. (c) La omnipresencia de la variabilidad. (d) La medición y calibración de la variabilidad.
- Ofrecer más datos y conceptos, y menos teoría y fórmulas. Siempre que sea posible automatiza los cálculos y las representaciones gráficas. Un curso introductorio debe: (a) Confiar plenamente en datos reales (no que solamente lo parezcan). (b) Enfatizar los conceptos estadísticos; por ejemplo, causalidad frente a asociación, experimental versus observacional. (c) Apoyarse más en los ordenadores que en las fórmulas de cálculo. (d) No dar demasiada importancia a las demostraciones matemáticas.
- Fomentar la enseñanza activa, a través de las siguientes alternativas al es- tudio individual: (a) Discutir y resolver problemas en grupo. (b) Hacer ejercicios con ordenadores. (c) Trabajar con datos obtenidos en clase. (d) Presentar ejercicios por escrito y exponerlos en el aula. (e) Diseñar proyectos estadísticos de forma individual y en grupo. Figura 1. Recomendaciones de la Sociedad Americana de Estadística (ASA) y de la Asociación Americana de Matemáticas (MAA).
Prólogo / XIX Los capítulos 1 y 2 presentan los métodos y las ideas que unifican el análisis de datos. Los estudiantes agradecen la utilidad del análisis de datos, y el hecho de que realmente puedan hacerlo alivia un poco su inquietud sobre la estadística. Es- pero que los estudiantes se acostumbren a examinar los datos y que sigan reali- zando este análisis aun cuando el objetivo principal del análisis sea dar respuesta a una pregunta concreta mediante inferencia. El capítulo 3 trata sobre el muestreo aleatorio y los experimentos comparativos aleatorizados. Éstos, pese a encontrar- se entre las ideas más importantes de la estadística, suelen omitirse injustamente al iniciar su enseñanza. El capítulo 4 se basa en las ideas del capítulo 3 y en las herramientas del análisis de datos del capítulo 1 para presentar el concepto de distribución muestral y, de una manera informal, el lenguaje de la probabilidad. El capítulo 5, que es opcional, presenta material adicional para cursos que exijan presentar la probabilidad de una manera más formal. El capítulo 6, que describe los razonamientos en los que se basa la inferencia estadística, es la piedra angular del resto del libro. Los restantes capítulos presentan métodos de inferencia apli- cables a diversas situaciones, dando especial énfasis a los aspectos prácticos de la utilización de dichos métodos. Los capítulos 7 y 8 presentan los procedimientos básicos para hacer inferencia a partir de una y de dos muestras. Los capítulos 9, 10 y 11 (que se pueden leer de forma independiente y en cualquier orden) ofrecen una selección de algunos temas más avanzados. El capítulo 12 es una introduc- ción a los métodos inferenciales no paramétricos. Tecnología Los cálculos automáticos aumentan la capacidad de los estudiantes para resol- ver problemas, reducen su frustración y les ayudan a concentrarse en las ideas y en la identificación del problema más que en la mecánica de su resolución. Este libro exige de los estudiantes que dispongan de una calculadora que pue- da hallar la correlación y la regresión lineal simple, así como la media y la des- viación típica. Como los estudiantes tienen calculadoras, el texto no discute las fórmulas de cálculo de la desviación típica muestral o de la recta de regresión mínimo-cuadrática. Los programas estadísticos tienen considerables ventajas so- bre las calculadoras: la introducción y la edición de los datos es más fácil, y los gráficos son mucho mejores. Animo al empleo de programas estadísticos siem- pre que los recursos y el tiempo disponible para desarrollar el curso lo permitan. Este libro, sin embargo, no da por supuesto que los estudiantes utilizarán estos programas.