¡Descarga Presentación de Datos Numéricos: Tablas, Gráficos y Distribuciones de Frecuencias y más Diapositivas en PDF de Informática solo en Docsity!
Tema: Presentación de datos numéricos en Programa de Estudios de Medicina Humana Experiencia Curricular: Informática Médica y Bioestadística Docente: Ms. Zoraida Vidal Melgarejo
Informática Médica y
Bioestadística
Ms. Zoraida Yanet Vidal Melgarejo
Sesión 04
Presentación de
datos numéricos en
tablas y gráficas.
Adaptado de: Bioestadística Médica. Dawson & Trapp. Editorial Manual Moderno. 2005.
Tema: Presentación de datos numéricos en Programa de Estudios de Medicina Humana Experiencia Curricular: Informática Médica y Bioestadística Docente: Ms. Zoraida Vidal Melgarejo
- 3 - Los investigadores del campo de la salud usan gráficas y exposiciones ilustradas de los datos. Si el objetivo es realizar la presentación de la información sobre la distribución de una variable de forma general, los datos en bruto deberán ser organizados , resumidos y presentados adecuadamente, lo que permitirá una mejor comprensión de los resultados.
▪ Una vez terminado el proceso de recogida de datos, se dispone
de dicha información “ en bruto ”. Posteriormente, esta debe ser validada, registrada en algún formato previamente establecido para su posterior análisis.
▪ Siempre que sea posible se debe realizar el análisis estadístico
empleando los datos en bruto ya que de esa manera se logra una mayor precisión en los resultados. Presentación de datos numéricos en tablas y gráficos.
▪ Ejemplo: Con la finalidad de desarrollar un proyecto universitario de hábitos saludables se
recoge, de una muestra de 450 estudiantes del primer año de la Escuela de Medicina de la UPAO, los datos correspondientes al género, salud percibida, número de hermanos y talla (en centímetros).
▪ Se debe identificar el tipo de variable y sus modalidades:
Presentación de datos numéricos en tablas y gráficos. Variable Tipo Modalidades Género Cualitativa nominal Masculino (0), Femenino (1) Salud percibida Cualitativa ordinal Excelente (E), Buena (B), Regular (R), Mala (M). Número de hermanos Cuantitativa discreta 0 , 1, 2, 3, 4, etc. Talla Cuantitativa continua Infinitas
Tema: Presentación de datos numéricos en Programa de Estudios de Medicina Humana Experiencia Curricular: Informática Médica y Bioestadística Docente: Ms. Zoraida Vidal Melgarejo
- 7 - Para determinar el número de clases o intervalos , por lo general, el sentido común es adecuado para tomar esta decisión pero puede utilizarse las siguientes guías:
▪ Es suficiente entre 6 y 14 clases para proporcionar
información adecuada sin caer en el exceso de detalles. Debe haber suficientes clases para demostrar la forma de la distribución, pero no tantas que distorsionen las fluctuaciones menores.
▪ También se puede aplicar la regla de Sturges : 𝑛𝑖 = 1 +
- 322 ∗ log 𝑛 , donde n es el tamaño de la muestra. Presentación de datos numéricos en tablas y gráficos.
- 8 - Las siguientes son algunas guías para determinar la amplitud de las clases: a. Los límites de clase (número inicial y final) no deben sobreponerse. Por ejemplo, debe especificarse como “ 40 a 49 ” o “ 40 hasta antes de 50 ”, y no “ 40 a 50 ” o “ 50 a 60 ”, ya que no sería posible decir a que observación pertenece 50. b. Cuando sea posible, la amplitud de las clases debe ser igual. Con amplitudes de clase desiguales se presentan problemas para hacer gráficas y deben usarse cuando haya grandes brechas en los datos. c. Siempre que se pueda, deben evitarse las clases abiertas en los extremos superior e inferior de la variación , ya que no comunican con precisión la variación de las observaciones. d. Siempre que sea posible, escoger los límites de clase de tal modo que la mayor parte de los datos en la clase queden lo más cerca posible al punto medio de ésta y no cerca del extremo de la misma. Se obtiene un mejor estimado de la media de los datos reales cuando la media cargada se calcula a partir de una tabla de frecuencias. Presentación de datos numéricos en tablas y gráficos
Tema: Presentación de datos numéricos en Programa de Estudios de Medicina Humana Experiencia Curricular: Informática Médica y Bioestadística Docente: Ms. Zoraida Vidal Melgarejo
- 9 - ▪Este gráfico fue ideado en 1977 por Tukey , un estadístico interesado en formas significativas para comunicar imágenes. Es un medio conveniente de mostrar las observaciones , y puede usarse como una imagen directa de los datos o como un paso preliminar para construir una tabla de frecuencias.
1. Gráfico de tronco y hojas
Presentación de datos numéricos en tablas y gráficos. Ejercicio 1. Elaborar un gráfico de tronco y hojas con los datos de la variable talla de los estudiantes de primer año de Medicina de UPAO. Solución: Para elaborar un gráfico de tronco y hojas , se deben conformar clases o intervalos distribuidos en forma uniforme entre el menor y el mayor de los valores, y se realizarán los siguientes pasos:
1. Gráfico de tronco y hojas
Presentación de datos numéricos en tablas y gráficos. Identificar los valores menor (𝑋𝑚𝑖𝑛 = 150. 22 ) y mayor (𝑋𝑚𝑎𝑥 = 185. 99 ). Restar el valor menor del mayor para obtener la variación ( rango ) de los datos: 𝑅 = 𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛 = 185. 99 − 150. 22 = 35. 77 ≅ 36 1 2
Tema: Presentación de datos numéricos en Programa de Estudios de Medicina Humana Experiencia Curricular: Informática Médica y Bioestadística Docente: Ms. Zoraida Vidal Melgarejo
- 13 - Presentación de datos numéricos en tablas y gráficos.
1. Gráfico de tronco y hojas
Para formar un gráfico de tronco y hojas , trazar una línea vertical y colocar los primeros dígitos de cada clase – llamados el tronco – del lado izquierdo de la línea. Los números del lado derecho de la línea vertical representan el último dígito de cada resultado, son las hojas. Intervalos de amplitud 4. 150 − 153 154 − 157 158 − 161 162 − 165 166 − 169 170 − 173 174 − 177 178 − 181 182 − 185 186 − 189
- 14 - 1 Tomar^ el^ valor^ de^ la^ talla^ del^ primer^ estudiante^ (^167.^39 cm)^ y escribir el último dígito ( 7 ) u hoja en el lado derecho, opuesto al quinto dígito o tronco, correspondiente a [ 166 – 169 ]. Para el segundo estudiante ( 178. 61 cm), escribir el 8 (hoja) en el lado derecho de la línea vertical opuesta al de [ 178 – 181 ] (tronco). 2
1. Gráfico de tronco y hojas
Presentación de datos numéricos en tablas y gráficos. Intervalos de amplitud 4. 150 − 153 154 − 157 158 − 161 162 − 165 166 − 169 170 − 173 174 − 177 178 − 181 182 − 185 186 − 189 7 8 Para el tercer estudiante ( 172. 09 cm), escribir el 2 (hoja) opuesto a [ 170 – 173 ] (tronco), y así sucesivamente. 3 2
Tema: Presentación de datos numéricos en Programa de Estudios de Medicina Humana Experiencia Curricular: Informática Médica y Bioestadística Docente: Ms. Zoraida Vidal Melgarejo Cuadro 1. Talla de 450 estudiantes del primer año de Medicina de UPAO.
- 15 - Presentación de datos numéricos en tablas y gráficos. Intervalos de amplitud 4. 150 − 153 154 − 157 158 − 161 162 − 165 166 − 169 170 − 173 174 − 177 178 − 181 182 − 185 186 − 189 7 8 2
- 16 - Tronco Hojas Conteo 150 - 153 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 … 53 154 - 157 4 4 4 4 4 4 4 4 4 4 4 4 5 5 5 5 5 5 5 5 5 5 5 5 5 6 6 … 58 158 - 161 8 8 8 8 8 8 8 8 9 9 9 9 9 9 9 9 9 9 9 9 9 0 0 0 0 0 0 … 50 162 - 165 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 … 55 166 - 169 6 6 6 6 6 6 6 6 6 6 6 6 6 7 7 7 7 7 7 7 7 7 7 8 8 8 8 … 48 170 - 173 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 … 42 174 - 177 4 4 4 4 4 4 4 4 4 4 4 4 5 5 5 5 5 5 5 6 6 6 6 6 6 6 6 … 42 178 - 181 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 9 9 9 9 9 9 … 55 182 – 185 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 … 47 186 - 189 0 Cuadro 2. Construcción de una gráfica de tronco y hojas de la talla de 450 estudiantes del primer año de Medicina en UPAO El gráfico de tronco y hojas completo obtenido en SPSS se presenta en el Cuadro 3. Presentación de datos numéricos en cuadros y gráficas.
Tema: Presentación de datos numéricos en Programa de Estudios de Medicina Humana Experiencia Curricular: Informática Médica y Bioestadística Docente: Ms. Zoraida Vidal Melgarejo
- 19 - Una tabla de distribución de frecuencias es adecuada para todo tipo de variables, pero es necesaria una agrupación previa de los datos (por clases o intervalos) en el caso de variables cuantitativas continuas. Se definen los siguientes conceptos, considerando una población o muestra de n individuos: a. Frecuencia absoluta: es el número de individuos o casos que están incluidos en una modalidad. Se representa por 𝑛𝑖 a la frecuencia absoluta correspondiente a la modalidad i-ésima. 2. Tablas de Frecuencia Presentación de datos numéricos en tablas y gráficos
- 20 - b. Frecuencia relativa: es el tanto por uno de los individuos contenidos en una modalidad respecto al total de la población o la muestra. Si se multiplica por 100 obtenemos el porcentaje de individuos de la muestra incluidos en esa modalidad. Se representa por 𝑓𝑖 a la frecuencia relativa correspondiente a la modalidad i-ésima , por tanto, la frecuencia relativa para la modalidad i será: 𝑓𝑖 =
2. Tablas de Frecuencia Presentación de datos numéricos en tablas y gráficos Se denomina distribución de frecuencias a la representación conjunta de las modalidades (o intervalos en caso de variables cuantitativas continuas) de una variable junto a sus frecuencias correspondientes.
Tema: Presentación de datos numéricos en Programa de Estudios de Medicina Humana Experiencia Curricular: Informática Médica y Bioestadística Docente: Ms. Zoraida Vidal Melgarejo
- 21 - Se presenta mediante una tabla en las que se listan las posibles modalidades (o intervalos) de la variable en la primera columna, mostrando para cada una de ellas las distintas frecuencias. 2. Tablas de Frecuencia Presentación de datos numéricos en tablas y gráficos Modalidad Frecuencia absoluta Frecuencia relativa Porcentaje 1 𝑛 1 𝑓 1 = 𝑛 𝑛^1 𝑓 1 × 100 2 𝑛 2 𝑓 2 = 𝑛 𝑛^2 𝑓 2 × 100 … … … … M 𝑛𝑀 𝑓𝑀 = 𝑛 𝑛𝑀 𝑓𝑀 × 100
- 22 - 2. Tablas de Frecuencia Presentación de datos numéricos en tablas y gráficos Ejercicio 2. Elaborar una tabla de distribución de frecuencias con los datos de la variable salud percibida de los estudiantes de primer año de Medicina de UPAO. Solución: Para elaborar una tabla de distribución de frecuencias , y teniendo en cuenta que la variable salud percibida es cualitativa ordinal, se debe contar la cantidad de respuestas obtenidas de cada modalidad de la variable salud percibida, obteniéndose las siguientes cantidades: 8 estudiantes reportaron que su salud era mala, 120 que su salud era regular, 161 que era buena y 161 que era excelente. Estas serían las frecuencias absolutas de cada una de las modalidades de la variable.
Tema: Presentación de datos numéricos en Programa de Estudios de Medicina Humana Experiencia Curricular: Informática Médica y Bioestadística Docente: Ms. Zoraida Vidal Melgarejo
- 25 - 2. Tablas de Frecuencia Presentación de datos numéricos en tablas y gráficos Salud percibida por los estudiantes de primer año de Medicina en UPAO 𝑀𝑎𝑙𝑎 8 ( 1. 78 %) 𝑅𝑒𝑔𝑢𝑙𝑎𝑟 120 ( 26. 66 %) 𝐵𝑢𝑒𝑛𝑎 161 ( 35. 78 %) 𝑀𝑢𝑦 𝑏𝑢𝑒𝑛𝑎 161 35. 78 % 𝑻𝒐𝒕𝒂𝒍 𝟒𝟓𝟎 Cuadro 5. Construcción de una tabla de distribución de frecuencias de la salud percibida de 450 estudiantes del primer año de Medicina en UPAO En forma resumida, también se podrían mostrar los resultados de la siguiente manera: Ahora es posible responder a las interrogantes: ¿Cuál es el estado de salud percibida más frecuente?, ¿Puede cuantificarse?
- 26 - 2. Tablas de Frecuencia Presentación de datos numéricos en tablas y gráficos Ejercicio 3. Elaborar una tabla de distribución de frecuencias con los datos de la variable talla de los estudiantes de primer año de Medicina de UPAO. Solución: Para elaborar una tabla de distribución de frecuencias , y teniendo en cuenta que la variable talla es cuantitativa continua y que sus valores posibles son infinitos (considerando la precisión y los decimales que fuera posible medir), la forma de representar a la variable es mediante la conformación de clases o intervalos. Para definir el número de intervalos y la amplitud de los mismos, se tomará como base los resultados obtenidos al elaborar el gráfico de tronco y hojas.
Tema: Presentación de datos numéricos en Programa de Estudios de Medicina Humana Experiencia Curricular: Informática Médica y Bioestadística Docente: Ms. Zoraida Vidal Melgarejo
- 27 - 2. Tablas de Frecuencia Presentación de datos numéricos en tablas y gráficos Modalidad Frecuencia absoluta Frecuencia relativa Porcentaje [ 150 − 153 ] 53 0. 1178 11. 78 % [ 154 − 157 ] 58 0. 1290 12. 90 % [ 158 − 161 ] 50 0. 1111 11. 11 % [ 162 − 165 ] 55 0. 1222 12. 22 % [ 166 − 169 ] 48 0. 1067 10. 67 % [ 170 − 173 ] 42 0. 0933 9. 33 % [ 174 − 177 ] 42 0. 0933 9. 33 % [ 178 − 181 ] 55 0. 1222 12. 22 % [ 182 − 185 ] 47 0. 1044 10. 44 % Cuadro 6. Construcción de una tabla de distribución de frecuencias de la estatura (talla) de 450 estudiantes del primer año de Medicina en UPAO Estatura de los estudiantes de primer año de Medicina en UPAO [ 150 − 153 ] 53 ( 11. 78 %) [ 154 − 157 ] 58 ( 12. 90 %) [ 158 − 161 ] 50 ( 11. 11 %) [ 162 − 165 ] 55 ( 12. 22 %) [ 166 − 169 ] 48 ( 10. 67 %) [ 170 − 173 ] 42 ( 9. 33 %) [ 174 − 177 ] 42 ( 9. 33 %) [ 178 − 181 ] 55 ( 12. 22 %) [ 182 − 185 ] 47 ( 10. 44 %) Total 𝟒𝟓𝟎
- 28 - 2. Tablas de Frecuencia Presentación de datos numéricos en tablas y gráficos Cuadro 7. Construcción de una tabla de distribución de frecuencias de la estatura (talla) de 450 estudiantes del primer año de Medicina en UPAO Ahora es posible responder a las interrogantes: ¿Cuál es la talla más frecuente?, ¿Cuántos estudiantes miden entre 166 y 169 cm?, ¿Qué porcentaje de estudiantes mide más de 173 cm?
Tema: Presentación de datos numéricos en Programa de Estudios de Medicina Humana Experiencia Curricular: Informática Médica y Bioestadística Docente: Ms. Zoraida Vidal Melgarejo
- 31 -
- El área de cada barra es proporcional al porcentaje de resultados en ese intervalo; por ejemplo, los 53 datos en el primer intervalo constituyen 53 / 450 , o 11. 78 %, del área cubierta por el histograma; por tanto, un histograma brinda información acerca del área. El concepto de área es uno de los motivos por el cual la amplitud de las clases debe ser igual. 3. Histogramas, gráfica de caja y polígonos de frecuencia Presentación de datos numéricos en tablas y gráficos
3.1. Histograma.
- 32 - A veces llamado gráfico de caja y barbas por Tukey ( 1977 ), es otra manera de mostrar la información cuando el objetivo es ilustrar ciertos puntos en la distribución.
3.2. Gráfico de caja.
Se construye con la información de un gráfico de tronco y hojas o una tabla de frecuencia. Para construir se usa la mediana, así como el primer y tercer cuartiles de la distribución.
3. Histogramas, gráfica de caja y polígonos de frecuencia Presentación de datos numéricos en tablas y gráficos
Tema: Presentación de datos numéricos en Programa de Estudios de Medicina Humana Experiencia Curricular: Informática Médica y Bioestadística Docente: Ms. Zoraida Vidal Melgarejo
- 33 - Se dibuja una caja con la parte alta en el tercer cuartil y la baja en el primer cuartil, a veces se dice que los cuartiles son las bisagras de los gráficos de caja. La longitud de ésta es una representación visual de la variación intercuartilar, representación de 50 % medio de los datos. No importa la amplitud de la caja. La localización del punto medio o mediana de la distribución se indica con una línea horizontal en la caja. Por último, las líneas verticales o barbas, se extienden 1. 5 veces más de la variación intercuartilar por arriba y debajo de los percentiles 75 y 25. A todo valor que quede arriba o debajo de las barbas se le llama extremo.
3.2. Gráfico de caja.
3. Histogramas, gráfica de caja y polígonos de frecuencia Presentación de datos numéricos en tablas y gráficos
- 34 - Figura 2. Gráfico de caja de la estatura (talla) de los estudiantes de primer año de Medicina de UPAO. Presentación de datos numéricos en tablas y gráficos
Tema: Presentación de datos numéricos en Programa de Estudios de Medicina Humana Experiencia Curricular: Informática Médica y Bioestadística Docente: Ms. Zoraida Vidal Melgarejo
- 37 - Figura 3. Polígono de frecuencia de talla de los estudiantes de primer año de Medicina en UPAO Exposición de datos numéricos en cuadros y gráficas
- 38 -
3.4. Gráficos que comparan a dos o más grupos.
Los gráficos de caja son muy eficaces cuando hay más de un grupo.
3. Histogramas, gráfica de caja y polígonos de frecuencia Exposición de datos numéricos en cuadros y gráficas
Tema: Presentación de datos numéricos en Programa de Estudios de Medicina Humana Experiencia Curricular: Informática Médica y Bioestadística Docente: Ms. Zoraida Vidal Melgarejo
- 39 - Los polígonos de porcentaje son útiles para comparar dos distribuciones de frecuencia, las cuales deben convertirse a porcentajes cuando los grupos a comparar tienen un número desigual de observaciones.
3.4. Gráficos que comparan a dos o más grupos.
3. Histogramas, gráfica de caja y polígonos de frecuencia Presentación de datos numéricos en tablas y gráficos
- 40 - En el diagrama de error en barras , el círculo designa la media y las barras representan la desviación estándar.
3.4. Gráficos que comparan a dos o más grupos.
3. Histogramas, gráfica de caja y polígonos de frecuencia Presentación de datos numéricos en tablas y gráficos