Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Apuntes bioestadística, Apuntes de Bioestadística

Apuntes de tercero de bioestadistica

Tipo: Apuntes

2019/2020

Subido el 23/05/2020

franciscaufro
franciscaufro 🇨🇱

1 documento

1 / 8

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Estadística descriptiva.
Primero un par de definiciones relevantes basadas en el libro de Daniel
Wayne.
Se tiene el desafío de tener herramientas necesarias que permiten recoger,
clasificar, resumen, hallar regularidades y principalmente analizar los datos,
y esto genera incertidumbre.
¿Por qué la estadística cambia a bioestadística?
Basado en todas las herramientas de la estadística moderna, se lleva a las
ciencias biológicas y de la salud en general para poder darle sentido a los
números, “hacerlos hablar”.
La estadística descriptiva describe y analiza los datos yendo desde lo general
a lo particular. Para después hacer una inferencia, esto es: a partir de los
datos se genera, generaliza y extrapola a la población.
Conceptos:
Los individuos son las personas u objetos que contienen los datos a
estudiar mientras, la población es el conjunto de individuos que tienen
ciertas propiedades que son de interés a investigar. La población se escribe
como “x personas, de x lugar y de o hasta el año x”: el tiempo se define.
Cuando se hace un censo, se está describiendo a una población, muchas
veces eso no es posible, entonces se requiere una muestra, que es un
subconjunto de la población y a partir de esa muestra, si reúne ciertas
características se puede explotar a la población de origen.
El concepto de variable es en el fondo, las preguntas que se van a realizar a
los individuos bajo estudio. ¿Qué se espera de una variable? Se espera que
varíe de individuo en individuo.
Las posibles respuestas y resultados que puede arrojar una variable, son
llamadas categorías, que deben ser exhaustivas (cubrir todas las
posibilidades de la realidad) y excluyentes. Cada categoría genera datos
que es la evidencia científica que se va a utilizar para tomar decisiones y con
ella, se va a generar información que permita tomar buenas decisiones
clínicas.
También es necesario diferenciar, ¿qué es un parámetro? Es una función
que describe a una población, ya que hay funciones matemáticas que nos
ayudan a estimar eventos de salud. Lo diferenciamos de un estadístico o
estadígrafo porque estos permiten describir las características de la
muestra.
Ejemplo:
pf3
pf4
pf5
pf8

Vista previa parcial del texto

¡Descarga Apuntes bioestadística y más Apuntes en PDF de Bioestadística solo en Docsity!

Estadística descriptiva. Primero un par de definiciones relevantes basadas en el libro de Daniel Wayne. Se tiene el desafío de tener herramientas necesarias que permiten recoger, clasificar, resumen, hallar regularidades y principalmente analizar los datos, y esto genera incertidumbre. ¿Por qué la estadística cambia a bioestadística? Basado en todas las herramientas de la estadística moderna, se lleva a las ciencias biológicas y de la salud en general para poder darle sentido a los números, “hacerlos hablar”. La estadística descriptiva describe y analiza los datos yendo desde lo general a lo particular. Para después hacer una inferencia, esto es: a partir de los datos se genera, generaliza y extrapola a la población. Conceptos: Los individuos son las personas u objetos que contienen los datos a estudiar mientras, la población es el conjunto de individuos que tienen ciertas propiedades que son de interés a investigar. La población se escribe como “x personas, de x lugar y de o hasta el año x”: el tiempo se define. Cuando se hace un censo, se está describiendo a una población, muchas veces eso no es posible, entonces se requiere una muestra , que es un subconjunto de la población y a partir de esa muestra, si reúne ciertas características se puede explotar a la población de origen. El concepto de variable es en el fondo, las preguntas que se van a realizar a los individuos bajo estudio. ¿Qué se espera de una variable? Se espera que varíe de individuo en individuo. Las posibles respuestas y resultados que puede arrojar una variable, son llamadas categorías , que deben ser exhaustivas (cubrir todas las posibilidades de la realidad) y excluyentes. Cada categoría genera datos que es la evidencia científica que se va a utilizar para tomar decisiones y con ella, se va a generar información que permita tomar buenas decisiones clínicas. También es necesario diferenciar, ¿qué es un parámetro? Es una función que describe a una población, ya que hay funciones matemáticas que nos ayudan a estimar eventos de salud. Lo diferenciamos de un estadístico o estadígrafo porque estos permiten describir las características de la muestra. Ejemplo:

Consideremos la población formada por todos los estudiantes de la universidad X registrados en el año W que poseen beca de alimentación. De esta población se selecciona una muestra aleatoria de 100 estudiantes para realizarles una evaluación nutricional. Entre las características evaluadas en cada estudiante está el sexo, el peso corporal y la estatura. Se desea estimar el índice de masa corporal (IMC) promedio de esta población. Con la información muestral se determinó que el promedio de IMC no difiere significativamente del promedio de IMC reportado en otro estudio para los estudiantes sin beca de alimentación. Individuo Estudiante con beca de alimentación. Población Estudiantes de la Universidad X registrados en el año W que poseen beca de alimentación. Muestra 100 estudiantes seleccionados al azar de la población de referencia Variables Categorías Sexo Mujer, hombre. Peso corporal Estatura Asociadas a los números reales positivos. Dato El peso corporal de la estudiante que pertenece a la muestra, srta. Margarita Rosas: 59 kg. Información El promedio de IMC no difiere significativamente del promedio de IMC reportado en otro estudio para los estudiantes sin beca de alimentación. Parámetro Promedio de IMC en la población de referencia. Estadígrafo Promedio de IMC observado en la muestra de estudiantes. Clasificación de variables. Variables cualitativas: miden cualidades no cuantificables de la unidad de observación, miden atributos. Se dividen en dos grupos: -Nominales: categorías sin orden implícito. Ej. sexo, gingivitis (variables dicotómicas, de dos respuestas), estado civil. -Ordinales: categorías poseen un orden jerárquico. Ej. estado del paciente (grave/estable/recuperado), nivel educacional (superior, media, básica). Poseen una gradiente en la respuesta. Son excluyentes y exhaustivas. Variables cuantitativas: son variables de tipo numérica, donde los números tienen relaciones de magnitud. -Discretas: recuento o conteo de datos o características, en donde siempre el encabezado es “número de…”, enteros positivos. Ej. número de glóbulos

Con este indicador, que es una medida hemodinámica se puede tener una visión global de la condición arterial al momento del ingreso. Con estos valores se puede definir si la PAM está dentro de un rango normal (70-105), o si se habla de hipotenso/hipoperfundido o hipertenso/hiperperfundido. A los números se les puede dar sentido clínico y para eso se debe conocer el contexto de salud en el cual se trabaja. Tablas y gráficos Tabla de distribución de frecuencia  una variable como criterio de clasificación. -Título: En quién se va a realizar, qué se va a medir (variable), dónde y en qué año. Las tablas de distribución de frecuencia para variables cuantitativas se pueden representar: -A través de un gráfico de barra simple (un solo color)  también se puede usar con variables cualitativas y discretas. En el eje X: variable bajo estudio. En el eje Y: frecuencias absolutas y/o porcentaje.

  • Gráfico sectorial , torta, circular (dos colores) Si las categorías son muy largas, se aconseja un gráfico de barra simple horizontal. Tabla de contingencia (asociación)  dos variables como criterio de clasificación. -Evento de salud principal en la columna. -Factor asociado en la fila (Ej. Sexo). Medidas de resumen. Cuando se tiene un grupo de datos organizados en frecuencias o una serie de observaciones no elaboradas y dispersas, muchas veces se describen mediante una o dos figuras sintéticas. -Medidas de posición, entre ellas las de tendencia central. -Medidas de dispersión o variación. -Medidas de forma que incluyen la simetría y el apuntamiento de los datos. Ej. Hay cuatro cursos que imparten una asignatura y en el eje X se tiene la distribución de las notas. ¿Qué se observa? En promedio, el curso 2, 3 y 4 tienen la misma nota pero la variabilidad de las notas al interior de los cursos es distinta.

En cambio, si se compara el curso 1 con el 2, claramente se observar que en el curso 2 las notas promedio son mejores, pero la distribución de las notas al interior del grupo, es la misma. Es cosa de tomar la curva y ponerla encima, tienen la misma distribución. En cierta medida, las medidas de resumen persiguen el que se pueda dar cuenta de la forma y el comportamiento de las distintas medidas a la hora de comparar las mediciones que se realizan. ¿Dónde se puede calcular moda y mediana? En las variables cualitativas, pero en las cuantitativas se les puede agregar el promedio o la media aritmética. Entonces, ¿qué se entiende por moda? Es el valor de una variable que más veces se repite, el promedio es una operación de una suma de valores, dividido por un total, y la mediana es exactamente el valor que se encuentra en el centro de un conjunto de datos. Promedio o media aritmética: se suman todos los valores cuando se tiene una serie simple y se divide por el total. Recordar que también recibe nombre de centro de gravedad pues puede ser sensible a los valores extremos, valores altos hacen que el promedio suba y los valores bajos hacen que el promedio baje. Mediana: los datos deben estar ordenados de menor a mayor; si el tamaño de la muestra es impar, va a ser exactamente el valor que se encuentra en la mitad, en cambio si es par, se deben promediar los valores centrales. Ejemplo: Se tiene una serie simple, en donde se mide la edad en diez personas. 18 18 20 20 21 21 19 19 20 21 La primera persona tiene 18 años y la persona numero diez tiene 21 años. Lo aconsejable es ordenarlo en una tabla de distribución de frecuencias, en donde se tienen las frecuencias absolutas, las proporciones, la frecuencia relativa acumulada y la absoluta acumulada. ¿Qué se observa? Hay dos personas que tiene 18 años, la proporción seria 2 de 10, que es 0,20, ¿qué representa? Para calcular el promedio, se deben sumar y ponderar de acuerdo a la cantidad de veces que se repite un valor; se hablaría de un promedio ponderado. (18·2+19·2+20·3+21·3) / 10 = (18·0,2+19·0,2+20·0,3+21·0,3) = 19,

A cada valor de varianza, representado por x sub i, se le resta la media, la diferencia se eleva al cuadrado y se pondera. Para obtener la desviación, se saca la raíz. Ejemplo, se está midiendo la FC en un articulo científico, y el valor reportado en el estudio representa la media o el promedio de FC de los pacientes que ingresaron a un servicio de salud. Esto dice que es de 68,7 lpm, es decir, si todas las personas tuviesen la misma FC, sería esa. El segundo valor, se refiere a la desviación estándar de las FC de cada persona de acuerdo a su promedio (8,7 lpm). Reglas empíricas. -Si se tiene el promedio y 1DE, al sumar y restar, se genera un intervalo que contiene el 68,3% de todas las mediciones. -Si se tiene el promedio y 2DE, se cubre el 95% de todas las mediciones. -En cambio, al tener 3DE, prácticamente se cubre el 100% (99,7%) de todas las mediciones. El coeficiente de variación (CV) es la frecuencia relativa entre la DE y el promedio, y mientras más pequeño sea, más homogéneos son los datos (menos variabilidad relativa). Compara la variabilidad de dos o más distribuciones de datos.

CV =

S

X

Menor dispersión no significa que los datos sean más homogéneos, solo eso lo entrega el coeficiente de variación. Ej. Se tiene una distribución de diferentes estratos de una institución según remuneraciones recibidas, en miles de pesos. La moda es ser obrero porque la cantidad es mayor, y el ingreso promedio es mucho mayor en directivos, siguen empleados y finalmente los obreros. Al ver la SD, la menor dispersión de los ingresos está en los empleados, en cambio, la mayor en los obreros. Entonces, ¿Cuál es más homogéneo? En este caso, los directivos con un menor CV%. La media central está definida como: Medidas de forma.

Las medidas de simetría indican como se tienen que mirar los datos y como se comportan algunas medidas de tendencia central. Estadígrafos de simetría (Skewness): a La simetría estadística se deduce comparando la distribución con la forma de la “curva normal” que corresponde a una distribución simétrica. En general, toda distribución que tiene que el promedio=media=moda, se dice que es simétrica; en otro caso, será asimétrica. El coeficiente de asimetría de Karl Pearson, se basa en las relaciones que existen entre la media aritmética, la moda y la mediana. Como consecuencia, una distribución es asimétrica si la media se aleja de la moda. De acuerdo al valor de a3, se tiene: -Si a3 > 0, tiene asimetría positiva. La curva tiende a deformarse hacia los valores altos. -Si a3 > 0, tiene asimetría negativa. La curva tiende a deformarse hacia los valores bajos. -Si a3 = 0, la distribución es simétrica. Curtosis , a4, que tiene que ver con apuntamiento. Es el grado de apuntamiento de una distribución; se analiza comparando la distribución de la forma de la curva normal. De acuerdo al valor de a4, se tiene: -Si a4 = 0 o 3, es mesocúrtica o normal. -Si a4 > 0 o 3, es leptucúrtica o apuntada. -Si a3 < 0 o 3, es platicúrtica o achatada.