










Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Análisis univariado, medidas de tendencia central (La media la mediana la moda) , medidas de dispersión (desviación media , desviación estándar , varianza , coeficiente de varianza) , medidas de posición (cuatriles , deciles , percentiles ) , tasas relativas
Tipo: Resúmenes
1 / 18
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!











Hemos conocidos los personajes centrales del juego cuantitativo, valores y variables y ha llegado el momento de conocer las reglas del juego , sin las cuales no podremos avanzar: El analisis Univariado El Análisis Univariado es uno de los escalones fundamentales a enfrentar para todo estudiante de bioestadística , este es el escalón más esencial y del cual depende también el entendimiento del análisis Bivariado y Trivariado , de allí la importancia , de su compresión y análisis. Consiste en el análisis de cada una de las variables estudiadas por separado, es decir, el análisis esta basado en una sola variable. Las técnicas más frecuentes de análisis univariado son parte de la estadística descriptiva: el análisis de las medidas de tendencia central de la variable (La media aritmética , la moda , y la mediana) , La medidas de dispersión (La desviacion media , la desviación estándar) Y las medidas de posicion (Cuartiles , deciles y percentiles) y las tasas relativas El Análisis Univariado es la columna vertebral de todo estudio o analisis estadistico , por lo cual en el siguiente informe , trataremos brevemente de los aspectos claves que lo conforman
números incluidos en una serie estadística. Esta medida de tendencia central (X) es muy representativa de la serie si esta es simétrica o ligeramente asimétrica. En un cálculo intervienen todos los valores de la serie estadística, por lo cual no debe utilizarse cuando alguno de los valores externos presenta una gran diferencia con respecto a los demás valores. Así mismo no puede calularse cuando se desconoce el valor máximo o el mínimo de la distribución La media es la medida de tendencial central que se emplea con mayor frecuencia , cuando las distribuciones son simétricas. Es un estadístico que permite el cálculo de otros datos estadísticos como , la desviación típica , es más estable o confiable La media aritmética de un conjunto de n valores (x) , se define como el cociente de la sumatoria de todos los valores de la serie , dividida entre el numero total de ellos la expresión matemática es : Donde : Σ = Sumatoria x = Cada valor que ha tomado la variable en los sujetos estudiados n = El número total de casos y o observaciones. Cuando los datos están agrupados en clases de intervalo uno , se multiplica cada valor por la frecuencia absoluta de la clase respectiva , en este caso el valor de la media de calcula de la siguiente fórmula : Donde : Σ = Sumatoria Xi = Valores de la variable en cada clase fi = frecuencia absoluta en cada clase n = frecuencia total
Cuando el rango de la variable es amplio los datos pueden agruparse en clases , al agrupar los datos en clases , se asume que los valores en cada una de distribuyen de manera igual a lo largo de ella perdiendo su carácter individual , por lo cual pasan a ser representados por los centros de clase o puntos medios. En este caso la media de distribución es igual a la sumatoria de las frecuencias multiplicadas por el centro de cada clases , y dividido luego entre el total de frecuencia Donde : Σ = Sumatoria Xm = puntos medios o centros de clase fi = frecuencias absolutas de cada clase n = Total de las frecuencias La media aritmética es el valor alrededor de cual tienden a agruparse los valores del conjunto de observaciones. Podria decirse que si no existiera variación , todos los sujetos habrían tomado el mismo valor de la media en esa serie.
Indica el punto por debajo del cual se encuentra el 50% de los casos , de tal forma que la mitad de los datos toman valores menores a la mediana y la otra mitad , valores superiores a esta se simboliza como Md. Es una medida descriptiva ubicada en el centro de la distribucion ,por lo cual, divide a la serie en dos partes iguales. Cuando la distribución es asimétrica se usa la mediana como la medida más adecuada , asi como cuando se necesita conocer con exactitud el punto medio de la distribución , del mismo modo es útil cuando se tiene series abiertas o valores muy altos o muy bajos en el extremos de la serie. Para el cálculo de la mediana en series no agrupadas : Lugar de Md= n + 1 n
El promedio ponderado o la media combinada, se aplica cuando se requiere conocer la media de varias medidas , es decir si se tiene dos o más medias correspondientes a otras tantas muestras y se desea conocer la media general de todas las observaciones como sus errata de un solo grupo. Se define como la sumatoria de los productos de cada una de estas observaciones por su correspo niente ponderación (p) dividida entre la sumas de las ponderaciones. Donde : Xi = Media aritmética de cada grupo ni = número de sujetos que conforma cada grupo
Para describir o analizar una distribución de datos de forma completa, se necesita conocer la variación de sus valores , con relación a su medidas de tendencia central , la necesidad viene dada por el hecho de que al construir una distribución y calcularlas medidas de tendencia central , aún cuando son los valores , representativos , no todos los datos de la serie coinciden con ellas , sino que se desvían. Estás desviacion se expresa con las medidas de dispersión. Desviación Media : Es la suma de los valores absolutos (sin tomar en cuenta el signo) de las desviaciones con respecto a la media , dividida entre n , representa la dispersión promedio de las observaciones con respecto a la media , se entiende por desviación media , la diferencia entre cada valor y la media de la distribución. Para los datos no agrupada , se calcula mediante la siguiente fórmula : Donde :
x = Valor de cada observación X = Media aritmética de la serie n = Numero total de datos (x-X ) = diferencia entre cada valor y la media ignorando signos Desviación estándar : Es la medida de la variación frecuentemente utilizada para demostrar la dispersión de los valores individuales alrededor de la media de distribución. La desviación estándar es el promedio de desviaciones puntuales con respecto a la media. Cuando Mayor es la dispersion de los datos mayor es la desviación estándar. Se simboliza como "s" (en minúscula) , o en letra griega Sigma (σ.) Para su cálculo de utilizan las siguientes fórmulas: Varianza: Es la desviacion estándar elevada al cuadrado y se simboliza como S2 .Es un concepto muy importante principalmente en pruebas cuantitativas, sin embargo para fines descriptivos se utiliza preferiblemente la desviacion estándar. Coeficiente de variación: En diversas series estadísticas no es posible utilizar directamente la desviación estándar para determinar en cual de ellas existe mayor o menor variación, en su lugar se utiliza el coeficiente de variación, la cual mide la variación porcentual de los valores en la distribución. El coeficiente de variación se define como el cociente entre la desviación estándar y la media, multiplicado por 100. (a mayor coeficiente de variación mas heterogéneo es decir hay mas dispercion en el grupo, y a menor coeficiente hay mas homogeneidad, es decir mayor concentración de los valores en la serie.
Ic = INtervalo de la clase donde está el Cuatril buscado n = frecuencia total o total de datos
el valor por debajo de cual está el 10% de las observaciones de los asos de distribución. Para calcular por ejemplo el D4 en la serie anterior procede de la siguiente manera : Lugar de D4= 4(n + 1) 10 Cuando los datos estan agrupados en clases con 2 intervalos o más y una vez ubicada la clase de donde se encuentran el Decil buscado se siguen los mismos pasos utilizados anteriormente para calcular la mediana según la siguiente fórmula :
un determinado percentil se encuentra un cierto porcentaje de casos , por ejemplo el percentil 60 es el punto debajo del cual se encuentran el 60% de los sujetos Para calcular el percentil 25 P25 como ejemplo sería: P25= 25(n + 1) 100 Si los datos estan agrupados en clases con 2 intervalos o más y una vez ubicada la clase de donde se encuentran el Percentil buscado se siguen los mismos pasos utilizados anteriormente para calcular la mediana según la siguiente fórmula : Donde: P =(Buscado )= Percentil buscado el cual puede ser 1 -
Li= Limite inferior de la clase donde está el P buscado F.A .= Frecuencia acumulada hasta la clase anterior a aquella donde está el P buscado. fi= Frecuencia absoluta de las clase donde está el P buscado Ic= Intervalo de la clase donde está el Percentil buscado n = frecuencia total o total de datos
dispercion. Mide la dispercion de los valores de la serie, pues, mientras mas próximos son sus limites, existe mayor concentración de las observaciones alrededor de la mediana.
investigador la información para decidir si el numero de casos de una enfermedad representa una situación normal en una comunidad en un momento determinado o si esta en presencia de una epidemia. Para elaborar el índice endémico se procede de la manera siguiente: Averiguar la morbilidad de la enfermedad estudiada en los últimos 5 o 7 años, especificada por meses o semanas. Se ordenan los casos por meses o por semanas independientemente de los años. Se calcula la media aritmética o la desviación estándar a las series correspondientes a cada mes.
cualitativas. Estas permiten comparar varias muestras aun cuando sean de tamaños distintos y envuelven la nocion de probabilidades o de riesgo de la existencia del referido atributo en los individuos de la poblacion.
decir, solo toma en cuenta los valores extremos de la distribución.
Tasa general de mortalidad: Indica el riesgo o probabilidad que tuvo esa poblacion de morir por cualquier causa en el periodo estudiado.
La tasa de mortalidad es la proporción de defunciones registradas, con respecto a la cantidad de individuos total que habita en una población, ciudad o país; en un año.
Población total de lugar en el año y lugar de estudio
Población total del lugar y año de estudio
Población total del lugar y año de estudio
T.L. = N. de muertes ocurridas por determinada causa en un lugar y periodo determinado X 100 Total de enfermos por esa causa en ese lugar y periodo determinado -Tasa de mortalidad infantil T.M.I= N# de muertes en menores de un año ocurridas en un lugar y periodo determinado X Nacimientos vivos ocurridos durante el año en el lugar estudiado Indica el riesgo que tienen los niños menores de un año de morir antes de haber ocurrido su primer año de edad , en ese lugar y periodo de estudio. Además de la tasa de mortalidad infantil , también pueden calcularse las tasas que son variantes de la misma Mortalidad precoz : Incluye solo las defunciones de menores de 7 días Mortalidad Neonatal : Defuniones en niños menores de 7 días Mortalidad residual : Defunciones de niños de 28 días a 11 meses Mortalidad perinatal TMTPn = N # de muertes fetales socurridas durante el año , en un lugar determinado X Nacimientos vivos durante el año en ese lugar estudiado En estás el denominador será el mismo , número de nacimientos vivos pero el numerador dependerá de la tasa a calcular -Tasa de mortalidad temprana : T.M.T= N# de muertes en menores de 5 años ocurridas en un lugar y tiempo determinado x Población 5 años de edad en un lugar y periodo de estudio
Riesgo absoluto: Es similar a las incidencias y se utiliza para calcular los otros 2 valores , para ellos se calcula la tasa de incidencia de la enfermedad de individios expuesto al riesgo y en la que los no expuestos -R.A de los expuestos : N# de enfermos expuestos al factor de riesgos X 100 Población total -R.A. de los No expuestos: N# de enfermos No expuestos al factor de riesgos X 100 Población total Riesgo Relativo : Expresa la incidencica de la enfermedad en el grupo expuesto al factor con expuestos al factor con respecto al grupo no expuesto R.R: = Incidencia en el grupo expuesto al riesgo Incidencia de los no expuestos Un riesgo relativo alto sugiere que el factor muere ser el caudante de la enfermedad , por lo tanto conveniencia de eliminar o controlar ese factor de riesgo Riesgo Atribuible = R A = Incidencia en el grupo expuesto - incidencia en el grupo NO expuesto Expreso la cantidad de nuevos casos atribuibles a un factor en particular , se calcula mediante la diferencia entre el grupo expuesto y los no expuestos. Estas no indican que hay personas expuestas al factor de riesgo desarrollarán la enfermedad sino que tienen mayor probabilidad de que suceda.
Como se ha visto, los métodos de análisis univariable se utilizan para estudiar el comportamiento de las variables de forma individual. a diferencia del análisis bivariado con dos variables, ; con tres en el análisis trivariado (o estratificado); y cuando son más de tres las variables que se analizan en conjunto, se acostumbra hablar de análisis multivariado. En su el análisis Univariado es el más simple de los otros tipos de análisis, ya que solo es una variable a analizar; pero no por ello menos complejo , porque a través de ellas podemos desglosar y analizar la información de distintas formas dependiendo de la variable a utilizar y la informacion que deseemos recolectar entre las técnicas a utilizar tenemos: Las Medidas de tendencia central: que son medidas estadísticas que pretenden resumir en un solo valor a un conjunto de valores. Representan un centro en torno al cual se encuentra ubicado el conjunto de los datos. Las medidas de tendencia central más utilizadas son: media, mediana y moda. Las Medidas de dispersión : entregan información sobre la variación de la variable. Pretenden resumir en un solo valor la dispersión que tiene un conjunto de datos. Las medidas de dispersión más utilizadas son: Rango de variación, Varianza, Desviación estándar, Coeficiente de variación. Las Medidas de Posicion: que son indicadores estadísticos que permiten resumir los datos en uno solo, o dividir su distribución en intervalos del mismo tamaño. Las medidas de posición, por tanto, sirven para medir y para dividir. (Cuartiles , Deciles , y Percentiles). Y las tasas generales o específicas (tasas de mortalidad , natalidad , fecundida , letalidad prevalencia Etc ) Caso uno de estos conceptos , son esenciales , para el análisis estadistico , tanto indivualmente como en conjunto , si deseamos entender y ejecutar nuestros propios analisis , así como avanzar escalones mas arriba en la bioestadística , es necesario dominar dichos conceptos , ya que forman parte de grandes descubrimientos y aportes , en la humanidad , como en la vida cotidiana.