




























































































Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: Bioestadística, Profesor: Julia Garcia Galisteo, Carrera: Biología, Universidad: UMA
Tipo: Resúmenes
1 / 261
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!





























































































Siguiente: 1. Conceptos previos
http://www.bioestadistica.uma.es/libro/node7.htm
Iniciamos este capítulo con la definición de algunos conceptos elementales y básicos, y sin embargo pilares, para una comprensión intuitiva y real de lo que es la Bioestadística. Pretendemos introducir al estudiante en los primeros pasos sobre el uso y manejos de datos numéricos: distinguir y clasificar las características en estudio, enseñarle a organizar y tabular las medidas obtenidas mediante la construcción de tablas de frecuencia y por último los métodos para elaborar una imagen que sea capaz de mostrar gráficamente unos resultados. El aserto una imagen vale más que mil palabras'' se puede aplicar al ámbito de la estadística descriptiva diciendo queun gráfico bien elaborado vale más que mil tablas de frecuencias''. Cada vez es más habitual el uso de gráficos o imágenes para representar la información obtenida. No obstante, debemos ser prudente al confeccionar o interpretar gráficos, puesto que unas misma información se puede representar de
formas muy diversas, y no todas ellas son pertinentes, correctas o válidas. Nuestro objetivo, en este capítulo, consiste en establecer los criterios y normas mínimas que deben verificarse para construir y presentar adecuadamente los gráficos en el ámbito de la estadística descriptiva.
Cuando coloquialmente se habla de estadística, se suele pensar en una relación de datos numéricos presentada de forma ordenada y sistemática. Esta idea es la consecuencia del concepto popular que existe sobre el término y que cada vez está más extendido debido a la influencia de nuestro entorno, ya que hoy día es casi imposible que cualquier medio de difusión, periódico, radio, televisión, etc, no nos aborde diariamente con cualquier tipo de información estadística sobre accidentes de tráfico, índices de crecimiento de población, turismo, tendencias políticas, etc. Sólo cuando nos adentramos en un mundo más específico como es el campo de la investigación de las Ciencias Sociales: Medicina, Biología, Psicología, ... empezamos a percibir que la Estadística no sólo es algo más, sino que se convierte en la única herramienta que, hoy por hoy, permite dar luz y obtener resultados, y por tanto beneficios, en cualquier tipo de estudio, cuyos movimientos y relaciones, por su variabilidad intrínseca, no puedan ser abordadas desde la perspectiva de las leyes determistas. Podríamos, desde un punto de vista más amplio, definir la estadística como la ciencia que estudia cómo debe emplearse la información y cómo dar una guía de acción en situaciones prácticas que entrañan incertidumbre.
La Estadística se ocupa de los métodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos , siempre y cuando la variabilidad e incertidumbre sea una causa intrínseca de los mismos; así como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones.
Podríamos por tanto clasificar la Estadística en descriptiva, cuando los resultados del análisis no pretenden ir más allá del conjunto de datos, e inferencial cuando el objetivo del estudio es derivar las conclusiones obtenidas a un conjunto de datos más amplio.
Estadística descriptiva: Describe, analiza y representa un grupo de datos utilizando métodos numéricos y gráficos que resumen y presentan la información contenida en ellos.
Estadística inferencial: Apoyándose en el cálculo de probabilidades y a partir de datos muestrales, efectúa estimaciones, decisiones, predicciones u otras generalizaciones sobre un conjunto mayor de datos.
Consideremos la población formada por todos los estudiantes de la Universidad de Málaga (finita). La altura media de todos los estudiantes es el parámetro. El conjunto formado por los alumnos de la Facultad de Medicina es una muestra de dicha población y la altura media de esta muestra, , es un estadístico.
Caracteres: propiedades, rasgos o cualidades de los elementos de la población. Estos caracteres pueden dividirse en cualitativos y cuantitativos.
Modalidades: diferentes situaciones posibles de un carácter. Las modalidades deben ser a la vez exhaustivas y mutuamente excluyentes --cada elemento posee una y sólo una de las modalidades posibles. Clases: conjunto de una o más modalidades en el que se verifica que cada modalidad pertenece a una y sólo una de las clases.
1.7.2 Variables estadísticas Cuando hablemos de variable haremos referencia a un símbolo (X,Y,A,B,...) que puede tomar cualquier modalidad (valor) de un conjunto determinado, que llamaremos dominio de la variable o rango. En función del tipo de dominio, las variables las clasificamos del siguiente modo: Variables cualitativas, cuando las modalidades posibles son de tipo nominal. Por ejemplo, una variable de color
Variables cuasicuantitativas son las que, aunque sus modalidades son de tipo nominal, es posible establecer un orden entre ellas. Por ejemplo, si estudiamos la llegada a la meta de un corredor en una competición de 20 participantes, su clasificación C es tal que
Otro ejemplo de variable cuasicuantitativa es el nivel de dolor, D , que sufre un paciente ante un tratamiento médico:
Variables cuantitativas son las que tienen por modalidades cantidades numéricas con las que podemos hacer operaciones aritméticas. Dentro de este tipo de variables podemos distinguir dos grupos: Discretas, cuando no admiten siempre una modalidad intermedia entre dos cualesquiera de sus modalidades. Un ejemplo es el número de caras X , obtenido en el lanzamiento repetido de una moneda. Es obvio que cada valor de la variable es un número natural
Continuas, cuando admiten una modalidad intermedia entre dos cualesquiera de sus modalidades, v.g. el peso X de un niño al nacer. En este caso los valores de las variables son números reales, es decir
Ocurre a veces que una variable cuantitativa continua por naturaleza, aparece como discreta. Este es el caso en que hay limitaciones en lo que concierne a la precisión del aparato de medida de esa variable, v.g. si medimos la altura en metros de personas con una regla que ofrece dos decimales de precisión, podemos obtener
En realidad lo que ocurre es que con cada una de esas mediciones expresamos que el verdadero valor de la misma se encuentra en un intervalo de radio. Por tanto cada una de las observaciones de X representa más bien un intervalo que un valor concreto. Tal como hemos citado anteriormente, las modalidades son las diferentes situaciones posibles que puede presentar la variable. A veces éstas son muy numerosas (v.g. cuando una variable es continua) y conviene reducir su número, agrupándolas en una cantidad inferior de clases. Estas clases deben ser construidas, tal como hemos citado anteriormente, de modo que sean exhaustivas e incompatibles , es decir, cada modalidad debe pertenecer a una y sólo una de las clases.
Variable cualitativa: Aquella cuyas modalidades son de tipo nominal. Variable cuasicuantitativa: Modalidades de tipo nominal, en las que existe un orden. Variable cuantitativa discreta: Sus modalidades son valores enteros.
Frecuencia absoluta ( n (^) i ): Número de elementos que presentan la clase xi. Frecuencia relativa:. Frecuencia absoluta acumulada:. Frecuencia relativa acumulada:
Llamaremos distribución de frecuencias al conjunto de clases junto a las frecuencias correspondientes a cada una de ellas. Una tabla estadística sirve para presentar de forma ordenada las distribuciones de frecuencias. Su forma general es la siguiente:
Modali. Frec. Abs. Frec. Rel. Frec. Abs. Acumu. Frec. Rel. Acumu. C ni fi N (^) i Fi c 1 n 1 N (^) 1 = n (^) 1 ... ... ... ... ... cj nj ... ... ... ... ... ck nk N (^) k = n Fk = 1 n 1
Calcular los datos que faltan en la siguiente tabla: li -1 -- li ni fi N (^) i 0 -- 10 60 f 1 60 10 -- 20 n 2 0,4 N (^) 2 20 -- 30 30 f 3 170 30 -- 100 n 4 0,1 N (^) 4 100 -- 200 n 5 f 5 200 n
Solución: Sabemos que la última frecuencia acumulada es igual al total de observaciones, luego n =200. Como N (^) 3=170 y n (^) 3=30, entonces N (^) 2= N (^) 3- n (^) 3=170-30=140.
Además al ser n (^) 1=60, tenemos que n 2= N (^) 2- n (^) 1=140-60=80.
Por otro lado podemos calcular n (^) 4 teniendo en cuenta que conocemos la frecuencia relativa correspondiente:
Así:
N (^) 4= n (^) 4+ N (^) 3=20+170 =190.
Este último cálculo nos permite obtener n (^) 5= N (^) 5- N (^) 4=200-190=10.
Al haber calculado todas las frecuencias absolutas, es inmediato obtener las relativas:
Escribimos entonces la tabla completa: li -1 -- li ni fi N (^) i 0 -- 10 60 0,3 60 10 -- 20 80 0,4 140 20 -- 30 30 0,15 170 30 -- 100 20 0,1 190 100 -- 200 10 0,05 200 200
En cuanto a la elección de las clases, deben seguirse los siguientes criterios en función del tipo de variable que estudiemos:
o bien
Éste es un convenio que tomaremos en las páginas que siguen. El considerar los intervalos por el lado izquierdo y abrirlos por el derecho no cambia de modo significativo nada de lo que expondremos. El número de intervalos, k , a utilizar no está determinado de forma fija y por tanto tomaremos un k que nos permita trabajar cómodamente y ver bien la estructura de los datos; Como referencia nosotros tomaremos una de los siguientes valores aproximados:
Por ejemplo si el número de observaciones que tenemos es n =100, un buen criterio es agrupar las observaciones en intervalos. Sin embargo si tenemos n =1.000.000, será mas razonable elegir intervalos, que. La amplitud de cada intervalo ai = li - l (^) i -
suele tomarse constante, considerando la observación más pequeña y más grande de la población (respectivamente y ) para calcular la amplitud total, A , de la población
A = l (^) k - l 0
de forma que la amplitud de cada intervalo sea:
Así la división en intervalos podría hacerse tomando:
Podría ocurrir que la cantidad a fuese un número muy desagradable a la hora de escribir los intervalos (ej. a =10,325467). En este caso, es recomendable variar simétricamente los extremos, , de forma que se tenga que a es un número más simple (ej. a =10).
Recorrido: Amplitud: a (^) i = li - li -
Marca de clase: Frecuencias rectificadas: ;
Sobre un grupo de n =21 personas se realizan las siguientes observaciones de sus pesos, medidos en kilogramos:
58 42 51 54 40 39 49 56 58 57 59 63 58 66 70 72 71 69 70 68 64 Agrupar los datos en una tabla estadística. Solución: En primer lugar hay que observar que si denominamos X a la variable ``peso de cada persona'' esta es una variable de tipo cuantitativa y continua. Por tanto a la hora de ser ordenados los resultados en una tabla estadística, esto se ha de hacer agrupándolos en intervalos de longitud conveniente. Esto nos lleva a perder cierto grado de precisión. Para que la perdida de información no sea muy relevante seguimos el criterio de utilizar intervalos (no son demasiadas las observaciones). En este punto podemos tomar bien k =4 o bien k =5. Arbitrariamente se elige una de estas dos posibilidades. Por ejemplo, vamos a tomar k =5. Lo siguiente es determinar la longitud de cada intervalo, a (^) i. Lo más cómodo es tomar la misma longitud en todos los intervalos, a (^) i = a (aunque esto no tiene por qué ser necesariamente así), donde
Entonces tomaremos k =5 intervalos de longitud a =6,6comenzando por l (^) 0= xmin =39 y terminando en l 5=33:
Intervalos M. clase f.a. f.r. f.a.a. f.r.a. li -1 -- li ci ni fi N (^) i Fi i =1 39 -- 45,6 42,3 3 0,1428 3 0, i =2 45,6 -- 52,2 48,9 2 0,0952 5 0, i =3 52,2 -- 58,8 55,5 6 0,2857 11 0, i =4 58,8 -- 65,4 62,1 3 0,1428 14 0, i =5 65,4 -- 72 68,7 7 0,3333 21 21 Otra posibilidad a la hora de construir la tabla, y que nos permite que trabajemos con cantidades más simples a la hora de construir los intervalos, es la siguiente. Como la regla para elegir l 0 y l 5 no es muy estricta podemos hacer la siguiente elección:
Figura: Diagramas de barras para comparar una variable cualitativa en diferentes poblaciones. Se ha de tener en cuenta que la altura de cada barra es proporcional al número de observaciones (frecuencias relativas).
Diagramas de sectores (también llamados tartas ). Se divide un círculo en tantas porciones como clases existan, de modo que a cada clase le corresponde un arco de círculo proporcional a su frecuencia absoluta o relativa (figura 1.3).
Figura: Diagrama de sectores.
El arco de cada porción se calcula usando la regla de tres :
Como en la situación anterior, puede interesar comparar dos poblaciones. En este caso también es aconsejable el uso de las frecuencias relativas (porcentajes) de ambas sobre gráficos como los anteriores. Otra posibilidad es comparar las 2 poblaciones usando para cada una de ellas un diagrama semicircular, al igual que en la figura 1.4. Sean los tamaños respectivos de las 2 poblaciones. La población más pequeña se representa con un semicírculo de radio r (^) 1y la mayor con otro de radio r (^) 2. La relación existente entre los radios, es la que se obtiene de suponer que la relación entre las areas de las circunferencias es igual a la de los tamaños de las poblaciones respectivas, es decir:
Figura: Diagrama de sectores para comparar dos poblaciones
Pictogramas Expresan con dibujos alusivo al tema de estudio las frecuencias de las modalidades de la variable. Estos gráficos se hacen representado a diferentes escalas un mismo dibujo, como vemos en la figura 1.5.
Figura: Pictograma. Las áreas son proporcionales a las frecuencias.
El escalamiento de los dibujos debe ser tal que el área 1.1 de cada uno de ellos sea proporcional a la frecuencia de la modalidad que representa. Este tipo de gráficos suele usarse en los medios de comunicación, para que sean comprendidos por el público no especializado, sin que sea necesaria una explicación compleja.
1.9.4 Gráficos para variables cuantitativas Para las variables cuantitativas, consideraremos dos tipos de gráficos, en función de que para realizarlos se usen las frecuencias (absolutas o relativas) o las frecuencias acumuladas: Diagramas diferenciales: Son aquellos en los que se representan frecuencias absolutas o relativas. En ellos se representa el número o porcentaje de elementos que presenta una modalidad dada. Diagramas integrales: Son aquellos en los que se representan el número de elementos que presentan una modalidad inferior o igual a una dada. Se realizan a partir de las frecuencias acumuladas, lo que da lugar a gráficos crecientes, y es obvio que este tipo de gráficos no tiene sentido para variables cualitativas. Según hemos visto existen dos tipos de variables cuantitativas: discretas y continuas. Vemos a continuación las diferentes representaciones gráficas que pueden realizarse para cada una de ellas así como los nombres específicos que reciben.
Cuando representamos una variable discreta, usamos el diagrama de barras cuando pretendemos hacer una gráfica diferencial. Las barras deben ser estrechas para representar el que los valores que toma la variable son discretos. El diagrama integral o acumulado tiene, por la naturaleza de la variable, forma de escalera. Un ejemplo de diagrama de barras así como su diagrama integral correspondiente están representados en la figura 1.6.
Se lanzan tres monedas al aire en 8 ocasiones y se contabiliza el número de caras, X , obteniendose los siguientes resultados:
Representar gráficamente el resultado. Solución: En primer lugar observamos que la variable X es cuantitativa discreta, presentando las modalidades: