






















Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: Bioestadistica y Epidemiologia, Profesor: , Carrera: Veterinaria, Universidad: UNILEON
Tipo: Apuntes
1 / 30
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!























Bioestadística y Epidemiología.
Tema 1.- Introducción a la Bioestadística. La Bioestadística en las ciencias veterinarias. Estadística descriptiva e inductiva. Conceptos básicos: población, muestra, individuo, variable, parámetros y estadísticos. Tipos de estudios en la investigación biológica. El software en el análisis estadístico.
Tema 2. La organización de los datos. Tipos de variables: variables cualitativas y cuantitativas. Distribución de frecuencias. Definición de una distribución de datos en variables cuantitativas. Medidas de centralización. Medidas de dispersión. Medidas de posición. Representación gráfica de los datos.
Tema 3. Cálculo de Probabilidades : Conceptos básicos. Probabilidad y propiedades. Sucesos compatibles y excluyentes. Probabilidad condicionada. Sucesos dependientes e independientes. Teorema de Bayes. Dependencia e independencia.
Tema 4. Variables aleatorias , distribución en la población. Distribuciones modelo. La distribuciones binomial y de Poisson. La distribución normal. Tipificaciones. Desviaciones de la normalidad.
Bioestadística y Epidemiología _____________________________________ Tema 1. Introducción a la Bioestadística.
poblaciones naturales las variables tienden a tener una distribución normal, si conozco los procedimientos bioestadísticas con solo dos parámetros de la población (media aritmética y desviación típica) puedo conocer la distribución total de la población. Es decir podré saber cuantas ovejas pesan mas de 85 kilos o cuantas entre 70 y 80, etc.
En Bioestadística se diferencian dos grandes apartados, Estadística descriptiva e inductiva.
La estadística descriptiva comprende: Organización y Presentación de los datos con la finalidad de describir las características de una situación. Así se ocupa de reunir datos de la mejor manera posible en base a Formularios, Diseño de experimentos, Optimizar el muestreo, etc. La descripción de las características de una situación concreta se aborda a través de técnicas de Reducción de datos y Presentación de parámetros de interés, tablas, gráficos, etc.
La estadística inductiva, Inferencia estadística o estadística analítica a comprende: El Análisis los datos y generaliza conclusiones de tales datos, a través de los métodos de Estimación de parámetros los métodos de Contraste de hipótesis, que proporcionan la técnicas matemáticas para generalizar dichas conclusiones. Dichos métodos están basados en el cálculo de probabilidades.
Ejemplo: La eficacia del tratamiento tipo actual de una enfermedad X se admite un 50 % de curaciones. Se está probando un nuevo tratamiento (TR34) en un grupo experimental de 18 individuos, se observan 12 curaciones lo que representa un 66 % de curaciones. ¿ Es mejor el nuevo tratamiento TR34 al tratamiento tipo o estos resultados son debidos al azar ?, Si aplicásemos este nuevo tratamiento a toda la población obtendríamos el mismo resultado que en la prueba?
El analizar la superioridad del nuevo tratamiento es objeto de los métodos de inferencia estadística que nos proporciona métodos para demostrar si los resultados observados son o no atribuidos al azar.
Población : Conjunto o grupo de entidades de cualquier índole que tiene una característica cuantificable común. Muestra: Número finito de unidades procedente de una población de individuos. Individuo o elemento: Cada una de las unidades (personas, animales, objetos, etc.) que pertenece a una población. Parámetro : Característica descriptiva global y medible de la una población. Estadístico : Característica descriptiva global y medible de la una muestra. Caracteres : Propiedades o cualidades de los elementos de la población. La mayoría de las veces el investigador, médico, veterinario, etc., está interesado en conocer las características de las poblaciones con las que trabaja, esto es los parámetros de la citada población, por ejemplo si estoy interesado en conocer la altura de los españoles un parámetro interesante que describe esta característica es la media aritmética. Sin embargo si se mide esta característica en una muestra no se denomina
Bioestadística y Epidemiología _____________________________________ Tema 1. Introducción a la Bioestadística.
parámetro sino estadístico. Los parámetros se denotan con letras griegas (μ-media aritmética, σ-desviación típica), en tanto que los estadísticos con letras latinas (s- desviación típica).
Los parámetros y estadísticos describen las poblaciones/muestras caracterizando dichas poblaciones, las diferencias son que los estadísticos suelen ser conocidos, se miden en las muestra, y los parámetros suelen ser desconocidos, pues el acceso a toda la población generalmente no es posible.
El acceso estadístico de la población a través de la muestra. Generalmente se desea conocer la población pero no se tiene acceso a medir a todos los individuos, por ser de gran tamaño o por no disponer de tiempo y recursos para acceder a toda la población, la alternativa es obviamente realizar el estudio o medición de la característica de interés en una muestra de dicha población.
Acceso estadístico de la Población a través de la muestra
Población
Ejemplo, Porcentaje de fumadores , 32 ± 5 (p<0,05)
Población
Muestra
Experimento
Resultados
Seguridad Investigador
Estimación
(F=32)
(32±5)
(32±5) (p<0,05)
Figura 1. Esquema del acceso estadístico de la población a través de la muestra. El objetivo de acceso es tomar una muestra fiel de la población y realizar sobre ella las mediciones a través de encuestas, experimentos que nos permitan conocer las características en la muestra (estadísticos) y luego poder estimar el parámetro en la población. Obviamente al pasar de la muestra a la población podemos equivocarnos, pero la Estadística proporciona métodos para conocer el grado de acierto o la probabilidad de error. Necesitamos entonces incorporar mas conceptos, Error sistemático o sesgo y Error aleatorio o muestral.
La secuencia del proceso tiene tres etapas y el resultado se expresa con tres números:
Bioestadística y Epidemiología _____________________________________ Tema 1. Introducción a la Bioestadística.
Para el análisis de la información (datos) en la resolución de los trabajos en Bioestadística donde a veces se manejan gran cantidad de datos existen variedad de programas adaptados a los diversos sistemas operativos de los computadores. Estos programas son de gran ayuda, casi imprescindibles, para la resolución de los cálculos necesarios en el tratamiento estadístico.
Tradicionalmente estos programas han software registrado, donde es necesario comprar y pagar una licencia de uso, sin embargo actualmente hay a disposición del usuario muchas opciones de software libre.
El software libre más divulgado para el análisis estadístico y gráfico es el “ R”, es un lenguaje y entorno de programación muy utilizado por los investigadores a nivel internacional.
Se trata de un proyecto de software libre, resultado de la implementación GNU del premiado lenguaje S. R y S son, probablemente, los dos lenguajes más utilizados en investigación por la comunidad estadística, siendo además muy populares en el campo de la investigación biomédica, la bioinformática y las matemáticas financieras. A esto contribuye la posibilidad de cargar diferentes bibliotecas o paquetes con finalidades específicas de cálculo o gráfico.
Existen también otros paquetes registrados para el análisis estadísticos, están muy divulgados el “SAS” Statistical analysis system y el “SPSS” Statistical Package for the Social Sciences, así como otros muchos.
Bioestadística y Epidemiología ___________________________________________ Tema 2. Organización de los datos.
Las variables cuantitativas son aquellas características que pueden medirse o cuantificarse, hay una magnitud asociada, según una escala numérica. Por ejemplo el carácter producción de leche diaria.
Tabla 2-1. Ejemplo de base de datos. NOMBRE ESPECIE SEXO EDAD PESO Nº de partos Gallarda Bovina Hembra 7 455,23 3 Katum Felina Macho 2 1,52 - Paul Canina Macho 5 12,13 - Katy Canina Hembra 3 5,24 1 Canela Felina Hembra 6 2,10 0 Poncho Canina Macho 3 4,50 -
A su vez las variables cuantitativas se clasifican en Cuantitativas discretas , son variables discontinuas que no admiten modalidades intermedias entre dos datos y se miden en la escala de los números enteros, o Cuantitativas continuas , que si presentan variación continua, entre dos datos hay siempre una modalidad intermedia, se miden en la escala de los números reales.
Ejemplo de variable discreta, Tamaño de la camada en ganado ovino (modalidades 1, 2, 3, 4 o mas crías), Especie (modalidades Bovino, felino, canino, etc.), sexo (macho, hembra). Ejemplo de variable continua es la alzada a la cruz en ganado vacuno, la producción láctea diaria, la edad, el peso corporal, la velocidad de crecimiento, etc..
Distribución del nº de crías por parto en ganado ovino
0
10
20
30
40
50
60
1 2 3 4 Nº de crías
%
Distribucion de la alzada a la cruz en ganado vacuno
0
5
10
15
20
25
30
130 135 140 145 150 155 Alzada en cm
Figura 2-2. Distribuciones de dos tipos de caracteres con variación discreta y continua
La distribución de frecuencias es el método para definir como se distribuye una variable cualitativa, es decir para presentar los resultados de una variable cualitativa, donde tenemos distintas categorías o modalidades. Así la Distribución de frecuencias se define como Conjunto de clases de la variable y la frecuencia de cada una de ellas.
Frecuencia absoluta. Número de observaciones en cada categoría. Frecuencia relativa. Proporción de observaciones en cada categoría. Ejemplo. ¿ Que tipo de animales llegan a la consulta? La especie animal que llega a una consulta veterinaria es una variable cualitativa, donde vamos considerar cinco categorías (perros, gatos, aves, reptiles y otros).
Bioestadística y Epidemiología ___________________________________________ Tema 2. Organización de los datos.
Respuesta: Opción A. El año pasado se recibieron 1450 consultas y paso un listado con todas las consultas donde se puede leer la especie animal de cada una de ellas. (Esta opción es poco eficiente). Opción B. Presento la tabla 2.2. La distribución de frecuencias permite su interpretación con solo leer la tabla, sin necesidad de leer las 1450 consultas.
Tabla 2-2. Distribución de frecuencias del tipo de animales en la consulta el año pasado. Tipo animal (clase) Frecuenciaabsoluta^ Frecuencia relativa Perros 755 0, Gatos 455 0, Aves 136 0, Reptiles 36 0 , Otros 68 0, Total 1450 1,
Distribución de frecuencias en variables cuantitativas. En las variables cuantitativas, aunque no hay modalidades, se pueden presentar los resultados como distribución de frecuencias transformando la variable cuantitativa en categórica a través de un conjunto de clases.
Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases, a la que se le asigna su frecuencia correspondiente. Es necesario tener en consideración otros conceptos como:
Limites de clases: Limite superior y limite inferior de la clase. Amplitud de clase: Diferencia entre el límite superior e inferior. Marca de clases: Punto medio de cada intervalo. Ejemplo. ¿ Que altura tienen las alumnos de la clase? Para responder a esta pregunta hemos de hacer la medición de los 200 alumnos de clase y presentar esta información, sin necesidad de dar el listado de las 200 medidas u observaciones. Aunque hay otras formas de presentar la información, la distribución de frecuencias se presenta en la tabla 2-2.
Tabla 2-3. Distribución de frecuencia de la altura (cm) de los alumnos de clase. Clases Frecuencia absoluta Frecuencia relativa
Fre. Rel. acumulada 150-159 16 0,08 0, 160-169 72 0,36 0, 170-179 78 0,39 0, 180-189 20 0,10 0, 190-199 12 0,06 0, 200-210 2 0,01 1, Total (^200) 1,00 1,
En los apartados anteriores hemos visto como se puede resumir los datos obtenidos de un estudio, a través de la tabla de la distribución de frecuencias. Sin embargo, para las variables cuantitativas resulta más eficaz condensar dicha información en algunos números (parámetros) que la expresen de forma clara y concisa.
Bioestadística y Epidemiología ___________________________________________ Tema 2. Organización de los datos.
Media geométrica: (μg ) Es la media de los logaritmos de los valores de la variable. La formulación de la media aritmética es la siguiente fórmula:
La característica de la media geométrica es muy utilizada para trabajar con aquellas variables que siguen una función exponencial como el crecimiento bacteriano. Por ejemplo la variable recuento de células somáticas en leche, como indicador de la calidad sanitaria.
Mediana: (M (^) ed ) Es el valor de la variable que deja por debajo de sí el 50% de las observaciones. Las propiedades de la mediana son:
Ejemplo A, en la serie X ( 20, 24, 31, 35, 45, 49); Media=34; M (^) ed = 33.
Ejemplo B, en la serie X ( 20, 24, 31, 35, 45, 49, 426); Media=90; M (^) ed = 35
En el ejemplo B la mediana es mejor indicador de tendencia central que la media, que se ha visto afectada por una observación extrema.
Moda: El valor (o los valores) máximo de la serie. Cualquier valor de la serie que posea una frecuencia mayor que su anterior y posterior. Las características de la moda son: que es muy fácil de calcular y que puede no ser única.
Respecto a la relación entre media, mediana y moda, en las variables que siguen una distribución normal coinciden. En los estudios estadísticos y de inferencia suele ser más apta la media, como medida de centralidad, por sus propiedades matemáticas. Cuando la distribución está lejos de la normalidad suele ser más apta la mediana.
Las medidas de dispersión son los parámetros o estadísticos que tiene como objetivo indicar el grado de variabilidad o dispersión de la variable cuantitativa. Nos indican si los valores están próximos a la media si o están dispersos.
Las medidas de dispersión son: Rango, Desviación media, Varianza, Covarianza, Desviación típica y Mediana.
Rango. Amplitud o rango es la diferencia entre el valor más alto y mas bajo de las observaciones. Propiedades:
X (^) g =^ n^ x 1 x 2 ... xn n
x x X (^) g n log ..... log log 1
Bioestadística y Epidemiología ___________________________________________ Tema 2. Organización de los datos.
Desviación media. Media de las desviaciones con respecto a la media aritmética.
Es un parámetro muy poco utilizado en el tratamiento estadístico. Varianza: (S 2 ) (V) (σ^2 ) Media de las desviaciones cuadráticas con respecto a su media aritmética.
Propiedades:
Desviación típica o estándar : (S) (σ) Se define como la raíz cuadrada de la varianza. Se utiliza la raíz cuadrada de la varianza para que se exprese la variabilidad en las mismas unidades que la variable.
Propiedades:
Ejemplo en la serie X en cm (20, 24, 24, 24, 45, 49); Sx = 11,42 cm
Coeficiente de variación : (CV) Se define como la relación entre la desviación típica y la media. Es una medida de la variabilidad adimensional, lo que permite comparar la dispersión entre variables medias en distintas unidades o entre distintas variables.
Propiedades:
n
n
x x
n
i i x
2 2 2 ( )
= ∑
2 S (^) x = S x
x
CV = x
n
DM (^) x ∑ − =
Bioestadística y Epidemiología ___________________________________________ Tema 2. Organización de los datos.
Las representaciones gráficas o gráficos (histogramas, líneas, sectores, etc.), son estrategias para trasmitir con una imagen la distribución de la variable, siguiendo el dicho de Vale más una imagen que mil palabras.
A. Gráficos en variables cualitativas : Los gráficos en las variables cualitativas más frecuentes son: diagrama de barras, gráfico de sectores y pictogramas.
.
Distribución del tipo de animales en la Clínica A el año pasado
0
100
200
300
400
500
600
700
800
Perros Gatos Aves Reptiles Otros Tipo de animal
Nº
Distribución del tipo de animales en en las clinicas A y B
Perros^ Gatos^ Aves Reptiles^ Otros Tipo de animal
% Clinica A Clínica B
Figura 2.1. Diagramas de barras de la variable tipo de animales en la consulta. Gráfico de sectores : Se divide el circulo en tantas porciones como clases existan, así a cada sector le corresponde un arco proporcional a su frecuencia. También se denominan tartas. El arco de cada sección es el resultado de la frecuencia relativa por
136
36 68
755 455
Perros Gatos Aves Reptiles Otros
Figura 2.2. Gráfico de sectores de la variable tipo de animales en la consulta.
Bioestadística y Epidemiología ___________________________________________ Tema 2. Organización de los datos.
Pictogramas: Expresan con dibujos alusivo al tema las frecuencias de las modalidades de la variable. Es un mismo dibujo en diferente escala de tal forma que el área de la figura sea proporcional a la frecuencia de la clase que representa.
España Francia Portugal Figura 2.3. Censo de ganado ovino en España. Francia y Portugal.
B. Gráficos en variables cuantitativas. Los gráficos mas frecuentes para variables cuantitativos son: Histogramas, Polígono de frecuencias y Polígono acumulativo.
Histograma. Se representa un rectángulo para cada intervalo que tiene dicho intervalo como base y la frecuencia relativa o absoluta como altura.
Polígono de frecuencias. Consiste en unir mediante líneas rectas los puntos en el eje de coordenadas que se corresponden con cada marca de clase y su frecuencia.
0
10
20
30
40
50
60
70
80
90
Frecuencia
145 155 165 175 185 190 205 Altura (cm)
0
20
40
60
80
100
145 155 165 175 185 190 205 Altura (cm)
Frecuencia absoluta
Bioestadística y Epidemiología ___________________________________________ Tema 3. Cálculo de probabilidades.
Tema 3 .- Cálculo de Probabilidades : Conceptos básicos. Probabilidad y propiedades. Sucesos compatibles vs excluyentes. Probabilidad condicionada. Sucesos dependientes e independientes. Teorema de Bayes.
La probabilidad nos provee de herramientas para estudiar la incertidumbre, pues nos mide la incertidumbre en la ocurrencia de un determinado suceso, estudia los fenómenos aletorios. Además el estudio de las probabilidades nos será muy útil en desarrollo de la inferencia estadística.
Ejemplo: Ante la decisión de hacer un tratamiento frente a una enfermedad es muy útil conocer de todos los tratamientos posibles la probabilidad de curación en cada uno de ellos. También es interesante conocer si la probabilidad de curación de cada tratamiento está condicionada por algún factor del individuo como sexo, edad, etc., que permitirá elegir el tratamiento más interesante.
Se definen dos tipos de experimentos, los aleatorios y los deterministas. Los deterministas son aquellos que realizados de la misma forma y con las mismas condiciones iniciales, ofrecen siempre el mismo resultado. Por el contrario, aquellos experimentos en los cuales no se pude predecir el resultado final se denominan aleatorios.
Experimento aleatorio : Cualquier proceso cuyos resultados no se conocen de antemano, pero si los posibles resultados llamados sucesos. Las repeticiones sucesivas de un experimento, aun realizándose en idénticas condiciones son impredecibles, varían de forma aleatoria. Ejemplo: Lanzamiento de una moneda, Sexo de una futura cría, etc.
Los experimentos aleatorios cumplen tres condiciones: 1. Repetición indefinida, bajo las mismas condiciones, 2. Imposibilidad de predicción, es la condición de azar. 3. Regularidad estadística; Aunque el resultado es impredecible existe una tendencia de las frecuencias relativas a alcanzar la proximidad a un valor fijo o estable (probabilidad), es la regularidad estadística.
Espacio muestral o universo : Conjunto de posibles resultados o sucesos de un experimento. Por ejemplo si el experimento consiste en el lanzamiento de un dado para observar el número de puntos que se obtiene en su cara superior el universo o espacio muestral sería [ 1, 2, 3, 4, 5, 6 ].
Suceso: Cualquier subconjunto del espacio muestral. Ejemplo [1], [2,4,6]. Suceso simple o elemental: Resultado de un experimento que no puedo expresar como unión de otros sucesos. Ejemplo [1], [4]. Suceso compuesto: Resultado de un experimento que puedo expresar como unión de otros sucesos simples. Ejemplo [2,4,6].
Modelo probabilístico : Conjunto del espacio muestral y una familia de probabilidades.
Bioestadística y Epidemiología ___________________________________________ Tema 3. Cálculo de probabilidades.
Probabilidad: Respecto al concepto de probabilidad tenemos varios puntos de vista o definiciones.
Probabilidad clásica (según Laplace). Cociente entre el número de casos favorables y casos posibles, cuando todos los sucesos elementales son igualmente probables.
Ejemplo, Sacar un número par al lanzar el dado P (nº par) = 3/6 = 0,5.
Probabilidad frecuencial (según Mises). La probabilidad de un suceso es el límite de su frecuencia relativa cuando el número de pruebas tiende a infinito.
n
f p ( S )= lim n −>∞
Ejemplo, Lanzar una moneda al aire, probabilidad de cara, ½.
Probabilidad subjetiva. Grado de creencia del investigador, basada en la experiencia o información previa.
El concepto de probabilidad se define también a través de tres axiomas:
Propiedades de la probabilidad. Las propiedades de la probabilidad se deducen a partir de estos axiomas. ♦ La probabilidad de un suceso vacío o imposible es cero, p (Ø) = 0. ♦ La probabilidad de un suceso seguro es uno, p (Ω)=1. ♦ La ley de la adicción : p (A U B) = p(A) + p(B) - p (A ∩ B) Para sucesos compatibles. p (A+B) = p(A) + p(B) – p (A.B). Para sucesos excluyentes : p (A+B) = p(A) + p(B), p (A.B)= ♦ La ley de la multiplicación : p (A ∩ B) = p(A). p (B/A) Probabilidad condicionada, P(B/A), es la probabilidad de B condicionado a que suceda A. Para sucesos independientes, p (A y B) = p(A). p(B), p(B/A)=P(B) Para sucesos dependientes, p (A y B) = p(A). p(B/A),
♦ Suceso contrario , p ( A )= 1 − p ( A )
♦ Suceso complementario , p ( A )= p ( A ∪ B )+ p ( A ∩ B )
Cuando el especio muestral es discreto se puede estimar la probabilidad de todos los subconjuntos y de los sucesos elementales.