Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Estadística: distribuciones, medidas de tendencia y varianza, Apuntes de Bioestadística

Los conceptos básicos de estadística relacionados con las distribuciones de frecuencias, medidas de tendencia central y varianza. Se explican los diferentes tipos de variables, la distribución de frecuencias y la forma de representarla en tablas y gráficos, como histogramas. También se presentan las medidas de tendencia central, como la media aritmética simple, y la varianza, incluyendo su cálculo y la interpretación de su valor.

Tipo: Apuntes

2019/2020

Subido el 14/08/2020

PetaWilson
PetaWilson 🇪🇸

2 documentos

1 / 284

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Bloque Tema Apartados
I.-El Análisis de
datos
Tema 1. “Conceptos básicos del
análisis de datos”
1.1. Comprender qué y cómo es y para que se utiliza el análisis
de datos
1.2. Aspectos generales y particulares de la asignatura
II.-
La Estadística
Descriptiva
Tema 2. “Introducción ala
descripción numérica y gráfica de
variables”
1. Distribuciones de frecuencias.
2.1.1. Distribución de frecuencias de variables cualitativas.
Representaciones gráficas
2.1.2.
Distribución de frecuencias de variables cuantitativas.
Representaciones gráficas. Primeros índices de posición:
percentiles
Tema 3. “Índices de tendencia
central”
3.1. Definición y cálculo de la media aritmética.
3.2. Relación con mediana y moda
Tema 4. “Índices de variabilidad”
4.1.
Introducción
4.2. Definición y cálculo de la varianza y de la desviación típica.
Tema 5. “Índices de forma”
5.1. Concepto de asimetría y de curtosis.
5.2. Tipos e interpretación de los coeficientes de asimetría y
de curtosis
Tema 6. “Puntuaciones
típicas”
6.1. Introducción
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51
pf52
pf53
pf54
pf55
pf56
pf57
pf58
pf59
pf5a
pf5b
pf5c
pf5d
pf5e
pf5f
pf60
pf61
pf62
pf63
pf64

Vista previa parcial del texto

¡Descarga Estadística: distribuciones, medidas de tendencia y varianza y más Apuntes en PDF de Bioestadística solo en Docsity!

Bloque Tema Apartados

I.-El Análisis de datos

Tema 1. “Conceptos básicos del análisis de datos”

1.1. Comprender qué y cómo es y para que se utiliza el análisis de datos

1.2. Aspectos generales y particulares de la asignatura

II.- La Estadística Descriptiva

Tema 2. “Introducción ala descripción numérica y gráfica de variables”

  1. Distribuciones de frecuencias.

2.1.1. Distribución de frecuencias de variables cualitativas. Representaciones gráficas

2.1.2. Distribución de frecuencias de variables cuantitativas. Representaciones gráficas. Primeros índices de posición: percentiles

Tema 3. “Índices de tendencia central”

3.1. Definición y cálculo de la media aritmética.

3.2. Relación con mediana y moda

Tema 4. “Índices de variabilidad”

4.1. Introducción

4.2. Definición y cálculo de la varianza y de la desviación típica.

Tema 5. “Índices de forma”

5.1. Concepto de asimetría y de curtosis.

5.2. Tipos e interpretación de los coeficientes de asimetría y de curtosis

Tema 6. “Puntuaciones típicas” 6.1. Introducción

6.2. Definición de las puntuaciones típicas.

6.3. Relación entre puntuaciones típicas y curva normal.

6.4. Puntuaciones relacionadas: puntuaciones T

Tema 7. “Relaciones entre variables”

7.1. Concepto de relación lineal.

7.2. Definición y cálculo de la covarianza.

7.2.1. Propiedades de la covarianza.

7.3. Definición, cálculo e interpretación del coeficiente de correlación de Pearson.

7.4. Matriz de correlaciones.

Tema 8. “Regresión lineal”

8.1. Concepto de regresión lineal.

8.2. Identificación del modelo de regresión lineal e interpretación.

III.-La Inferencia Estadística

Tema 9. “Estimación de parámetros”

9.1. Muestra y población.

9.2. Estadísticos y parámetros. 9.3. Estimación de parámetros. 9.4. Estimación de la media aritmética.

INDICE

Tema 12. “Tablas de contingencia”

12.1. Concepto de tablas de contingencia.

12.2. Comprobación de la hipótesis de independencia en las tablas de contingencia.

12.3. Corrección de Yates.

Tema 13. “Inferencia no paramétrica”

13.1. Objetivos de la inferencia no paramétrica.

13.2. Prueba de Mann-Whitney para dos muestras independientes. 13.3. Prueba de Wilcoxon para dos muestras relacionadas.

Tema 14. “Contraste de hipótesis en correlación y regresión”

14.1. Comprobación de hipótesis para el coeficiente de correlación de Pearson.

14.2. Comprobación de hipótesis para los coeficientes de regresión

Introducción

La asignatura análisis de datos es una asignatura del máster en investigación en ciencias de la salud.

Se trata de una asignatura de 6 créditos de carácter teórico-práctico en la que se presentan las ideas y los conceptos fundamentales del análisis de datos, con ejemplos concretos, tanto en la investigación como en la aplicación en la promoción del bienestar de los individuos.

Se trata de una herramienta de carácter metodológico que enlaza directamente con las asignaturas de fundamentos de investigación en ciencias de la salud y análisis multivariantes.

El objetivo general de la asignatura es que el alumno adquiera conocimientos de las principales técnicas de análisis de datos existentes, y criterios para decidir qué técnicas son más apropiadas para distintos de problemas abordados, así como, destrezas de análisis crítico de los resultados obtenidos.

BLOQUE 1. EL ANÁLISIS DE DATOS

Tema 1. “Conceptos básicos del análisis de datos”

Tema 9. “Estimación de parámetros”

Tema 10. “Comprobación de hipótesis”

Tema 11. “Comparaciones entre medias”

Tema 12. “Tablas de contingencia

Tema 13. “Inferencia no paramétrica”

Tema 14. “Contraste de hipótesis en correlación y regresión”

I.-El Análisis de datos

Tema 1. “Conceptos básicos del análisis de datos”

1.1. Comprender qué y cómo es y para que se utiliza el análisis de datos

1.2. Aspectos generales y particulares de la asignatura

Tema 1. “Conceptos básicos del análisis de datos”

1.1. Comprender qué y cómo es y para que se utiliza el análisis de datos

  • La mayor parte de los conceptos de esta formación son propiamente estadísticos, por tanto la estadística es

fundamental para completar y entender mejor ciertos aspectos de la metodología de la investigación.

  • La estadística será una herramienta en el futuro ejercicio de vuestra profesión.
  • Al igual que en la vida real en el ejercicio de vuestra profesión encontraréis distintos hallazgos, procedimientos y

conceptos basados en análisis estadísticos previos. La simple interpretación de un análisis de sangre requiere una madurez estadística suficiente para poder ser interpretado de forma adecuada.

  • La estadística abre la puerta a la literatura científica.
  • Todas las disciplinas en las que se realizan estudios cuantitativos han de justificar sus hallazgos en términos

estadísticos

  • Supone una herramienta para el análisis de situaciones con componente aleatoria.
  • La estadística es la ciencia que trabaja y cuantifica la incertidumbre. En aquellas situaciones en las que el resultado de

un procedimiento es incierto, la estadística se muestra como una herramienta imprescindible para tomar decisiones basadas en información objetiva y que ofrezcan garantías de ser adecuadas.

  • La estadística supone una herramienta de incalculable valor para las ciencias de la salud a la hora de establecer protocolos para determinados procedimientos ya que es capaz de cuantificar la conveniencia de los resultados de distintas alternativas, por ejemplo de distintos tratamientos, y así poder tomar la mejor decisión de forma fundamentada.

La estadística permite hacer inferencias acerca de la población, en base al cálculo de probabilidades. El tipo de inferencias que permite realizar pueden ser sobre los parámetros (valores numéricos promedios que caracteriza una población o un modelo) de la población o sobre la forma de distribución de una variable en la población.

1.2. Aspectos generales y particulares de la asignatura

Más concretamente, la aplicación de técnicas estadísticas a las ciencias de la naturaleza, entre las que se encuentran todas las ciencias de la salud, se conoce como Bioestadística. La labor de la bioestadística será transformar los datos que disponemos en información útil para el propósito de nuestra investigación.

Los datos constituyen la constituyen la materia prima de la bioestadística. Son todas aquellas unidades de información relevantes a la hora de hacer un estudio estadístico.

En un estudio estadístico, los datos provienen de las unidades experimentales y representan las variables de estudio.

Las unidades experimentales (muestra) son todos aquellos individuos (individuos, grupos de personas, municipios, muestras serológicas, …) que contienen la información sobre el objeto de interés de nuestro estudio y que por ello son incluidos en éste.

Código Edad Sexo Municipio Motivo

H

M

Sagunto Valencia

……..

Migraña Arritmia

……..

Una vez organizada la información de los individuos en la tabla, podemos comenzar el análisis estadístico de los datos. El primer paso para analizar estadísticamente los datos consiste en resumir y representar gráficamente cada una de las variables que aparecen en la tabla de datos. Esta parte preliminar del análisis se conoce como estadística descriptiva. La estadística descriptiva resume un conjunto de datos proporcionando información mediante tablas, parámetros y/o gráficos. Permite conocer el comportamiento de las variables, consideradas una a una, o la posible relación existente entre ellas. Posteriormente, se llevará a cabo el análisis inferencial de los datos, el cuál nos permitirá de estudiar determinadas características de interés de la población de estudio partir de los datos. La estadística descriptiva, la forma de resumir y representar los datos, y las herramientas necesarias para poder realizarlo depende del tipo de variable. Antes de llevar a cabo el análisis descriptivo de los datos se ha de tener claro de qué tipo es cada una de las variables de que disponemos.

Las variables de estudio se pueden clasificar en:

  • Variables cuantitativas: responden a la pregunta ¿cuánto?, y se expresan siempre con un valor numérico. A su vez se dividen en:
  • Variables continuas. Pueden tomar cualquier valor (entero o no) dentro de un rango determinado de valores (edad, altura, presión arterial)
  • Variables discretas. Pueden tomar sólo ciertos valores concretos (habitualmente números enteros) (número de hijos, kilos de patatas vendidos, censo anual de los españoles)
  • Variables cualitativas o categóricas: responden a la pregunta ¿de qué tipo?, y se pueden expresar con cualquier valor numérico o de otro tipo. A su vez se dividen en:
  • Variables nominales: variables de tipo cualitativo en el que las posibles respuestas NO admiten ningún tipo de ordenación lógica (sexo, estado civil, grupo sanguíneo, color de ojos)
  • Variables ordinales: variables de tipo cualitativo en el que las posibles respuestas admiten una ordenación lógica (nivel de estudios, gravedad de un infarto)

En la estadística descriptiva una vez se recogen los datos, estos han de ser organizados. Los datos se organizan mediante una distribución de frecuencias, que presenta las observaciones realizadas, los datos recogidos, clasificadas en categorías mutuamente excluyentes que indican el número de observaciones en cada categoría.

Posteriormente, conocida la distribución de la/s variable/s, se lleva a cabo el análisis descriptivo de los datos para conocer las medidas de tendencia central (media, moda) y la variabilidad de las características estudiadas en la muestra (desviación típica, varianza), y qué grado de relación existe entre las variables para poder, por ejemplo, pronosticar la puntuación de un sujeto en una de las variables a partir de su puntuación en otra característica.

2.1. Distribución de frecuencias

Como mencionamos en el Tema 1, la distribución de frecuencias es la agrupación de datos en categorías mutuamente excluyentes que indican el número de observaciones en cada categoría. La distribución de frecuencias presenta las observaciones clasificadas de modo que se pueda ver el número existente en cada clase.

Antes de adentrarse en las distribuciones de frecuencias, es importante tener claros algunos conceptos que de manera reiterada se presentan en la terminología estadística.

Algunos de estos conceptos son:

  • Elementos o unidades : Son las entidades acerca de las que se reúnen datos. Por ejemplo, 1) si se evalúa la memoria de los aspirantes a un puesto de cocinero en el restaurante X, las unidades son cada uno de los aspirantes. 2) Si se estudia el fenómeno de abandono escolar de las escuelas primarias públicas de Madrid, las unidades son cada una de las escuelas de dicha región.
  • Población de individuos: Es el conjunto de todos los elementos sobre los cuales se observa una o más características de Interés. Frecuentemente se alude a ella como población objetivo, en razón de que sobre ella recae el objetivo o el interés del estudio. Ejemplos: 1) el conjunto de aspirantes al empleo del restaurante X, 2) el conjunto de escuelas primarias públicas de Madrid.
  • Muestra de individuos: Es un subconjunto o parte de una población de individuos. Ejemplos: 1) los cinco primeros aspirantes entrevistados; 2) las escuelas número 12, 16, 17, 23, 34, 55, 62, 70, 84 y 97 Madrid.
  • Constante: característica que únicamente puede manifestarse en un nivel o modalidad.
  • Variable: característica de un fenómeno observable en los individuos de una población que presenta diferentes modalidades (dos o más) entre los individuos.
  • Variable estadística: Es una representación, a través de números u otros símbolos, de una variable. Esta representación se obtiene mediante algún procedimiento de medición. Ejemplos: 1) cantidad de palabras recordadas de una lista de 12.
    1. porcentaje de abandono escolar (cantidad de estudiantes que abandonaron los estudios en un determinado período dividida por el total de alumnos que ingresaron, multiplicado por 100).

Las variables estadísticas se clasifican de acuerdo con el tipo de valores que pueden tomar en:

  • Variable cualitativa. Es aquella cuyos valores expresan atributos. Ejemplo: Tipo de trastorno que presentan los pacientes de un servicio de salud mental (de ansiedad, de atención, de sueño, etc.)
  • Variable cuasi-cuantitativa. Es aquella cuyos valores indican un orden o jerarquía. Ejemplo: Nivel de abandono escolar (bajo, medio, alto).
  • Variable cuantitativa. Es aquella cuyos valores expresan cantidades numéricas. Dentro de las variables cuantitativas se diferencian las llamadas discretas de las continuas. Se consideran discretas aquellas cuyos valores son puntos aislados; esto es, cuando todo valor tiene un consecutivo. Se dice que dos valores son consecutivos cuando no puede existir un

Población de observaciones: Es el conjunto de todos los valores que puede tomar una variable estadística sobre la población de individuos. Sobre una misma población de individuos se pueden definir muchas poblaciones de observaciones, tantas como variables de interés.

Muestra de observaciones: Es el conjunto de valores que toma una variable estadística sobre una muestra de individuos; es decir, es un subconjunto de la población de observaciones.

Parámetro: Es una característica fija, generalmente numérica, de la población de valores de una variable. Por ejemplo, si la variable es el tiempo de reacción de sujetos entrenados ante un estímulo, un parámetro es el tiempo promedio de reacción de todos los individuos de la población de interés si éstos fueran entrenados (éste es un ejemplo de población hipotética). Al promediar todos los valores de la población se obtiene un único valor fijo para la población. Otro parámetro podría ser el tiempo mínimo de reacción que surgiría de comparar los tiempos de todos los sujetos de la población y que, por tanto, también es único; lo mismo puede decirse del tiempo máximo. Si la variable es actitud de los consumidores hacia un nuevo producto, un parámetro puede ser el porcentaje de consumidores de toda la población objetivo que tiene una actitud positiva.

Estadístico: Es una característica muestral y, como tal, es una variable porque sus valores dependen de la muestra que salga seleccionada (piense que dada una población pueden extraerse muchas muestras diferentes). Cada valor del estadístico se obtiene como función de las observaciones de una muestra. Por ejemplo, tiempo promedio de reacción de 10 individuos que fueron entrenados. Porcentaje de consumidores entre 100 encuestados que manifestaron tener una actitud positiva frente al producto.

Estimador: Es un estadístico cuyos valores se consideran próximos a un parámetro que, por ser generalmente desconocido, se desea estimar.

Frecuencia o Frecuencia absoluta: Es la cantidad de veces que cada valor de la variable aparece en un conjunto de datos. La suma de todas las frecuencia absolutas coincide con la totalidad de los datos.

Proporción o Frecuencia relativa: cantidad de veces que cada valor de la variable aparece en un conjunto de datos en relación al número total de valores dados.

Porcentaje: Es la proporción multiplicada por cien.

2.1.1. Distribución de frecuencias de variables cualitativas

El análisis descriptivo de las variables incluidas en el estudio depende del tipo de variables.

Las variables de tipo cualitativo se pueden resumir individualmente mediante las frecuencias absolutas y relativas de sus categorías.

Frecuencias absolutas. Se definen las frecuencias absolutas (fa) de una variable cualitativa como el número de ocasiones en las que se ha dado cada una de las categorías de la variable que queramos resumir.

Frecuencias relativas. Se definen las frecuencias relativas (fr) como la proporción de veces que se ha dado cada uno de las categorías de la variable.

Las frecuencias absolutas y relativas de una variable cumplen la siguiente relación: fr = fa/ número de unidades experimentales