Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


ESTADÍSTICA DESCRIPTIVA, Apuntes de Estadística

Los conceptos básicos de estadística descriptiva, como población, muestra, individuos y variables. Se explica cómo seleccionar la muestra/muestreo de poblaciones y se detallan las técnicas que mejores muestras proporcionan. Además, se describen las variables cuantitativas y las medidas de centralización y dispersión. útil para estudiantes de estadística y matemáticas.

Tipo: Apuntes

2021/2022

A la venta desde 16/10/2022

Biopmb
Biopmb 🇪🇸

30 documentos

1 / 15

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
TEMA 1
ESTADÍSTICA DESCRIPTIVA
CONCEPTOS BÁSICOS:
- POBLACIÓN: total de elementos bajo estudio. Conjunto o colección de elementos al que esta referido un
estudio estadístico. Está constituido por elementos de cualquier naturaleza.
- MUESTRA: subconjunto de elementos de la población (debería ser representativo de la población). Los
procedimientos a seguir para la elección de este tipo de muestras se denominan muestreo.
- INDIVIDUOS: elementos individuales de la población (o muestra).
- VARIABLES: características de los individuos.
COMO SELECCIONAR LA MUESTRA/MUESTREO DE POBLACIONES:
* las técnicas que mejores muestras proporcionan son las aleatorias.
- MUESTREO NO ALEATORIO: no se usa el azar, sino el criterio del investigador, quien decide si la muestra es o no
representativa. Ejemplo: un medico en su estudio de una enfermedad selecciona unos determinados pacientes.
- MUESTREO ALEATORIO: interviene el azar de alguna forma.
* Aleatorio simple (m.a.s): todos los individuos tienen la misma probabilidad de ser escogidos. De entre ellos se
seleccionan al azar N individuos. El tamaño de la muestra viene indicado por N.
* Muestreo estratificado: la población se divide en estratos relevantes para el estudio. Después se eligen
aleatoriamente individuos dentro de cada estrato y en cantidad proporcional al tamaño del estrato correspondiente.
* Muestreo polietrápico o por conglomerados: se divide previamente la población en unidades, siguiendo cierto
criterio, y se seleccionan aleatoriamente algunas de éstas. Después, sobre las unidades escogidas se realiza algún muestreo
de los tipos.
Estadística: rama de las matemáticas que proporciona
instrumentos para la toma de decisiones, utilizando para ello grandes
conjuntos de datos numéricos.
Tiene como objetivo extraer conocimiento a partir de información
numérica.
ESTADÍSTICA DESCRIPTIVA: es la rama de la estadística que
recolecta, analiza y caracteriza un conjunto de datos con el objetivo
de describir las características y comportamientos de este conjunto
mediante mediadas de resumen, tablas o gráficos.
IMPORTANCIA DE LA MUESTRA:
La importancia de la muestra radica en la capacidad que nos otorga de conocer cierta información estadística de una población determinada.
- TAMAÑO DE LA MUESTRA: debe de ser lo suficientemente amplio como para reflejar al total de los elementos del
conjunto y también las relaciones que existen entre ellos.
- REPRESENTATIVIDAD DE LA MUESTRA: muestra seleccionada tiene que ser representativa de la población.
INTE
1-
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff

Vista previa parcial del texto

¡Descarga ESTADÍSTICA DESCRIPTIVA y más Apuntes en PDF de Estadística solo en Docsity!

TEMA 1

ESTADÍSTICA DESCRIPTIVA

CONCEPTOS BÁSICOS:

- POBLACIÓN: total de elementos bajo estudio. Conjunto o colección de elementos al que esta referido un estudio estadístico. Está constituido por elementos de cualquier naturaleza. - MUESTRA: subconjunto de elementos de la población (debería ser representativo de la población). Los procedimientos a seguir para la elección de este tipo de muestras se denominan muestreo. - INDIVIDUOS: elementos individuales de la población (o muestra). - VARIABLES: características de los individuos. COMO SELECCIONAR LA MUESTRA/MUESTREO DE POBLACIONES:

  • las técnicas que mejores muestras proporcionan son las aleatorias. - MUESTREO NO ALEATORIO: no se usa el azar, sino el criterio del investigador, quien decide si la muestra es o no representativa. Ejemplo: un medico en su estudio de una enfermedad selecciona unos determinados pacientes. - MUESTREO ALEATORIO: interviene el azar de alguna forma.
  • Aleatorio simple (m.a.s): todos los individuos tienen la misma probabilidad de ser escogidos. De entre ellos se seleccionan al azar N individuos. El tamaño de la muestra viene indicado por N.
  • Muestreo estratificado: la población se divide en estratos relevantes para el estudio. Después se eligen aleatoriamente individuos dentro de cada estrato y en cantidad proporcional al tamaño del estrato correspondiente.
  • Muestreo polietrápico o por conglomerados: se divide previamente la población en unidades, siguiendo cierto criterio, y se seleccionan aleatoriamente algunas de éstas. Después, sobre las unidades escogidas se realiza algún muestreo de los tipos. Estadística: rama de las matemáticas que proporciona instrumentos para la toma de decisiones, utilizando para ello grandes conjuntos de datos numéricos. Tiene como objetivo extraer conocimiento a partir de información numérica. ESTADÍSTICA DESCRIPTIVA: es la rama de la estadística que recolecta, analiza y caracteriza un conjunto de datos con el objetivo de describir las características y comportamientos de este conjunto mediante mediadas de resumen, tablas o gráficos. IMPORTANCIA DE LA MUESTRA: La importancia de la muestra radica en la capacidad que nos otorga de conocer cierta información estadística de una población determinada. - TAMAÑO DE LA MUESTRA: debe de ser lo suficientemente amplio como para reflejar al total de los elementos del conjunto y también las relaciones que existen entre ellos. - REPRESENTATIVIDAD DE LA MUESTRA: muestra seleccionada tiene que ser representativa de la población. INTE 1-

VARIABLE ESTADÍSTICA: es el conjunto de valores que puede tomar cierta característica de la población sobre la que se realiza el estudio estadístico y sobre la que es posible su medición. VARIABLE CUANTITATIVAS: cuyos valores son numéricos.

  • DISCRETAS: solo pueden tomar valores aislados. Generalmente, las variables estadísticas discretas toman valores sobre el conjunto de los números enteros. Ejemplo: numero de hijos de mujeres ingresadas en una maternidad.
  • CONTINUAS: pueden tomar valores infinitos en un intervalo dado. Ejemplo: temperatura de un paciente.
  • existen variables cuantitativas que son continuas por naturaleza, pero que debido a la precisión de los aparatos empleados para medirlas aparecen como discretas. Tal es el caso de una bascula que ofrece 100 gramos de precisión. Las medidas que se pueden obtener de ella en kg son: 10.1, 10.2, 10.3… En realidad, lo que representa cada valor es que el peso del objeeto en cuestión se encuentra en un intervalo de radio 0.05. VALORES DE UNA VARIABLE CUANTITATIVA: Ejemplo : N (^) Pers (^) Altura - Imc sexo (^1 52) 1,58 - M (^2 71 182) _ H 3 Ejemplo : ✗ (^) , y , Z (^) , t (^) , W M -. (^400) personas Y^ I^ " Y → ✗^ i
  1. Xa^ , (^) Xz A^ personas?^?^?^ Y^ Y (^) Y (^) Y " y color (^). Y sexo^.^.^. Variables → ✗^ ≤^ Altura^ personas (m) 1 Y^ Y → Tamaño muestra ≤ n^ & (^) muestra Xy , X2 ,... XR (^3) Población 1%2 (^163) 1%8 (^) ¡ Cuantitativas Discretas O numéricas (^) Continuas

Variables

Cualitativas Nominales

Atributos Ordinales
  • (^) Necesitamos (^) conocer el^ tipo de^ variable para poder utilizar^ la^ herramienta^ estadística^ adecuada
HISTOGRAMAS
  • Se divide el rango de los datos en un número adecuado de intervalos.
  • Sobre cada intervalo se dibuja un rectángulo cuya área es proporcional a la frecuencia (relativa o abssoluta) de datos en el intervalo.
  • Si la base de todos los rectángulos es la misma, la altura es proporcional a la frecuencia. ¿Para qué sirve un histograma? Para resumir gráficamente la distribución de un conjunto de datos con el fin de encontrar patrones, características inusuales y tendencias fácilmente. ASPECTOS INTERESANTES DE UNA DISTRIBUCIÓN
  • POSICIÓN: en torno a qué valor central toma valores la variable.
  • DISPERSIÓN: el grado de concentración de los valores que toma la variable central alrededor de su posición central.
  • FORMA: por ejemplo, la simetría, es decir, si los valores se reparten de la misma forma a uno y otro lado del centro.
MEDIDAS DE CENTRALIZACIÓN

Puede decirse que las medidas de centralización nos dan una idea del valor o valores en torno a los cuales tienen a agruparse lo datos. Las medidas de centralización son coeficientes de tipo promedio que tratan de representar la distribución dando una visión resumida del comportamiento de la variable que estudiamos. Las principales medidas de centralización son:

  • MEDIA
  • MEDIANA
  • MODA MEDIA ARITMÉTICA VENTAJAS E INCONVENIENTES:
  • cumple las 3 condiciones que se exigen a toda medida de síntesis: considera todos los valores, es siempre calculable (al menos en el caso de las variables cuantitativas) y es única.
  • es el centro de gravedad de la distribución, es decir, se cumple que:
  • un inconveniente: la media puede llevar a situaciones no acertadas. Esto puede ocurrir, por ejemplo, si la variables presenta valores extremos que pueden distorsionar la media haciéndola poco representativa. Es decir, la media NO es robusta. MEDIANA Intuitivamente, la mediana (Me) de una distribución es una valor tal que ordenados todos los valores que toma la variable (de menor a mayor) lo separa en 2 partes iguales. Así, mientras la media aritmética hace referencia al valor medio, la mediana hace referencia al valor que ocupa el lugar medio. El calculo de la mediana depende de la frecuencia absoluta. Así, una vez ordenador los datos de menor a mayor:
RECORRIDO O RANGO
VARIANZA

Es la media aritmética de los cuadrados de las desviaciones de los valores de la variable respecto a la media aritmética, es decir: La varianza es el promedio de las desviaciones al cuadrado: Observe que las unidades de la varianza son las unidades de los datos al cuadrado. CUASIVARIANZA

FÓRMULAS ALTERNATIVAS PARA LA VARIANZA Y CUASIVARIANZA

Estas formulas suelen ser más rápidas para calcular Vx y S2. PROPIEDADES DE LA (CUASI)VARIANZA

  1. La varianza no puede ser negativa.
  2. A igualdad de medidas, mayor dispersión implica mayor varianza.
  3. De 2 muestras con medidas similares, es mas dispersa la que tenga mayor varianza.
  4. PERO, si 2 muestras tienen medidas diferentes, mayor varianza NO implica mayor dispersión, la varianza depende del tamaño (unidades) de los datos. CUASIDESVACIÓN TIPICA COEFICIENTE DE VARIACIÓN MEDIDAS DE POSICIÓN Las medidas de posición pretenden dar una idea de como se agrupan los valores de la distribución y se utilizan para cuantificar su grado de dispersión. Análogamente a la mediana solo tienen en cuenta la aposición de los valores de la variable. Son medidas que no reflejan ninguna tendencia central y que se agrupan bajo el nombre genérico de cuantiles. Son valores de la distribución que la dividen en artes que contienen un número determinando de valores. Además de la mediana estudiaremos:
  • CUARTILES.
  • DECILES
  • PERCENTILES
ESTANDARIZACIÓN O TIPIFICACIÓN
EFECTO DE ESTANDARIZAR UN
CONJUNTO DE DATOS

ANALISIS PARA 2 VARIABLES CONTINUAS 2 VARIABLES INDEPENDIENTES 2 VARIABLES DEPENDIENTES Una variable estadística bidimensional es el conjunto (X,Y) de valores que pueden tomar 2 características diferentes X e Y medidas sobre cada uno de los individuos de una poblacion o muestra. X e Y se denominan variables marginales, y pueden ser ambas cuantitativas, ambas cualitativas o una de cada tipo; y a su vez, las variables cuantitativas pueden ser tanto discretas como continuas.

FORMULACIÓN DE PROBLEMA DE REGRESIÓN:

En una regresión lineal simple trabajaremos solamente con 2 variables, la dependiente Y, y una sola variable predictora o regresar X. Es usual disponer ambas en un par ordenado y definir el par como una variable estadística bidimensional (X,Y). Observamos 2 variables, x e y, e objetivo es analizar la relación existente entre ambas de forma que podamos predecir o aproximar el valor de la variable y a partir del valor de la variable x.

  • la variable Y se llama variable respuesta o dependiente.
  • La variable X se llama variable represora o independiente. En un problema de regresión (a diferencia de cuando calculamos el coeficiente de correlación) el papel de las 2 variables no es simétrico. Matriz de varianzas^ -^ covarianza^72 ' 542 674,79 4,

0158 1 04 ÓOS^ 3 × 3

1 ÓSSY

1 Matriz^ de^ coeficientes^ de^ correlación

3 × 3

↓ (^) y (^99) e-◦ oe Is S O sA^ E a. (^) a Ee (^9 )

RECTA DE REGRESIÓN ESTIMADA

A las estimaciones dadas por (2.17) y (2.19) se les llama estimaciones de mínimos cuadrados ordinariez (MCO) de B0 y B1. Para cada observación de la muestra hay un valor ajustado: El residual de la observación i es la diferencia entre el verdadero valor yi y su valor ajustado: OBSERVACIONES

  • Puede demostrarse que la suma de los residuos de la recta de mínimos cuadrados siempre vale 0.
  • La recta para predecir Y en función de X no es la misma que la recta para predecir X en función de Y.
  • como medida de los bienque se ajusta la recta a los datos, se suele utilizar el coeficiente de determinación (que es el cuadrado del coeficiente de correlación r2).
  • no es aconsejable realizar predicciones con la recta de regresión fuera del rango de valores observados. y y (^) ,^ -^ -^ -^ -^ -^ -^ -^ -^ =^ TÉU: " ¡ (^) y.^ - cjpo MINIMOS (^) CUADRADOS ujj -^ -^ - -^ -^ -^ -^ -^ - ¥ 0 ORDINARIOS LMCO) ji -^ -^ -^ -^ - -^ :*^ | ¡¡ =3 , -5,20 | y.^.^ -^.^ -^ -^ -^ -^ -^ →^ |^ SLÁ. (^) - Ái (^) ) = § , Ú (^)? - (^) ¿ ( (^) Yi - %)? (^) ¿ (

y ,^ -^ E.^ ¡^ ✗^ ¡^ Y

1 1 "^ '^ ^ 1. ¡ I (^) , I I (^) ✗

✗ ¡ Xj

¥ (^) ¡ É2(^ y^ ,

  • piso - pixi) ◦ = Ely , -^ Ño^ - B. Xi) O =^ Exily,^ - Ño -^ B^ > Xi)
◦ SCÁOIÉ) = -

.IE/li(yi-p.-p.xi)--o } ZB, (^) n ✗

¡ = ,^ Yi^

npio-p.is/i0=Ely,-po-ps.,xi)--É^ ¡ =L n o^ n { ◦ = Exily ,^ -^ Á^.^ - A. xi)^

  • (^) Exi - y ,^ - po. Exija ,{^ × ? ¡=^ ,^ '
' = ' in ✗ = MAYÚSC.

✗ =^ minúsc^. { EYi-n.Bo-p.si/i-pso=j-ps.Ei=l E ✗ i.^ Sustituimos^ piso^ en^ la^ otra^ ec^. i yi-po.EE/i+psiEX?^ Para^ encontrará^. =\