Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Análisis Estadístico de Variables Unidimensionales II: Medidas de Dispersión y Forma, Apuntes de Estadística

En este tema se estudian las medidas de dispersión y forma de variables unidimensionales. Se presentan conceptos básicos como recorrido absoluto, recorrido intercuartílico, desviación media respecto a la media aritmética, varianza, desviación típica y coeficientes de asimetría y curtosis. Se incluyen ejercicios para calcular y interpretar estas medidas.

Tipo: Apuntes

2020/2021

Subido el 11/03/2021

user292
user292 🇪🇸

5

(3)

16 documentos

1 / 13

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
1. TEMA 3: ANÁLISIS ESTADÍSTICO DE VARIABLES
UNIDIMENSIONALES (II)
1.MEDIDAD DE DISPERSIÓN
Definición: medidas de la mayor o menor separación de los valores respecto a
otro, que se pretende que sea la síntesis de la. Distribución. Por lo tanto, sirve
para medir la representatividad de los valores de tendencia central, ya que una
medida sería tanto más representativa cuantos más valores se encuentren a su
alrededor.
Ejemplo: Sean dos poblaciones de once individuos cada una:
Población A: Uno gana 100.000 e/mensuales y los restantes diez ganan 1.000
e/mensuales cada uno.
Población B: Uno gana 10.000 e/mensuales, cinco ganan 9.000 e/mensuales y
los restantes cinco ganan 11.000 e/mensuales cada uno.
La media es 10.000 e/mensuales, pero, la riqueza está igualmente distribuida?
¿Son iguales las poblaciones? ¿Cómo diferenciarlas?
Recorrido Absoluto
Definición: sea X una variable de tamaño n, supuestos los datos ordenados
de menor a. mayo, se define el recorrido absoluto como la diferencia entre el
último y el primer valor: Re= Xn – X1
Ventajas:
El calculo es rápido y sencillo.
Inconvenientes:
Solo depende de los valores externos. No informa sobre la distribución
de los restantes datos en la muestra.
No sirve para medir la representatividad de ninguna medida de tenencia
central.
Ejercicio:
En una asesoría jurídica se tienen 12 empleados que han resuelto el siguiente
numero de consultas jurídicas en una semana:
Empleados
A. B. C. D. E. F. G. H I. J. K. L
2. 5. 4. 3. 6. 6. 4. 1. 5. 3. 6. 3.
pf3
pf4
pf5
pf8
pf9
pfa
pfd

Vista previa parcial del texto

¡Descarga Análisis Estadístico de Variables Unidimensionales II: Medidas de Dispersión y Forma y más Apuntes en PDF de Estadística solo en Docsity!

1. TEMA 3: ANÁLISIS ESTADÍSTICO DE VARIABLES

UNIDIMENSIONALES (II)

1.MEDIDAD DE DISPERSIÓN

Definición : medidas de la mayor o menor separación de los valores respecto a otro, que se pretende que sea la síntesis de la. Distribución. Por lo tanto, sirve para medir la representatividad de los valores de tendencia central, ya que una medida sería tanto más representativa cuantos más valores se encuentren a su alrededor. Ejemplo : Sean dos poblaciones de once individuos cada una: Población A: Uno gana 100.000 e/mensuales y los restantes diez ganan 1. e/mensuales cada uno. Población B: Uno gana 10.000 e/mensuales, cinco ganan 9.000 e/mensuales y los restantes cinco ganan 11.000 e/mensuales cada uno. La media es 10.000 e/mensuales, pero, la riqueza está igualmente distribuida? ¿Son iguales las poblaciones? ¿Cómo diferenciarlas? Recorrido Absoluto Definición: sea X una variable de tamaño n, supuestos los datos ordenados de menor a. mayo, se define el recorrido absoluto como la diferencia entre el último y el primer valor: Re= Xn – X Ventajas:

  • El calculo es rápido y sencillo. Inconvenientes:
  • Solo depende de los valores externos. No informa sobre la distribución de los restantes datos en la muestra.
  • No sirve para medir la representatividad de ninguna medida de tenencia central. Ejercicio: En una asesoría jurídica se tienen 12 empleados que han resuelto el siguiente numero de consultas jurídicas en una semana: Empleados A. B. C. D. E. F. G. H I. J. K. L
                    1. 6. 3.

Calcule el recorrido. Solución: Ordenamos de menor a mayor para obtener el máximo y el mínimo. Entonces: Re=6-1=5 consultas jurídicas Recorrido inicial Definición: sea X una variable de tamaño n, supuestos los datos ordenados de menor a mayor, se define el recorrido intercuartílico como la diferencia entre tercer y el primer cuartil: RI= G3 – Q Ventajas :

  • No depende de los valores extremos de la muestra: no está afectado por valores atípicos.
  • Mide el tamaño del 50% central de la muestra. Inconvenientes :
  • No sirve exactamente para medir la representatividad de ninguna medida de tendencia central particular. Ejercicio : Tomando los cuartiles de la distribución del ejercicio anterior se obtuvieron las siguientes medidas: Calcular el recorrido intercuartílico. Solución : RI= Q3 – Q1= 5,25 – 3= 2,25 consultas jurídicas. Desviación media respecto a la media aritmética Definición : sea X una variable de tamaño n, con k grupos de datos distintos, se define la desviación media respecto a la media aritmética. Ventajas :
  • Utiliza todos los datod de la muetra
  • Es una medida de dispersión a la media aritmétrica: mide su representatividad. Inconvenientes :
  • La función valor absoluto es complicada de manejar algebraicamente. Ejercicio : Conociendo que la media consultas jurídicas en una semana de la siguiente distribución es de 4:

Varianza Definición : Sea X una variable de tamaño n, con k grupos de datos distintos, se define la varianza como: Ventajas :

  • Utiliza todos los datos de la muestra.
  • Es una medida de dispersión a la media aritmética: mide su representatividad. Inconvenientes :
  • Es difícil de interpretar: su valor está expresado en unidades de la variable al cuadrado. Ejercicio : Conociendo que la consulta jurídica en una semana de los siguientes empleados y que la media de distribución es 4: Calcule la varianza. Solución : Primero se calcula la tabla de frecuencias: Posteriormente se emplea al calculo para obtener siguiendo la siguiente expresión: Repaso de conceptos

Cambio de origen: son aquellos cambios que desplazan a todos los valores de una distribución por igual. Este cambio no implica una transformación en la pendiente de la nueva distribución. P.ej. si todos los empleados de una empresa ganaran 100€ más al mes. Cambio de escala: son aquellos cambios que desplazan los valores de una distribución en función de un porcentaje o proporción. Este cambio transforma la pendiente de la nueva distribución. P.ej. si a todos los empleados de una empresa se les subiera en un 5% el salario al mes. Varianza Propiedades :

  • La varianza no queda afectada por cambios de origen, pero sí por los cambios de escala:
  • La varianza es igual a la media de la variable cuadrática menos el cuadrado de la media de la variable considerada: Ejercicio : Al revisar los datos de la semana, que se emplearon en el ejercicio anterior, se observa que no se ha contabilizado un caso que han resuelto entre todos, entonces se decide. Incorporar ese resultado a todos los trabajadores. Determinar la nueva varianza y explicar a que se debe. El resultado. (Dato: Varianza: 2,5 casos^2) Solución: El efecto se producirá sobre el origen, entonces la nueva dotribución se calculará Y= 1+X. como sabemos, los cambios en el origen no afecta al valor de la varianza entonces la varianza de la nueva distribución será igual a la anterior: Ejercicio :

Ventajas :

  • Utiliza todos los datos de la muestra.
  • Es una medida de dispersión a la media aritmética: mide su representatividad.
  • No tiene unidades: permite comparar la dispersión de dos muestras cualquiera. Inconvenientes :
  • Cuando la media es cero no se puede calcular. Ejercicio : Un individuo compra una asesoría jurídica y para conocer la fiabilidad de la en la resolución de casos le ofrecen datos de resolución semanal de casos de estas tres empresas: Interprete la representatividad de la media. Solución : La empresa con mejor representatividad de la media es la A, siendo también representativa la de la empresa B y nada representativa la de la empresa Z. Tipificación Utilidad : la tipificación es un instrumento para poder comparar valores de muestras diferentes, reduciendo todas las muestras a una escala común:
  • El cero de la escala es la media aritmética.
  • La unidad de medida es la desviación típica. Definición : Sea X una variable de tamaño n, con media X y desviación típica S, se define la variable tipificada Z como: Ejercicio : Sean dos empresas:
  • Empresa A: con una media de los sueldos de 1.000€ mensuales y una desviación típica de 825€.
  • Empresa B: con una media de los sueldos de 1.500€ mensuales y una desviación típica de 650€. Entre un empleado de A que gana 1.300€ y un empleado de B que gana 1.650€. ¿Cuál de los dos tiene una posición relativa mejor dentro de su empresa?

Solución : Tomando los dos ejemplos:

  • Empleado empresa A:
  • Empleado empresa B: La mejor posición es la del empleado A, su salario está mucho más por encima de la media que la del empleado B. 2.MEDIDAS DE FORMA Concepto Definición : son medidas de la manera en que están distribuidos los datos en la muestra, resumiendo la forma que tuenen al representarlos. Se consideran dos aspectos de la forma:
  • Asimetría
  • Curtosis Asimetría Las medidas de asimetría se dirigen a elaborar un indicador que permite establecer el grado de asimetría/simetría que presenta la distribución sin necesidad de llevar a cabo su representación. Coeficiente de asimetría de Ficher I Definición : Sea X una variable de tamaño n, con K grupos de datos distintos, se define el coeficiente de asimetría de Ficher como: Y de esta forma si:
  • gf= 0: la distribución es simétrica.
  • gf > 0: la distribución es asimétrica positiva o asimétrica a derechas.
  • gf < 0: la distribución es asimétrica negativa o asimétrica a izquierdas.

Curtosis La curtosis o apuntamiento es la mayor o menor concentración de frecuencias alrededor de la media aritmética. No se pude medir directamente, y por eso se compara la curtosis de cualquier muestra frente a una distribución de probabilidad Normal, a la que se da el nombre de mesocúrtica: Definición : Sea X una variable de tamaño n, con K grupos de datos distintos, se define el coeficiente de curtosis como: Y de esta forma si:

  • gf= 0: la distribución es igual de apuntada que la normal o mesocúrtica.
  • gf > 0: la distribución es más apuntada que la normal o leptocúrtica.
  • gf < 0: la distribución es menos apuntada que la normal o platicúrtica. Ejercicio : Partiendo de los casos resueltos por los trabajadores de una nueva sección jurídica durante una semana: X(media)= 3; S = 1, Calcule la forma a través del coeficiente de curtosis. Solución: 3.MEDIDAS DE CONCENTRACIÓN Concepto Definición : La concentración mide el mayor o menor grado de igualdad en el reparto del total de los valore de la variable; son, por tanto, indicadores del grado de equidistribución de la variable. Utilidad: Estas medidas tienen especial aplicación a variables económicas (rentas, salarios, etc.), donde lo que verdaderamente interesa es la mayor o menor igualdad de su reparto entre los componentes de la población, es decir, que esté equitativamente repartida. Los mas importantes son: