Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Análisis Descriptivo de Datos: Variabilidad, Asimetría y Curtosis, Apuntes de Estadística

En este documento se presenta un análisis descriptivo de datos que incluye el cálculo de la media, mediana, moda, desviación estándar, coeficiente de variación, radio de variación, asimetría y curtosis. Se analiza la simetría de la variable y se determina si hay sesgo positivo o negativo. Se identifica la distribución leptocúrtica, mesocúrtica o platicúrtica. Se examina el caso de una muestra de 400 casos de edad y su distribución respecto a la media.

Tipo: Apuntes

2019/2020

Subido el 29/09/2020

cidcapricornio
cidcapricornio 🇨🇱

5

(1)

12 documentos

1 / 13

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
-La media (51,47) esta mas cerca de los que tienen menos edad.
- La varianza es la suma de todas las desviaciones al cuadrado. Si a 134 le sacamos la raiz
cuadrados, nos da la desviación estándar que es 11,6. Ahora el 11,6 hay que compararlo
- CV: Des Estándar/ la media (hace una sola comparación) .En nuestro caso tendríamos un
coeficiente de variación Cv: 11,6 /51,47=0,2254=22,54%. La desviación equivale a un
22,54% de la media, Cv>10% si el coeficiente es mayor al 10% entonces la variable es
heterogénea (tiene valores que tienen mucha dispersión entre si en la variable). Los
valores son muy distantes entre si, o las distancias son muy distantes en torno a la media
de 51,47.
La comparación es que entre la desviación y la media es un 22,54%.
pf3
pf4
pf5
pf8
pf9
pfa
pfd

Vista previa parcial del texto

¡Descarga Análisis Descriptivo de Datos: Variabilidad, Asimetría y Curtosis y más Apuntes en PDF de Estadística solo en Docsity!

-La media (51,47) esta mas cerca de los que tienen menos edad.

  • La varianza es la suma de todas las desviaciones al cuadrado. Si a 134 le sacamos la raiz cuadrados, nos da la desviación estándar que es 11,6. Ahora el 11,6 hay que compararlo
  • CV: Des Estándar/ la media (hace una sola comparación).En nuestro caso tendríamos un coeficiente de variación Cv: 11,6 /51,47=0,2254=22,54%. La desviación equivale a un 22,54% de la media, Cv>10% si el coeficiente es mayor al 10% entonces la variable es heterogénea (tiene valores que tienen mucha dispersión entre si en la variable). Los valores son muy distantes entre si, o las distancias son muy distantes en torno a la media de 51,47. La comparación es que entre la desviación y la media es un 22,54%.

La moda es ser Administrativo (1) porque tiene la mayor frecuencia absoluta de 286. El Radio de Variación (RV)= 1-frecuencia de la moda/n. N=tamaño de la muestra.

  • Rv<10%, entonces hay poca variabilidad de la variable. <=quiere decir que es menor a algo.
    • RV>10%, entonces hay mucha variación - RV= 1-286/400=0,2850=28,5%. Como el Radio de Variación (RV) RV= 28,5% lo que nos indica que hay variabilidad. Eso quiere decir que hay mucha distancia de la variabilidad de la variable de los Administrativos respecto a las otras categorías laborales. Es ver cómo se comportan los Administrativos respecto a las otras categorías laborales. Si hay poca variabilidad, si es<10% es que las frecuencias son muy parecidas entre sí. La lectura es que todas las categorías laborales son muy parecidas, pero en este caso al ser >10% no es el caso. Son parecidas o no son parecidas las cantidades (frecuencia) de cada categoría.
    • Si observamos que en la categoría Administrativo es 286 y el resto es 23, 11, 48, 31 quiere decir que la dispersión es muy grande, es una dispersión o distancia de 28%.
    • El Cv lo que mide es que tan cerca o que tan lejos están los valores de la variable respecto del promedio. El comentario se hace respecto del promedio, en este caso no hay congestión, no hay agrupamiento de datos en torno a la media. El coeficiente de variación (CV) es muy descriptivo respecto de la media. Con el puro dato de la media, no se está aportando nada relevante en la descripción. Es para ver si hay o no congestión de datos respecto de la media de un 51,4 y hay poca variabilidad quiere decir que los datos están en torno a la media, hay mucha concentración respecto a la media. En términos simples que la media de 51,47 respecto a las edades de los 400 casos y un coeficiente de variación mayor al RV > 10%, significa que los datos se dispersan del promedio de 51,47. Significa que hay mucha dispersión, mucha distancia.

Distribución asimétrica (distribución con sesgo positivo) -Cuando es una curva de asimetría con sesgo positivo, significa que la media es la mayor que las tres Media>Mediana>Moda. a) Media > Mediana > Moda, entonces el sesgo el positivo. b) Moda > Mediana > Media, entonces el sesgo el sesgo es negativo. c) Media = Medina = Moda, entonces la distribución es simétrica. Se le dice sesgo positivo porque la curva sube violentamente hacia la izquierda y cae violentamente hacia la derecha como un tobogán. Por ejemplo si yo dijera que la nota de la prueba pasada la media del curso fue nota 5.0, entonces se ubican en donde marca el promedio hacia la derecha. Si yo le digo que el promedio del curso fue nota 5.0 y la variable nota tiene una Asimetría positiva, los valores

de la moda que están hacia la izquierda que tiene toda la curva, eso quiere decir los valores de la moda tienen la mayor frecuencia. En la mediana el valor que esta al medio de la curva que tengo el 50% de los datos y a la derecha de la mediana tengo el otro 50% de los datos. Si ahora digo que la nota de la media es 5.0, en dónde se me agrupan los estudiantes respecto de la media, en dónde hay más estudiantes respecto de la media, a la izquierda de la media o hacia la derecha. Como al lado izquierdo de la mediana tiene una curva muy grande, muy posiblemente estén mas del 60% de los datos. Cuando quiero decir que el promedio de los estudiantes es nota 5.0, el grueso de los estudiantes tiene una nota inferior al promedio 5.0, por tanto, se agrupan la mayoría de los estudiantes al lado izquierdo, es decir todos se van a agrupar a la izquierda. En este caso son los valores máximos que tiran la media. -Es un gráfico que sube por la derecha y termina hacia la izquierda. Aquí la media es el menor de los valores de resumen porque esta mas cerca del 0. En el fondo es el valor más pequeño de las tres. Eso quiere decir que la mayoría de los estudiantes tiene una nota superior a 5.0 porque esta ubicado en la moda, ya que la mediana esta al medio y el 50% que esta hacia la derecha tiene mas del 50%. En este caso son los valores mínimos quienes jalonan la media hacia la izquierda.

En este caso la media tiene el valor menor y la moda tiene el valor mayor. C: Si A < 0 Existe Asimetría negativa (valores negativos).

Medida de apuntamiento: Curtosis La curtosis es la altura que tienen las barras Cuando es Leptocúrtica hay poca variabilidad de los datos. Cuando es Mesocúrtica la dispersión es normal. Si es Platicúrtica la dispersión de los datos es muy grande. Por ejemplo, con la pandemia se buscaba que hubiera mucha dispersión, distancia entre las personas que están contagiadas.

  • Si el índice de la curtosis es >0 entonces voy a decir que la distribución es Leptocúrtica (positiva).
  • Si el coeficiente es=0 entonces voy a decir que es mesocúrtica
  • Si el coeficiente es menor que <0 es platicurtica (negativa).

  • -Mirando los datos, la media al tener un valor superior de 51,47 es Asimetria positiva.
  • La Asimetria es 1,708 lo que nos indica la mayoría de las personas tienen un sueldo inferior a la media (423504).
  • La Curtosis es 1,279 lo que nos indica que corresponde a la Leptocurtica esto quiere decir que la variable tiene poca dispersión respecto a la media (423504).
  • La Asimetría y la Curtosis el resultado es respecto a la media.

-En la mediana hay un 50% que tienen menos de 46 años.

  • Existe un 75% entre los hombres que tiene un sueldo inferior a 757989. -Existe un 75% entre las mujeres que tiene un sueldo inferior a 500500.