



























































Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Conceptos básicos del análisis descriptivo de datos, incluyendo variables cualitativas y quantitativas, distribución de frecuencias, medidas centrales y dispersión, y correlación. Se explican tipos de variables, medidas de centralidad como mediana y medidas de dispersión como varianza y desviación típica, así como la correlación entre dos variables.
Tipo: Apuntes
1 / 67
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!




























































Población y tipos de variables
Población
: El universo de objetos estudiados
Variable
: Cada rasgo o característica de los elementos de
la población. - Gasto anual en alimentación; color de ojos; consumo de combustiblepor km...^
Cualitativas
: El rasgo descrito no es de naturaleza
numérica
(color de ojos, sexo, nombre de la empresa.. .)
Cuantitativas
: El rasgo es numérico
(peso, temperatura,
ingresos anuales, precio)
Variables estadísticas cualitativas
Pueden ser
dicotómicas
cuando sólo pueden tomar dos
valores posibles (ej: sí o no) o ser
politómicas
cuando
pueden adquirir tres o más valores.
-^
Con cierta frecuencia las variables cualitativas seexpresan con números.
Variables cualitativas nominales
: la asignación de
números a las categorías es arbitraria
(mujer = 1,
hombre = 0)
Variables cualitativas ordinales
: indican un orden
(ej: el orden de nacimiento que ocupa el recién nacido dentro delos hijos de una familia; primer hijo=1, segundo hijo=2, tercerhijo=3)
La distribución de frecuencias
Es la agrupación de datos en categorías o clasesmutuamente excluyentes que indican el número deobservaciones en cada categoría.
-^
Tenemos
datos, agrupados en
k
categorías:
Si la variable es cualitativa, de forma natural
-^
Ej: estado civil: soltero, casado, divorciado, viudo
Si la variable es cuantitativa, se puede agrupar enintervalos no solapados
-^
Ej: Años: -18, 18-30, 31-45,46-60, 60+
Número de observaciones en cada clase o
frecuencia
absoluta
: n
, n 1
,.., n 2
k
Frecuencia relativa
de la clase i-ésima:
n^ N
i
Ejemplo
Muestra de 100 individuos
-^
Tenemos 4 categorías de estado civil (k=4)
Estado Civil
FrecuenciaAbsoluta
Frecuenciarelativa
Soltero
50
0,
Casado
30
0,
Divorciado
15
0,
Viudo
5
0,
Las distribuciones de frecuencias se pueden representaren un
histograma
(que serán diagramas de barras en el
caso de variables cualitativas y variables continuasdiscretas)
Descripción numérica de una variable
Medidas de centralización^ •
Moda
Media aritmética o promedio
x^ i
x
N
=
∑
Descripción numérica de una variable
Medidas de centralización^ •
Mediana
: “el centro de los datos”
menor a mayor) en dos grupos con igual número deelementos.
datos
Medidas de dispersión
-^
Coeficiente de variación:
describe la variabilidad de una
variable en relación con la media– La media no puede ser cero– Es adimensional (no posee unidades de medida)– Permite comparar distribuciones con distintas unidades
de medida
Rango^ – Diferencia entre los datos máximo y mínimo– Muy sensible a datos atípicos Descripción numérica de una variable
x
x CV
Otras medidas
Coeficientes de asimetría
(g
) y 3
curtosis
(g
Simetría de distribución
g^4
>
g^4
=
g^4
<
La distribución normal tiene curtosis igual a 3. Poreso a veces se le resta el valor 3 a g
(“exceso de 4
curtosis”)
Curtosis de distribución
g^3
<
g^3
=
g^3
>
Nubes de puntos o diagrama de
dispersión
Nos pueden sugerir la existencia de relaciones entrevariables
Medidas de asociación entre variables •
Covarianza
asociación lineal directa
asociación lineal inversa
mayor el grado de asociación lineal
pero N¿qué
significa grande?
de x e y. También, de la dispersión de x e y
Es necesaria una normalización
i^
i
∑
Ejemplo de nubes de puntos y
correlaciones
Correlación y causalidad
Un coeficiente de correlación alto no permite concluir laexistencia de relación de causalidad entre las variables
-^
Existen muchas correlaciones espurias: se deben alefecto de una tercera variable^ – Ej: consumo de helados y lipotimias se hallan muy correlados
pero el consumo de helados no causa lipotimias ni viceversa. Latercera variable es la temperatura
http://tylervigen.com/spurious-correlations