



































Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
El capítulo 1 del libro 'organización, representación gráfica y síntesis de la información' del grupo teloydisren, donde se enseña el análisis exploratorio de distribuciones de datos. Se explican conceptos básicos como variables y atributos, representaciones gráficas, medidas centrales, medidas de dispersión y medidas de forma. Se incluyen ejemplos prácticos para calcular la media aritmética, media geométrica, media armónica, mediana, moda, desviación absoluta, recorrido intercuartílico, coeficiente de variación, desigualdad de tchebychev y momentos de la distribución.
Tipo: Apuntes
1 / 43
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!




































Introduccion al analisis de datos. Organizacion, representacion graca y síntesis de la información
Grupo TeLoYDisRen
(^1) Introducción Biografía Presentación
(^2) Planteamiento de un problema Presentación Cuestiones a resolver
3 Desarrollo del capítulo Variables y atributos Representaciones grácas Medidas centrales Medidas de dispersión Medidas de forma Análisis Exploratorio
(^4) Solución de las cuestiones
Planteamiento de un problemaIntroducción Desarrollo del capítulo Solución de las cuestiones
Biografía Presentación
Los datos constituyen la materia prima de la Estadística, pudiéndose establecer distintas clasicaciones en función de la forma en que éstos vengan dados. Se obtienen datos al realizar cualquier tipo de prueba, experimento, valoración, medición, observación,... Este capítulo tiene por nalidad la descripción de un conjunto de datos, sin considerar que éstos puedan pertenecer a un colectivo más amplio y, por supuesto, sin la intención de proyectar los resultados que se obtengan al colectivo global; objeto esto último de lo que se conoce como Inferencia Estadística.
Planteamiento de un problemaIntroducción Desarrollo del capítulo Solución de las cuestiones
Presentación Cuestiones a resolver
Los pesos de un colectivo de niños son: 60, 56, 54, 48, 99, 65, 58, 55, 74, 52, 53, 58, 67, 62, 65
76, 85, 92, 66, 62, 73, 66, 59, 57, 54, 53, 58, 57, 55, 60
65, 65, 74, 55, 73, 97, 82, 80, 64, 70, 99, 72, 96, 73, 55
59, 67, 49, 90, 58, 63, 96, 99, 70, 53, 67, 60, 54, 75, 64
Nuestro objetivo es describir este conjunto de datos con una serie de medidas que sinteticen la información contenida en el conjunto; de forma que las medidas obtenidas sean fácilmente interpretables y comparables a las que se puedan obtener para cualquier otra colección de datos.
Planteamiento de un problemaIntroducción Desarrollo del capítulo Solución de las cuestiones
Representaciones grácasMedidas centrales Medidas de dispersión Medidas de forma Análisis Exploratorio
En una primera instancia podemos clasicar los datos en cualitativos o cuantitativos. En el primero de los casos se tiene un atributo o factor y en el segundo una variable numérica o simplemente variable. Los distintos valores o matices de un factor se suelen denominar categorías o clases del factor. Un factor, observado en un grupo de individuos, suele tener pocas categorías. Para hacer referencia genéricamente a una variable o a un atributo se utilizará el término carácter. Ejemplo Como ejemplos de atributos (factores) pueden considerarse el color del pelo de un colectivo de personas, su raza o el idioma que hablan y como variables su estatura, peso o edad.
Planteamiento de un problemaIntroducción Desarrollo del capítulo Solución de las cuestiones
Representaciones grácasMedidas centrales Medidas de dispersión Medidas de forma Análisis Exploratorio
Dentro del conjunto de las variables se distingue entre discretas y continuas. Se dice que una variable es discreta cuando entre dos valores consecutivos no toma valores intermedios y que es continua cuando puede tomar cualquier valor dentro de un intervalo. Ejemplo La estatura de un grupo de personas sería una variable continua, mientras que el número de sus células sería una variable discreta.
Planteamiento de un problemaIntroducción Desarrollo del capítulo Solución de las cuestiones
Representaciones grácasMedidas centrales Medidas de dispersión Medidas de forma Análisis Exploratorio
La organización de los datos constituye la primera etapa de su tratamiento, pues, facilita los cálculos posteriores y evita posibles confusiones. La organización va a depender de la naturaleza de los caracteres que se manejen. Factores o variables. En esta primera etapa de la asignatura compaginaremos las cuestiones prácticas con las metodológicas.
Planteamiento de un problemaIntroducción Desarrollo del capítulo Solución de las cuestiones
Representaciones grácasMedidas centrales Medidas de dispersión Medidas de forma Análisis Exploratorio
Factor Como hemos comentado, un factor medido sobre un conjunto de individuos suele tener pocas categorías distintas. La forma idónea de organizar dicho factor es a través de una tabla de frecuencias. Cada categoría se expresa acompañada del número de individuos, o frecuencia, que presenta dicho rasgo. Ejemplo La tabla Categoría Blanco Verde Azul Rojo Frecuencia 4 3 2 3
... indica que la categoría Blanco la poseen 4 individuos, la Verde 3, etc.... Una variable discreta también podría organizarse de esta manera.
Planteamiento de un problemaIntroducción Desarrollo del capítulo Solución de las cuestiones
Representaciones grácasMedidas centrales Medidas de dispersión Medidas de forma Análisis Exploratorio
En cualquiera de los casos anteriores, factor o variable, se tendría lo que estadísticamente se conoce como una distribución de frecuencias. a la variable que representa a la distribución se le llama genéricamente X a cada uno de los valores que toma la variable (categoría, valor) se le denota por xi. Si estamos hablando de una variable numérica tendríamos intervalos Li− 1 , Li a la frecuencia con que toma dicho valor, o el número de individuos en el intervalo, lo denotamos por ni Para evitar confusiones es aconsejable ordenar los valores de la variable, o los intervalos, de menor a mayor. Los valores ordenados de una distribución se presentan con los subíndices entre paréntesis: x( 1 ), x( 2 ), · · · , x(n) siempre se verica que x(i ) ≤ x(i + 1 )
Planteamiento de un problemaIntroducción Desarrollo del capítulo Solución de las cuestiones
Representaciones grácasMedidas centrales Medidas de dispersión Medidas de forma Análisis Exploratorio
Para efectuar cálculos, sea cuál sea el tipo de distribución, se disponen los datos de la siguiente forma: xi ni Ni fi Fi x 1 n 1 N 1 f 1 F 1 x 2 n 2 N 2 f 2 F 2 .. .
xr nk Nr = n fr Fr = 1
n número total de observaciones,
∑r i= 1 ni fi frecuencia relativa, n ni Ni frecuencia absoluta acumulada, ∑i j= 1 nj Fi frecuencia relativa acumulada, ∑i j= 1 fj
Planteamiento de un problemaIntroducción Desarrollo del capítulo Solución de las cuestiones
Representaciones grácasMedidas centrales Medidas de dispersión Medidas de forma Análisis Exploratorio
Para representar factores o variables discretas, se puede utilizar un diagrama de barras.
Ejemplo Valor 2 4 5 6 7 8 9 Frecuencia 4 4 3 2 3 3 1
Planteamiento de un problemaIntroducción Desarrollo del capítulo Solución de las cuestiones
Representaciones grácasMedidas centrales Medidas de dispersión Medidas de forma Análisis Exploratorio
Si se tiene una distribución de una variable continua, se utiliza un histograma.
Ejemplo Li− 1 , Li ni hi (2,3] 4 4 (3,7] 6 1, (7,12] 12 2, (12,21] 8 0, (21,25] 6 1, (25,30] 4 0, (30,50] 3 0,
Planteamiento de un problemaIntroducción Desarrollo del capítulo Solución de las cuestiones
Representaciones grácasMedidas centrales Medidas de dispersión Medidas de forma Análisis Exploratorio
¯x =
∑^ r
i= 1
xi ni
n
∑^ r
i= 1
xi fi
Ejemplo
Valor 2 4 5 6 7 8 9 Frecuencia 4 4 3 2 3 3 1
¯x =
Planteamiento de un problemaIntroducción Desarrollo del capítulo Solución de las cuestiones
Representaciones grácasMedidas centrales Medidas de dispersión Medidas de forma Análisis Exploratorio
media geométrica:
x ¯g = n
x 1 n 1 x 2 n 2... x rnk media armónica: ¯xa =
n ∑^ k
i= 1
ni xi media ponderada: Se asigna a cada valor xi un peso wi que depende de la importancia relativa de cada uno de estos valores bajo algún criterio.
¯xp =
∑r ∑i=r^1 ni^ wi^ xi i= 1 ni^ wi