Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Análisis Exploratorio a la Distribución de Datos: Medidas Centrales, Dispersión y Forma - , Apuntes de Estadística

El capítulo 1 del libro 'organización, representación gráfica y síntesis de la información' del grupo teloydisren, donde se enseña el análisis exploratorio de distribuciones de datos. Se explican conceptos básicos como variables y atributos, representaciones gráficas, medidas centrales, medidas de dispersión y medidas de forma. Se incluyen ejemplos prácticos para calcular la media aritmética, media geométrica, media armónica, mediana, moda, desviación absoluta, recorrido intercuartílico, coeficiente de variación, desigualdad de tchebychev y momentos de la distribución.

Tipo: Apuntes

2015/2016

Subido el 30/11/2016

cabaco95
cabaco95 🇪🇸

3.2

(11)

9 documentos

1 / 43

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Capitulo 1
Introduccion al analisis de datos. Organizacion, representacion
graca y síntesis de la información
Grupo TeLoYDisRen
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b

Vista previa parcial del texto

¡Descarga Análisis Exploratorio a la Distribución de Datos: Medidas Centrales, Dispersión y Forma - y más Apuntes en PDF de Estadística solo en Docsity!

Capitulo 1

Introduccion al analisis de datos. Organizacion, representacion graca y síntesis de la información

Grupo TeLoYDisRen

Índice

(^1) Introducción Biografía Presentación

(^2) Planteamiento de un problema Presentación Cuestiones a resolver

3 Desarrollo del capítulo Variables y atributos Representaciones grácas Medidas centrales Medidas de dispersión Medidas de forma Análisis Exploratorio

(^4) Solución de las cuestiones

Planteamiento de un problemaIntroducción Desarrollo del capítulo Solución de las cuestiones

Biografía Presentación

Síntesis de la información

Los datos constituyen la materia prima de la Estadística, pudiéndose establecer distintas clasicaciones en función de la forma en que éstos vengan dados. Se obtienen datos al realizar cualquier tipo de prueba, experimento, valoración, medición, observación,... Este capítulo tiene por nalidad la descripción de un conjunto de datos, sin considerar que éstos puedan pertenecer a un colectivo más amplio y, por supuesto, sin la intención de proyectar los resultados que se obtengan al colectivo global; objeto esto último de lo que se conoce como Inferencia Estadística.

Planteamiento de un problemaIntroducción Desarrollo del capítulo Solución de las cuestiones

Presentación Cuestiones a resolver

Problema

Los pesos de un colectivo de niños son: 60, 56, 54, 48, 99, 65, 58, 55, 74, 52, 53, 58, 67, 62, 65

76, 85, 92, 66, 62, 73, 66, 59, 57, 54, 53, 58, 57, 55, 60

65, 65, 74, 55, 73, 97, 82, 80, 64, 70, 99, 72, 96, 73, 55

59, 67, 49, 90, 58, 63, 96, 99, 70, 53, 67, 60, 54, 75, 64

Nuestro objetivo es describir este conjunto de datos con una serie de medidas que sinteticen la información contenida en el conjunto; de forma que las medidas obtenidas sean fácilmente interpretables y comparables a las que se puedan obtener para cualquier otra colección de datos.

Planteamiento de un problemaIntroducción Desarrollo del capítulo Solución de las cuestiones

Representaciones grácasMedidas centrales Medidas de dispersión Medidas de forma Análisis Exploratorio

Variable y Atributo

En una primera instancia podemos clasicar los datos en cualitativos o cuantitativos. En el primero de los casos se tiene un atributo o factor y en el segundo una variable numérica o simplemente variable. Los distintos valores o matices de un factor se suelen denominar categorías o clases del factor. Un factor, observado en un grupo de individuos, suele tener pocas categorías. Para hacer referencia genéricamente a una variable o a un atributo se utilizará el término carácter. Ejemplo Como ejemplos de atributos (factores) pueden considerarse el color del pelo de un colectivo de personas, su raza o el idioma que hablan y como variables su estatura, peso o edad.

Planteamiento de un problemaIntroducción Desarrollo del capítulo Solución de las cuestiones

Representaciones grácasMedidas centrales Medidas de dispersión Medidas de forma Análisis Exploratorio

Variables discretas y continuas

Dentro del conjunto de las variables se distingue entre discretas y continuas. Se dice que una variable es discreta cuando entre dos valores consecutivos no toma valores intermedios y que es continua cuando puede tomar cualquier valor dentro de un intervalo. Ejemplo La estatura de un grupo de personas sería una variable continua, mientras que el número de sus células sería una variable discreta.

Planteamiento de un problemaIntroducción Desarrollo del capítulo Solución de las cuestiones

Representaciones grácasMedidas centrales Medidas de dispersión Medidas de forma Análisis Exploratorio

Distribución de datos

La organización de los datos constituye la primera etapa de su tratamiento, pues, facilita los cálculos posteriores y evita posibles confusiones. La organización va a depender de la naturaleza de los caracteres que se manejen. Factores o variables. En esta primera etapa de la asignatura compaginaremos las cuestiones prácticas con las metodológicas.

Planteamiento de un problemaIntroducción Desarrollo del capítulo Solución de las cuestiones

Representaciones grácasMedidas centrales Medidas de dispersión Medidas de forma Análisis Exploratorio

Distribución de un factor

Factor Como hemos comentado, un factor medido sobre un conjunto de individuos suele tener pocas categorías distintas. La forma idónea de organizar dicho factor es a través de una tabla de frecuencias. Cada categoría se expresa acompañada del número de individuos, o frecuencia, que presenta dicho rasgo. Ejemplo La tabla Categoría Blanco Verde Azul Rojo Frecuencia 4 3 2 3

... indica que la categoría Blanco la poseen 4 individuos, la Verde 3, etc.... Una variable discreta también podría organizarse de esta manera.

Planteamiento de un problemaIntroducción Desarrollo del capítulo Solución de las cuestiones

Representaciones grácasMedidas centrales Medidas de dispersión Medidas de forma Análisis Exploratorio

Distribución de Frecuencias

En cualquiera de los casos anteriores, factor o variable, se tendría lo que estadísticamente se conoce como una distribución de frecuencias. a la variable que representa a la distribución se le llama genéricamente X a cada uno de los valores que toma la variable (categoría, valor) se le denota por xi. Si estamos hablando de una variable numérica tendríamos intervalos Li− 1 , Li a la frecuencia con que toma dicho valor, o el número de individuos en el intervalo, lo denotamos por ni Para evitar confusiones es aconsejable ordenar los valores de la variable, o los intervalos, de menor a mayor. Los valores ordenados de una distribución se presentan con los subíndices entre paréntesis: x( 1 ), x( 2 ), · · · , x(n) siempre se verica que x(i ) ≤ x(i + 1 )

Planteamiento de un problemaIntroducción Desarrollo del capítulo Solución de las cuestiones

Representaciones grácasMedidas centrales Medidas de dispersión Medidas de forma Análisis Exploratorio

Distribución de Frecuencias

Para efectuar cálculos, sea cuál sea el tipo de distribución, se disponen los datos de la siguiente forma: xi ni Ni fi Fi x 1 n 1 N 1 f 1 F 1 x 2 n 2 N 2 f 2 F 2 .. .

xr nk Nr = n fr Fr = 1

n número total de observaciones,

∑r i= 1 ni fi frecuencia relativa, n ni Ni frecuencia absoluta acumulada, ∑i j= 1 nj Fi frecuencia relativa acumulada, ∑i j= 1 fj

Planteamiento de un problemaIntroducción Desarrollo del capítulo Solución de las cuestiones

Representaciones grácasMedidas centrales Medidas de dispersión Medidas de forma Análisis Exploratorio

Diagrama de Barras

Para representar factores o variables discretas, se puede utilizar un diagrama de barras.

Ejemplo Valor 2 4 5 6 7 8 9 Frecuencia 4 4 3 2 3 3 1

Planteamiento de un problemaIntroducción Desarrollo del capítulo Solución de las cuestiones

Representaciones grácasMedidas centrales Medidas de dispersión Medidas de forma Análisis Exploratorio

Histograma

Si se tiene una distribución de una variable continua, se utiliza un histograma.

Ejemplo Li− 1 , Li ni hi (2,3] 4 4 (3,7] 6 1, (7,12] 12 2, (12,21] 8 0, (21,25] 6 1, (25,30] 4 0, (30,50] 3 0,

Planteamiento de un problemaIntroducción Desarrollo del capítulo Solución de las cuestiones

Representaciones grácasMedidas centrales Medidas de dispersión Medidas de forma Análisis Exploratorio

La media aritmética

¯x =

∑^ r

i= 1

xi ni

n

∑^ r

i= 1

xi fi

Ejemplo

Valor 2 4 5 6 7 8 9 Frecuencia 4 4 3 2 3 3 1

¯x =

Planteamiento de un problemaIntroducción Desarrollo del capítulo Solución de las cuestiones

Representaciones grácasMedidas centrales Medidas de dispersión Medidas de forma Análisis Exploratorio

Otras medias

media geométrica:

x ¯g = n

x 1 n 1 x 2 n 2... x rnk media armónica: ¯xa =

n ∑^ k

i= 1

ni xi media ponderada: Se asigna a cada valor xi un peso wi que depende de la importancia relativa de cada uno de estos valores bajo algún criterio.

¯xp =

∑r ∑i=r^1 ni^ wi^ xi i= 1 ni^ wi