estadistica descriptiva, Apuntes de Estadística. Universidad de Cádiz (UCA)
cabaco95
cabaco95

estadistica descriptiva, Apuntes de Estadística. Universidad de Cádiz (UCA)

43 páginas
3Número de descargas
11Número de visitas
Descripción
Asignatura: Estadística, Profesor: Auxiliadora Auxiliadora, Carrera: Enología, Universidad: UCA
20 Puntos
Puntos necesarios para descargar
este documento
Descarga el documento
Vista previa3 páginas / 43
Esta solo es una vista previa
3 páginas mostradas de 43 páginas totales
Descarga el documento
Esta solo es una vista previa
3 páginas mostradas de 43 páginas totales
Descarga el documento
Esta solo es una vista previa
3 páginas mostradas de 43 páginas totales
Descarga el documento
Esta solo es una vista previa
3 páginas mostradas de 43 páginas totales
Descarga el documento
Capitulo 1 - Introduccion al analisis de datos. Organizacion, representacion grafica y síntesis de la información

Capitulo 1 Introduccion al analisis de datos. Organizacion, representacion

graca y síntesis de la información

Grupo TeLoYDisRen

Índice

1 Introducción

Biografía

Presentación

2 Planteamiento de un problema

Presentación

Cuestiones a resolver

3 Desarrollo del capítulo

Variables y atributos

Representaciones grácas

Medidas centrales

Medidas de dispersión

Medidas de forma

Análisis Exploratorio

4 Solución de las cuestiones

Introducción Planteamiento de un problema

Desarrollo del capítulo Solución de las cuestiones

Biografía Presentación

John Graunt, estadista inglés

Nació el 24 de abril de 1620 en Londres.

Graunt fue el primer demógrafo de la historia.

En 1662 publica Natural and Political

Observations Mentioned in a following

Index, and made upon the Bills of

Mortality, en donde estima una mortalidad

en niños nacidos vivos, menores de 6 años,

del 36%.

Carlos III le propuso como socio fundador de

la Royal Society.

Falleció en 1674 y está enterrado en la iglesia

de St. Dunstan.

John Graunt

Grupo TeLoYDisRen Capitulo 1

Introducción Planteamiento de un problema

Desarrollo del capítulo Solución de las cuestiones

Biografía Presentación

Síntesis de la información

Los datos constituyen la materia prima de la Estadística,

pudiéndose establecer distintas clasicaciones en función de la

forma en que éstos vengan dados. Se obtienen datos al realizar

cualquier tipo de prueba, experimento, valoración, medición,

observación,. . .

Este capítulo tiene por nalidad la descripción de un conjunto

de datos, sin considerar que éstos puedan pertenecer a un

colectivo más amplio y, por supuesto, sin la intención de

proyectar los resultados que se obtengan al colectivo global;

objeto esto último de lo que se conoce como Inferencia

Estadística.

Grupo TeLoYDisRen Capitulo 1

Introducción Planteamiento de un problema

Desarrollo del capítulo Solución de las cuestiones

Presentación Cuestiones a resolver

Problema

Los pesos de un colectivo de niños son:

60, 56, 54, 48, 99, 65, 58, 55, 74, 52, 53, 58, 67, 62, 65

76, 85, 92, 66, 62, 73, 66, 59, 57, 54, 53, 58, 57, 55, 60

65, 65, 74, 55, 73, 97, 82, 80, 64, 70, 99, 72, 96, 73, 55

59, 67, 49, 90, 58, 63, 96, 99, 70, 53, 67, 60, 54, 75, 64

Nuestro objetivo es describir este conjunto de datos con una

serie de medidas que sinteticen la información contenida en el

conjunto; de forma que las medidas obtenidas sean fácilmente

interpretables y comparables a las que se puedan obtener para

cualquier otra colección de datos. Grupo TeLoYDisRen Capitulo 1

Introducción Planteamiento de un problema

Desarrollo del capítulo Solución de las cuestiones

Presentación Cuestiones a resolver

Cuestiones

Concretamente nos planteamos: 1 Organizar la colección de datos de manera eciente. 2 Obtener representaciones grácas que muestren la disposición

del colectivo. 3 Elegir uno o varios valores que representen con garantías al

conjunto de los datos. 4 Determinar el nivel de homogeneidad del conjunto de datos. 5 Sistematizar el análisis de un conjunto parecido de datos.

Grupo TeLoYDisRen Capitulo 1

Introducción Planteamiento de un problema

Desarrollo del capítulo Solución de las cuestiones

Variables y atributos Representaciones grácas Medidas centrales Medidas de dispersión Medidas de forma Análisis Exploratorio

Variable y Atributo

En una primera instancia podemos clasicar los datos en

cualitativos o cuantitativos. En el primero de los casos se tiene

un atributo o factor y en el segundo una variable numérica o

simplemente variable.

Los distintos valores o matices de un factor se suelen

denominar categorías o clases del factor. Un factor, observado

en un grupo de individuos, suele tener pocas categorías. Para hacer referencia genéricamente a una variable o a un atributo se utilizará el término carácter.

Ejemplo

Como ejemplos de atributos (factores) pueden considerarse el color del pelo de un colectivo de personas, su raza o el idioma que hablan y como variables su estatura, peso o edad.

Grupo TeLoYDisRen Capitulo 1

Introducción Planteamiento de un problema

Desarrollo del capítulo Solución de las cuestiones

Variables y atributos Representaciones grácas Medidas centrales Medidas de dispersión Medidas de forma Análisis Exploratorio

Variables discretas y continuas

Dentro del conjunto de las variables se distingue entre

discretas y continuas.

Se dice que una variable es discreta cuando entre dos valores

consecutivos no toma valores intermedios y que es continua

cuando puede tomar cualquier valor dentro de un intervalo.

Ejemplo

La estatura de un grupo de personas sería una variable continua, mientras que el número de sus células sería una variable discreta.

Grupo TeLoYDisRen Capitulo 1

Introducción Planteamiento de un problema

Desarrollo del capítulo Solución de las cuestiones

Variables y atributos Representaciones grácas Medidas centrales Medidas de dispersión Medidas de forma Análisis Exploratorio

Clasicación de las series estadísticas

Además de por su naturaleza, se pueden realizar distintas clasicaciones del conjunto de los datos o serie estadística.

1 Por su número 1 Finitas. Las que tienen un número nito de elementos. 2 Innitas. Cuando tienen innitos elementos.

2 Por su obtención 1 Objetivas. Obtenidas con métodos exactos de medición. 2 Subjetivas. Obtenidas mediante apreciaciones personales.

3 Por su dimensión 1 Unidimensionales: x1, x2, x3, · · · , xn. 2 Bidimensionales: (x1, y1), (x2, y2), · · · , (xn, yn). 3 n-dimensionales: (x11 , x

1 2 , · · · , x1n ), · · · , (x r1 , x r2 , · · · , x rn).

4 Por su dependencia temporal 1 Temporales. Los valores se toman en instantes o períodos de

tiempo. 2 Atemporales. No dependen de ningún soporte temporal.

Grupo TeLoYDisRen Capitulo 1

Introducción Planteamiento de un problema

Desarrollo del capítulo Solución de las cuestiones

Variables y atributos Representaciones grácas Medidas centrales Medidas de dispersión Medidas de forma Análisis Exploratorio

Distribución de datos

La organización de los datos constituye la primera etapa de su

tratamiento, pues, facilita los cálculos posteriores y evita

posibles confusiones.

La organización va a depender de la naturaleza de los

caracteres que se manejen. Factores o variables.

En esta primera etapa de la asignatura compaginaremos las

cuestiones prácticas con las metodológicas.

Grupo TeLoYDisRen Capitulo 1

Introducción Planteamiento de un problema

Desarrollo del capítulo Solución de las cuestiones

Variables y atributos Representaciones grácas Medidas centrales Medidas de dispersión Medidas de forma Análisis Exploratorio

Distribución de un factor

Factor Como hemos comentado, un factor medido sobre un conjunto de individuos suele tener pocas categorías distintas. La forma idónea de organizar dicho factor es a través de una tabla de frecuencias. Cada categoría se expresa acompañada del número de individuos, o frecuencia, que presenta dicho rasgo.

Ejemplo

La tabla

Categoría Blanco Verde Azul Rojo

Frecuencia 4 3 2 3

. . . indica que la categoría Blanco la poseen 4 individuos, la Verde 3, etc.. . .

Una variable discreta también podría organizarse de esta manera.

Grupo TeLoYDisRen Capitulo 1

Introducción Planteamiento de un problema

Desarrollo del capítulo Solución de las cuestiones

Variables y atributos Representaciones grácas Medidas centrales Medidas de dispersión Medidas de forma Análisis Exploratorio

Organización de una variable numérica

Variable numérica: En el caso de que haya muchas

observaciones, la mayoría de ellas distintas, una forma de

organización que puede tener un cierto interés, es agrupar las

observaciones en intervalos e indicando el número de

observaciones, frecuencia, que caen dentro de cada intervalo.

Volvemos a tener una tabla de frecuencias.

Ejemplo

La tabla

Intervalo (2,3] (3,7] (7,12] (12,21] (21,25] (25,30]

Frecuencia 4 6 12 8 6 4

. . . nos dice que en el intervalo (2, 3] hay 4 observaciones, que en el (3, 7] hay 6, etc. . .

Grupo TeLoYDisRen Capitulo 1

Introducción Planteamiento de un problema

Desarrollo del capítulo Solución de las cuestiones

Variables y atributos Representaciones grácas Medidas centrales Medidas de dispersión Medidas de forma Análisis Exploratorio

Distribución de Frecuencias

En cualquiera de los casos anteriores, factor o variable, se tendría lo que estadísticamente se conoce como una distribución de frecuencias.

a la variable que representa a la distribución se le llama genéricamente X a cada uno de los valores que toma la variable (categoría, valor) se le denota por xi . Si estamos hablando de una variable numérica tendríamos intervalos Li−1, Li a la frecuencia con que toma dicho valor, o el número de individuos en el intervalo, lo denotamos por ni

Para evitar confusiones es aconsejable ordenar los valores de la variable, o los intervalos, de menor a mayor. Los valores ordenados de una distribución se presentan con los subíndices entre paréntesis:

x(1), x(2), · · · , x(n)

siempre se verica que x(i ) ≤ x(i+1)

Grupo TeLoYDisRen Capitulo 1

Introducción Planteamiento de un problema

Desarrollo del capítulo Solución de las cuestiones

Variables y atributos Representaciones grácas Medidas centrales Medidas de dispersión Medidas de forma Análisis Exploratorio

Distribución de Frecuencias

Para efectuar cálculos, sea cuál sea el tipo de distribución, se

disponen los datos de la siguiente forma:

xi ni Ni fi Fi x1 n1 N1 f1 F1 x2 n2 N2 f2 F2 ...

... ...

... ...

xr nk Nr = n fr Fr = 1

n número total de observaciones, ∑r

i=1 ni fi frecuencia relativa,

ni n

Ni frecuencia absoluta acumulada, ∑i

j=1 nj

Fi frecuencia relativa acumulada, ∑i

j=1 fj

Grupo TeLoYDisRen Capitulo 1

Introducción Planteamiento de un problema

Desarrollo del capítulo Solución de las cuestiones

Variables y atributos Representaciones grácas Medidas centrales Medidas de dispersión Medidas de forma Análisis Exploratorio

Diagrama de Sectores

El diagrama de sectores se emplea para representar atributos o

factores.

Ejemplo

En una votación entre cuatro candidatos a representante de una comunidad se han obtenido los siguientes resultados:

Candidato A B C D

Número de votos 287 315 275 189

Grupo TeLoYDisRen Capitulo 1

Introducción Planteamiento de un problema

Desarrollo del capítulo Solución de las cuestiones

Variables y atributos Representaciones grácas Medidas centrales Medidas de dispersión Medidas de forma Análisis Exploratorio

Diagrama de Barras

Para representar factores o variables discretas, se puede utilizar un

diagrama de barras.

Ejemplo

Valor 2 4 5 6 7 8 9

Frecuencia 4 4 3 2 3 3 1

Grupo TeLoYDisRen Capitulo 1

Introducción Planteamiento de un problema

Desarrollo del capítulo Solución de las cuestiones

Variables y atributos Representaciones grácas Medidas centrales Medidas de dispersión Medidas de forma Análisis Exploratorio

Histograma

Si se tiene una distribución de una variable continua, se utiliza un

histograma.

Ejemplo

Li−1, Li ni hi (2,3] 4 4 (3,7] 6 1,5 (7,12] 12 2,4 (12,21] 8 0,88 (21,25] 6 1,5 (25,30] 4 0,8 (30,50] 3 0,15

Grupo TeLoYDisRen Capitulo 1

Introducción Planteamiento de un problema

Desarrollo del capítulo Solución de las cuestiones

Variables y atributos Representaciones grácas Medidas centrales Medidas de dispersión Medidas de forma Análisis Exploratorio

Medias

Una media es una medida de representación central que necesariamente debe cumplir tres requisitos:

1 Para su obtención deben utilizarse todas las observaciones. 2 Debe ser un valor comprendido entre el menor y el mayor de

los valores de la distribución. 3 Debe venir expresada en la misma unidad que los datos.

Grupo TeLoYDisRen Capitulo 1

Introducción Planteamiento de un problema

Desarrollo del capítulo Solución de las cuestiones

Variables y atributos Representaciones grácas Medidas centrales Medidas de dispersión Medidas de forma Análisis Exploratorio

La media aritmética

x̄ =

r∑ i=1

xini

n =

r∑ i=1

xi fi

Ejemplo

Valor 2 4 5 6 7 8 9

Frecuencia 4 4 3 2 3 3 1

x̄ = 2 · 4 + · · ·+ 9 · 1

4 + · · ·+ 1

= 105

20 = 5′25

Grupo TeLoYDisRen Capitulo 1

Introducción Planteamiento de un problema

Desarrollo del capítulo Solución de las cuestiones

Variables y atributos Representaciones grácas Medidas centrales Medidas de dispersión Medidas de forma Análisis Exploratorio

Otras medias

media geométrica:

x̄g = n

√ xn1 1 xn2 2 . . . xnkr

media armónica: x̄a =

n k∑ i=1

ni xi

media ponderada: Se asigna a cada valor xi un peso wi que depende de la importancia relativa de cada uno de estos

valores bajo algún criterio.

x̄p =

∑r i=1 niwixi∑r i=1 niwi

Grupo TeLoYDisRen Capitulo 1

Introducción Planteamiento de un problema

Desarrollo del capítulo Solución de las cuestiones

Variables y atributos Representaciones grácas Medidas centrales Medidas de dispersión Medidas de forma Análisis Exploratorio

Propiedades de la media

1 r∑

i=1

(xi − x̄)ni = 0

2

Y = aX + b ⇒ ȳ = ax̄ + b. 3 La media es el valor φ que hace mínima la expresión:

r∑ i=1

(xi − φ)2ni .

Grupo TeLoYDisRen Capitulo 1

Introducción Planteamiento de un problema

Desarrollo del capítulo Solución de las cuestiones

Variables y atributos Representaciones grácas Medidas centrales Medidas de dispersión Medidas de forma Análisis Exploratorio

La mediana

La mediana es un valor que, previa ordenación, deja la mitad de las observaciones en la recta real a la izquierda y la otra

mitad a la derecha.

Cálculo de la Mediana 1 n impar

Me = x( n+1 2

)

2 n par

Me = x( n

2 ) + x( n

2 +1)

2

Grupo TeLoYDisRen Capitulo 1

Introducción Planteamiento de un problema

Desarrollo del capítulo Solución de las cuestiones

Variables y atributos Representaciones grácas Medidas centrales Medidas de dispersión Medidas de forma Análisis Exploratorio

Las modas

La moda absoluta de una distribución es el valor que más

veces se repite.

Además de la moda absoluta, aquellos valores que tengan

frecuencia mayor a la de los valores adyacentes serán modas

relativas.

Ejemplo

En la distribución 2, 3, 3, 4, 6, 7, 7, 7, 10

Mo = 7 es la moda

Mor = 3 es una moda relativa

Grupo TeLoYDisRen Capitulo 1

Introducción Planteamiento de un problema

Desarrollo del capítulo Solución de las cuestiones

Variables y atributos Representaciones grácas Medidas centrales Medidas de dispersión Medidas de forma Análisis Exploratorio

Comparación entre media, moda y mediana

La media es la mejor de las medidas de representación, pues la

moda es bastante inestable y un pequeño cambio en las

observaciones puede afectarle mucho, mientras que la mediana

es insensible al tamaño de los datos.

Si se dispone de las modas y medianas de dos distribuciones

hay que conocer cada uno de los datos de éstas para calcular

la moda y mediana de la distribución conjunta.

La media es sensible a las alteraciones de los datos, al tamaño

de éstos y si se conocen las medias de dos conjuntos de datos,

basta con saber los tamaños de ambos grupos para calcular la

media global.

Grupo TeLoYDisRen Capitulo 1

Introducción Planteamiento de un problema

Desarrollo del capítulo Solución de las cuestiones

Variables y atributos Representaciones grácas Medidas centrales Medidas de dispersión Medidas de forma Análisis Exploratorio

Medidas de posición

Se llaman medidas de posición o cuantiles de orden k a aquellas que dividen a la distribución en k partes, de tal forma que en cada una de esas partes haya el mismo número de

elementos.

Las más importantes son:

Los cuartiles(3), Ci , i = 1, 2, 3 que dividen a la distribución en cuatro partes iguales. Los deciles(9), Di , i = 1, 2, . . . , 9 que dividen a la distribución en diez partes iguales. Los percentiles(99), Pi , i = 1, 2, . . . , 99 que dividen a la distribución en cien partes iguales.

Grupo TeLoYDisRen Capitulo 1

No hay comentarios
Esta solo es una vista previa
3 páginas mostradas de 43 páginas totales
Descarga el documento