Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Estadística Descriptiva: Ejercicios y Ejemplos para Estudiantes de la UNAM, Apuntes de Estadística

Estadistica descriptiva, definicion y sus caracteristicas

Tipo: Apuntes

2018/2019

Subido el 10/08/2019

IraisTepal
IraisTepal 🇲🇽

1 documento

1 / 38

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Facultad de Contaduría y Administración. UNAM Estadística descriptiva Autor: Dr. José Manuel Becerra Espinosa
1
MATEMÁTICAS BÁSICAS
ESTADÍSTICA DESCRIPTIVA
DEFINICIÓN Y CLASIFICACIÓN DE VARIABLES
La estadística descriptiva es la rama de las Matemáticas que recolecta, presenta y caracteriza un
conjunto de datos (por ejemplo, edad de una población, altura de los estudiantes de una escuela,
temperatura en los meses de verano, etc.) con el fin de describir apropiadamente las diversas
características de ese conjunto.
Al conjunto de los distintos valores numéricos que adopta un carácter cuantitativo se llama variable
estadística.
Las variables pueden ser de dos tipos:
Variables cualitativas o categóricas: no se pueden medir numéricamente (por ejemplo: nacionalidad,
color de la piel, sexo).
Variables cuantitativas: tienen valor numérico (edad, precio de un producto, ingresos anuales).
Las variables también se pueden clasificar en:
Variables unidimensionales: sólo recogen información sobre una característica (por ejemplo: edad de
los alumnos de una clase).
Variables bidimensionales: recogen información sobre dos características de la población (por
ejemplo: edad y altura de los alumnos de una clase).
Variables pluridimensionales: recogen información sobre tres o más características (por ejemplo:
edad, altura y peso de los alumnos de una clase).
Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas:
Discretas: sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: número de hermanos
(puede ser 1, 2, 3...., etc., pero, por ejemplo, nunca podrá ser 3.45).
Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un
vehículo puede ser 90.4 km/h, 94.57 km/h...etc.
Cuando se estudia el comportamiento de una variable hay que distinguir los siguientes conceptos:
Individuo: cualquier elemento que porte información sobre el fenómeno que se estudia. Así, si
estudiamos la altura de los niños de una clase, cada alumno es un individuo; si se estudia el precio
de la vivienda, cada vivienda es un individuo.
Población: conjunto de todos los individuos (personas, objetos, animales, etc.) que porten información
sobre el fenómeno que se estudia. Por ejemplo, si se estudia el precio de la vivienda en una ciudad,
la población será el total de las viviendas de dicha ciudad.
Muestra: subconjunto que seleccionado de una población. Por ejemplo, si se estudia el precio de la
vivienda de una ciudad, lo normal será no recoger información sobre todas las viviendas de la ciudad
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26

Vista previa parcial del texto

¡Descarga Estadística Descriptiva: Ejercicios y Ejemplos para Estudiantes de la UNAM y más Apuntes en PDF de Estadística solo en Docsity!

MATEMÁTICAS BÁSICAS

ESTADÍSTICA DESCRIPTIVA

DEFINICIÓN Y CLASIFICACIÓN DE VARIABLES

La estadística descriptiva es la rama de las Matemáticas que recolecta, presenta y caracteriza un conjunto de datos (por ejemplo, edad de una población, altura de los estudiantes de una escuela, temperatura en los meses de verano, etc.) con el fin de describir apropiadamente las diversas características de ese conjunto.

Al conjunto de los distintos valores numéricos que adopta un carácter cuantitativo se llama variable estadística.

Las variables pueden ser de dos tipos:

  • Variables cualitativas o categóricas : no se pueden medir numéricamente (por ejemplo: nacionalidad, color de la piel, sexo).
  • Variables cuantitativas : tienen valor numérico (edad, precio de un producto, ingresos anuales).

Las variables también se pueden clasificar en:

  • Variables unidimensionales : sólo recogen información sobre una característica (por ejemplo: edad de los alumnos de una clase).
  • Variables bidimensionales : recogen información sobre dos características de la población (por ejemplo: edad y altura de los alumnos de una clase).
  • Variables pluridimensionales : recogen información sobre tres o más características (por ejemplo: edad, altura y peso de los alumnos de una clase).

Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas:

  • Discretas : sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: número de hermanos (puede ser 1, 2, 3...., etc., pero, por ejemplo, nunca podrá ser 3.45).
  • Continuas : pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un vehículo puede ser 90.4 km/h, 94.57 km/h...etc.

Cuando se estudia el comportamiento de una variable hay que distinguir los siguientes conceptos:

  • Individuo : cualquier elemento que porte información sobre el fenómeno que se estudia. Así, si estudiamos la altura de los niños de una clase, cada alumno es un individuo; si se estudia el precio de la vivienda, cada vivienda es un individuo.
  • Población : conjunto de todos los individuos (personas, objetos, animales, etc.) que porten información sobre el fenómeno que se estudia. Por ejemplo, si se estudia el precio de la vivienda en una ciudad, la población será el total de las viviendas de dicha ciudad.
  • Muestra : subconjunto que seleccionado de una población. Por ejemplo, si se estudia el precio de la vivienda de una ciudad, lo normal será no recoger información sobre todas las viviendas de la ciudad

(sería una labor muy compleja), sino que se suele seleccionar un subgrupo (muestra) que se entienda que es suficientemente representativo.

Las variables aleatorias son variables que son seleccionadas al azar o por procesos aleatorios.

DATOS. CLASIFICACIÓN, ORGANIZACIÓN Y CONSTRUCCIÓN DE BLOQUES

ESTADÍSTICOS

Los datos son medidas y/o números recopilados a partir de la observación. Los datos pueden concebirse como información numérica necesaria para ayudar a tomar una decisión con más bases en una situación particular.

Existen muchos métodos mediante los cuales se pueden obtener datos necesarios. Primero, se puede buscar datos ya publicados por otras fuentes. Segundo, se puede diseñar un experimento. En tercer lugar, se puede conducir un estudio. Cuarto, se pueden hacer observaciones del comportamiento, actitudes u opiniones de los individuos en los que se está interesado.

Los datos se pueden clasificar en:

  • Datos discretos. Son respuestas numéricas que surgen de un proceso de conteo.
  • Datos continuos. Son respuestas numéricas que surgen de un proceso de medición.
ESCALAS DE MEDICIÓN

Medir en el campo de las ciencias exactas es comparar una magnitud con otra, tomada de manera arbitraria como referencia, denominada patrón y expresar cuántas veces la contiene. En el campo de las ciencias sociales medir es “el proceso de vincular conceptos abstractos con indicadores empíricos”. Al resultado de medir lo se le llama medida.

La medición de las variables puede realizarse por medio de cuatro escalas de medición: la nominal, ordinal, de intervalo y de razón. Se utilizan para ayudar en la clasificación de las variables, el diseño de las preguntas para medir variables, e incluso indican el tipo de análisis estadístico apropiado para el tratamiento de los datos.

Una característica esencial de la medición es la dependencia que tiene de la posibilidad de variación. La validez y la confiabilidad de la medición de una variable depende de las decisiones que se tomen para operarla y lograr una adecuada comprensión del concepto evitando imprecisiones y ambigüedades, en caso contrario, la variable corre el riesgo inherente de ser invalidada debido a que no produce información confiable.

a) Medición Nominal.

En este nivel de medición se establecen categorías distintivas que no implican un orden específico. Por ejemplo, si la unidad de análisis es un grupo de personas, para clasificarlas se puede establecer la categoría sexo con dos niveles, masculino (M) y femenino (F), los encuestados sólo tienen que señalar su género, no se requiere de un orden real.

Así, se pueden asignar números a estas categorías para su identificación: 1=M, 2=F o bien, se pueden invertir los números sin que afecte la medición: 1=F y 2=M. En resumen en la escala nominal se asignan números a eventos con el propósito de identificarlos.

Es importante recordar que nunca se colocan las tablas y las gráficas juntos, porque en realidad dicen lo mismo, corrientemente se utiliza o una tabla y su análisis, o una gráfica y su análisis^1.

Por ejemplo, supóngase que se ha preguntado a un conjunto de n^ personas: ¿qué opinión tienen acerca

de la instalación de playas en la Ciudad de México en que el Gobierno del Distrito Federal ha hecho a

partir de 2007? Las n^ respuestas se encuentran en una escala que va de 1 a 9, donde 1 representa un

total desacuerdo con la medida mientras que 9 quiere significar un acuerdo total.

El resultado de la medición es el siguiente:

Tabla 1: Conjunto original de datos

7 5 6 8 6 5 9 5 8 6 5 7 5 5 4 5 8 5 4 2 6 6 4 6 4 8 4 3 4 3 3 1 4 5 6 5 8 5 4 7 4 3 5 3 4 9 4 2 6 3 4 2 4 1 3 6 3 1 2 4 4 6 2 4 7 4 2 4 6 4 4 6 7 5 8 5 7 6 5 6 5 7 5 6 4 5 4 1 6 5 6 5 5 5 4 6 2 5 5 6 5 4 4 3 5 5 9 4 3 6 5 7 3 2 4 4 7 4 2 1 8 2 7 4 5 5 7 5 5 1 5 8 5 6 7 6 6 7 7 5 2 5 6 5 8 5 3 6 5 5

Si se plantean las siguientes preguntas:

  • ¿Cuántas personas fueron encuestadas?
  • ¿Cuál fue la respuesta más frecuente?
  • ¿Cuántas personas tienen, como máximo, una actitud de cuatro puntos en la escala? (es decir, ¿cuántas personas se encuentran en desacuerdo con la medida?)

Es difícil responder a las tres cuestiones. ¿Cuál es el problema?

Las personas tienen dificultades para procesar o tener en cuenta mucha información de forma simultanea. La tabla 1 muestra demasiados datos y es preciso contar con mucha paciencia y una buena vista para responder a las preguntas anteriores con seguridad.

Así pues, ¿qué se puede hacer? Una solución alternativa al repaso repetitivo de la tabla 1 es organizar los datos de tal forma que tengan una disposición que facilite la lectura. En este sentido, la primera acción a realizar es ordenar los datos desde el que posee el valor más pequeño hasta el que cuenta con el valor mayor.

Obsérvese el resultado:

Tabla 2: Conjunto ordenado de datos

1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 7 7 7 7 7 7 7 7 7 7 7 7 7 7 8 8 8 8 8 8 8 8 8 9 9 9

Se logra una ganancia al pasar de la tabla 1 a la tabla 2. Parece que ésta es más fácil de interpretar. No ha desaparecido ninguna información, el único cambio está en su ordenación. No obstante, la solución es parcial, puesto que aún debe ser mejorada (sigue siendo difícil responder a las preguntas).

(^1) Generalmente, el titulo de la tabla va encima de ésta, mientras que el título de una figura va por debajo. El título, de ambas, sólo lleva la primera palabra en mayúscula y no va subrayado.

Si se observa la tabla 2, contiene una sucesión de datos con valores repetidos. Por ejemplo, el valor 1 se encuentra presente en seis ocasiones. Una buena estrategia es mostrar una sola vez cada valor y hacerlo seguir por su frecuencia, es decir, por la cantidad de ocasiones en que aparece, tal como lo muestra la tabla 3:

Tabla 3: Conjunto ordenado de valores y frecuencias

1 (6), 2 (11), 3 (12), 4 (30), 5 (40), 6 (25), 7 (14), 8 (9), 9 (3)

Aún se puede disponer la información de tal forma que resulte fácil responder a preguntas que se han planteado. En la tabla 3 se ha mantenido la misma disposición que en la tabla 2. Esto es innecesario. Para disponer la información de manera óptima, se genera una tabla que tenga dos columnas. En la columna

primera se presentarán los valores, que se representa con la letra x mientras que en la segunda columna

se dispondrán las frecuencias, que se representa con la letra f. Obsérvese el resultado en la tabla 4:

Tabla 4: Tabla de frecuencias

x f

1 2 3 4 5 6 7 8 9 6 11 12 30 40 25 14 9 3

Total: 150

Ahora sí, la tabla de frecuencias permite responder a las preguntas planteadas con facilidad: ¿Cuántas personas fueron encuestadas? Solución: 150 ¿Cuál fue la respuesta más frecuente? Solución: 5 (40 datos) ¿Cuántas personas tienen, como máximo, una actitud de cuatro puntos en la escala? Solución: 59 (6+11+12+30)

ACUMULACIÓN DE FRECUENCIAS

No todas las preguntas que se han realizado sobre el mismo conjunto de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han respondido con una lectura de la tabla, la tercera pregunta ha necesitado de algunas operaciones:

¿Cuántas personas tienen, como máximo, una actitud de cuatro puntos en la escala? Solución: 59 (6+11+12+30). Para responder a esa pregunta se ha tenido que realizar una suma: la de todas las frecuencias comprendidas entre el primer valor de la tabla y el valor que interesa, ambos inclusive. Esta cantidad final recibe el nombre de frecuencia acumulada.

Muchas interrogantes requieren respuestas que se basan en las frecuencias acumuladas. Es recomendable escribir esta nueva información en la tabla, de tal forma que permita respuestas directas en el futuro. Véase el resultado:

Sin embargo, al analizar esta tabla se concluye: ¿qué sentido tiene acumular frecuencias en el problema que se ha planteado sobre las colonias? Por ejemplo, no tiene ningún significado la cantidad 12 que acompaña al valor 4 (Mixcoac).

La diferencia esencial entre el problema de las colonias y el de las respuestas a la escala de acuerdo, se encuentra en el tipo de variable. En el caso de las colonias, éstas no pueden ordenarse en función de ser más o ser menos "colonia de domicilio" (se pueden ordenar según número de habitantes, extensión, altitud media, etc. Pero no en función de ser más o ser menos colonia).

Por lo tanto, la acumulación de frecuencias sólo procede si los valores de la variable que se está estudiando se pueden ordenar. Así, la respuesta correcta al problema debe ser:

Colonia Código f

Álamos Copilco Florida Mixcoac Nápoles Portales Plateros Tepeaca

1 2 3 4 5 6 7 8 4 3 3 2 3 3 3 4

FRECUENCIAS RELATIVAS

Si se retoma el problema de las actitudes frente a la instalación de playas, la tabla de frecuencias no termina donde se dejó. Se puede añadir más información útil en la que se basan respuestas para otras preguntas. Por ejemplo ¿Cuántas personas han respondido con una actitud media (valor 5)? Solución:

Ahora, considérese la siguiente tabla con datos nuevos:

Tabla 7: Nueva tabla de frecuencias

x f

1 2 3 4 5 6 7 8 9 200 170 120 60 40 60 120 170 200 Total 1,

Si se trata de responder a la misma pregunta, ocurre lo siguiente:

En la tabla 7 ha cambiado el conjunto de datos. Ahora son 1,140, frente a los 150 de la encuesta anterior. Una misma frecuencia, en este caso f = 40 , no tiene la misma interpretación en ambas tablas. ¿Qué ha

cambiado? La importancia relativa de la frecuencia, puesto que f = 40 frente a N = 150 es diferente a

f = 40 frente a N = 1 , 140. De hecho, el valor 5 pasa de ser el más frecuente al menos frecuente.

La solución se encuentra en expresar las frecuencias en términos relativos en vez de absolutos. Esto es precisamente lo que consiguen las proporciones: expresar una cantidad con respecto al total. Así, se

añade una nueva columna, conteniendo las frecuencias relativas ( f r)que surgen de hacer la operación:

N

f fr =. Obsérvese el resultado comparando el obtenido con cada una de las dos tablas afectadas en

este problema (tablas 4 y 7):

Tabla 8: Comparación entre dos tablas de frecuencias

Nuevos datos Datos anteriores x f (^) f (^) r f (^) fr

1 2 3 4 5 6 7 8 9 200 170 120 60 40 60 120 170 200

6 11 12 30 40 25 14 9 3

Total 1,140 1.0000 150 1.

Nótese que el valor 5 pasa de contar con una frecuencia relativa fr = 0. 2667 (más de la cuarta parte) a

fr = 0. 0351 al ser comparado, respectivamente, con un total de N = 150 a N = 1 , 140.

Un aspecto de interés se encuentra en la fila de los totales. El resultado es 1.0000 en los dos casos. Esto debe ocurrir siempre. Lo que se hace al traducir las frecuencias absolutas a las relativas es unificar el referente. En el conjunto de datos de la tabla 4, el referente absoluto es 150. En el conjunto de datos de la tabla 7, el referente absoluto es 1,140. No se pueden comparar frecuencias de conjuntos de datos diferentes porque los referentes son diferentes. Para que la comparación sea factible es necesario unificar. Dado que las proporciones se expresan en tantos por uno, es posible comparar frecuencias entre tablas. En otros términos: para interpretar una frecuencia absoluta se necesita conocer el número total de datos puesto que, según se ha visto, el número de datos condiciona la importancia de una frecuencia. Pero para interpretar una frecuencia relativa expresada como una proporción no es necesario conocer el número total de datos, puesto que aquí el referente es constante de una tabla a otra: 1.0000.

Sin embargo, no se terminó el proceso de enriquecimiento de la tabla.

Las proporciones se expresan siempre en cantidades que se sitúan entre 0 y 1. Es decir, las proporciones son números decimales. Y las personas también se sienten incómodas con las cantidades decimales.

TABLAS DE FRECUENCIAS

Por lo general, cuando se exponen los resultados de una encuesta en un medio de comunicación, lo habitual es utilizar otro tipo de frecuencias relativas: los porcentajes.

El principio que rige la utilización de los porcentajes es el mismo que para las proporciones: utilizar un referente fijo de tal forma que no sea necesario contar con el número total de datos para interpretar una frecuencia. La diferencia entre los porcentajes y las proporciones es que los primeros utilizan el referente 100, mientras que las proporciones utilizan el 1.

TIPOS DE GRÁFICAS

Una gráfica es la representación de datos, generalmente numéricos, mediante líneas, superficies o símbolos, para ver la relación que esos datos guardan entre sí. Sirven para analizar el comportamiento de un proceso, o un conjunto de elementos o signos que permiten la interpretación de un fenómeno. Las gráficas se pueden agrupar en cinco tipos:

GRÁFICAS DE LÍNEAS

Gráfica simple de líneas

Muestran la relación entre dos variables cuantitativas. En el eje horizontal (x) se gráfica la variable independiente en el eje vertical (y). Las marcas de los cuadrantes en los ejes marcan las unidades de medida; las escalas en los ejes pueden ser lineales, logarítmicas o ambas.

Cuando los datos se relacionan entre sí, es decir, cuando podemos decir que existe cierta continuidad entre las observaciones (como por ejemplo el crecimiento poblacional, la evolución del peso o estatura de una persona a través del tiempo, el desempeño académico de un estudiante a lo largo de su instrucción escolar, las variaciones presentadas en la medición realizada en algún experimento cada segundo o minuto) se pueden utilizar las gráficas de líneas, que consisten en una serie de puntos trazados en las intersecciones de las marcas de clase y las frecuencias de cada una, uniéndose consecutivamente con líneas.

Ejemplo. Aquí se muestra el comportamiento de los promedios escolares finales de dos alumnos (Daniel y Blanca) a lo largo de cinco observaciones anuales:

Polígono de frecuencias

Otra forma de representación de uso menos común, y muy parecida a las gráficas de líneas, es el polígono de frecuencias. La diferencia fundamental entre ambas es que en el polígono de frecuencias se añaden dos clases con frecuencias cero: una antes de la primera clase con datos y otra después de la última. El resultado es que se "sujeta" la línea por ambos extremos al eje horizontal y lo que podría ser una línea separada del eje se convierte, junto con éste, en un polígono.

Ejemplo. El siguiente polígono de frecuencias muestra los goles anotados por un delantero en un equipo de fútbol en las temporadas de 2000 a 2007:

Una gráfica similar al polígono de frecuencias es la ojiva, pero ésta se obtiene de aplicar parcialmente la misma técnica a una distribución acumulativa y de igual manera que éstas, existen las ojivas mayor que y las ojivas menor que.

La diferencia fundamental entre las ojivas y los polígonos de frecuencias es que en el eje horizontal (x) en lugar de colocar las marcas de clase se colocan las fronteras de clase. Para el caso de la ojiva mayor que es la frontera menor y para la ojiva menor que , la mayor. Los dos casos posibles son:

  • Caso 1. Para la ojiva mayor que , el extremo izquierdo de la ojiva no se "amarra" al eje x.

Ejemplo. De un grupo de 30 estudiantes, 20 acreditaron la materia de Estadística y Probabilidad y se agruparon sus calificaciones desde 6 hasta 10 en intervalos de 0.5. Se obtuvo la frecuencia acumulada hasta el intervalo de clase mayor de 9.5. De la gráfica de ojiva mayor puede verse que el 30% de los estudiantes sacaron 9 o más de calificación.

Calificación mayor que

Número de estudiantes

Frecuencia acumulada 6 20 1 6.5 18 0. 7.0 16 0. 7.5 15 0. 8.0 11 0. 8.5 7 0. 9 6 0. 9.5 4 0.

  • Caso 2. Para la ojiva menor que , el extremo derecho no se “amarra” al eje x.

Ejemplo. Se tomaron las estaturas de 50 estudiantes en un grupo del plantel 8 de la ENP y se agruparon por intervalos de 5 centímetros, iniciando en 1.45m y terminando en 1.90m. Se obtuvo la frecuencia acumulada hasta el intervalo de clase menor de 1.90m. De la gráfica de ojiva menor puede verse que el 90% de los estudiantes miden menos de 1.80 metros.

Es importante notar que resulta difícil utilizar este tipo de representación cuando existen intervalos abiertos o cuando los intervalos no son iguales entre sí.

Barras horizontales

Se parecen mucho a las gráficas de columnas, con la salvedad importante de que la función de los ejes se intercambia y el eje horizontal queda destinado a las frecuencias y el eje vertical a las clases.

Es muy común que este tipo de gráficos se utilicen para ilustrar el tamaño de una población dividida en estratos como, por ejemplo, son sus edades.

Ejemplo.

La siguiente gráfica presenta la distribución de las edades de los 236 niños que estudian en una escuela primaria:

A este tipo de gráficos en particular se le llama pirámide de edades por su forma.

Gráficas de columnas bidimensionales

Un tipo de gráfico muy parecido al histograma es la gráfica de columnas. Para este tipo de gráfica, elaboradas con rectángulos también, se pide que sus bases sean del mismo ancho y sus alturas equivalentes con las frecuencias. Para este tipo, a diferencia del histograma, no es necesario tener una escala horizontal continua, por lo que los rectángulos (o barras) no tienen que aparecer juntas entre sí.

Otra observación pertinente es que se pueden representar en la misma gráfica, utilizando las mismas escalas horizontales y verticales, varios datos correspondientes a las mismas variables producto de varias observaciones. Esto produce una gráfica con varias series, correspondiendo cada una de ellas a cada observación de la muestra (o población), y teniéndose una gráfica compuesta. Es conveniente que cada serie de datos (u observaciones) sean coloreados de igual manera entre sí, pero distinta de las demás.

Ejemplo. La gráfica siguiente muestra el comportamiento de los minutos de retraso que acumularon tres trabajadores de una tienda durante cuatro semanas. Las series están coloreadas con diferente color para mostrar el comportamiento tanto individual, como de cada uno de los trabajadores con respecto a los demás.

Gráficas de columnas tridimensionales

Existe la posibilidad, y si los recursos lo permiten, de representar gráficos compuestos de una manera "tridimensional", es decir, con gráficos que posean no sólo dos ejes, sino tres; y en los que los rectángulos son sustituidos por prismas de base rectangular (ocasionalmente el software en el mercado permite utilizar prismas cuya base son polígonos regulares de más de cuatro lados, pirámides o cilindros).

Ejemplo. En la gráfica se puede apreciar el número de medallas que han ganado cinco países en las ediciones de los Juegos Panamericanos de 1999 a 2007:

En este tipo de gráficas pueden complicarse mucho si hay demasiados datos ya que la información es menos legible.

GRÁFICAS CIRCULARES

Denominadas también gráfica de pastel, se utilizan para mostrar porcentajes y proporciones. El número de elementos comparados dentro de un gráfico circular, no deben ser más de 7, ordenando los segmentos de mayor a menor, iniciando con el más amplio a partir de las 12 como en un reloj. Una manera sencilla de diferenciar los segmentos es sombreándolos con colores contrastantes.

Ejemplo. La siguiente gráfica de dispersión compara temperaturas en un día en la Ciudad de México. En el eje de horizontal mide la hora de medición y el eje vertical mide las temperaturas previstas y las temperaturas reales.

Es interesante observar que los puntos parecen seguir una cierta tendencia en una curva imaginaria. Uno de los usos de este tipo de gráficas es precisamente encontrar si las observaciones siguen algún patrón (lineal, exponencial, polinomial, logarítmica, etc.) o si existen valores atípicos.

GRÁFICAS DE BURBUJAS

Un tipo de gráfico similar a las gráficas de dispersión son las gráficas de burbujas, en las cuales se presenta la dispersión de las observaciones de la misma forma pero se le añade la posibilidad de visualizar otra variable representada en el tamaño del punto, pues éstos se convierten en círculos (burbujas) con radios proporcionales a las magnitudes que representan.

Ejemplo. La gráfica siguiente se puede apreciar el volumen de ventas y el número de productos de siete artículos (A-1 a A-7) en una fábrica. Además, se puede ver fácilmente la participación o cuota de mercado de cada artículo a través del tamaño de cada burbuja, que corresponde a la cifra que está después de cada coma:

PICTOGRAMAS

Son gráficos con dibujos alusivos al carácter que se está estudiando y cuyo tamaño es proporcional a las frecuencias que representan. Se emplean para representar diferencias cuantitativas simples entre grupos. Los símbolos utilizados para representar valores idénticos deben ser de igual dimensión.

Actualmente muchos medios masivos de comunicación utilizan gráficos para ilustrar resultados de alguna investigación. Regularmente se utilizan dibujos llamativos para captar el interés del público.

Ejemplo. El pictograma siguiente representa la población de los Estados Unidos de 1930 a 1990 (cada figura representa a dos millones de habitantes).

MEDIDAS DE TENDENCIA CENTRAL

INTRODUCCIÓN A LA SUMATORIA

Por sumatoria se entiende la suma de un conjunto finito de números, que se denota por la letra sigma

mayúscula ∑ :

k n

k n

ik

S xi xk xk xk xk n x+

=

donde: S es magnitud resultante de la suma. n es la cantidad de valores a sumar. k es punto inicial de la sumatoria. k + nes punto final de la sumatoria.

i es el índice de la suma, que varía entre k y k + n.

x k es el valor de la magnitud objeto de suma en el punto i.

En el caso particular en que la sumatoria empiece en con el primer valor de la serie y termine en el último, la expresión se simplifica a:

n

n

i

S = ∑xi =x+x +x + +xn +x

=

− 1

Ejemplo.

∑^ (^ )^ (^ )^ ( )^ ( )^ ( )

5

1

i

yi

e) (^) ∑

5

1

i

xi yi

Solución.

7 7 [ 1 ( 3 ) 2 ( 5 ) 3 ( ) 2 4 ( ) 0 5 ( ) 1 ] 7 ( 3 10 6 0 5 ) 7 ( 2 ) 14

5

1

⋅ (^) ∑ ⋅ = − + − + + + = − − + + + = − = − i=

xi yi

MEDIA, MEDIANA Y MODA

Cuando se tiene un grupo de observaciones, se desea describirlo a través de un sólo número. Para tal fin, no se usa el valor más elevado ni el valor más pequeño como único representante, ya que sólo representan los extremos. Una de las propiedades más sobresalientes de la distribución de datos es su tendencia a acumularse hacia el centro de la misma. Esta característica se denomina tendencia central.

Las medidas de tendencia central más usuales son: la media aritmética, la mediana y la moda.

MEDIA ARITMÉTICA

La media aritmética de n valores, es igual a la suma de todos ellos dividida entre n. Se denota por x.

Esto es:

n

x x

n

i

∑ i = =^1

Cuando los datos tienen más de una frecuencia, para obtener la media aritmética se agrega otra columna a la tabla estadística con el producto de las observaciones y sus frecuencias. Es decir, si se cuenta con una distribución de datos entonces se aplica la fórmula:

n

f x x

n

i

∑ i

Ejemplo. Con los datos: 10, 8, 6, 15, 10, 5, hallar la media aritmética.

Solución.

9 6

x =

Ejemplo. Mediante la siguiente distribución de frecuencias que muestra las estaturas en metros de los alumnos de un grupo de la Facultad de Contaduría y Administración, hallar la media aritmética.

Estaturas [m] f

1.52 1 1.54 5 1.55 4 1.58 5 1.60 2 1.62 4 1.64 7 1.66 3 1.70 5 1.71 8 1.73 6 1.74 5 1.77 3 1.80 1 1.83 1

Solución. Construyendo una tabla:

Estaturas [m] f f ⋅x

1.52 1 1. 1.54 5 7. 1.55 4 6. 1.58 5 7. 1.60 2 3. 1.62 4 6. 1.64 7 11. 1.66 3 4. 1.70 5 8. 1.71 8 13. 1.73 6 10. 1.74 5 8. 1.77 3 5. 1.80 1 1. 1.83 1 1. Total: 60 99.

x = =

Las características de la media aritmética son:

  1. Es una medida totalmente numérica o sea sólo puede calcularse en datos de características cuantitativas.
  2. En su cálculo se toman en cuenta todos los valores de la variable.
  3. Es lógica desde el punto de vista algebraico.
  4. La media aritmética es altamente afectada por valores extremos.
  5. No puede ser calculada en distribuciones de frecuencia que tengan clases abiertas.
  6. La media aritmética es única, o sea, un conjunto de datos numéricos tiene una y sólo una media aritmética.
MEDIANA

La mediana es el punto central de una serie de datos ordenados de forma ascendente o descendente.

De acuerdo al número de casos o datos, hay dos formas para calcular la mediana: para número impar y para número par: