Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


ingeniería telecomunicaciones, Apuntes de Matemáticas

Asignatura: matematicas 4, Profesor: , Carrera: Tecnologías de Telecomunicación, Universidad: UMA

Tipo: Apuntes

2011/2012

Subido el 12/04/2012

ignarvilchez
ignarvilchez 🇪🇸

4

(1)

1 documento

1 / 296

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Apuntes de
ESTAD´
ISTICA
6 de junio de 2011
Sixto anchez Merino
Dpto. de Matem´atica Aplicada
Universidad de alaga
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51
pf52
pf53
pf54
pf55
pf56
pf57
pf58
pf59
pf5a
pf5b
pf5c
pf5d
pf5e
pf5f
pf60
pf61
pf62
pf63
pf64

Vista previa parcial del texto

¡Descarga ingeniería telecomunicaciones y más Apuntes en PDF de Matemáticas solo en Docsity!

Apuntes de

ESTAD´ISTICA

6 de junio de 2011

Sixto S´anchez Merino

Dpto. de Matem´atica Aplicada

Universidad de M´alaga

Mi agradecimiento a los profesores del departamento del Ma- tem´atica Aplicada de la Universidad de M´alaga con los que he compartido asignatura en los ´ultimos cursos acad´emicos y, en particular, a los compa˜neros Carlos Cerezo, Inmaculada Fortes, Carlos Guerrero, Jos´e Morones y Agust´ın Valverde, por sus co- rrecciones y sugerencias en la elaboraci´on de estos apuntes.

Apuntes de Estad´ıstica

«2011, Sixto S´anchez Merino.

Este trabajo est´a editado con licencia “Creative Commons” del tipo: Reconocimiento-No comercial-Compartir bajo la misma licencia 3.0 Espa˜na. Usted es libre de: copiar, distribuir y comunicar p´ublicamente la obra. hacer obras derivadas. Bajo las condiciones siguientes: Reconocimiento. Debe reconocer los cr´editos de la obra de la manera especificada por el autor o el licenciador (pero no de una manera que sugiera que tiene su apoyo o apoyan el uso que hace de su obra). No comercial. No puede utilizar esta obra para fines comerciales. Compartir bajo la misma licencia. Si altera o transforma esta obra, o genera una obra derivada, s´olo puede distribuir la obra generada bajo una licencia id´entica a ´esta. Al reutilizar o distribuir la obra, tiene que dejar bien claro los t´erminos de la licencia de esta obra. Alguna de estas condiciones puede no aplicarse si se obtiene el permiso del titular de los derechos de autor. Nada en esta licencia menoscaba o restringe los derechos morales del autor.

    1. Estad´ıstica descriptiva
    • 1.1. Conceptos elementales
    • 1.2. Distribuciones de frecuencias de un car´acter
      • 1.2.1. Frecuencias
      • 1.2.2. Distribuciones discretas
      • 1.2.3. Distribuciones continuas
    • 1.3. Representaciones gr´aficas
      • 1.3.1. Caracteres cualitativos
      • 1.3.2. Caracteres cuantitativos
    • 1.4. Medidas de posici´on
      • 1.4.1. Media aritm´etica
      • 1.4.2. Moda
      • 1.4.3. Mediana
      • 1.4.4. Cuantiles
    • 1.5. Medidas de dispersi´on
      • 1.5.1. Rango
      • 1.5.2. Desviaci´on media
      • 1.5.3. Varianzas y desviaci´on t´ıpica
      • 1.5.4. Coeficiente de variaci´on
      • 1.5.5. Momentos
    • 1.6. Medidas de forma
      • 1.6.1. Medidas de asimetr´ıa
      • 1.6.2. Medidas de apuntamiento
    • 1.7. Relaci´on de problemas
    • 1.8. Anexo I: Comandos de R 4 ´INDICE GENERAL
    1. Regresi´on y correlaci´on
    • 2.1. Distribuciones bidimensionales
      • 2.1.1. Representaci´on tabular
      • 2.1.2. Representaciones gr´aficas
      • 2.1.3. Distribuciones Marginales
      • 2.1.4. Distribuciones Condicionadas
      • 2.1.5. Distribuciones conjuntas: Momentos mixtos
    • 2.2. Regresi´on y correlaci´on
      • 2.2.1. Relaci´on entre variables
      • 2.2.2. Regresi´on: M´etodo de los m´ınimos cuadrados
      • 2.2.3. Correlaci´on
    • 2.3. El modelo lineal
      • 2.3.1. Regresi´on lineal
      • 2.3.2. Correlaci´on lineal
    • 2.4. Modelos de regresi´on no lineal
      • 2.4.1. Linealizaci´on de modelos
      • 2.4.2. Ajuste parab´olico
      • 2.4.3. Otros ajustes
      • 2.4.4. Bondad del ajuste
    • 2.5. Relaci´on de problemas
    • 2.6. Anexo I: Justificaci´on de algunos resultados
      • 2.6.1. Descomposici´on de las varianzas para el modelo lineal de regresi´on
        • dido entre -1 y 2.6.2. El coeficiente de correlaci´on lineal de Pearson (r) es un n´umero compren-
    • 2.7. Anexo II: Comandos de R
    1. Series estad´ısticas
    • 3.1. N´umeros ´ındice
      • 3.1.1. Clasificaci´on de n´umeros ´ındice
      • 3.1.2. Propiedades de los n´umeros ´ındice
    • 3.2. ´Indices simples
  • ´INDICE GENERAL - 3.2.1. ´Indices simples elementales (ISE) - 3.2.2. ´Indices simples en cadena (ISC) - 3.2.3. Relaci´on de precios, cantidades y valores
    • 3.3. ´Indices complejos
      • 3.3.1. ´Indices complejos sin ponderar
      • 3.3.2. ´Indices complejos ponderados
      • 3.3.3. ´Indices de precios
    • 3.4. Series de n´umeros ´ındice
      • 3.4.1. Cambio de periodo base
      • 3.4.2. Renovaci´on y empalme
      • 3.4.3. Deflaci´on de series estad´ısticas
    • 3.5. Series Temporales o Cronol´ogicas
      • 3.5.1. Representaci´on gr´afica
      • 3.5.2. Promedios o Medias M´oviles
    • 3.6. An´alisis de las series temporales
      • 3.6.1. Tendencia secular
      • 3.6.2. Variaciones estacionales o peri´odicas
      • 3.6.3. Variaciones c´ıclicas
      • 3.6.4. Variaciones aleatorias, irregulares o accidentales
    • 3.7. Estimaci´on de la tendencia
      • 3.7.1. M´etodo gr´afico
      • 3.7.2. M´etodo de las medias m´oviles
      • 3.7.3. M´etodo de m´ınimos cuadrados
      • 3.7.4. M´etodo de semipromedios
    • 3.8. Estimaci´on de la variaci´on estacional
      • 3.8.1. M´etodo de la media m´ovil en porcentajes
      • 3.8.2. M´etodo del porcentaje medio
      • 3.8.3. Estimaci´on de la variaci´on estacional para el modelo aditivo
      • 3.8.4. Desestacionalizaci´on de una serie temporal
    • 3.9. Estimaci´on de las variaciones c´ıclicas
    • 3.10. Estimaci´on de las variaciones aleatorias
    • 3.11. Relaci´on de problemas 6 ´INDICE GENERAL
    1. Probabilidad
    • 4.1. Algebra de Boole de sucesos .´
    • 4.2. Probabilidad
      • 4.2.1. Definici´on axiom´atica de probabilidad
      • 4.2.2. Relaci´on entre frecuencias y probabilidad
    • 4.3. Probabilidad condicionada. Sucesos independientes
    • 4.4. Teorema de la probabilidad total. Teorema de Bayes
      • 4.4.1. Teorema de la probabilidad total
      • 4.4.2. Teorema de Bayes
    • 4.5. ANEXO: Combinatoria
      • 4.5.1. Identificaci´on del problema
    • 4.6. Relaci´on de problemas
    1. Variable aleatoria
    • 5.1. Variable aleatoria unidimensional
    • 5.2. Funci´on de distribuci´on
    • 5.3. Variable aleatoria discreta
      • 5.3.1. Distribuci´on de probabilidad
      • 5.3.2. Funci´on de distribuci´on
      • 5.3.3. Funci´on generatriz de probabilidad
    • 5.4. Variable aleatoria continua
      • 5.4.1. Funci´on de densidad
      • 5.4.2. Funci´on de distribuci´on
    • 5.5. Esperanza matem´atica y otras medidas
      • 5.5.1. Esperanza matem´atica
      • 5.5.2. Momentos
      • 5.5.3. Funci´on generatriz de momentos
      • 5.5.4. Medidas de posici´on
      • 5.5.5. Medidas de dispersi´on
      • 5.5.6. Medidas de forma
  • ´INDICE GENERAL - 5.6. Variable aleatoria bidimensional - 5.6.1. Funci´on de distribuci´on - 5.6.2. Tipos de variables aleatorias bidimensionales - 5.7. Relaci´on de problemas
      1. Distribuciones de probabilidad
      • 6.1. Distribuciones uniformes
        • 6.1.1. Distribuci´on uniforme discreta
        • 6.1.2. Distribuci´on uniforme continua
        • 6.1.3. Distribuci´on uniforme bidimensional
      • 6.2. Distribuci´on Binomial
        • 6.2.1. Distribuci´on de Bernouilli
        • 6.2.2. Distribuci´on Binomial
        • 6.2.3. Distribuci´on Multinomial
        • 6.2.4. Distribuci´on Hipergeom´etrica
        • 6.2.5. Distribuci´on Binomial negativa
      • 6.3. Distribuciones asociadas a fen´omenos aleatorios de espera
        • 6.3.1. Distribuci´on de Poisson
        • 6.3.2. Distribuci´on Geom´etrica o de Pascal
        • 6.3.3. Distribuci´on Exponencial
      • 6.4. Distribuciones normales
        • 6.4.1. Distribuci´on Normal o de Laplace-Gauss
        • 6.4.2. Distribuci´on normal bidimensional
        • 6.4.3. Teorema central del l´ımite
      • 6.5. Distribuciones derivadas de la normal
        • 6.5.1. Distribuci´on χ^2 de Pearson
        • 6.5.2. Distribuci´on t de Student
        • 6.5.3. Distribuci´on F de Fisher-Snedecor
      • 6.6. Simulaci´on y M´etodo de Montecarlo
      • 6.7. Relaci´on de problemas
      • 6.8. Relaci´on de problemas II – Temas 4, 5 y
      • 6.9. Anexo I: Justificaci´on de algunos resultados
      • 6.9.1. Distribuci´on Binomal 8 ´INDICE GENERAL
      • 6.9.2. Propiedades de la funci´on Gamma
    1. Inferencia estad´ıstica
    • 7.1. Inferencia estad´ıstica
      • 7.1.1. Teor´ıa de muestras
    • 7.2. Estimaci´on param´etrica
      • 7.2.1. Estimaci´on puntual
      • 7.2.2. Estimaci´on por intervalos
    • 7.3. Contraste de Hip´otesis
    • 7.4. Inferencia no param´etrica
      • 7.4.1. Bondad de ajuste. Tabla de contingencia
      • 7.4.2. Contraste de homogeneidad de varias muestras
        • Tablas de contingencia K × M 7.4.3. Contraste de dependencia o independencia de caracteres.
    • 7.5. Relaci´on de problemas
  • A. Tablas de intervalos de confianza
  • B. Tablas de contrastes de hip´otesis (regiones de rechazo)
  • C. Tablas de las distribuciones de probabilidad

Mi agradecimiento a los profesores Carlos Cerezo Casermeiro y Carlos Guerrero Garc´ıa, por sus correcciones y sugerencias en la elaboraci´on de estos apuntes.

Apuntes de Estad´ıstica

«2011, Sixto S´anchez Merino.

Este trabajo est´a editado con licencia “Creative Commons” del tipo: Reconocimiento-No comercial-Compartir bajo la misma licencia 3.0 Espa˜na. Usted es libre de: copiar, distribuir y comunicar p´ublicamente la obra. hacer obras derivadas. Bajo las condiciones siguientes: Reconocimiento. Debe reconocer los cr´editos de la obra de la manera especificada por el autor o el licenciador (pero no de una manera que sugiera que tiene su apoyo o apoyan el uso que hace de su obra). No comercial. No puede utilizar esta obra para fines comerciales. Compartir bajo la misma licencia. Si altera o transforma esta obra, o genera una obra derivada, s´olo puede distribuir la obra generada bajo una licencia id´entica a ´esta. Al reutilizar o distribuir la obra, tiene que dejar bien claro los t´erminos de la licencia de esta obra. Alguna de estas condiciones puede no aplicarse si se obtiene el permiso del titular de los derechos de autor. Nada en esta licencia menoscaba o restringe los derechos morales del autor.

Cap´ıtulo 1

Estad´ıstica descriptiva

La estad´ıstica descriptiva es la rama de la estad´ıstica que trata la descripci´on y an´alisis de los datos de una poblaci´on, sin pretender extender o generalizar sus resultados y conclusiones a otras poblaciones distintas o m´as amplias. La descripci´on consiste en enumerar los elementos y rasgos que configuran una realidad mediante la observaci´on o la medida. El an´alisis de la poblaci´on est´a constituido por los proce- dimientos existentes para la determinaci´on de los distintos aspectos, propiedades y relaciones de los conjuntos de datos. La estad´ıstica descriptiva implica la colecci´on, clasificaci´on, an´alisis e interpretaci´on de los datos en un proceso de organizaci´on y s´ıntesis de la informaci´on. Estos sencillos trabajos de orde- nar, contar, clasificar, registrar inform´aticamente, etc. requieren mucho tiempo (que se traduce en costes) y una especial atenci´on para evitar posibles errores iniciales. En este cap´ıtulo se tratan distintos m´etodos de clasificaci´on y representaci´on de los datos y se detallan los par´ametros m´as importantes para el an´alisis, la interpretaci´on y la obtenci´on de resultados. Entre los ejemplos que ilustran los conceptos, se han seleccionado dos de ellos que hacen referencia a un estudio del tr´afico (ejemplo 1.5 de la p´agina 16) y a las calificaciones de un grupo de alumnos (ejemplo 1.7 de la p´agina 17). El recorrido de estos dos ejemplos a lo largo de todas las secciones, ilustra un estudio estad´ıstico completo. Por ´ultimo, algunas cuestiones interesantes se tratan a modo de ejercicios autocontenidos en la relaci´on de problemas propuestos al final del cap´ıtulo. Su inter´es queda justificado por el uso conjunto de las t´ecnicas estudiadas en el cap´ıtulo y por sus numerosas aplicaciones pr´acticas.

1.1. Conceptos elementales

Como cualquier otra ciencia, la estad´ıstica utiliza su propia terminolog´ıa y para acceder al conocimiento resulta imprescindible dominar su lenguaje. Conviene familiarizarse con los conceptos que se introducen en este cap´ıtulo y ser capaz de identificarlos. A continuaci´on se presentan las definiciones de los elementos b´asicos que intervienen en cualquier estudio estad´ıstico.

11

  1. Estad´ıstica descriptiva 13

En este caso, la poblaci´on est´a constituida por todas las empresas malague˜nas que usan soft- ware para la gesti´on de bases de datos. La encuesta se realiza mediante llamada telef´onica y el resultado es una muestra de 10 valores del car´acter “tipo de software para la gesti´on de bases de datos” que resulta ser un atributo cuyas dos modalidades son “libre” y “propietario”. 

En el caso de las variables cuantitativas se pueden definir funciones que permiten obtener medidas descriptivas a partir de las observaciones. El objetivo de estas medidas es proporcionar informaci´on sobre las caracter´ısticas de la distribuci´on de los datos. Par´ametro. Un par´ametro es una funci´on que permite obtener una medida descriptiva num´erica a partir de los valores de un car´acter medible de la poblaci´on. Por ejemplo, la media de una poblaci´on se calcula dividiendo la suma de los valores de la variable entre el n´umero total de individuos. Estas medidas suelen ser desconocidas pues para calcularlas se necesita efectuar un censo. Estad´ıstico. Un estad´ıstico es una funci´on definida sobre los valores num´ericos de una muestra. Esta funci´on permite obtener una medida descriptiva que se utiliza para obtener informaci´on sobre alguno de los par´ametros desconocidos de la poblaci´on. Por ejemplo, el estad´ıstico “me- dia aritm´etica de los datos de una muestra” se usa para estimar el par´ametro “media de la poblaci´on”.

Ejemplo 1.2 Estimar la compresi´on media del motor instalado en los autom´oviles de un cierto modelo producidos por una f´abrica a partir del estudio efectuado en 100 veh´ıculos. Se considera la poblaci´on formada por todos los autom´oviles de ese modelo producidos por la f´abrica. El conjunto de 100 autom´oviles extra´ıdos de dicha poblaci´on constituye una muestra de tama˜no 100. Se realiza una encuesta que consiste en medir la compresi´on del motor en cada uno de ellos. El resultado es una muestra de 100 valores del car´acter “compresi´on del motor” que es una variable continua cuyas modalidades corresponden a todas las posibles relaciones volum´etricas. Si se calcula la media de los 100 datos de compresi´on se obtiene un valor del estad´ıstico que proporciona informaci´on sobre el par´ametro media de la poblaci´on total. 

1.2. Distribuciones de frecuencias de un car´acter

Uno de los conceptos sobre el que se basar´an muchas definiciones posteriores y que simplifica la presentaci´on de los datos es el de frecuencia o n´umero de veces que aparece una determinada modalidad de un car´acter o su proporci´on sobre el total. Las distintas modalidades junto a su frecuencia correspondiente constituye la distribuci´on de frecuencias de un car´acter.

1.2.1. Frecuencias

En adelante se considerar´a una poblaci´on o muestra de tama˜no N en la que se observar´a el car´acter X que presenta las modalidades x 1 , x 2 , ..., xk (ordenadas de menor a mayor, si el car´acter es cuantitativo). Frecuencia Absoluta. Se llama frecuencia absoluta de un valor xi del car´acter X, y se denota por ni, al n´umero de individuos observados que presentan esta modalidad.

Apuntes de M´etodos Estad´ısticos para la Computaci´on

14 1.2. Distribuciones de frecuencias de un car´acter

Frecuencia Relativa. Se llama frecuencia relativa de un valor xi del car´acter X, y se denota por fi, al cociente entre la frecuencia absoluta y el total de individuos. fi = n Ni i = 1, 2 , ..., k La frecuencia relativa representa la proporci´on de individuos que presentan una determinada modalidad y se puede expresar en tantos por cien sin m´as que multiplicar por cien el cociente de la f´ormula anterior.

Ejemplo 1.3 De la siguiente frase: “La representaci´on gr´afica no es m´as que un medio auxiliar de la investigaci´on estad´ıstica, pues ´esta es fundamentalmente num´erica”, obtener las distribu- ciones de frecuencias de las vocales. Las frecuencias absolutas de las modalidades “a”, “e”, “i”, “o” y “u” del atributo “vocales” son 15, 16, 11, 4 y 6 respectivamente y suman un total de 52 observaciones. Por tanto, la frecuencia relativa de cada una de las modalidades es 15/52, 16/52, 11/52, 4/52 y 6/52 que expresadas en tantos por cien son 29 %, 31 %, 21 %, 8 % y 11 % aproximada y respectivamente. El significado de estas frecuencias est´a claro. Por ejemplo, la frecuencia absoluta de la vocal “a” es 15, es decir, de las 52 vocales contenidas en la frase, 15 de ellas son la vocal “a”, lo que corresponde al 29 % del total. 

Cuando el car´acter es cuantitativo, tiene sentido definir tambi´en las siguientes frecuencias acumuladas: Frecuencias Acumuladas Absolutas y Relativas. Se llama frecuencia acumulada de un valor xi de la variable X a la suma de las frecuencias de los valores que son menores o iguales a ´el. Las frecuencias acumuladas se definen, tanto para las frecuencias absolutas, que se denotan por Ni, como para las relativas, que se denotan por Fi. Si los valores xi est´an ordenados de forma creciente entonces

Ni = ∑^ i j=

nj y Fi = ∑^ i j=

fj = N Ni i = 1, 2 , ..., k

Dualmente, se podr´ıan haber definido estas frecuencias con los datos ordenados de forma de- creciente. Seg´un la definici´on utilizada se denominan frecuencias absolutas/relativas acumuladas crecientes o decrecientes. De las definiciones anteriores se destacan las siguientes propiedades elementales:

  1. 0 ≤ ni ≤ N 2)

∑^ k i=

ni = N 3) ni = Ni − Ni− 1

  1. 0 ≤ fi ≤ 1 5) ∑^ k i=

fi = 1 6) fi = Fi − Fi− 1

que pueden usarse a modo de prueba para detectar posibles errores iniciales en el c´alculo de la distribuci´on de frecuencias.

Dpto. Matem´atica Aplicada (Universidad de M´alaga)

16 1.2. Distribuciones de frecuencias de un car´acter

de cada modalidad. Adem´as, este tipo de tablas se completan a˜nadiendo una fila que contiene algunas de las sumas por columnas, de los datos correspondientes (v´ease el ejercicio 24 de la p´agina 46, en la relaci´on de problemas).

Ejemplo 1.5 Representar, en una tabla estad´ıstica, la distribuci´on de frecuencias de los datos del ejemplo 1.4 de la p´agina 15. Se observa que la variable X que determina el “n´umero de ocupantes en los autom´oviles” presenta un reducido n´umero de modalidades (1, 2, 3, 4 y 5), de tal manera que, aunque haya un elevado n´umero de observaciones, ´estas se pueden agrupar haciendo uso de la frecuencia, tal y como se recoge en la tabla de la figura 1.2.

xi ni fi Ni Fi 1 15 0 ′ 375 15 0 ′ 375 2 12 0 ′ 300 27 0 ′ 675 3 8 0 ′ 200 35 0 ′ 875 4 4 0 ′ 100 39 0 ′ 975 5 1 0 ′ 025 40 1 Suma 40 1 Figura 1.2: Tabla de frecuencias para los datos del ejemplo 1.  Existen distribuciones que constan de un reducido n´umero de observaciones y, en consecuen- cia, la variable toma un reducido n´umero de valores distintos. Estas distribuciones tambi´en se conoce como distribuciones de tipo I, y para construir la tabla estad´ıstica basta simplemente con anotar ordenadamente las observaciones en fila o en columna, generalmente de menor a mayor. x 1 , x 2 , x 3 ,... , xN

Ejemplo 1.6 Para realizar un estudio sobre la venta semanal de ordenadores en una determina- da empresa de inform´atica, se observa, durante 5 semanas, el n´umero de ordenadores vendidos, obteni´endose los siguientes resultados: 10, 12, 20, 6 y 10. Representar su distribuci´on de fre- cuencias. La distribuci´on de frecuencias se representa ordenando los datos: 6 , 10 , 10 , 12 , 20. 

1.2.3. Distribuciones continuas

Algunas variables discretas y, en general, las variables de naturaleza continua dan lugar a conjuntos de datos en los que el n´umero de modalidades es muy variado. Consideraremos que una distribuci´on es continua cuando presenta un elevado n´umero de observaciones y de modalidades distintas. En estos casos no resulta apropiado escribir todas las modalidades en una columna, como se hizo en el caso discreto. Para tabular estos datos conviene agruparlos en intervalos que constituyen una partici´on, y determinar el n´umero de individuos que pertenecen a cada uno de ellos. Este tipo de distribuciones tambi´en se conoce como distribuciones de tipo III.

Dpto. Matem´atica Aplicada (Universidad de M´alaga)

  1. Estad´ıstica descriptiva 17

Tomar el intervalo como unidad de estudio, en lugar de cada valor de la variable, supone una simplificaci´on pero resulta una p´erdida de informaci´on. Por lo tanto, es importante elegir un n´umero adecuado de intervalos que equilibre estos dos aspectos y que constituyan una partici´on del mismo. Seg´un las caracter´ısticas del conjunto de datos, en la bibliograf´ıa se proponen distintas formas de establecer el n´umero de intervalos en funci´on del tama˜no (N ) de la muestra. Un criterio sencillo usado frecuentemente es considerar un n´umero de intervalos aproximadamente igual a la ra´ız cuadrada del n´umero de datos, es decir, √N. Cada intervalo se denomina clase y a la diferencia entre el extremo superior (Li) e inferior (Li− 1 ) se le llama amplitud de la clase o del intervalo y se denota por ai que puede ser variable o constante para todos los intervalos. Al ser una partici´on, la uni´on de todos los intervalos ha de recubrir a todos los valores de la variable (exhaustivo) pero sin solaparse (excluyente). La elecci´on del n´umero de intervalos y su amplitud es importante si se quiere identificar el tipo de distribuci´on y sus caracter´ısticas. Se llama marca de clase del intervalo i-´esimo y se denota por xi al punto medio del intervalo y ser´a el valor que representar´a la informaci´on del intervalo al que pertenece como si fuera un valor de la variable. Para construir ahora la tabla estad´ıstica se colocan ordenadamente y por columnas los in- tervalos, las marcas de clase y las frecuencias correspondientes, como se muestra en la tabla de la figura 1.3.

Li− 1 , Li xi ni fi Ni Fi [L 0 , L 1 ] x 1 n 1 f 1 N 1 F 1 (L 1 , L. 2 ] x 2 n 2 f 2 N 2 F 2 .. ... ... ... ... ... (Lk− 1 , Lk] xk nk fk Nk Fk Figura 1.3: Tabla de frecuencias de una distribuci´on continua

Ejemplo 1.7 Las calificaciones finales en Matem´aticas de 100 estudiantes fueron:

11 46 58 25 48 18 41 35 59 28 35 2 37 68 70 31 44 84 64 82 26 42 51 29 59 92 56 5 52 8 1 12 21 6 32 15 67 47 61 47 43 33 48 47 43 69 49 21 9 15 11 22 29 14 31 46 19 49 51 71 52 32 51 44 57 60 43 65 73 62 3 17 39 22 40 65 30 31 16 80 41 59 60 41 51 10 63 41 74 81 20 36 59 38 40 43 18 60 71 44

Representar, en una tabla estad´ıstica, la distribuci´on de frecuencias de las notas de Matem´aticas. Se define la variable X que representa la “nota final en Matem´aticas”. Se observa un gran n´umero de observaciones correspondientes a un elevado n´umero de modalidades distintas, lo que sugiere agruparlas en clases. Veamos dos agrupamientos distintos:

  1. Intervalos de la misma amplitud: Si consideramos 10 intervalos (√N ) de igual amplitud, podemos representar la distribuci´on de las notas como se muestra en la tabla de la figura 1.4.

Apuntes de M´etodos Estad´ısticos para la Computaci´on

  1. Estad´ıstica descriptiva 19

Los distintos tipos de gr´aficas representan las frecuencias absolutas, relativas o acumula- das. El tipo de car´acter, seg´un sea cualitativo o cuantitativo, establece una clasificaci´on de las representaciones gr´aficas. Aunque algunas de ellas se pueden utilizar indistintamente, conviene conocer sus caracter´ısticas para elegir la representaci´on gr´afica que resulta m´as apropiado a cada caso. A continuaci´on se relacionan los tipos de representaci´on m´as utilizados y se detallan las caracter´ısticas principales y la interpretaci´on de los elementos que lo constituyen. La creatividad y la originalidad pueden dar lugar a otros tipos de gr´aficas, siempre y cuando cumplan con el objetivo de garantizar una imagen sencilla y real de los datos.

1.3.1. Caracteres cualitativos

Las distintas modalidades de los caracteres cualitativos no contemplan ning´un orden num´eri- co. Por tanto, estas representaciones gr´aficas suelen ser m´as ic´onicas y hacen uso del etiquetado de las clases o de la leyenda. Diagrama de rect´angulos o barras. Para cada modalidad, se representa un rect´angulo o barra cuya altura (o longitud) coincide con la frecuencia absoluta (o relativa). En la figura 1.6 se representa la distribuci´on de frecuencia de las vocales del ejemplo 1.3 de la p´agina 14, utilizando distintos diagramas de columnas en vertical u horizontal.

0

5

10

15

20

a e i o u 0 0,1 0,2 0,

a

e

i

o

u

1

Figura 1.6: Diagrama de rect´angulos

Diagrama de Pareto. Diagrama de barras de frecuencias relativas donde las modalidades se representan por orden decreciente en altura. Adem´as, se superpone una curva con la frecuencia relativa acumulada cuya escala se representa a la derecha. Con este diagrama es f´acil identificar las modalidades con mayor frecuencia. En la figura 1.7 se representa la distribuci´on de frecuencias de las vocales del ejemplo 1.3 de la p´agina 14, utilizando un diagrama de Pareto.

0

0,

0,

0,

0,

0,

0,

0,

e a i u o^0

0,

0,

0,

0,

1

Figura 1.7: Diagrama de Pareto

Apuntes de M´etodos Estad´ısticos para la Computaci´on

20 1.3. Representaciones gr´aficas

Diagrama de sectores. Se descompone un c´ırculo en sectores de ´area proporcional a la frecuen- cia de la modalidad correspondiente. El ´angulo (en grados) del sector circular correspondiente a la modalidad i-´esima es αi = 360 · fi. En la figura 1.8 se representa la distribuci´on de frecuencia de las vocales del ejemplo 1.3 de la p´agina 14, utilizando distintas variedades de diagramas de sectores.

29%

30%

21%

8%

12% 29%

30%

21%

8% 12% a ei ou

Figura 1.8: Diagrama de sectores

Pictograma y cartogramas. Representaci´on ic´onica del fen´omeno que utiliza dibujos simb´oli- cos o mapas donde aparecen los iconos. El pictograma de la figura 1.9 representa la distribuci´on de frecuencias de las vocales del ejemplo 1.3 de la p´agina 14.

0

0,

0,

0,

0,

Figura 1.9: Pictograma

1.3.2. Caracteres cuantitativos

Este tipo de representaciones gr´aficas se realizan sobre los ejes de coordenadas. Para que sean m´as significativas, puede ser interesante un cambio de origen o escala en los ejes, si bien esto debe indicarse convenientemente para no inducir a enga˜no. Por ejemplo, un cambio de origen suele indicarse mediante una l´ınea en zigzag en el eje correspondiente. Diagrama de barras o puntos. Se utiliza en el caso discreto y es similar al de rect´angulos pero con barras verticales o puntos en los extremos. La frecuencia absoluta (o relativa) determina la longitud de la barra y el valor de la variable determina el lugar del eje horizontal donde se apoya. En la figura 1.10 se representa la distribuci´on de frecuencias (absolutas) del ejemplo 1. de la p´agina 16, haciendo uso de un diagrama de puntos (izquierda) y de barras (derecha).

0

4

8

12

16

0 1 2 3 4 5 6 0

4

8

12

16

1 2 3 4 5 Figura 1.10: Diagrama de puntos – diagrama de barras

Dpto. Matem´atica Aplicada (Universidad de M´alaga)