




























































































Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: matematicas 4, Profesor: , Carrera: Tecnologías de Telecomunicación, Universidad: UMA
Tipo: Apuntes
1 / 296
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!





























































































Mi agradecimiento a los profesores del departamento del Ma- tem´atica Aplicada de la Universidad de M´alaga con los que he compartido asignatura en los ´ultimos cursos acad´emicos y, en particular, a los compa˜neros Carlos Cerezo, Inmaculada Fortes, Carlos Guerrero, Jos´e Morones y Agust´ın Valverde, por sus co- rrecciones y sugerencias en la elaboraci´on de estos apuntes.
Este trabajo est´a editado con licencia “Creative Commons” del tipo: Reconocimiento-No comercial-Compartir bajo la misma licencia 3.0 Espa˜na. Usted es libre de: copiar, distribuir y comunicar p´ublicamente la obra. hacer obras derivadas. Bajo las condiciones siguientes: Reconocimiento. Debe reconocer los cr´editos de la obra de la manera especificada por el autor o el licenciador (pero no de una manera que sugiera que tiene su apoyo o apoyan el uso que hace de su obra). No comercial. No puede utilizar esta obra para fines comerciales. Compartir bajo la misma licencia. Si altera o transforma esta obra, o genera una obra derivada, s´olo puede distribuir la obra generada bajo una licencia id´entica a ´esta. Al reutilizar o distribuir la obra, tiene que dejar bien claro los t´erminos de la licencia de esta obra. Alguna de estas condiciones puede no aplicarse si se obtiene el permiso del titular de los derechos de autor. Nada en esta licencia menoscaba o restringe los derechos morales del autor.
Mi agradecimiento a los profesores Carlos Cerezo Casermeiro y Carlos Guerrero Garc´ıa, por sus correcciones y sugerencias en la elaboraci´on de estos apuntes.
Este trabajo est´a editado con licencia “Creative Commons” del tipo: Reconocimiento-No comercial-Compartir bajo la misma licencia 3.0 Espa˜na. Usted es libre de: copiar, distribuir y comunicar p´ublicamente la obra. hacer obras derivadas. Bajo las condiciones siguientes: Reconocimiento. Debe reconocer los cr´editos de la obra de la manera especificada por el autor o el licenciador (pero no de una manera que sugiera que tiene su apoyo o apoyan el uso que hace de su obra). No comercial. No puede utilizar esta obra para fines comerciales. Compartir bajo la misma licencia. Si altera o transforma esta obra, o genera una obra derivada, s´olo puede distribuir la obra generada bajo una licencia id´entica a ´esta. Al reutilizar o distribuir la obra, tiene que dejar bien claro los t´erminos de la licencia de esta obra. Alguna de estas condiciones puede no aplicarse si se obtiene el permiso del titular de los derechos de autor. Nada en esta licencia menoscaba o restringe los derechos morales del autor.
La estad´ıstica descriptiva es la rama de la estad´ıstica que trata la descripci´on y an´alisis de los datos de una poblaci´on, sin pretender extender o generalizar sus resultados y conclusiones a otras poblaciones distintas o m´as amplias. La descripci´on consiste en enumerar los elementos y rasgos que configuran una realidad mediante la observaci´on o la medida. El an´alisis de la poblaci´on est´a constituido por los proce- dimientos existentes para la determinaci´on de los distintos aspectos, propiedades y relaciones de los conjuntos de datos. La estad´ıstica descriptiva implica la colecci´on, clasificaci´on, an´alisis e interpretaci´on de los datos en un proceso de organizaci´on y s´ıntesis de la informaci´on. Estos sencillos trabajos de orde- nar, contar, clasificar, registrar inform´aticamente, etc. requieren mucho tiempo (que se traduce en costes) y una especial atenci´on para evitar posibles errores iniciales. En este cap´ıtulo se tratan distintos m´etodos de clasificaci´on y representaci´on de los datos y se detallan los par´ametros m´as importantes para el an´alisis, la interpretaci´on y la obtenci´on de resultados. Entre los ejemplos que ilustran los conceptos, se han seleccionado dos de ellos que hacen referencia a un estudio del tr´afico (ejemplo 1.5 de la p´agina 16) y a las calificaciones de un grupo de alumnos (ejemplo 1.7 de la p´agina 17). El recorrido de estos dos ejemplos a lo largo de todas las secciones, ilustra un estudio estad´ıstico completo. Por ´ultimo, algunas cuestiones interesantes se tratan a modo de ejercicios autocontenidos en la relaci´on de problemas propuestos al final del cap´ıtulo. Su inter´es queda justificado por el uso conjunto de las t´ecnicas estudiadas en el cap´ıtulo y por sus numerosas aplicaciones pr´acticas.
Como cualquier otra ciencia, la estad´ıstica utiliza su propia terminolog´ıa y para acceder al conocimiento resulta imprescindible dominar su lenguaje. Conviene familiarizarse con los conceptos que se introducen en este cap´ıtulo y ser capaz de identificarlos. A continuaci´on se presentan las definiciones de los elementos b´asicos que intervienen en cualquier estudio estad´ıstico.
11
En este caso, la poblaci´on est´a constituida por todas las empresas malague˜nas que usan soft- ware para la gesti´on de bases de datos. La encuesta se realiza mediante llamada telef´onica y el resultado es una muestra de 10 valores del car´acter “tipo de software para la gesti´on de bases de datos” que resulta ser un atributo cuyas dos modalidades son “libre” y “propietario”.
En el caso de las variables cuantitativas se pueden definir funciones que permiten obtener medidas descriptivas a partir de las observaciones. El objetivo de estas medidas es proporcionar informaci´on sobre las caracter´ısticas de la distribuci´on de los datos. Par´ametro. Un par´ametro es una funci´on que permite obtener una medida descriptiva num´erica a partir de los valores de un car´acter medible de la poblaci´on. Por ejemplo, la media de una poblaci´on se calcula dividiendo la suma de los valores de la variable entre el n´umero total de individuos. Estas medidas suelen ser desconocidas pues para calcularlas se necesita efectuar un censo. Estad´ıstico. Un estad´ıstico es una funci´on definida sobre los valores num´ericos de una muestra. Esta funci´on permite obtener una medida descriptiva que se utiliza para obtener informaci´on sobre alguno de los par´ametros desconocidos de la poblaci´on. Por ejemplo, el estad´ıstico “me- dia aritm´etica de los datos de una muestra” se usa para estimar el par´ametro “media de la poblaci´on”.
Ejemplo 1.2 Estimar la compresi´on media del motor instalado en los autom´oviles de un cierto modelo producidos por una f´abrica a partir del estudio efectuado en 100 veh´ıculos. Se considera la poblaci´on formada por todos los autom´oviles de ese modelo producidos por la f´abrica. El conjunto de 100 autom´oviles extra´ıdos de dicha poblaci´on constituye una muestra de tama˜no 100. Se realiza una encuesta que consiste en medir la compresi´on del motor en cada uno de ellos. El resultado es una muestra de 100 valores del car´acter “compresi´on del motor” que es una variable continua cuyas modalidades corresponden a todas las posibles relaciones volum´etricas. Si se calcula la media de los 100 datos de compresi´on se obtiene un valor del estad´ıstico que proporciona informaci´on sobre el par´ametro media de la poblaci´on total.
Uno de los conceptos sobre el que se basar´an muchas definiciones posteriores y que simplifica la presentaci´on de los datos es el de frecuencia o n´umero de veces que aparece una determinada modalidad de un car´acter o su proporci´on sobre el total. Las distintas modalidades junto a su frecuencia correspondiente constituye la distribuci´on de frecuencias de un car´acter.
En adelante se considerar´a una poblaci´on o muestra de tama˜no N en la que se observar´a el car´acter X que presenta las modalidades x 1 , x 2 , ..., xk (ordenadas de menor a mayor, si el car´acter es cuantitativo). Frecuencia Absoluta. Se llama frecuencia absoluta de un valor xi del car´acter X, y se denota por ni, al n´umero de individuos observados que presentan esta modalidad.
Apuntes de M´etodos Estad´ısticos para la Computaci´on
14 1.2. Distribuciones de frecuencias de un car´acter
Frecuencia Relativa. Se llama frecuencia relativa de un valor xi del car´acter X, y se denota por fi, al cociente entre la frecuencia absoluta y el total de individuos. fi = n Ni i = 1, 2 , ..., k La frecuencia relativa representa la proporci´on de individuos que presentan una determinada modalidad y se puede expresar en tantos por cien sin m´as que multiplicar por cien el cociente de la f´ormula anterior.
Ejemplo 1.3 De la siguiente frase: “La representaci´on gr´afica no es m´as que un medio auxiliar de la investigaci´on estad´ıstica, pues ´esta es fundamentalmente num´erica”, obtener las distribu- ciones de frecuencias de las vocales. Las frecuencias absolutas de las modalidades “a”, “e”, “i”, “o” y “u” del atributo “vocales” son 15, 16, 11, 4 y 6 respectivamente y suman un total de 52 observaciones. Por tanto, la frecuencia relativa de cada una de las modalidades es 15/52, 16/52, 11/52, 4/52 y 6/52 que expresadas en tantos por cien son 29 %, 31 %, 21 %, 8 % y 11 % aproximada y respectivamente. El significado de estas frecuencias est´a claro. Por ejemplo, la frecuencia absoluta de la vocal “a” es 15, es decir, de las 52 vocales contenidas en la frase, 15 de ellas son la vocal “a”, lo que corresponde al 29 % del total.
Cuando el car´acter es cuantitativo, tiene sentido definir tambi´en las siguientes frecuencias acumuladas: Frecuencias Acumuladas Absolutas y Relativas. Se llama frecuencia acumulada de un valor xi de la variable X a la suma de las frecuencias de los valores que son menores o iguales a ´el. Las frecuencias acumuladas se definen, tanto para las frecuencias absolutas, que se denotan por Ni, como para las relativas, que se denotan por Fi. Si los valores xi est´an ordenados de forma creciente entonces
Ni = ∑^ i j=
nj y Fi = ∑^ i j=
fj = N Ni i = 1, 2 , ..., k
Dualmente, se podr´ıan haber definido estas frecuencias con los datos ordenados de forma de- creciente. Seg´un la definici´on utilizada se denominan frecuencias absolutas/relativas acumuladas crecientes o decrecientes. De las definiciones anteriores se destacan las siguientes propiedades elementales:
∑^ k i=
ni = N 3) ni = Ni − Ni− 1
fi = 1 6) fi = Fi − Fi− 1
que pueden usarse a modo de prueba para detectar posibles errores iniciales en el c´alculo de la distribuci´on de frecuencias.
Dpto. Matem´atica Aplicada (Universidad de M´alaga)
16 1.2. Distribuciones de frecuencias de un car´acter
de cada modalidad. Adem´as, este tipo de tablas se completan a˜nadiendo una fila que contiene algunas de las sumas por columnas, de los datos correspondientes (v´ease el ejercicio 24 de la p´agina 46, en la relaci´on de problemas).
Ejemplo 1.5 Representar, en una tabla estad´ıstica, la distribuci´on de frecuencias de los datos del ejemplo 1.4 de la p´agina 15. Se observa que la variable X que determina el “n´umero de ocupantes en los autom´oviles” presenta un reducido n´umero de modalidades (1, 2, 3, 4 y 5), de tal manera que, aunque haya un elevado n´umero de observaciones, ´estas se pueden agrupar haciendo uso de la frecuencia, tal y como se recoge en la tabla de la figura 1.2.
xi ni fi Ni Fi 1 15 0 ′ 375 15 0 ′ 375 2 12 0 ′ 300 27 0 ′ 675 3 8 0 ′ 200 35 0 ′ 875 4 4 0 ′ 100 39 0 ′ 975 5 1 0 ′ 025 40 1 Suma 40 1 Figura 1.2: Tabla de frecuencias para los datos del ejemplo 1. Existen distribuciones que constan de un reducido n´umero de observaciones y, en consecuen- cia, la variable toma un reducido n´umero de valores distintos. Estas distribuciones tambi´en se conoce como distribuciones de tipo I, y para construir la tabla estad´ıstica basta simplemente con anotar ordenadamente las observaciones en fila o en columna, generalmente de menor a mayor. x 1 , x 2 , x 3 ,... , xN
Ejemplo 1.6 Para realizar un estudio sobre la venta semanal de ordenadores en una determina- da empresa de inform´atica, se observa, durante 5 semanas, el n´umero de ordenadores vendidos, obteni´endose los siguientes resultados: 10, 12, 20, 6 y 10. Representar su distribuci´on de fre- cuencias. La distribuci´on de frecuencias se representa ordenando los datos: 6 , 10 , 10 , 12 , 20.
Algunas variables discretas y, en general, las variables de naturaleza continua dan lugar a conjuntos de datos en los que el n´umero de modalidades es muy variado. Consideraremos que una distribuci´on es continua cuando presenta un elevado n´umero de observaciones y de modalidades distintas. En estos casos no resulta apropiado escribir todas las modalidades en una columna, como se hizo en el caso discreto. Para tabular estos datos conviene agruparlos en intervalos que constituyen una partici´on, y determinar el n´umero de individuos que pertenecen a cada uno de ellos. Este tipo de distribuciones tambi´en se conoce como distribuciones de tipo III.
Dpto. Matem´atica Aplicada (Universidad de M´alaga)
Tomar el intervalo como unidad de estudio, en lugar de cada valor de la variable, supone una simplificaci´on pero resulta una p´erdida de informaci´on. Por lo tanto, es importante elegir un n´umero adecuado de intervalos que equilibre estos dos aspectos y que constituyan una partici´on del mismo. Seg´un las caracter´ısticas del conjunto de datos, en la bibliograf´ıa se proponen distintas formas de establecer el n´umero de intervalos en funci´on del tama˜no (N ) de la muestra. Un criterio sencillo usado frecuentemente es considerar un n´umero de intervalos aproximadamente igual a la ra´ız cuadrada del n´umero de datos, es decir, √N. Cada intervalo se denomina clase y a la diferencia entre el extremo superior (Li) e inferior (Li− 1 ) se le llama amplitud de la clase o del intervalo y se denota por ai que puede ser variable o constante para todos los intervalos. Al ser una partici´on, la uni´on de todos los intervalos ha de recubrir a todos los valores de la variable (exhaustivo) pero sin solaparse (excluyente). La elecci´on del n´umero de intervalos y su amplitud es importante si se quiere identificar el tipo de distribuci´on y sus caracter´ısticas. Se llama marca de clase del intervalo i-´esimo y se denota por xi al punto medio del intervalo y ser´a el valor que representar´a la informaci´on del intervalo al que pertenece como si fuera un valor de la variable. Para construir ahora la tabla estad´ıstica se colocan ordenadamente y por columnas los in- tervalos, las marcas de clase y las frecuencias correspondientes, como se muestra en la tabla de la figura 1.3.
Li− 1 , Li xi ni fi Ni Fi [L 0 , L 1 ] x 1 n 1 f 1 N 1 F 1 (L 1 , L. 2 ] x 2 n 2 f 2 N 2 F 2 .. ... ... ... ... ... (Lk− 1 , Lk] xk nk fk Nk Fk Figura 1.3: Tabla de frecuencias de una distribuci´on continua
Ejemplo 1.7 Las calificaciones finales en Matem´aticas de 100 estudiantes fueron:
11 46 58 25 48 18 41 35 59 28 35 2 37 68 70 31 44 84 64 82 26 42 51 29 59 92 56 5 52 8 1 12 21 6 32 15 67 47 61 47 43 33 48 47 43 69 49 21 9 15 11 22 29 14 31 46 19 49 51 71 52 32 51 44 57 60 43 65 73 62 3 17 39 22 40 65 30 31 16 80 41 59 60 41 51 10 63 41 74 81 20 36 59 38 40 43 18 60 71 44
Representar, en una tabla estad´ıstica, la distribuci´on de frecuencias de las notas de Matem´aticas. Se define la variable X que representa la “nota final en Matem´aticas”. Se observa un gran n´umero de observaciones correspondientes a un elevado n´umero de modalidades distintas, lo que sugiere agruparlas en clases. Veamos dos agrupamientos distintos:
Apuntes de M´etodos Estad´ısticos para la Computaci´on
Los distintos tipos de gr´aficas representan las frecuencias absolutas, relativas o acumula- das. El tipo de car´acter, seg´un sea cualitativo o cuantitativo, establece una clasificaci´on de las representaciones gr´aficas. Aunque algunas de ellas se pueden utilizar indistintamente, conviene conocer sus caracter´ısticas para elegir la representaci´on gr´afica que resulta m´as apropiado a cada caso. A continuaci´on se relacionan los tipos de representaci´on m´as utilizados y se detallan las caracter´ısticas principales y la interpretaci´on de los elementos que lo constituyen. La creatividad y la originalidad pueden dar lugar a otros tipos de gr´aficas, siempre y cuando cumplan con el objetivo de garantizar una imagen sencilla y real de los datos.
Las distintas modalidades de los caracteres cualitativos no contemplan ning´un orden num´eri- co. Por tanto, estas representaciones gr´aficas suelen ser m´as ic´onicas y hacen uso del etiquetado de las clases o de la leyenda. Diagrama de rect´angulos o barras. Para cada modalidad, se representa un rect´angulo o barra cuya altura (o longitud) coincide con la frecuencia absoluta (o relativa). En la figura 1.6 se representa la distribuci´on de frecuencia de las vocales del ejemplo 1.3 de la p´agina 14, utilizando distintos diagramas de columnas en vertical u horizontal.
0
5
10
15
20
a e i o u 0 0,1 0,2 0,
a
e
i
o
u
1
Figura 1.6: Diagrama de rect´angulos
Diagrama de Pareto. Diagrama de barras de frecuencias relativas donde las modalidades se representan por orden decreciente en altura. Adem´as, se superpone una curva con la frecuencia relativa acumulada cuya escala se representa a la derecha. Con este diagrama es f´acil identificar las modalidades con mayor frecuencia. En la figura 1.7 se representa la distribuci´on de frecuencias de las vocales del ejemplo 1.3 de la p´agina 14, utilizando un diagrama de Pareto.
0
0,
0,
0,
0,
0,
0,
0,
e a i u o^0
0,
0,
0,
0,
1
Figura 1.7: Diagrama de Pareto
Apuntes de M´etodos Estad´ısticos para la Computaci´on
20 1.3. Representaciones gr´aficas
Diagrama de sectores. Se descompone un c´ırculo en sectores de ´area proporcional a la frecuen- cia de la modalidad correspondiente. El ´angulo (en grados) del sector circular correspondiente a la modalidad i-´esima es αi = 360 · fi. En la figura 1.8 se representa la distribuci´on de frecuencia de las vocales del ejemplo 1.3 de la p´agina 14, utilizando distintas variedades de diagramas de sectores.
29%
30%
21%
8%
12% 29%
30%
21%
8% 12% a ei ou
Figura 1.8: Diagrama de sectores
Pictograma y cartogramas. Representaci´on ic´onica del fen´omeno que utiliza dibujos simb´oli- cos o mapas donde aparecen los iconos. El pictograma de la figura 1.9 representa la distribuci´on de frecuencias de las vocales del ejemplo 1.3 de la p´agina 14.
0
0,
0,
0,
0,
Figura 1.9: Pictograma
Este tipo de representaciones gr´aficas se realizan sobre los ejes de coordenadas. Para que sean m´as significativas, puede ser interesante un cambio de origen o escala en los ejes, si bien esto debe indicarse convenientemente para no inducir a enga˜no. Por ejemplo, un cambio de origen suele indicarse mediante una l´ınea en zigzag en el eje correspondiente. Diagrama de barras o puntos. Se utiliza en el caso discreto y es similar al de rect´angulos pero con barras verticales o puntos en los extremos. La frecuencia absoluta (o relativa) determina la longitud de la barra y el valor de la variable determina el lugar del eje horizontal donde se apoya. En la figura 1.10 se representa la distribuci´on de frecuencias (absolutas) del ejemplo 1. de la p´agina 16, haciendo uso de un diagrama de puntos (izquierda) y de barras (derecha).
0
4
8
12
16
0 1 2 3 4 5 6 0
4
8
12
16
1 2 3 4 5 Figura 1.10: Diagrama de puntos – diagrama de barras
Dpto. Matem´atica Aplicada (Universidad de M´alaga)