























































































Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: estadistica, Profesor: irene riboó, Carrera: Administración y Dirección de Empresas, Universidad: URJC
Tipo: Apuntes
1 / 95
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!
























































































Este documento corresponde a la asignatura de Estadística del segundo curso de la Ingeniería Técnica en Informática de Sistemas de la Universidad Alfonso X el Sabio. Está basado en las notas de clase de la profesora Luisa Fernanda Rodríguez Hevia.
Este documento se distribuye desprovisto de cualquier garantía; dado que se rige por la licen- cia GFDL 2.0 puede distribuirlo libremente según las condiciones establecidas por ésta.
Para comunicar cualquier error en el documento o solicitar el fichero fuente del mismo puede escribir un correo electrónico a [email protected]
Copyright (c) 2003 Antonio Jara Sánchez-Caro. Permission is granted to copy, distribute and/or modify this document under the terms of the GNU Free Documentation License, Version 2.0 or any later version published by the Free Software Foundation; with no invariant sections, with no Front-Cover texts, and with no Back-Cover texts. A copy of the license is included in the section entitled "GNU Free Documentation License".
Existen dos formas de interpretar el término "estadística":
Se entiende por estadística, cualquier colección de datos numéricos clasificados según un criterio. (^1) Es la ciencia que utiliza los números para el estudio de las leyes que dependen del azar. Tratando de descubrir mediante el razonamiento inductivo la causa general a la que obe- dece el modelo particularmente analizado.
En la vida cotidiana el hombre protagoniza dos tipos de fenómenos:
Deterministas : aquellos que dadas las mismas condiciones se obtienen los mismos resul- tados.
Aleatorios : aquellos que dadas las mismas condiciones se obtienen distintos resultados (lanzar un dado). Se suele decir que están regidos por la ley del azar.
La estadística descriptiva trata de la descripción numérica de conjuntos, siendo particularmente útil cuando el número de elementos del conjunto es elevado. No pretende sacar conclusiones del conjunto, solo pretende describirlo.
Estudiaremos dos tipos de variables:
Variables cualitativas : No toman valores númericos y describen cualidades. Se representan con las primeras letras del abecedario en mayúsculas. Ej: A, color de pelo.
Variables cuantitativas : Toman valores numéricos y se utilizan si el carácter que quere- mos valorar es susceptible a la medida. Se representan con las ultimas letras del abecedario en mayúsculas. Ej: X (altura), Y (peso). (^1) Es la definición académico-científica
1 Estadística Descriptiva
Es la suma de las frecuencias relativas hasta un determinado valor ( i ).
Es el conjunto de todos los valores que ha tomado la variable estadística acompañados de sus correspondientes frecuencias. Según cómo estén agrupados los datos tendremos dos tipos de distribuciones:
1.5.1. Distribuciones no agrupadas.
Una vez recogida la información, esta se dispone asociando a cada valor de la variable sus correspondientes frecuencias. Se representan en una tabla como la que sigue:
xi ni fi Ni Fi x 1 n 1 f 1 N 1 F 1 x 2 n 2 f 2 N 2 F 2 .. .
xn nn fn Nn Fn N 1
1.5.2. Distribuciones agrupadas.
Los datos se agrupan en intervalos cuando el número de valores que ha tomado la variable estadística es lo sufucientemente grande. Se agrupan para optimizar el tratamiento de la información. El número de intervalos está, generalmente, entre 4 y 15, no siendo nunca superior al 10 % de los datos.
√Una regla muy utilizada para elegir el número de intervalos es tomar el entero más próximo a n , siendo n el número de datos. Se representa en una tabla como la siguiente:
Li → Li + 1 ni fi Ni Fi L 0 → L 1 n 1 f 1 N 1 F 1 L 1 → L 2 n 2 f 2 N 2 F 2 .. .
Ln − 1 → Ln nn fn Nn Fn N 1
Nota: Los intervalos son cerrados por la derecha y abiertos por la izquierda [∗, ∗).
1 Estadística Descriptiva
Es la diferencia entre el valor superior e inferior de un intervalo.
ci = Li + 1 − Li
Hace referencia al punto medio del intervalo. Se utiliza para calcular la media de la distribu- ción.
xi = Li + 1 + Li 2
1.7.1. Diagrama de Barras.
Se utiliza para variables discretas y en general para distribuciones no agrupadas. Ver figura 1.1.
ni
xi
Figura 1.1: Diagrama de barras.
1.7.2. Diagrama de Frecuencias Acumuladas.
Se representan las frecuencias acumuladas en el eje de ordenadas ( y ) y los valores que toma la variable en el eje de abscisas ( x ). Ver figura 1.
1.7.3. Histograma de Frecuencias.
Se utiliza para datos agrupados y se construye levantando sobre cada intervalo un rectángulo de área proporcional a la frecuencia absoluta ( ni ) correspondiente a ese intervalo. Dependiendo si los intervalos son o no uniformes se procederá de la siguiente forma:
1 Estadística Descriptiva
La suma de las desviaciones de los valores de la variable con respecto a la media es siempre nula.
n ∑ i = 1
( xi − x ) ni = 0
Si a todos los valores de la variable les sumamos una constante, es decir, les hacemos un cambio de origen, la media queda también sumada por esa constante.
Si a todos los valores de la variable les multiplicamos por una constante, es decir, les hacemos un cambio de escala, la media también queda multiplicada por esa constante.
Es el valor de la distribución que deja a ambos lados el mismo número de observaciones. Para calcularla hay que ordenar las observaciones de menor a mayor. Es decir, la mediana es el valor que ocupa el lugar central si el número de observaciones es impar. Si el número de datos es par, podrá decirse que existen dos valores medianos y, en tal caso se calcula la media de los valores medianos. Ej: { 1 , 2 , 3 , 4 , 5 } Me = 3 Ej: { 1 , 2 , 3 , 4 , 5 , 6 } Me = 3 + 2 4 = 3 , 5 La mediana puede definirse también como el valor que tiene una distribución acumulada igual a N 2. Para calcularla distinguiremos de nuevo si los datos están o no agrupados:
Datos no agrupados :
Ejemplo: xi ni Ni 0 2 2 1 3 5 2 4 9 3 1 10 x = 1410 = 1 , 4 Me = 1 + 2 2 = 1 ,5 (porque N 2 = Ni −→ 102 = 5)
1 Estadística Descriptiva
Ejemplo: xi ni Ni 0 2 2 1 4 6 2 3 9 3 1 10 x = 1410 = 1 , 4 N 2 =^ 5, no coincide con ningún^ Ni ,^ por tanto^ Me^ =^1 Datos agrupados : tenemos que seguir los siguientes pasos:
Me = Li +
N 2 −^ Ni −^1 ni
ci
Ejemplo: Li → Li + 1 ni Ni ci 2 - 4 4 4 2 4 - 6 10 14 2 6 - 8 40 54 2 8 - 10 20 74 2 10 - 12 1 75 2 N 2 =^
75 2 =^37 ,^5 Me = 6 + 37 ,^540 − 142 = 7 , 175
Ejemplo: Li → Li + 1 ni Ni ci 2 - 4 2 2 2 4 - 6 3 5 2 6 - 8 5 10 2 N 2 =^
10 2 =^5 Me = 6
(^3) Se le conoce como “intervalo mediano”
1 Estadística Descriptiva
Datos agrupados : Si r k N = Ni −→ Cuantil = Extremo superior del intervalo Si r k N 6 = Ni −→ Cuantil = Li +
r k N − Ni − 1 ni ci
Ejemplo: Calcular el primer y el tercer cuartil ( C 1 y C 3 ) de la siguiente distribución:
xi ni Ni 0 2 2 1 3 5 2 10 15 3 16 31 4 5 36 6 5 41
Para calcular el primer cuartil tomamos r = 1 y k = 4, por tanto tenemos: r k N = 14 41 = 10 ,25. Cogemos el valor de Ni inmediatamente superior que es 15 y por tanto C 1 = 2. Para calcular el tercer cuartil tomamos r = 3 y k = 4, por tanto tenemos: (^) kr N = 34 41 = 30 ,75. Cogemos el valor de Ni inmediatamente superior que es 31 y por tanto C 3 = 3.
Ejemplo: Calcular el primer y el tercer cuartil ( C 1 y C 3 ) de la siguiente distribución:
Li → Li + 1 ni Ni 20 - 25 5 5 25 - 30 9 14 30 - 35 14 28 35 - 40 20 48 40 - 45 26 74 45 - 50 18 92 50 - 55 7 99 55 - 60 11 110
Para calcular el primer cuartil tomamos r = 1 y k = 4, por tanto tenemos: r k N = 14 110 = 27 , 25 Calculamos N 2 = 55 Como r k N no coincide con ningún Ni tenemos que aplicar la fórmula: Li + kr N − Ni −^1 ni ci^ donde Li es el extremo inferior del intervalo en el que Ni es inmediatamente superior a N 2. Por tanto: Li +
r k N − Ni − 1 ni ci^ =^30 +^
27 , 25 − 14 14 5 =^34 ,^82 Para calcular el tercer cuartil tomamos r = 3 y k = 4, por tanto tenemos: r k N = 34 110 = 82 , 5 Calculamos N 2 = 55
1 Estadística Descriptiva
Como r k N no coincide con ningún Ni tenemos que proceder de la misma forma que antes: Li +
r k N − Ni − 1 ni ci^ =^30 +^
82 , 5 − 74 18 5 =^47 ,^36
1.9.1. Recorrido o Rango.
Será la diferencia entre el valor máximo y mínimo de la distribución.
D = xM − xm
1.9.2. Recorrido Intercuantílico.
Será la diferencia entre el mayor y el menor cuantil. Por ejemplo, para los cuartiles sería RI = C 3 − C 1
1.9.3. Varianza
Es una medida de dispersión de los valores de la variable con respecto a la media.
S^2 x = ∑
n i = 1 ( xi^ −^ x ) (^2) ni N
S^2 x = ∑
ni = 1 ( xi − x ) (^2) ni N =^
∑ ni = 1 ( x^2 i + x^2 − 2 xix ) ni N =^
∑ ni = 1 x^2 i ni N +^
x^2 N N −^2 x^
∑ ni = 1 xini N =^
∑ ni = 1 x^2 i ni N +^ x (^2) − 2 x (^2) = = ∑
ni = 1 x (^2) i ni N −^ x
2 Propiedades:
S^2 x ≥ 0
Si a todos los valores de la variable les sumamos una constante, es decir, hacemos un cambio de origen, la varianza no se ve afectada. xi → x ; x ′ i = xi + k
S^2 x ′ = ∑ ni = 1 ( x ′ i −^ x ′)^2 ni N Si a todos los valores de la variable les multiplicamos por una constante, la varianza queda afectada por la constante, concretamente, multiplicada por la constante al cuadrado.
S^2 x ′ = k^2 S^2 x
Nota: Las unidades de la varianza serán las mismas que las de la variable elevadas al cuadrado.
1 Estadística Descriptiva
Problema Consideremos una variable estadísitica cuya media aritmética es 70, y cuya desvia- ción típica es 10, sea el valor de la variable en la observación i-ésima igual a 90. Calcular el valor tipificado e interpretar su significado.
zi = xi − x Sx
El valor de la variable está dos veces la desviación típica por encima de la media.
Calcular ahora para una observación i-ésima igual a 60.
z ′ i =
El valor de la variable está una vez la desviación típica por debajo de la media.
Problema Un estudiante obtiene en matemáticas una nota de 8.5, siendo 7.8 la nota media de la asignatura y con una desviación típica de 1.3. En estadística la nota media es de 6.3 y la desviación típica 1.65, el estudiante obtiene una nota de 7.2. Calcula:
¿En qué asignatura obtiene la mejor puntuación relativa?
zM =
zE =
Por tanto, la mayor puntuación relativa la obtiene en estadística.
¿En cuál de las dos asignaturas presenta la nota una mayor dispersión relativa?
xM
xE
La mayor dispersión se obtiene también en estadística.
Son unos valores que caracterizan la distribución. Distinguiremos dos tipos:
1 Estadística Descriptiva
1.10.1. Momentos respecto al origen.
Al momento de orden r respecto al origen lo llamaremos α r y lo calcularemos según la si- guiente fórmula:
α r = ∑ ni = 1 xri ni N Casos particulares:
Si r = 0 −→ α 0 = ∑
ni = 1 x (^0) i ni N =^
∑ ni = 1 ni N =^1
Si r = 1 −→ α 1 = ∑
ni = 1 x (^1) i ni N =^ x
Si r = 2 −→ α 2 = ∑
ni = 1 x (^2) i ni N
1.10.2. Momentos respecto a la media.
Al momento de orden s respecto a la media lo llamaremos ms y, lo calcularemos según la siguiente fórmula:
ms = ∑ ni = 1 ( xi −^ x ) sni N Casos particulares:
Si s = 0 −→ m 0 = ∑
ni = 1 ( xi − x ) (^0) ni N =^
∑ ni = 1 ni N =^
N N =^1
Si s = 1 −→ m 1 = ∑
ni = 1 ( xi − x ) (^1) ni N =
Si s = 2 −→ m 2 = ∑
ni = 1 ( xi − x ) (^2) ni N =^ S
(^2) x
Nota: Cómo expresar la varianza en función de los momentos.
S^2 x = ∑ ni = 1 ( xi −^ x )^2 ni N
∑ ni = 1 x^2 i ni N − x^2 = a 2 − a^21
Problema Un fabricante de tubos de televisión dispone de dos tipos de tubos, A y B. Los tubos tienen una duración media de 1495 h. y 1875 h. respectivamente. Las desviaciones típicas son 280 para A y 310 para B. Determinar qué tubo presenta mayor dispersión absoluta y cuál presente mayor dispersión relativa.
A = 1495 y SA = 280 (^4) Por la primera propiedad de la media.