






Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Estos apuntes proporcionan una introducción al análisis estadístico unidimensional, cubriendo conceptos fundamentales como la estadística descriptiva, la teoría de la probabilidad y la representación de datos. Se exploran las variables, atributos, frecuencias, distribuciones de frecuencias, medidas de tendencia central, dispersión y forma. Útil para estudiantes que buscan una comprensión básica de los principios estadísticos.
Tipo: Apuntes
1 / 12
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!







Estadística: es una ciencia que se encarga de la recogida, ordenación, resumen y presentación de la información asociada a un determinado fenómeno que se desea estudiar o conocer en profundidad ( Estadística Descriptiva ) con el objetivo de deducir las leyes que gobiernan esos fenómenos que normalmente incorporan variabilidad o incertidumbre ( Teoría de la Probabilidad ) para que, a partir de la utilización de métodos y técnicas propias, se puede llegar a tener un mejor conocimiento de dichos fenómenos y, con ello, realizar predicciones y llegar a unas adecuadas conclusiones a partir de un análisis de la información disponible ( Inferencia Estadística ) Estadística Descriptiva : se incluyen en estos métodos la utilización de tablas y gráficos, así como medidas que permitan resumir la información disponible. Teoría de la Probabilidad: Campana de Gauss. Ej. salario de las personas (hay pocas personas que ganan poco o mucho, sin embargo hay muchas personas que se encuentran en la mitad)
Variables Discretas Los valores son 1,2,3, … Continuas Los valores son 1;1,0000001; … Atributos Nominal No hay jerarquía. Ej. colores
Ordinal Puede ser ordenado por una jerarquía. Ej. puestos de trabajo
3.1. Representaciones de los datos: frecuencias Frecuencia absoluta : determinar el número de veces que se reproducen esos datos. Frecuencia relativa : es el porcentaje de aparición que hay de n 3. Va en %. fi= ni / N Frecuencia absoluta acumulada : ordenar previamente los datos de la variable. Nm= nm + nm-1 + nm-2 + nm-3 + … Frecuencia relativa acumulada : ordenar previamente los datos de la variable Fi= Ni / N Frecuencia absoluta Frecuencia relativa Frecuencia absoluta acumulada Frecuencia relativa acumulada X=edad ni fi Ni Fi 18 3 0,2 20% 3 0,2 20% 19 5 0.33 33% 8 0,53 53% 20 2 0,13 13% 10 0,67 67% 21 4 0,27 27% 14 0,93 93% 22 1 0,07 7% 15 1 100% N=15 1 100%
4.1. Medidas de tendencia central y posición (Media, Mediana y Moda / Cuantiles) 4.1.1. Tendencia central ¿Hacia qué punto tienden a “centrarse” más los valores?, ¿por dónde se encuentra el centro de distribución? A) Media aritmética Media aritmética : es el promedio de todos los valores en un conjunto de datos. Cálculo: Media muestral: ´x=a 1 =ax Distribución individualizada (ni = 1) Distribución agrupada x= ∑ xi ni N = x= ∑ xi N x= ∑ x ´i ni N Propiedades: ∑( xi−x (^) ) ⋅ ni= 0 = ∑ xi−N x= 0 Teoría de Köning ∑^ ( xi−k^ ) 2
∑( xi−x (^) ) 2 Cambio de origen (suma o resta a valores de la variable) xi+ a= yi = x +a= y a+b ⋅ xi = yi = a+ b ⋅ x= y Cambio de escala (multiplicación o división a valores de la variable) xi ⋅ b= yi = x ⋅ b= y Ventajas Desventajas Usa todos los datos Es única Fácil de interpretar Siempre existe Sensible a números extremos Sensible a como hagamos las distribuciones agrupadas
Otras medias (geométrica y armónica): M. Geométrica M. Armónica G= N√ x 1 n (^2) ⋅ x 2 n (^2) ⋅ … ⋅ xm n m (^) =N
∏ i= 1 m xi ni
x 1 n 1 +
x 2 n 2 +…+
xm nm
∑ i= 1 m 1 xi ni Se usa sobre todo en %. Ej. números índices, rentabilidades, … Se usa sobre todo en “algo sobre algo”. Ej. velocidad, aceleración, tipo de cambio (de € a $) No siempre existe (por algún dato que valga 0) Menos sensible a números extremos Momentos respecto al origen: ar= ∑ xi r ni N r= orden Casos particulares: a 1 = ∑ xi 1 ni N =x=ax Es la media a 2 = ∑ xi 2 ni N Es útil para calcular la varianza B) Mediana Mediana : es el valor central de la distribución (está dejando la mitad de los valores a un lado, y la otra mitad al otro). Nota: Es fundamental ordenarlas de menor a mayor. Distribución individualizada (ni = 1) Distribución agrupada Posición=
Posición=
Con esto averiguaremos en que intervalo se encuentra Mediana=x (^) j+
−N (^) j− 1 nj
x (^) j=extremo inferior del intervaloque contiene la mediana Ventajas Desventajas No es sensible a valores extremos No usa toda la información
C) Moda Moda: es el valor más representativo de toda la distribución Distribución individualizada (ni = 1) Distribución agrupada Es el que tiene elmayor ni Moda=x (^) j + n (^) j+ 1 nj− 1 +n (^) j+ 1
Otros casos: Bimodal Moda relativa No hay solo una única moda La repetición de valores en un solo punto, pero no es la absoluta Ventajas Desventajas No es sensible a valores extremos No usa toda la información D) Relación entre Media, Mediana y Moda La Media y la Mediana son únicas , la Moda no (puede ser bimodal) En cuanto a la simetría y asimetría :
4.1.2. Posición Cuantiles : valores que dividen la distribución en partes iguales. Los cuartiles se dan cuando dividimos la distribución en 4 partes (25%). Distribución individualizada (ni = 1) Distribución agrupada Posición=¿ Qk=
∙ k k= 1,2, Posición=
∙ k Con esto averiguaremos en que intervalo se encuentra Qk=x (^) j+
∙ k −N (^) j− 1 n (^) j
x (^) j=extremo inferior del intervaloque contiene la mediana Los deciles se dan cuando dividimos la distribución en 10 partes (10%). Distribución individualizada (ni = 1) Posición=¿ Dk=
∙ k k= 1,2,3, … 10 Con esto averi x (^) j=extremo infe Los percentiles se dan cuando dividimos la distribución en x partes (un %). Me=Q 2 =D 5 =P 50 Q 1 =P 25 Q 3 =P 75 Distribución individualizada (ni = 1) Distribución agrupada Posición=¿ Pk=
∙ k Posición=
∙ k Con esto averiguaremos en que intervalo se encuentra
4.2.2. Respecto a la media (o Relativas) 4.2.2.1. Varianza Varianza : forma de entender cuanto se dispersan o varían los datos alrededor de su media. La varianza ayuda a ver si los datos están muy dispersos o no. Si todos están cerca del promedio, la varianza será baja, pero si están muy esparcidos, la varianza será alta. S 2 = ∑ (^ xi −x) 2 ∙ ni N S 2 =a 2 −a 1 2 S 2 =a 2 −x 2 El resultado se da en unidades al cuadrado. Propiedades: S 2 ≥ 0 Si es igual a 0, es cuando todos los valores son iguales, por lo tanto no hay dispersión, la distancia es nula Teoría de Köning ∑^ ( xi−k^ ) 2
∑( xi−x (^) )
2 La varianza es la mínima desviación cuadrática de todas respecto a la media. Es una medida de dispersión óptima Cambio de origen (suma o resta a valores de la variable) No afecta a la varianza yi=xi +a = Sy 2 =Sx (^2) y i=a+b^ ⋅^ xi = Sy 2 =b 2 ∙ Sx Cambio de escala 2 (multiplicación o división a valores de la variable) Sí afecta a la varianza yi=xi ⋅ b = Sy 2 =b 2 ∙ Sx 2 Momentos respecto a la media: mr = ∑ (^ x^ ¿¿^ i−x) r ni N
r= orden Casos particulares: m 0 = ∑(^ x¿¿^ i−x^ ) 0 ni N
m 1 = ∑ (^ x^ ¿¿^ i−x^ ) 1 ni N
m 2 = ∑ (x^ ¿¿^ i−x^ ) 2 ni N
2 ¿ m 3 = ∑(x^ ¿¿^ i−x^ ) 3 ni N
m 4 = ∑ (^ x^ ¿¿^ i−x) 4 ni N ¿ Son útiles para calcular la forma (simetría, curtosis, …) 4.2.2.2. Desviación típica Una vez dada la varianza, la desviación típica se hace para poder trabajar en las unidades de medida iniciales. S=+ √ S 2 =+√a 2 −x 2 Propiedades: S ≥ 0 Teoría de Köning ∑^ ( xi−k^ ) 2
∑( xi−x (^) ) 2 Es una medida de dispersión óptima Cambio de origen (suma o resta a valores de la variable) No afecta a la varianza yi=xi +a = Sy=Sx yi=a+b^ ⋅^ xi =
Cambio de escala (multiplicación o división a valores de la variable) Sí afecta a la varianza yi=xi ⋅ b =
4.2.2.3. Cuasivarianza S 1 2 = ∑ (xi−x^ ) 2 ∙ ni N − 1 El resultado se da en unidades al cuadrado. 4.2.2.4. Coeficiente de Variación de Pearson CV =
El resultado no tiene unidades de medida. Normalmente pasan a ser %. Normalmente el resultado se encuentra entre 0-1. Contra menos CV, menor dispersión tendrá. Es decir, los datos estarán más juntos, y por lo tanto la media es más representativa. Según algunos autores, si CV<0,30 tiene una media representativa.