Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Introducción a la Estadística Descriptiva y Probabilidad, Apuntes de Estadística Empresarial

Estos apuntes proporcionan una introducción al análisis estadístico unidimensional, cubriendo conceptos fundamentales como la estadística descriptiva, la teoría de la probabilidad y la representación de datos. Se exploran las variables, atributos, frecuencias, distribuciones de frecuencias, medidas de tendencia central, dispersión y forma. Útil para estudiantes que buscan una comprensión básica de los principios estadísticos.

Tipo: Apuntes

2023/2024

Subido el 13/12/2024

lentejas-2
lentejas-2 🇪🇸

3 documentos

1 / 12

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Tema 1. Alisis Estadístico
Unidimensional
1. Introducción
Estadística:
es una ciencia que se encarga de la recogida, ordenación, resumen y presentación de la
información asociada a un determinado fenómeno que se desea estudiar o conocer en
profundidad (Estadística Descriptiva)
con el objetivo de deducir las leyes que gobiernan esos fenómenos que normalmente
incorporan variabilidad o incertidumbre (Teoría de la Probabilidad)
para que, a partir de la utilización de métodos y técnicas propias, se puede llegar a tener un
mejor conocimiento de dichos fenómenos y, con ello, realizar predicciones y llegar a unas
adecuadas conclusiones a partir de un análisis de la información disponible ( Inferencia
Estadística)
Estadística Descriptiva: se incluyen en estos todos la utilización de tablas y gráficos, así
como medidas que permitan resumir la información disponible.
Teoría de la Probabilidad: Campana de Gauss.
Ej. salario de las personas (hay pocas personas
que ganan poco o mucho, sin embargo hay
muchas personas que se encuentran en la
mitad)
2. Variables y atributos: valores y modalidades
Variables Discretas Los valores son 1,2,3, …
Continuas Los valores son 1;1,0000001; …
Atributos Nominal No hay jerarquía. Ej. colores
Fenomenos
Cuantitativo
(números) Variables (x,y,z) Valores (Datos
cuantitativos)
Cualitativo
(cualidades) Atributos (x,y,z)
Modalidades
(Datos
cualitativos)
pf3
pf4
pf5
pf8
pf9
pfa

Vista previa parcial del texto

¡Descarga Introducción a la Estadística Descriptiva y Probabilidad y más Apuntes en PDF de Estadística Empresarial solo en Docsity!

Tema 1. Análisis Estadístico

Unidimensional

1. Introducción

Estadística: es una ciencia que se encarga de la recogida, ordenación, resumen y presentación de la información asociada a un determinado fenómeno que se desea estudiar o conocer en profundidad ( Estadística Descriptiva ) con el objetivo de deducir las leyes que gobiernan esos fenómenos que normalmente incorporan variabilidad o incertidumbre ( Teoría de la Probabilidad ) para que, a partir de la utilización de métodos y técnicas propias, se puede llegar a tener un mejor conocimiento de dichos fenómenos y, con ello, realizar predicciones y llegar a unas adecuadas conclusiones a partir de un análisis de la información disponible ( Inferencia Estadística ) Estadística Descriptiva : se incluyen en estos métodos la utilización de tablas y gráficos, así como medidas que permitan resumir la información disponible. Teoría de la Probabilidad: Campana de Gauss. Ej. salario de las personas (hay pocas personas que ganan poco o mucho, sin embargo hay muchas personas que se encuentran en la mitad)

2. Variables y atributos: valores y modalidades

Variables Discretas Los valores son 1,2,3, … Continuas Los valores son 1;1,0000001; … Atributos Nominal No hay jerarquía. Ej. colores

Fenomenos

Cuantitativo

(números)

Variables (x,y,z)

Valores (Datos

cuantitativos)

Cualitativo

(cualidades)

Atributos (x,y,z)

Modalidades

(Datos

cualitativos)

Ordinal Puede ser ordenado por una jerarquía. Ej. puestos de trabajo

3. Representaciones de los datos: frecuencias. Las

distribuciones de frecuencias y sus clases.

Representaciones gráficas

3.1. Representaciones de los datos: frecuencias Frecuencia absoluta : determinar el número de veces que se reproducen esos datos. Frecuencia relativa : es el porcentaje de aparición que hay de n 3. Va en %. fi= ni / N Frecuencia absoluta acumulada : ordenar previamente los datos de la variable. Nm= nm + nm-1 + nm-2 + nm-3 + … Frecuencia relativa acumulada : ordenar previamente los datos de la variable Fi= Ni / N Frecuencia absoluta Frecuencia relativa Frecuencia absoluta acumulada Frecuencia relativa acumulada X=edad ni fi Ni Fi 18 3 0,2 20% 3 0,2 20% 19 5 0.33 33% 8 0,53 53% 20 2 0,13 13% 10 0,67 67% 21 4 0,27 27% 14 0,93 93% 22 1 0,07 7% 15 1 100% N=15 1 100%

4. Medidas resumen de la información en las

distribuciones de frecuencias

4.1. Medidas de tendencia central y posición (Media, Mediana y Moda / Cuantiles) 4.1.1. Tendencia central ¿Hacia qué punto tienden a “centrarse” más los valores?, ¿por dónde se encuentra el centro de distribución? A) Media aritmética Media aritmética : es el promedio de todos los valores en un conjunto de datos. Cálculo: Media muestral: ´x=a 1 =ax Distribución individualizada (ni = 1) Distribución agrupada x= ∑ xi ni N = x= ∑ xi N x= ∑ x ´i ni N Propiedades: ∑( xi−x (^) ) ni= 0 = ∑ xi−N x= 0 Teoría de Köning ∑^ ( xi−k^ ) 2

∑( xi−x (^) ) 2 Cambio de origen (suma o resta a valores de la variable) xi+ a= yi = x +a= y a+b xi = yi = a+ b x= y Cambio de escala (multiplicación o división a valores de la variable) xi b= yi = x b= y Ventajas Desventajas Usa todos los datos Es única Fácil de interpretar Siempre existe Sensible a números extremos Sensible a como hagamos las distribuciones agrupadas

Otras medias (geométrica y armónica): M. Geométrica M. Armónica G= N√ x 1 n (^2) x 2 n (^2) xm n m (^) =N

∏ i= 1 m xi ni

H=
N

x 1 n 1 +

x 2 n 2 +…+

xm nm

N

∑ i= 1 m 1 xi ni Se usa sobre todo en %. Ej. números índices, rentabilidades, … Se usa sobre todo en “algo sobre algo”. Ej. velocidad, aceleración, tipo de cambio (de € a $) No siempre existe (por algún dato que valga 0) Menos sensible a números extremos Momentos respecto al origen: ar= ∑ xi r ni N r= orden Casos particulares: a 1 = ∑ xi 1 ni N =x=ax Es la media a 2 = ∑ xi 2 ni N Es útil para calcular la varianza B) Mediana Mediana : es el valor central de la distribución (está dejando la mitad de los valores a un lado, y la otra mitad al otro). Nota: Es fundamental ordenarlas de menor a mayor. Distribución individualizada (ni = 1) Distribución agrupada Posición=

N + 1

Posición=

N

Con esto averiguaremos en que intervalo se encuentra Mediana=x (^) j+

N

−N (^) j− 1 nj

∙ C

x (^) j=extremo inferior del intervaloque contiene la mediana Ventajas Desventajas No es sensible a valores extremos No usa toda la información

C) Moda Moda: es el valor más representativo de toda la distribución Distribución individualizada (ni = 1) Distribución agrupada Es el que tiene elmayor ni Moda=x (^) j + n (^) j+ 1 nj− 1 +n (^) j+ 1

∙ C

Otros casos: Bimodal Moda relativa No hay solo una única moda La repetición de valores en un solo punto, pero no es la absoluta Ventajas Desventajas No es sensible a valores extremos No usa toda la información D) Relación entre Media, Mediana y Moda La Media y la Mediana son únicas , la Moda no (puede ser bimodal) En cuanto a la simetría y asimetría :

4.1.2. Posición Cuantiles : valores que dividen la distribución en partes iguales. Los cuartiles se dan cuando dividimos la distribución en 4 partes (25%). Distribución individualizada (ni = 1) Distribución agrupada Posición=¿ Qk=

N + 1

∙ k k= 1,2, Posición=

N

∙ k Con esto averiguaremos en que intervalo se encuentra Qk=x (^) j+

N

∙ k −N (^) j− 1 n (^) j

∙ C

x (^) j=extremo inferior del intervaloque contiene la mediana Los deciles se dan cuando dividimos la distribución en 10 partes (10%). Distribución individualizada (ni = 1) Posición=¿ Dk=

N + 1

∙ k k= 1,2,3, … 10 Con esto averi x (^) j=extremo infe Los percentiles se dan cuando dividimos la distribución en x partes (un %). Me=Q 2 =D 5 =P 50 Q 1 =P 25 Q 3 =P 75 Distribución individualizada (ni = 1) Distribución agrupada Posición=¿ Pk=

N + 1

∙ k Posición=

N

∙ k Con esto averiguaremos en que intervalo se encuentra

4.2.2. Respecto a la media (o Relativas) 4.2.2.1. Varianza Varianza : forma de entender cuanto se dispersan o varían los datos alrededor de su media. La varianza ayuda a ver si los datos están muy dispersos o no. Si todos están cerca del promedio, la varianza será baja, pero si están muy esparcidos, la varianza será alta. S 2 = ∑ (^ xi −x) 2 ∙ ni N S 2 =a 2 −a 1 2 S 2 =a 2 −x 2 El resultado se da en unidades al cuadrado. Propiedades: S 2 ≥ 0 Si es igual a 0, es cuando todos los valores son iguales, por lo tanto no hay dispersión, la distancia es nula Teoría de Köning ∑^ ( xi−k^ ) 2

∑( xi−x (^) )

2 La varianza es la mínima desviación cuadrática de todas respecto a la media. Es una medida de dispersión óptima Cambio de origen (suma o resta a valores de la variable) No afecta a la varianza yi=xi +a = Sy 2 =Sx (^2) y i=a+b^ ^ xi = Sy 2 =b 2 ∙ Sx Cambio de escala 2 (multiplicación o división a valores de la variable) afecta a la varianza yi=xi b = Sy 2 =b 2 ∙ Sx 2 Momentos respecto a la media: mr = ∑ (^ x^ ¿¿^ i−x) r ni N

r= orden Casos particulares: m 0 = ∑(^ x¿¿^ i−x^ ) 0 ni N

m 1 = ∑ (^ x^ ¿¿^ i−x^ ) 1 ni N

m 2 = ∑ (x^ ¿¿^ i−x^ ) 2 ni N

=S

2 ¿ m 3 = ∑(x^ ¿¿^ i−x^ ) 3 ni N

m 4 = ∑ (^ x^ ¿¿^ i−x) 4 ni N ¿ Son útiles para calcular la forma (simetría, curtosis, …) 4.2.2.2. Desviación típica Una vez dada la varianza, la desviación típica se hace para poder trabajar en las unidades de medida iniciales. S=+ √ S 2 =+√a 2 −x 2 Propiedades: S ≥ 0 Teoría de Köning ∑^ ( xi−k^ ) 2

∑( xi−x (^) ) 2 Es una medida de dispersión óptima Cambio de origen (suma o resta a valores de la variable) No afecta a la varianza yi=xi +a = Sy=Sx yi=a+b^ ^ xi =

Sy=|b|∙ Sx

Cambio de escala (multiplicación o división a valores de la variable) afecta a la varianza yi=xi b =

Sy=|b|∙ Sx

4.2.2.3. Cuasivarianza S 1 2 = ∑ (xi−x^ ) 2 ∙ ni N − 1 El resultado se da en unidades al cuadrado. 4.2.2.4. Coeficiente de Variación de Pearson CV =

S

|x|

El resultado no tiene unidades de medida. Normalmente pasan a ser %. Normalmente el resultado se encuentra entre 0-1. Contra menos CV, menor dispersión tendrá. Es decir, los datos estarán más juntos, y por lo tanto la media es más representativa. Según algunos autores, si CV<0,30 tiene una media representativa.