











Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: Estadistica I, Profesor: irene riboó, Carrera: Administración y Dirección de Empresas, Universidad: URJC
Tipo: Diapositivas
1 / 19
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!












1
2
Tema 1: Análisis estadístico unidimensional Tema 2: Análisis estadístico bidimensional Tema 3: Números índices Tema 4: Introducción a las series temporales
TEORÍA DE LA PROBABILIDAD Tema 5: Teoría de la probabilidad. Aspectos generales Tema 6: Variables aleatorias unidimensionales Tema 7: Variables aleatorias bidimensionales Tema 8: Características de las distribuciones de probabilidad Tema 9: Distribuciones de probabilidad discretas y continuas Tema 10: Convergencia
3
4
5
Ejemplos: talla y peso de una población
salario y antigüedad de los trabajadores de una empresa volumen de importación de maquinaria y producción durante ese año en una empresa.
Si estudiamos conjuntamente más de una variable sobre una misma población, a cada elemento observado de dicha población le corresponden tantos valores observados como variables estudiadas.
6
En el caso particular de observar dos variables X e Y sobre un mismo elemento, tendremos para él el par de observaciones (xi , yj). Así, estamos ante una variable bidimensional (X,Y), par de variables observadas simultáneamente, de forma que:
*La variable X presenta n valores de los cuales k son distintos *La variable Y presenta m valores de los cuales h son distintos
El conjunto de pares (xi,yj) con sus respectivas frecuencias se denomina distribución bidimensional de frecuencias de la variable (X,Y).
De esta variable bidimensional, se pueden estudiar medidas de posición, dispersión y forma, se puede representar gráficamente, ...
7 Salario inicial
Salario actual 0 20000 40000 60000 80000 100000
140000 120000 100000 80000 60000 40000 20000 (^0 )
El estudio de una variable bidimensional es útil para:
13
k i
i
h j
1
. 1
Frecuencia relativa marginal de xi es la proporción de individuos que presentan dicho valor:
h j
1
. ^
Análogamente, la frecuencia relativa marginal de yj :
i
j
1
. ^
Observación:
14
Frecuencia absoluta marginal acumulada de xi es:
i (^) r i r
Análogamente, la frecuencia absoluta marginal acumulada de yj :
j (^) r j r
Frecuencia relativa marginal acumulada de xi es:
Frecuencia relativa marginal acumulada de yj es:
15
Ejemplo: Dada la siguiente distribución bidimensional sobre los ingresos mensuales de 100 familias (X en unidades monetarias) y el número de miembros integrantes de cada familia (Y), complete la tabla de correlación con las frecuencias marginales absolutas, relativas, absolutas acumuladas y relativas acumuladas.
X\Y 2 3 4 ni. fi. Ni. Fi. 100 21 20 0 41 0,41 41 0, 200 5 15 5 25 0,25 66 0, 300 10 5 19 34 0,34 100 1 n.j 36 40 24 100 1 f.j 0,36 0,4 0,24 1 N.j 36 76 100 F.j 0,36 0,76 1
17
X/yj nij x 1 n1j x 2 n2j ... … xn nnj n.j
Y/xi nij y 1 ni y 2 ni … … ym nim ni.
Distribuciones Condicionadas: distribuciones de una de las componentes cuando la otra toma un valor o valores fijos (cumple una condición)
Distribución de X condicionada por yj
Observaciones:
Frecuencia absoluta de xi condicionada a yj ni/j
Frecuencia relativa de xi condicionada a yj fi/j = ni/j / n.j
1
/^
n i
X/ yj
n nj N
n i
i j
. 1
/ 18
Ejemplo: Con los datos del ejercicio anterior obtenga las distribuciones condicionadas: X/y=4 ; Y/ x<250.
X\Y 2 3 4 ni. 100 21 20 0 41 200 5 15 5 25 300 10 5 19 34 n.j 36 40 24
X/y=4 ni 100 0 200 5 300 19 24
Y/x<250 n1j +n2j 2 26 3 35 4 5 66
19
N
yn y
N
xn X
h
j
j j
k
i
ii
( )
( )
y N
yn
N
y y n S
X N
xn
N
x X n S
h
j
j j
h
j
j j y
k
i
i i
k
i
i i x
2 2 2
y y
y
y j j
jj
2
2 2
x^ x
x
ii x
ii
Y es más homogénea
Ejemplo: Con los datos del ejercicio anterior estudie cuál de las dos distribuciones es más homogénea.
25
*momentos respecto a la media o centrales:
r s xi x y y n N
m (^)
, ( ) ( )
1
26
11 10 01 1 1
1 1
1 , 1
ij
k
i
h
j
i j
ij
k
i
h
j
xy i j
27
1 1
(^)
n
i
m
j
xy i j
28
S ' (^) xy a 1 a 2 Sxy
xy xy xy
xy x y
N
i
i
N
i
i
N
i
i i
2 2 2
1 1
2
1
Dividiendo entre N: Campo de variación:
29
Si hay algún tipo de relación entre las variables, es decir cuando el comportamiento de una de ellas influye en el comportamiento de la otra se dice que son dependientes y en caso contrario se habla de independencia. La dependencia o independencia puede ser estadística o funcional.
si no existe relación entre las variables
independientes funcionalmente dependientes
estadísticamente dependientes
si existe una función que relacione las dos variables
término medio
sueldos por categorías: mecánicos=x, vendedores=1’3x, y directivos=2x
salario y altura
altura-peso edad altura ...
30
Dependencia Funcional:
X\Y 1 3 5 7 100 15 0 0 0 120 0 20 0 0 140 0 0 30 0 160 0 0 0 25
X\Y 1 2 3 4 5 100 20 0 0 5 0 120 0 26 0 0 0 140 0 0 28 0 12 160 0 0 0 10 0
31 32
Caso en que las variables ni son independientes, ni existe dependencia funcional. La definición de dependencia estadística está asociada a las frecuencias, por lo que podemos exponer su definición de distintos modos:
i^ j i j
ij ij
ij
37
Relación lineal positiva
Relación no lineal
Relación lineal negativa
Ausencia de relación lineal
38
39
Coeficiente de correlación lineal simple de Pearson: cociente entre la covarianza y el producto de las desviaciones típicas de las dos variables.
Interpretación del coeficiente de correlación lineal: rxy =1: Relación lineal perfecta y directa entre X e Y rxy =-1: Relación lineal perfecta e indirecta entre X e Y rxy =0 ; Incorrelación lineal entre X e Y rxy 1 ; Fuerte relación lineal directa entre X e Y rxy - 1 ; Fuerte relación lineal indirecta entre X e Y rxy 0 ; Poca relación lineal entre X e Y 40
Propiedades del coeficiente de correlación lineal:
Independencia Estadística Cov=0^ Incorrelación lineal
41
si c y d tienen el mismo signo.
si c y d tienen signos opuestos. (^42)
xy
xy xy
Relación directa de intensidad media
Ejemplo: Con los datos del primer ejercicio estudie la intensidad de la relación lineal existente entre las variables.
43
Puede comprobarse que existen distintas alternativas para predecir el valor de una variable a partir de sus valores observados. Cualquiera de ellas conlleva el incurrir en errores ya que se trata de predicciones. Definimos el error cometido al estimar la observación j-ésima de la variable estimada como la diferencia entre el valor observado y el estimado:
Así, la suma de los cuadrados de los errores es: (^) i j
44
Ej.- Dada la cantidad demandada de un bien en un establecimiento durante ocho semanas, 50,48, 39, 52, 47, 51, 46, 43, realice la predicción de la demanda en la novena semana sin más información.
Mínimo error que en esta situación puedo cometer
i j j^ ij
SCE (^) y y n N S
TIEMPO^49
0 10 20 30 40 50 60
VIRUS
300
200
100
0 T 50
Y 0 10 20
500
400
300
200
100
0
51
FUNCIONES POTENCIALES (pendiente menor que la unidad):
T
Y1 0 5 10 15 20
5 4 3 2 1 0
52
FUNCIONES POTENCIALES (pendiente negativa):
T
Y2 0 5 10 15 20
1,
,
,
,
,
0,
53
X
Y -30 -20 -10 0 10 20 30
60 50 40 30 20 10 0
55
Error cometido al estimar la observación j-ésima de la variable
yj
y (^) j
Y: regresando, var. explicada, dependiente o de respuesta X: regresor, var. explicativa o independiente)
56
61
De forma análoga …. LINEA DE REGRESION DE X SOBRE Y (X/Y) : descrita por las medias de las distribuciones de X condicionadas por valores de Y
j y
xy y
xy
Se cortan en el punto de las medias :
x y^ ,
x
Ambas rectas pasan por el centro de gravedad de la nube de puntos, es decir, el punto x;y
63
signo b signo Sxy
Crecientes Correlación lineal directa
Decrecientes Correlación lineal inversa
Perpendiculares Incorrelación lineal
65
66
Variaciones de otros fenómenos relacionados con Y o por azar
Varianza residual y varianza explicada. Coeficiente de determinación.
Variación de Y
Variación de X
Nos planteamos calcular el porcentaje de variabilidad de la variable explicada que se debe a la variabilidad de la variable explicativa.
Se puede demostrar que, en la regresión lineal de Y sobre X, la varianza de la variable Y puede descomponerse en la suma de la varianza explicada y la varianza residual:
67
Varianza explicada, de los valores teóricos o debida a la regresión (S^2 r )
Varianza residual o de los errores (S^2 e )
Varianza de los valores observados o varianza total (S^2 y )
68
Coeficiente de determinación R2 : Medida de bondad del ajuste efectuado^2
2 2
2
y
e y
r
Si R^2 ~ 0 Con la función seleccionada se está explicando un bajo porcentaje de las variaciones de Y. La bondad del ajuste realizado es baja. Si R^2 ~ 1 Con la función seleccionada se está explicando un alto porcentaje de las variaciones de Y. La bondad del ajuste realizado es elevada.
Dependencia nula. Ausencia de relación según este modelo
Dependencia funcional perfecta
Mayor grado de dependencia
73
Coeficiente de correlación lineal entre el número de horas no trabajadas por vacaciones y festivos (variable Y) y el tamaño del centro (variable X).
xi (marca de clase)
y j x^2 i y^2 j x i y j 2,5 232,0 6,25 53824,00 580 7,5 226,5 56,25 51302,25 1698, 17,5 224,6 306,25 50445,16 3930, 37,5 221,5 1406,25 49062,25 8306, 75 218,3 5625 47654,89 16372, 150 216,7 22500 46958,89 32505 350 209,7 122500 43974,09 73395 640 1549,3 152400 343221,5 136788
74
Realizamos los mismos cálculos para el número de horas no trabajadas por causas ocasionales
75
2 ( x x ) S
S y y
Sxy 694 ' 612 Sx^2 13. 412 ' 24
( 91 ' 4286 )
694 ' 612 221 ' 3286
y x
ˆ y 0 ' 05179 x 226 ' 0636
2 ( x x ) S
S y y x
xy
Sxy 1787 ' 066 S^2 x^ 13. 412 ' 24
( 91 ' 4286 )
1787 ' 066 y 50 ' 4286 x
y ˆ 01332 ' x 38 ' 2465