Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Estadistica bidimensional, indice general, Apuntes de Administración de Empresas

Asignatura: tecnicas cuantitativas, Profesor: departemento departemento, Carrera: Administración y Dirección de Empresas, Universidad: UGR

Tipo: Apuntes

2012/2013

Subido el 18/11/2013

msmaria
msmaria 🇪🇸

3.2

(13)

5 documentos

1 / 9

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Estadística Bidimensional. -1-
ESTADÍSTICA BIDIMENSIONAL
ÍNDICE GENERAL
1.-Variable Estadística Bidimensional. Tablas de frecuencia ................................. 2
1.1.- Concepto de variable estadística bidimensional. Ejemplos. .......................2
1.2.-Tablas bidimensionales de frecuencias. Tablas de doble entrada. .................. 3
1.3.-Distribuciones marginales ....................................................4
1.4.-Vector de medias. ........................................................... 5
1.5.-Distribuciones condicionadas .................................................5
1.6.-Covarianza: Concepto y cálculo. Matriz de covarianza. ...........................5
2.- Introducción a la regresión lineal .....................................................7
2.1.- Idea intuitiva del ajuste de una linea a un diagrama de dispersión.................7
2.2 Recta de regresión: Significado y cálculo de la recta de regresión de y sobre x. Cálculo de
la recta de regresión de x sobre y............................................ 7
3.-Significado y cálculo del coeficiente de correlación. ...................................... 8
3.1 Coeficiente de correlación lineal: Definición y cálculo. ............................ 8
3.2 Interpretación del coeficiente de correlación Lineal ............................... 9
pf3
pf4
pf5
pf8
pf9

Vista previa parcial del texto

¡Descarga Estadistica bidimensional, indice general y más Apuntes en PDF de Administración de Empresas solo en Docsity!

ESTADÍSTICA BIDIMENSIONAL

  • 1.-Variable Estadística Bidimensional. Tablas de frecuencia ÍNDICE GENERAL
    • 1.1.- Concepto de variable estadística bidimensional. Ejemplos.
    • 1.2.-Tablas bidimensionales de frecuencias. Tablas de doble entrada.
    • 1.3.-Distribuciones marginales
    • 1.4.-Vector de medias.
    • 1.5.-Distribuciones condicionadas
    • 1.6.-Covarianza: Concepto y cálculo. Matriz de covarianza.
  • 2.- Introducción a la regresión lineal
    • 2.1.- Idea intuitiva del ajuste de una linea a un diagrama de dispersión
      • la recta de regresión de x sobre y. 2.2 Recta de regresión: Significado y cálculo de la recta de regresión de y sobre x. Cálculo de
  • 3.-Significado y cálculo del coeficiente de correlación.
    • 3.1 Coeficiente de correlación lineal: Definición y cálculo.
    • 3.2 Interpretación del coeficiente de correlación Lineal

1.-Variable Estadística Bidimensional. Tablas de frecuencia

1.1.- Concepto de variable estadística bidimensional. Ejemplos.

En muchas ocasiones no basta con estudiar la descripción de un fenómeno y sus variaciones, es conveniente conocer a qué son debidas esas variaciones. Puede resultar interesante e incluso necesario estudiar los cambios producidos en una variable en relación con otras, o cómo influyen unas variables para que otra cambie. Cuando se estudian conjuntamente varias variables se entra en el campo de la estadística multivariable (muchas variables). Si el estudio se reduce a dos variables, como en este tema, se llama estadística bidimensional. La estadística bidimensional estudia fenómenos en los que intervienen dos variables conjuntamente, buscando la relación que existe entre ambas. Así, por ejemplo, se puede estudiar la influencia que tienen los ingresos de una determinada familia en los gastos que tiene, o cómo influye la velocidad de un cierto automóvil en su consumo de combustible, o qué relación existe entre los pesos y las estaturas de un grupo de personas. Una variable bidimensional se representa por un par (X, Y), donde X es la primera variable y toma los valores x 1 , x 2 , x 3 , ...,xn e Y la segunda y toma los valores, y 1 , y 2 , y 3 , ...,y (^) n. Sin embargo, al considerar dos variables de una población o muestra, no podemos afirmar que se trata de una variable bidimensional porque la relación entre las variables puede no ser estadística. Así, entre dos variables puede existir:

 Dependencia Funcional.

Cuando es posible predecir con exactitud los valores de una variable a partir de los de la otra, se dice que ambas variables están en relación funcional. Dada la variable (X,Y) existirá una función f(x) tal que y (^) i = f(xi). Para cada valor de x se puede conocer el valor de y. Ejemplo: a) La altura desde la que cae un cuerpo y el tiempo que tarda en llegar al suelo está sujeto a la ley de la gravedad. Siempre tarda lo mismo en recorrer el mismo espacio. b) El precio de una tela es función del coste del metro de tela y del número de metros.

 Independencia o Incorrelación.

Cuando las dos variables no tienen ninguna relación entre ellas y podemos estudiarlas por separado. Ejemplo: a) La estatura y la nota de matemáticas. b) La nota en selectividad y el número de letras del nombre.

 Dependencia estadística o correlación.

Cuando no podemos establecer una relación funcional pero tampoco podemos afirmar que no existe interrelación, se dice que están en relación estadística. Lo que nos proponemos a lo largo de estos apartados es determinar el grado de correlación que existe entre las variables. Ejemplo: a) De un colectivo se anota el número de horas de sueño y la edad de cada individuo. Hay una tendencia general a afirmar que a mayor edad menos horas de sueño, pero no podemos afirmar con exactitud que a X años le corresponden Y horas de sueño. b) Otro ejemplo de relación estadística es el nº de cigarrillos consumidos y el riesgo de fallo cardiaco.

Observa esta nueva tabla en la que se ha añadido una fila y una columna más con los totales:

Y \ X 0 1 2 3 4 5 6 7 8 9 10 Total

Total 0 1 2 4 4 5 2 7 2 3 0 30

1.3.-Distribuciones marginales

Se denomina distribución marginal de una variable bidimensional a la distribución que se obtiene al estudiar independientemente cada variable. Si tomamos la primera columna y la última columna en la tabla anterior, obtenemos la distribución de frecuencias marginales de la variable estadística Y :

Y 0 1 2 3 4 5 6 7 8 9 10

ni 1 2 4 0 3 7 3 3 2 3 2

Si tomamos la primera fila y la última, obtenemos la distribución de frecuencias de X :

X 0 1 2 3 4 5 6 7 8 9 10

n’j 0 1 2 4 4 5 2 7 2 3 0

Con estas distribuciones podemos calcular los mismos parámetros estadísticos que calculamos para las distribuciones unidimensionales.

Las medias marginales son: x

x n

N

y

x n

N

i i i

p j i i

q

= =^ = =

∑ •^ ∑ •^ ' 1 1

Varianzas marginales son:

S ( ) ( )

x x n

N

x x S

y y n

N

x y^ y

i i i y

j j 2 2 2 2 j 2 2

∑ (^ ) • ∑

1.4.-Vector de medias.

Sea (X,Y) una distribución estadística bidimensional. Al par ( x y , ) se le denomina vector de medias

o centro de gravedad de la distribución.

Ejercicios : 1) Un vendedor de helados anota durante doce días la temperatura (T) a las doce de la mañana y el número de bloques vendidos (V) en ese día, obteniendo los siguientes valores: (30 0 ,10), (27 0 ,8), (28 0 ,9), (27 0 ,8), (30 0 ,10), (31 0 ,11), (27 0 ,9), (28 0 ,10), (29 0 ,11), (30 0 ,11), (29 0 ,12), (30 0 ,10). Escribe la distribución de frecuencias de la variable bidimensional (T,V) en forma de tabla de doble entrada. Escribe las distribuciones marginales de la distribución anterior y calcula la temperatura media y el número medio de bloques vendidos. Calcula en las dos distribuciones marginales la varianza y la desviación típica.

  1. Hemos preguntado a los 20 alumnos de una clase el número de horas semanales que dedican al estudio (E) y el número de horas semanales que ven televisión (T):

E 2 5 6 5 3 1 4 0 2 1 3 4 3 2 1 1 2 4 0 1

T 1 7 2 7 6 9 5 5 9 6 7 5 6 8 5 5 9 5 5 8 Construye una tabla de doble entrada. escribe las distribuciones marginales de ambas variables y calcula sus medias y varianza.

3) Las alturas (X) y los pesos (Y) de 25 personas son los siguientes:

X (Kgr.) [60-65) [60-65) [65-70) [65-70) [65-70 ) Y (Cm.) [165-170) [170-175) [165-170) [170-175) [175-180) Frecuencia 1 3 2 4 2

X (Kgr.) [70-75) [70-75) [70-75) [75-80) [80-85) Y (Cm.) [165-170) [170-175) [175-180) [170-175) [170-175) Frecuencia 1 4 3 3 2

Expresa estos resultados mediante una tabla de doble entrada. Escribe las distribuciones marginales y calcula sus medias y varianzas (toma como valor de cada intervalo el punto medio, Marca de clase).

1.5.-Distribuciones condicionadas

Son las distribuciones que se obtienen al fijar un valor en una de las variables y estudiar las frecuencias correspondientes a la otra. Por ejemplo la distribución de la variable Y para el valor X=xi. La distribución que se obtiene es unidimensional.

1.6.-Covarianza: Concepto y cálculo. Matriz de covarianza.

Se llama covarianza de la variable (X,Y) a la media aritmética de los productos de las desviaciones de cada variable respecto de la media.. También se le denomina varianza conjunta o sincronizada de las variables X e Y. La covarianza es la medida más simple de la relación lineal entre dos variables. Viene dada

por: σ (^) xy i i

j j

r i j

i i j

j

x x y y f x y

x x y y n

N

ij

∑ ∑

,

2.- Introducción a la regresión lineal

2.1.- Idea intuitiva del ajuste de una linea a un diagrama de dispersión

La regresión es el estudio de los métodos de ajuste de una curva conocida a una nube de puntos. La regresión calcula la expresión matemática de la curva que más se aproxima, o que mejor se ajusta, a la nube de puntos. Trata, por lo tanto, de averiguar cuál es la función que refleja del modo más exacto la relación entre ambas variables. Esto nos permitirá estimar y predecir valores para una de las variables a partir de los valores de la otra. Regresión lineal: La regresión lineal estudia los distintos métodos, o técnicas, de ajustar una recta a una nube de puntos.

2.2 Recta de regresión: Significado y cálculo de la recta de regresión de y sobre x.

Cálculo de la recta de regresión de x sobre y.

Dada una nube de puntos, la recta de regresión que mejor se ajuste a ella tendrá una ecuación de la forma y = Ax + B. Para obtener los valores de A y B, se impondrán dos condiciones: 1.- Gravedad de la nube de puntos. Esta condición implica que la recta de regresión pasa por

el punto ( , )es decir su ecuación será. Sólo queda por determinar el

_ _ x y yy = A xx

_ _

  • ( ) valor de la pendiente de la recta, A. 2.- A cada punto P (^) i, de coordenadas (xi, y (^) i), perteneciente a la nube de puntos, le corresponde,

en la recta, el punto P i' de coordenadas (xi, y’ i). Si se llamamos Di a la diferencia yi - y’i, se

impondrá la condición de que la suma de los cuadrados de estas diferencias sea mínima.

Puesto que el punto ( xi,y’ i ) pertenece a la recta se verifica que y ' i y A • ( x i x )

_ _

Como D (^) i^2 tiene que ser mínimo, para cometer el menor error. Entonces la derivada de

D i y y y A x x y con respecto a “A” debe de ser 0. De esta

i

i i i

i i i

2 2

2

∑ =^ ∑ −^ =^ ∑ +^ −^ −

_ _

condición, y mediante un tratamiento matemático, se deduce que el valor de A debe ser A = S (^) xy / Sx^2. Por lo tanto la recta de regresión de y sobre x es:

y y esta ecuación permite aproximar valores de y conocidos los de x.

S

S

x x

xy x

_ _

2 (^ )

Al valor se le denomina Coeficiente de regresión de Y sobre X

S

S

xy

x

2

Del mismo modo obtenemos la ecuación de la recta de regresión de x sobre y que será:

x x que permite aproximar valores de x conociendo los de y.

S

S

y y

xy y

_ _

2 (^ )

Al valor se le denomina Coeficiente de regresión de X sobre Y

S

S

xy

y

2

El método de obtención de esta recta, minimizando la suma de los cuadrados de las diferencias yi - y’i, se denomina método de mínimos cuadrados y la recta de regresión se llama también recta de mínimos cuadrados.

L Los valores de la aproximación serán mejores si el coeficiente de correlación se acerca a 1 o

 Interpolación y extrapolación.

La recta de regresión puede utilizarse para predecir el valor de Y que corresponde a un determinado valor de X conocido. Se llama interpolación a la estimación de un valor de la variable Y para un cierto valor de X, dentro de su recorrido. Se llama extrapolación a la estimación de un valor de Y, para un cierto valor de X fuera de su recorrido. Ejemplo: Realizamos un experimento que consiste en suministrar a cada una de 10 ratas una dosis diaria de 1 mg, 2 mg, 3 mg, ...., 10 mg, respectivamente, de un cierto fármaco A, y calculamos el aumento de peso de cada rata después de un mes. Realizamos el mismo experimento con otras 10 ratas y otro fármaco B. Y por último un tercer experimento con otras 10 ratas y otro fármaco C. Los resultados gráficamente son: A la vista de las tres gráficas, nos inclinamos a pensar que A favorece el engorde de las ratas, B no influye y C es perjudicial. La correlación de la gráfica 1 es positiva y la de la 3 es negativa, igual que las pendientes de las rectas de regresión correspondientes. En la segunda gráfica se observa que la nube de puntos es amorfa y no sugiere ninguna recta. No hay correlación entre las variables. Se dice que son Incorreladas.