Regresión y correlación - Prácticas - Estadística Matemática - Estadística, Ejercicios de Estadística Matemática. Universidad de Salamanca (USAL)
empanadilla
empanadilla13 de noviembre de 2012

Regresión y correlación - Prácticas - Estadística Matemática - Estadística, Ejercicios de Estadística Matemática. Universidad de Salamanca (USAL)

PDF (84 KB)
58 pages
2Número de download
1000+Número de visitas
Descripción
Prácticas de Estadística. Ejercitaciones y ejercicios. La regresión y la correlación son dos técnicas estrechamente relacionadas y comprenden una forma de estimación.
20 Puntos
Puntos download necesarios para descargar
este documento
descarga el documento
Pre-visualización3 pages / 58

Esta solo es una pre-visualización

3 páginas mostradas de 58 páginas totales

descarga el documento

Esta solo es una pre-visualización

3 páginas mostradas de 58 páginas totales

descarga el documento

Esta solo es una pre-visualización

3 páginas mostradas de 58 páginas totales

descarga el documento

Esta solo es una pre-visualización

3 páginas mostradas de 58 páginas totales

descarga el documento

Regresión y Correlación

La regresión y la correlación son dos técnicas estrechamente relacionadas y comprenden una forma de estimación.

En forma más especifica el análisis de correlación y regresión comprende el análisis de los datos muestrales para saber que es y como se relacionan entre si dos o mas variables en una población. El análisis de correlación produce un número que resume el grado de la correlación entre dos variables; y el análisis de regresión da lugar a una ecuación matemática que describe dicha relación.

El análisis de correlación generalmente resulta útil para un trabajo de exploración cuando un investigador o analista trata de determinar que variables son potenciales importantes, el interés radica básicamente en la fuerza de la relación. La correlación mide la fuerza de una entre variables; la regresión da lugar a una ecuación que describe dicha relación en términos matemáticos

Los datos necesarios para análisis de regresión y correlación provienen de observaciones de variables relacionadas.

Regresión lineal

La regresión lineal simple comprende el intento de desarrollar una línea recta o ecuación matemática lineal que describe la reacción entre dos variables.

La regresión puede utilizadas de diversas formas. Se emplean en situaciones en la que las dos variables miden aproximadamente lo mismo, pero en las que una variable es relativamente costosa, o, por el contrario, es poco interesante trabajar con ella, mientras que con la otra variable no ocurre lo mismo.

La finalidad de una ecuación de regresión seria estimar los valores de una variable con base en los valores conocidos de la otra.

Otra forma de emplear una ecuación de regresión es para explicar los valores de una variable en término de otra. Es decir se puede intuir una relación de causa y efecto entre dos variables. El análisis de regresión únicamente indica qué relación matemática podría haber, de existir una. Ni con regresión ni con la correlación se pude establecer si una variable tiene causa ciertos valores de otra variable.

Ecuación Lineal

Dos características importantes de una ecuación lineal

la independencia de la recta• la localización de la recta en algún punto. Una ecuación lineal tiene la forma•

y = a + bx

En la que a y b son valores que se determina a partir de los datos de la muestra; a indica la altura de la recta en x= 0, y b señala su pendiente. La variable y es la que se habrá de predecir, y x es la variable predictora.

Determinación de la ecuación matemática

En la regresión, los valores de y son predichos a partir de valores de x dados o conocidos. La variable y

1

recibe le nombre variable dependiente y la variable x, el de variable independiente.

Métodos de mínimos cuadrados

EL procedimiento mas utilizado por adaptar una recta aun conjunto de punto se le que conoce como método de mínimos cuadrados. La recta resultante presenta 2 característica importantes

es nula la suma desviaciones verticales en los puntos a partir de la recta• es mínima la suma de los cuadrados de dicha desviaciones•



(yi − yc)2

En el cual

Yi = valor esperado de y

Yc= valor calculado de y utilizando la ecuación de mínimos cuadrados con el valor correspondientes x para yi

Los valores de a y b para la recta es Yc = a + bx que minimiza la suma de los cuadrados de la desviación ecuaciones normales

y = na + (x)

xy= a (x) +b (x2)

En las que n es el numero de pares de observaciones. Evaluando las cantidades x, y, etc. Se puede resolver estas dos ecuaciones simultáneamente para determinar a b. la ecuaciones puede despejarse. Se obtuvieron dos formulas aun para a y otra para b.

n(xy)− (x)(y)

b=

n(x2)−(x)2

y − b x

a=

n

Inferencia en el análisis de regresión

Los supuestos para el análisis de regresión son como:

Existen datos de medición para a x y z.la variable dependiente es una variable aleatoria.para cada valor de x, existe una distribución condicional de la qué es de naturaleza normalla desviación estándar de toda las distribuciones condicionales son iguales

2

EL error estándar de estimación

La determinante primaria de la exactitud es el grado de dispersión de la población: cuanto mas dispersa este, menor será la exactitud de la estimación. El grado de dispersión en la población se puede estimar a partir del grado de dispersión en las observaciones de la muestra con respecto a la línea de regresión calculada, utilizando la formula.

Se = " (yi −yc)

n−2

en la cual:

yi = cada valor de y

yc = valor de línea de regresión correspondiente a partir de la ecuación de regresión.

n = números de observaciones.

La formula anterior no se utiliza por lo general para cálculos reales, es mas fácil trabajar con la formula simplificada

Se "y2 − a y − b xy

n − 2

Inferencia de acerca de la pendiente de una línea de regresión

Aun cuando es muy poca o nula relación entre dos variables de aun población, es posible obtener valores maestrales que hacen que parezca que la variables están relacionadas, es importantes probar los resultados tales de caculo, a fin determinar si son significativos (es decir si los parámetros verdaderos no son cero), Si no existe ninguna relación se esperaría obtener aun pendiente cero, se pone a prueba la hipótesis nula contra la hipótesis alternativa.

La significación del coeficiente de regresión se puede probar comparándolo con su desviación estándar

t = valor de la muestra − valor esperado

Desviación estándar

Análisis de regresión lineal múltiple

La regresión múltiple comprende tres o más variables. Existe solo una variable dependiente, pero hay dos o mas tipo independiente. Esta operación al desarrollo de una ecuación que se pede utilizar para predecir valore de y, respecto a valores dados de la diferencia variables independientes adicionales es incrementar la capacidad predicativa sobre la de la regresión lineal simple.

Las técnicas de los mínimos cuadrados se utilizan para obtener ecuaciones de regresión.

Yc= a +b1x1+b2x2+bkxk

a = ordenada en el origen

3

b1= pendiente

k = numero de variables independientes

Un análisis de regresión simple de dos variable da lugar a la ecuación de una recta, un problema de tres variables produce un plano, y un problema de k variables implica un hiperplano de a

(k +1) dimensiones.

Análisis de Correlación

EL objetivo de un estudio de correlación es determinar la consistencia de una relación entre observaciones por partes. EL termino correlación significa relación mutua, ye que indica el grado en el que los valores de una variable se relacionan con los valores de otra. Se considera tres técnicas de correlación uno para datos de medición, otro para datos jerarquizados y el último para clasificaciones nominales.

Datos Continuos: r de Pearson

EL grado de relación entre dos variables continuas se resume mediante un coeficiente de correlación que se conoce como r de Pearson en honor del gran matemático Kart Pearson, quien ideo este método. Esta técnica es valida mientras si es posible establecer ciertos supuestos bastante estrictos. Tales supuestos son los siguientes:

Tanto x como y son variables continuas aleatorias. Es decir, a diferencia del análisis de referencia de regresión, no es aceptable seleccionar ciertos valores de x, y después medir y; tanto y como x deben de variar libremente.

La distribución conjunta de frecuencia es normal. Esto recibe el nombre de de distribución normal divariada.

Carácter de r

El coeficiente de relación presenta dos propiedades que establecen la naturaleza de una relación entre dos variables. Una es su signo (+ o −) y la otra, es su magnitud. El signo es igual al de la pendiente de una recta que podría ajustarse a los datos si estos se graficaran en un diagrama de dispersión, y la magnitud de r indica cuan cerca esta de la recta tales puntos.

Método practicar para calcular r

Dado que los cálculos necesarios pueden requerir mucho tiempo especialmente cuando se resta las medias del grupo de cada observación se elevan a cuadrado esas diferencias. Existe una versión, la cual simplifica los cálculos:

r= n ("xy)−("x)("y) _

"n("x2)−("x)2 ·"n("y2)("y)2

Existen 3 formas posibles para obtener el valor de r en el caso de datos de medición: estandarizar cada conjunto y hallar el producto medio, calcular el coeficiente de determinación r2 y obtener su raíz cuadrada como utilizar la formula. Para un conjunto de datos los tres métodos producirán el mismo valor para r no obstante cada método agrega algo a la comprensión del significado del termino correlación

Inferencia acerca del coeficiente de correlación

4

Intervalo de confianza para la correlación de la población

El valor del coeficiente de correlación de la muestra se puede utilizar como un estimado de la correlación verdadera de población  existen varios métodos para obtener un método de confianza para  pero quizás la forma mas directa es usar un diagrama.

Si se examinan el diagrama se observara que el intervalo de los valores potenciales (no conocidos)  se indica a lo largo de la escala vertical los posibles valores r de la muestra se indica en la escala inferior una serie de curvas representan tamaño de muestras seleccionadas.

Prueba de significación de r

Puede ser necesario evaluar una aseveración con respecto al valor de . La forma mas sencilla es obtener un intervalo de confianza para r y observar si el valor propuesto esta incluido en el intervalo de ser así se rechaza a Ho y se acepta la alternativa.

Datos jerarquizados de: r Spearman

Es una técnica no paramétrica que utiliza para medir la fuerza de una relación por pares de 2 variables cuando los datos se encuentran en forma jerarquizados. El objeto de calcular un coeficiente de correlación estos ejemplos es determinar el grado en el que dos conjuntos de jerarquización concuerdan o no. Esta técnica también se puede extender a calificaciones u otro tipo de medición si estas se convierten a rangos.

Las medidas de l grado de concordancia son sol cuadrados de las diferencias entre los dos conjuntos de rangos: si la suma de éstos es pequeña, esto significa que hay acuerdo; si la suma es grande, esto indica lo contrario. EL calculo real de la correlación comprende la formula.

rsp = 1 − 6"d2

n(n2 −1)

En la cual n es el número de observaciones y "d2 es la suma de los cuadrados de la diferencia entre los rangos. El coeficiente de correlación de jerarquía obtenido recibe el nombre de r Spearman. La suma de la diferencia es cero. Esto no sirve como una comprobación útil de los cálculos aunque no es necesaria en la fórmula.

El procedimiento es como el siguiente:

Obtener la diferencia en rango para cada par de observaciones• Como comprobaciones, verificar que la diferencias se sumen a 0• elevar el cuadrado la diferencias• sumar los cuadrados de la diferencia para obtener "d2• Calcular rsp•

Si el valor rsp es pequeño para situaciones en donde n es mayor que 10, la hipótesis nula de rsp = 0 puede ser probada utilizándola la fórmula

rsp − 0

t=

"(1− rsp 2) (n −2)

5

Datos nominales: el coeficiente de contingencia

Cuando ambas variables se miden en escalas nominales ( es decir , categorías ) , el análisis es fácilmente mediante el desarrollo de una tabla de contingencia semejante a la que se utilizo en el análisis de k proporciones ( prueba de ji cuadrada ), el procedimiento en realidad de aun extensión del análisis de una tabla r * k.

Una medida de relación es calcular el coeficiente de contingencia en C, donde

x2

C=

X2 + N

Un aspecto interesante de una tabla ji cuadrada es que l tamaño máximo posible de x2 es función de N, de las observaciones y del tamaño de la tabla.

En le caso de tabla con los valores cuadrado, esto lleva obtener un valor máximo de C de

K − 1

C max =

k

En el cual k es el número de fila o columnas. La comprar C con C max se pude obtener una idea de la intensidad de la asociación entre la variables.

Esta es una relación moderada, no muy intensa. Su interpretación exacta en parte de la naturaleza de los datos y de los resultados comparables que se obtengan de otros estudios, por lo que es difícil establecer valores definitivos dé intensidades.

Se bebe observar que la formula no fórmula no produce automáticamente el signo del coeficiente de contingencia. DE ahí que no siempre resulte evidente el existe aun relación positiva o negativa.

Ventajas:

Nos e requiere de supuestos con respectos a la formula de población• Solamente se necesita una medición nominal ( categorías)•

Limitaciones

El limite superior de C es menor que 1.00 incluso Para un correlación perfecta.• El límite superior depende del tamaño de la tabla, por lo que no son comparables los coeficientes de contingencia de tablas de tamaño diferente

El coeficiente de contingencia no es directamente comprable con otras medidas de correlación, como la r de Pearson y la r de Spearman, o incluso con otras tablas de contingencia de tamaño diferente.

Cada casilla deberá tener una frecuencia esperada por lo menos 5.• C max solamente se puede calcular a partir de tabla de valores al cuadrado•

EJERCICIOS PAG. 411

6

1.− Cual es la ecuación de una recta con las siguientes características?

pendiente 10.2 y ordenada en el origen 5.0.•

Yc=5 + 10.2x.

pendiente 55 y ordenada en el origen 0.•

Yc=55x.

Pendiente 27 y ordenada en el origen −2.•

Yc=−2 + 27x.

Pendiente −13 y ordenada en el origen 200.•

Yc=200 − 13x.

Pendiente 0 y ordenada en el origen 2.4.•

Yc=2.4

2.− Calcule los valores de a y b en la ecuación lineal yc =a+bx apartir de las gráficas de la fig. 14.4.

Yc= 6+(7.5/500)x Yc=−1 +(12/4)x

EJERCICIOS PAG. 416

1.− Suponga que una cadena de supermercados financia un estudio sobre los gastos anuales en comestibles de familias de cuatro miembros. La investigación se limitó a familias con ingresos netos que van de $ 8,000 a $ 20,000 dólares. Se obtuvo la siguiente ecuación:

yc =−200 + .10x

y = gastos anuales estimados

x = ingresos netos anuales

Estime los gastos de una familia de cuatro miembros con un ingreso anual de $15,000.•

Como queremos estimar el gasto anual, se sustituye el valor de los ingresos(x) en la ecuación y queda así:

Yc = −200 + .10(15,000)

Yc = −200 + 1500

Yc= 1300

Uno de los vicepresidentes se preocupa por el hecho de que aparentemente la ecuación indica que una familia con ingreso de $2,000 no gastaría nada en alimentos. ¿Cuál sería su respuesta?

7

La respuesta es que no tiene de que preocuparse ya que el gasto está estimado para familias con ingresos de 8000 a 20000 dlls.

Explique porqué no se podría utilizar en los siguientes casos:•

1) estimación en los gastos de familias de cinco miembros.

No es posible ya que la ecuación está calculada para una familia de cuatro miembros.

2) estimación en los gastos de familias cuyos ingresos netos van de $20,000 a $35,000.

No se puede porque la formula se calculo para sueldos menores o iguales a 20,000.

d. Grafique la ecuación.

2.− Un bufete de ingenieros consultores ha establecido la siguiente relación con respecto al rendimiento por galón de automóviles estadounidenses de 6 cilindros, cuyo peso varía de 1500 a 3000 libras:

yc=30 − 0.002x

y=rendimiento millas/galón

x=peso del vehículo

Represente esta relación con una gráfica y marque los ejes.•

Estime el consumo de gasolina X milla para un auto de peso:•

Sustituimos en la formula:

1)2000 lb yc=30 − 0.002(2000)=26

2)1500 lb yc=30 − 0.002(1500)=27

3)2500 lb yc=30 − 0.002(2500)=25

3.− Emplee los siguientes valores de resumen para determinar las ecuaciones de regresión:

a. "x=200, "y=300, "xy=6200, "x2=3600, n=20.

b= 20(6200)−(200)(300)

20(3600)−(200)2

b= 2

a=300−b(200)

20

a=−5

8

Yc = −5 +2x

b. "x=7.2, "y=37, "xy=3100, "x2=620, n=36.

b= 36(3100)−(7.2)(37)

36(620)−(7.2)2

b= 5

a=37−b(7.2)

36

a=.028

Yc = 5 +.028x

c. "x=700, "y=−250, "xy=−1400, "x2=21000, n=30.

b= 30(−1400)−(700)(−250)

30(21000)−(700)2

b= .95

a=−250−b(700)

30

a=−30.5

Yc = −30.5 +.95x

d. "x=33, "y=207, "xy=525, "x2=750, n=40.

b= 40(525)−(33)(207)

40(750)−(33)2

b= .49

a=207−b(33)

40

a=4.77

Yc = 4.77 +x

4.− En el caso de cada conjunto represente estos en una gráfica y si parece apropiada una ecuación lineal, determine los coeficientes a y b a partir de los mismos.

9

a.

Tamaño Costo total

x y

20 3500

22 3000

25 2000

30 1600

40 1000

45 800

50 900

55 950

60 1100

63 1300

70 1500

Los datos siguen una tendencia polinomial.

b.

Ventas Ingresos

x y

150 15

201 17

225 20

305 21

370 19

380 23

450 21

510 22

560 25

600 24

685 27

725 30

735 27

"x=5896, "y=291, "xy=141502, "x2=3159126, n=13.

Como parece apropiada una ecuación lineal, se determinan los coeficientes a y b con la formula:

b= 13(141502)−(5896)(291)

13(3159126)−(5896)2

b=.2

10

a=291−b(5896)

13

a=13.48

Yc = 13.48+.2x

5.− Determine una ecuación que describa la relación entre la frecuencia de accidentes y el nivel de educación preventiva

X Y XY X2

150 8.00 1200 22500

200 7.00 1400 40000

300 6.50 1950 90000

450 5.20 2340 202500

500 6.40 3200 250000

600 4.40 2640 360000

800 4.00 3200 640000

900 3.10 2790 810000

3900 44.60 18720 2415000

n=8

Para encontrar la ecuación se sustituyen los valores en la formula:

b= 8(18720)−(3900)(44.6)

8(18720)−(3900)2

b=.006

a=44.6−b(3900)

8

a=8.44

Yc = 8.44+.006x

6.− Una compañía que tiene 15 tiendas ha recopilado datos en relación con los metros cuadrados de area de ventas respecto a los ingresos mensuales. Trace una gráfica de los datos, y si parece apropiado un modelo lineal determine la ecuación de regresión.

Tienda Metros 2 Ingreso

X Y XY X2

a 55 45 2475 3025

o 80 60 4800 6400

j 85 75 6375 7225

11

e 90 75 6750 8100

k 90 80 7200 8100

d 110 95 10450 12100

n 130 95 12350 16900

g 140 110 15400 19600

c 180 120 21600 32400

l 180 105 18900 32400

b 200 115 23000 40000

i 200 130 26000 40000

h 215 140 30100 46225

f 260 170 44200 67600

m 300 200 60000 90000

15 2315 1615 289600 430075

}Los datos serían:

"x=2315, "y=1615, "xy=289600, "x2=430075, n=15.

Y se sustituyen los valores en la formula:

b= 15(289600)−(2315)(1615)

15(430075)−(2315)2

b=.5543

a=1615−b(2315)

15

a=22.11

Yc = 22.11+.5543x

Y la grafica sería:

7.− Vuelva a resolver el ejercicio 5 utilizando accidentes como x y nivel horas instrucción. Como y compare la ecuación obtenida con la anterior.

Determine una ecuación que describa la relación entre la frecuencia de accidentes y el nivel de educación preventiva

Accidentes horas

X Y XY X2

3.10 900 2790 9.61

4.00 800 3200 16

4.40 600 2640 19.36

5.20 450 2340 27.04

12

6.40 500 3200 40.96

6.50 300 1950 42.25

7.00 200 1400 49

8.00 150 1200 64

44.60 3900.00 18720 268.22

n=8

Para encontrar la ecuación se sustituyen los valores en la formula:

b= 8(18720)−(44.6)(3900)

8(268.22)−(44.6)2

b=−154.4

a=3900−b(44.6)

8

a=1348

Yc = 1348−154.4x

8.− Teniendo:

X 1 2 3 4 5 6 7 28

Y 2 4 5 6 7 7 9 40

Utilice los datos para:

a. Calcular los coeficientes a y b de la ecuación.

X Y XY X2

1 2 2 1

2 4 8 4

3 5 15 9

4 6 24 16

5 7 35 25

6 7 42 36

7 9 63 49

28 40 189 140

b= 7(189)− (28)(40)

7(140)−(28)2

b=1.036

13

a= 40−b(28)

7

a=1.57

Yc = 1.57+1.036x

b. Duplicar cada valor de x y volver a calcular los coeficientes.

X Y XY X2

2 2 4 4

4 4 16 16

6 5 30 36

8 6 48 64

10 7 70 100

12 7 84 144

14 9 126 196

56 40 378 560

b= 7(378)−(56)(40)

7(560)−(56)2

b=.52

a= 40−b(56)

7

a=1.57

Yc = 1.57+.52x

c. Duplicar el valor original de x,y para evaluar de nuevo los coeficientes.

X Y XY X2

2 4 8 4

4 8 32 16

6 10 60 36

8 12 96 64

10 14 140 100

12 14 168 144

14 18 252 196

56 80 756 560

b= 7(756)−(56)(80)

14

7(560)−(56)2

b=1.036

a= 80−b(56)

7

a=3.14

Yc = 3.14+1.036x

d. Utilizar el valor original de x, pero agregando 2 a cada valor original de y, y recalcular la ecuación de regresión.

X Y XY X2

1 4 4 1

2 6 12 4

3 7 21 9

4 8 32 16

5 9 45 25

6 9 54 36

7 11 77 49

28 54 245 140

b= 7(245)−(28)(54)

7(140)−(28)2

b=1.036

a= 54−b(28)

7

a=3.57

Yc = 1.57+1.036x

9.− Determine una ecuación predictiva para calcular el monto del seguro, en función del ingreso anual para los siguientes datos:

Ingreso Prima

X Y XY X2

13 5 65 169

16 15 240 256

17 20 340 289

18 10 180 324

20 10 200 400

15

25 12 300 625

26 15 390 676

32 30 960 1024

38 40 1520 1444

40 50 2000 1600

42 40 1680 1764

287 247 7875 8571

b= 11(7875)−(287)(247)

11(8571)−(287)2

b=1.321

a= 247−b(287)

11

a=−12.01

Yc = −12.01+1.321x

EJERCICIOS PAGINA 435

1.− Determine qué pendientes para los siguientes datos son significativas al nivel 0.05. Utilice n−2 grados de libertad.

a) DATOS

b= 4

Sb=1

n=12

Solución:

n−2= 12−2= 10

tprueba= (b−0)/ Sb = (4−0)/1= 4

.025

=.05/2= .025

10 Tt= 2.228

Usando:

b − tSb " B " b + tSb

16

4−(2.228)(1) " 0 " 4+(2.228)(1)

! !

1.772 " 0 " 6.228

:. Es significativo

b) DATOS

b= −0.15

Sb=0.10

n= 20

Solución:

n−2= 20−2= 18

Tprueba= (−.015−0)/.10 = −1.5

.025

=.05/2= .025

2.101•

Usando:

b − tSb " B " b + tSb

−0.15−(2.101)(.10) " 0 " −0.15+(2.101)(.10)

! !

−0.3601 " 0 " 0.06

:. Se Acepta Ho

DATOS•

b= 1.2

Sb=0.6

n= 25

Solución:

n−2= 25−2= 23

17

Tprueba= (1.2−0)/0.6 = 2

.025

=.05/2= .025

2.069•

Usando:

b − tSb " B " b + tSb

1.2−(2.069)(0.6) " 0 " 1.2+(2.069)(0.6)

! !

−0.027 " 0 " 2.427

:. Se Acepta Ho

DATOS•

b= 0.6

Sb=0.2

n= 31

Solución:

n−2= 31−2= 29

Tprueba= (0.6−0)/0.2 = 3

.025

=.05/2= .025

29 2.045

Usando:

b − tSb " B " b + tSb

0.6−(2..045)(0.2) " 0 " 0.6+(2.045)(0.2)

! !

0.191 " 0 " 1.009

:. Es significativo

18

e) DATOS

b= −212

Sb=38

n= 50

Solución:

n>32 z

Tprueba= (−212−0)/38 = −5.57

.06

= .5−.025= .475

1.9 .475

Usando:

b − tSb " B " b + tSb

−212−(1.96)(38) " 0 " −212+(1.96)(38)

! !

−286.48 " 0 " −137.52

:. Es significativo

f) DATOS

b= .015

Sb=0.001

n= 100

Solución:

n>32 z

Tprueba= (.015−0)/0.001 = 15

0.06

=0.5−.025= 0.195

1.9 .475

19

Usando:

b−tSb " B " b+tSb

0.015−(1.96)(.001) " 0 " 0.015+(1.96)(.001)

! !

0.013 " 0 " 0.013

:. Se Acepta Ho

2.− Determine intervalos de confianza de 99% para cada uno de estos coeficientes de regresión, e indique qué pendientes son significativas.

DATOS•

b= 8.2

Sb= 4.1

n= 50

.495 .495

z=2.58

b − tSb " B " b + tSb

8.2−(2.58)(4.1) " 0 " 8.2+(2.58)(4.1)

−2.37 a 18.77

:. No significativo

DATOS•

b= .13

Sb= .04 .495 .495

n= 30

n−2= 30−2=28

= 0.5−.495=.005

.005

28 t= 2.763

b ± tSb

20

.13 ± (2.763)(.04)

0.02 a 0.2405

:. Significativo

DATOS•

b= 5.213

Sb= 1.50 .495 .495

n= 20

n−2= 20−2=18

2.87

b ± tSb

5.212 ± (2.87)(1.50)

0.908 a 9.518

:. Significativo

DATOS•

b= 145

Sb= 40 .495 .495

n= 60

z= 2.58

b ± tSb

145 ± (2.58)(40)

41.8 a 248.2

:. Significativo

DATOS•

b= −7.1

Sb= 3.0 .495 .495

n= 9

21

n−2= 9−2= 7

.005

7 3.499

b ± tSb

−7.1 ± (3.499)(3.0)

−17.59 a 3.39

:. No Significativo

3.− Utilizando los siguientes datos:

a) Calcular la ecuación de regresión

b) Calcular Se y después Sb.

Determinar si b es significativo, utilizando un intervalo de confianza con =0.05.

Calificaciones 1ª. Prueba 2ª. Prueba

A 80 78

B 95 90

C 88 85

D 98 98

E 94 90

F 74 76

G 81 80

H 86 78

I 90 89

J 69 62

Totales 855 826

y2=69,138

xy=71434

x2=73903

Ecuación de Regresión:•

Yc= a + bx

b= n(xy) −(x)( y)= 10 (71,434)− (855)(826) = 1.013

n(x2)−( x)2 10(73903)−(855)2

22

a= y −bx= 826−(1.013)(855)= −4.02

n 10

Yc= −4.02 + 1.013x

b) Calculo de Se y Sb

Se= y2 − ay − bxy = 69,138 − (−4.02)(826)−( 1.013)( 71434) =3.330

n−2 10−2

Sb= Se 1 _ =( 3.330) 1 _= 0.118

x2− [(x)2/n] 73903 − [(855)2/10]

=0.05•

0.025 b ± t Sb

1.013 ± (2.262)(.118)

0.746 a 1.28

8 2.262

:. Significativo

4.− Diga que ecuación escribiría los datos del ejercicio anterior, si la segunda calificación del examen en cada caso es exactamente igual a la primera.

b= n(xy) −(x)( y)= 10 (73903)− (855)(855) = 1

n(x2)−( x)2 10(73903)−(855)2

a= y −bx= 855−(1)(855)= 0

n 10

Yc= 1x

5.− Calcule r2 utilizando los datos del ejercicio 8, página 418.

x y

1 2

2 4

3 5

4 6

5 7

6 7

7 9

23

28 40

y2= 260

xy= 189

x2= 140

b= n(xy) −(x)( y)= 7 (189)− (28)( 40) = 1.03

n(x2)−( x)2 7(140)−( 28)2

a= y −bx= 40−(1.03)( 28)= 1.57

n 7

Se= 260− (1.57)(40)−( 1.03)( 189) =0.309

5

Se2= 0.095

Sy2= n(y2)−(y)2/n =7(260)−(40)2/7= 318.28

n−2 5

r2= 1− Se2 = 1− 0.095= 0.999

Sy2 318.28

6.− Explique por que el valor r2 nunca puede ser negativo

Porque r2= 1− Se2 ; y Se2 siempre debe ser menor que Sy2

Sy2

7.− Calcule r2 para cada uno de los siguientes casos:

a b c d e

Se2 14400 14400 2025 2025 606

Sy2 28800 57600 2500 2200 6060

a.− r2= 1− Se2 = 1− 14400 = 0.5

Sy2 28800

b.− r2= 1− Se2 = 1− 14400= 0.75

Sy2 57600

c.− r2= 1− Se2 = 1− 2025 = 0.19

24

Sy2 2500

d.− r2= 1− Se2 = 1− 2025 = 0.079

Sy2 2200

e.− r2= 1− Se2 = 1− 606 = 0.9

Sy2 6060

11.− Utilice la siguiente información para los cálculos:

Yc= 13 + 2x Se= 3 n=10

x= 40 x2=600

a) Estime un intervalo de confianza de 95% para el valor promedio (esperado) de y, si xg es:

Yc ± t(Se (1/n)+( xg−x)2 /{x2−[(x)2/n]})

DATOS:

1.0•

n−2= 10−2 = 8

Yc= 13+2(1) =15

X= x/n= 40/10= 4.0

.025

8 t= 2.306

SUSTITUYENDO EN LA FORMULA

15 ± 2.306 (3.0 (1/10)+( 1.0−4.0)2 /{600−[(40)2/10]})

± 2.306 (1.04)•

12.60 a 17.40

DATOS :

4.0•

Yc= 13+2(4) = 21

SUSTITUYENDO EN LA FORMULA

21 ± 2.306 (3.0 (1/10)+( 4.0−4.0)2 /{600−[(40)2/10]})

25

comentarios (0)

No hay comentarios

¡Escribe tu el primero!

Esta solo es una pre-visualización

3 páginas mostradas de 58 páginas totales

descarga el documento