Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Correlación lineal, Diapositivas de Estadística

formulas de correlacion lineal

Tipo: Diapositivas

2020/2021

Subido el 26/08/2021

naomi-shafira-prado-hinojosa
naomi-shafira-prado-hinojosa 🇧🇴

1 documento

1 / 25

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Capítulo 4: Correlación y Regresión
Ing. Carmen Rosario Domínguez Blanco
1
UNIVERSIDAD MAYOR DE SAN SIMÓN
FACULTAD DE CIENCIAS Y TECNOLOGÍA
DEPARTAMENTO DE MATEMÁTICAS
CURSO DE VERANO 3/2020
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19

Vista previa parcial del texto

¡Descarga Correlación lineal y más Diapositivas en PDF de Estadística solo en Docsity!

Capítulo 4: Correlación y Regresión

Ing. Carmen Rosario Domínguez Blanco [email protected]

UNIVERSIDAD MAYOR DE SAN SIMÓN

FACULTAD DE CIENCIAS Y TECNOLOGÍA DEPARTAMENTO DE MATEMÁTICAS CURSO DE VERANO 3/

4.1 Introducción

 Este capítulo tiene el objetivo de determinar si hay una relación entre las dos variables; en caso de existir tal relación, queremos describirla con una ecuación que permita hacer predicciones.

 Investigaremos la correlación por medio del diagrama de dispersión (una gráfica) y el coeficiente de correlación lineal (una medida de la dirección y el poder de la asociación lineal entre dos variables).

 describiremos la relación entre dos variables

 con una ecuación que las relaciona y mostraremos cómo utilizar esa ecuación para predecir valores de una variable cuando conocemos los valores de la otra variable.

4.3 Diagrama de Dispersión

El diagrama de dispersión permite estudiar la relación entre dos variables, como se puede observar en la figura Las gráficas en la figura a, b y c describen un patrón de valores crecientes de y , que corresponde a valores crecientes de x. Conforme vamos de a a c , el patrón de puntos se aproxima a una línea recta, lo que sugiere que la relación entre x y y se hace más fuerte

Diagrama de Dispersión

 Los diagramas de dispersión en d , e y f describen patrones en los que los valores de y disminuyen mientras los de x aumentan. Nuevamente, conforme vamos de d a f , la relación se hace más fuerte. En contraste con las primeras seis gráficas, el diagrama de dispersión de g no presenta ningún patrón.Y h representa una relación No lineal.

Cálculo de Coeficiente de Correlación de Pearson

 De igual manera se puede utilizar la ecuación siguiente, en caso de no ( )( )^ conocer la media de^ x^ e^ y ( ) x y

i n S S

x x y y r − 1

− − = 

x y

 También se puede calcular empleando la siguiente formula:

Donde: = Media de x = Media de y Sx = Desviación típica de x Sy = Desviación típica de y n = Tamaño de la muestra

 2 (^ )^2 *^ ^2 (^ )^2

   − −

i i i i

i i i i n x x n y y

n x y x y

n

x x S

n x =^  i =^1 i^ −

( )^2

n

y y S

n y =^  i =^1 i^ −

( )^2

Fórmulas

Ejemplo 1

 En pruebas diseñadas para medir el efecto de cierto aditivo en el tiempo de secado de pintura se obtuvieron los siguientes datos.

Con estos datos, se pide:

a) Graficar el diagrama de dispersión correspondiente b) Calcular la covarianza. c) Calcular el coeficiente de correlación, e interpretar su resultado.

Concentración de aditivo % 4.0 4.2 4.4 4.6 4.8 5.0 5.2 5.4 5.6 5. Tiempo de secado(horas) 8.7 8.8 8.3 8.7 8.1 8.0 8.1 7.7 7.5 7.

x y

11

a) Diagrama de Dispersión:

6.2 6 6.4^ 6.

6.8^7

7.2^ 7.

7.6^ 7.

8.2 8 8.4^ 8.

8.8^9

9.2^ 9.

9.6^ 9.

10

3.6 3.8 4 4.2 4.4 4.6 4.8 5 5.2 5.4 5.6 5.8 6

Y:Tiempo de Secado [hrs]

X: Concentración de aditivo [%]

Concentración de aditivo % x 4.0 4.2 4.4 4.6 4.8 5.0 5.2 5.4 5.6 5. Tiempo de secado(horas) y 8.7 8.8 8.3 8.7 8.1 8.0 8.1 7.7 7.5 7.

b) Covarianza

C) Coeficiente de Correlación

La correlación es excelente negativa NOTA: Algunos resultados se obtuvieron directamente con calculadora.

( ) ( )

( 4 , 9 )( 8 , 11 ) 0 , 275 10

σ^394 ,^64

σ

== − = −

=  −

xy

i i xy (^) n x y

x y

( )( )

0 , 941 0 , 5744 0 , 5088

= −^0 ,^275 =−  

x y

r xy

Regresión de una Función Lineal por Mínimos Cuadrados

 La ecuación de ajuste lineal es:

 Este modelo describe una relación determinista entre la variable de interés y (variable de respuesta o dependiente) , y la variable independiente x , ( variable de pronóstico o independiente).  La ecuación lineal determina un valor exacto de y cuando se da el valor de x.

y = a + bx

Regresión de una Función Lineal por Mínimos Cuadrados

 Si b < 0 la pendiente de la recta es negativa por lo tanto la recta es decreciente, esto significa que a medida que “ x” aumenta, y” disminuye, y por lo tanto el coeficiente de correlación r también será negativa.  Si b > 0 la pendiente de la recta es positiva por lo tanto la recta es creciente, esto significa que a medida que “ x” aumenta, y” aumenta también, y por lo tanto el coeficiente de correlación r también será positiva.  SI b = 0 La recta es una constante y = a.

 Para la determinación de la ecuación lineal:

 Los coeficientes a y b se calculan con las siguientes formulas:

Donde: = Media de x = Media de y σxy= covarianza entre x e y σ²y = Varianza de x n =Tamaño de la muestra

a = y − b x 2

x

b xy

x

y

y = a + bx

4.7 Coeficiente de Determinación

 El coeficiente de determinación es la cantidad de variación en y que está explicada por la recta de regresión.

 También se calcula elevando al cuadrado el coeficiente de correlación de Pearson.:

 Es importante saber que el resultado del coeficiente de determinación oscila entre 0 y 1. Cuanto más cerca de 1 se sitúe su valor, mayor será el ajuste del modelo a la variable que estamos intentando explicar. De forma inversa, cuanto más cerca de cero, menos ajustado estará el modelo y, por tanto, menos fiable será.

( )( ) ( )

2 2

2 2 1 

=  x y

i x y

xy n S S

x x y y r o r

( y y )

y y Variación Total

r Variación Explicada

4.8. Residuales y la propiedad de los mínimos cuadrados

 Para una muestra de datos apareados ( x,y ), un residual es la diferencia entre un valor de y observado y el valor de y calculado o predicho por medio de la ecuación de regresión. Es decir:

 Residual = y (^) observadoy (^) calculado Residual =

( y − y ˆ)

y ˆ

( yy ˆ) PROPIEDAD DE LOS MÍNIMOS CUADRADOS : Una recta satisface la propiedad de mínimos cuadrados si la suma de los cuadrados de los residuales es la menor suma posible.

4.9 Error Cuadrático Medio

 Es una técnica, en la que dados un conjunto de datos, se intenta encontrar la

función que mejor se aproxime a los datos de acuerdo al criterio de mínimos

cuadrados.

 El que tenga menor valor del Error cuadrático medio es el modelo que se

ajusta más.

 Se calcula así:

Donde:

n

y y

n

e

ECM ^  i i

2 ˆ^2

y valor de "y" calculado

y valor de y observado

i

i

= ˆ

" "

Ejemplo 2

Con los datos del ejemplo 1 :

a) Halle la ecuación de ajuste lineal del tiempo de secado en función del

porcentaje de concentración de aditivo en la pintura.

b) Calcular el coeficiente de determinación e interpretar.

c) Calcular el Error cuadrático medio para cada modelo de regresión y

determinar cual es el que mejor se ajusta a los datos observados.

d) Si la concentración del aditivo en la pintura fuera del 6.0 %, ¿cuál sería el

tiempo estimado de secado? Utilice el modelo que más se ajusta a los datos

observados.

Concentración de aditivo % 4.0 4.2 4.4 4.6 4.8 5.0 5.2 5.4 5.6 5. Tiempo de secado(horas) 8.7 8.8 8.3 8.7 8.1 8.0 8.1 7.7 7.5 7.