Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Recta de regressió, Apuntes de Estadística Matemática

Asignatura: Estadística matemàtica, Profesor: Maite Rabena, Carrera: Matemàtiques, Universidad: UV

Tipo: Apuntes

Antes del 2010

Subido el 22/06/2007

xequebo2
xequebo2 🇪🇸

4

(212)

406 documentos

1 / 38

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Regressió lineal i correlació
1 Estadístics bàsics.
2 Ajustament de la recta de regressió.
3 Interpretació paramètrica de la regressió: el model lineal.
4 Inferència estadística sobre el pendent.
5 El coeficient de correlació.
6 Taula ANOVA en regressió.
7 Condicions per a la validesa dels mètodes presentats.
8 Regressió múltiple.
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26

Vista previa parcial del texto

¡Descarga Recta de regressió y más Apuntes en PDF de Estadística Matemática solo en Docsity!

Regressió lineal i correlació

1 Estadístics bàsics. 2 Ajustament de la recta de regressió. 3 Interpretació paramètrica de la regressió: el model lineal. 4 Inferència estadística sobre el pendent. 5 El coeficient de correlació. 6 Taula ANOVA en regressió. 7 Condicions per a la validesa dels mètodes presentats. 8 Regressió múltiple.

INTRODUCCIÓ

Considerem ara estudis en que:

  • Intervenen 2 variables QUANTITATIVES, X i Y****.
  • L’objectiu és analitzar la relació entre X i Y.
  • Les tècniques de REGRESSIÓ LINEAL i CORRELACIÓ es basen en l’ ajust d’una línia recta a les dades per tal d’explicar la relació entre X i Y.
  • Les observacions de X i Y poden ser de dos tipus;
    • Els valors de la variable X són especificats per l’experimentador i per a cada valor de X es tria individus amb aquest valor de X i s’observa aleatòriament el seu valor de la variable Y.
    • Les dues variables X i Y són aleatòries. Es tria a l’atzar n individus i s’observa els seus valors de X i Y.
  • En els dos casos els càlculs són iguals però la interpretació pot ser diferent.

EXEMPLE. AMFETAMINES I CONSUM DE MENJAR

Les amfetamines són fàrmacs que inhibeixen la gana de menjar. En un estudi

sobre aquest efecte, un farmacòleg va assignar aleatòriament 24 ratolins a tres

grups de tractament. Dos grups van rebre una injecció d’amfetamina en dos

nivells diferents (dosi 2.5 i dosi 5 mg/kg). Els ratolins del tercer grup van rebre

una injecció d’una solució salina. Es va mesurar la quantitat de menjar

consumit per cada animal en un període de tres hores després de la injecció.

EXEMPLE. LONGITUD I PES DE SERPS

En un estudi d’una població salvatge de la serp Vipera berus , un grup d’investigadors van caçar nou femelles adultes i en van mesurar la longitud i el pes.

EXEMPLE LONGITUD I PES DE SERPS

En un estudi d’una població salvatge de la serp Vipera berus , un grup d’investigadors en van caçar i mesurar nou femelles adultes. La següent taula mostra la longitud i el pes de les nou serps:

Longitud (cm) Pes (g) 60 136 69 198 66 194 64 140 54 93 67 172 59 116 65 174 63 145 Mitjana (^63 ) S 4,6 35,

Tenim: X =Longitud (cm) de la serp

Y = Pes (g) de la serp

Representem les dades:

Sembla que a major longitud de la serp es correspon un pes major.

1 Estadístics bàsics.

  • Com podem ajustar una recta a les dades?
  • Comencem per introduir els càlculs bàsics

Considerem:

EXEMPLE. LONGITUD I PES DE SERPS En l’estudi d’una població salvatge de la serp Vipera berus , tenim: X =Longitud (cm) de la serp Y = Pes (g) de la serp

I a partir de les dades:

= 63 cm = 152 g

Podem seguir el formulari = 172 = 9.

sX = = 4,6 cm sY = = 35,3 g

O mitjançant calculadora, trobem directament s X i sY

és negatiu és positiu

és positiu és negatiu

2 Ajustament de la recta de regressió.

  • Volem ajustar una recta al núvol de punts de les dades.
  • Però si les dades no estan sobre una recta Quina recta triem?

F 0 E 0La que està més a prop de les dades (en el sentit de “ mínims quadrats” ) F 0 E 0Per a cada^ x , el valor en la recta () està prop del que hem observat^ y F 0 E 0Es fa mínima

  • L’anomenen recta de regressió o de mínims quadrats
  • D’acord amb el formulari tenim:

En l’exemple de les serps teníem:

=63 cm, S (^) X =4,6 cm, =152 g, S (^) Y =35,3g, SSX =172, SS (^) Y =9.990, SPXY =1.

Calculem: =1.237/172= 7,19 =152 7,

F D7 63 =–

Recta de regressió ajustada (de mínims quadrats): y = 301+ 7,19 F 0D 7 x

Per a cada x calculem ŷ=- +7.19x F 0E 0 Quant se’n va ŷ del y observat?

Recta ajustada Residu

Calculem la Suma de quadrats residuals : SS(resid.)

x y ŷ (y- ŷ) (y- ŷ) 2 60 136 130,42 5,57 31, 69 198 195,15 2,84 8, 66 194 173,57 20,42 417, 64 140 159,19 –19,19 368, 54 93 87,27 5,72 32, 67 172 180,76 –8,76 76, 59 116 123,23 –7,23 52, 65 174 166,38 7,61 58, 63 145 152,00 –7,00 49, SUMA 0 1093,66 = S(resid)

També podem obtenir SS(resid) ==9.990 =1.093,

Desviació típica residual: S (^) Y|X = = = 12,5 g

Indica la variabilitat de Y al voltant de la recta

Si la comparem amb:

SY = = 35,3 g

Indica la variabilitat de Y al voltant de la mitjana =152 g

3.- Interpretació paramètrica de la regressió: el model lineal.

  • Una població condicional de valors Y és una població de valors Y associats amb un valor fix, o donat, de X. Denotem per Y|X
  • Per exemple l’alçada dels fills (Y), per a un valor donat 62 d’alçada (X) dels pares (Y|X=62).

EXEMPLE ALÇADA I PES D’HOMES JOVES

En una població d’homes joves, considerem les variables: X: alçada (polzades) Y : pes (lliures)

Considerem que la població Y | X (com que està definida per una variable) tindrà una mitjana i una desviació típica poblacionals : Pes mitjà dels homes amb alçada igual a X : Desviació típica dels pesos dels homes amb alçada igual a X A més suposem un Model lineal que estableix que es compleix:

: linealitat = –145 + 4, F 0 D 7 X variabilitat constant = 20 ( no depèn de X )

4.-Inferència estadística sobre el pendent.

  • El model lineal de l’exemple anterior ( = –145 + 4,25 X) era teòric i suposàvem coneguts els valors dels paràmetres.
  • A partir d’una mostra aleatòria, cóm estimem els valors dels paràmetres?

EXEMPLE 13.16. LONGITUD I PES DE SERPS

Sabem que: X: longitud (cm) Y: pes (g)

Model lineal:

no depèn de X

Recta de regressió ajustada del pes (Y) sobre la longitud (X):

y = –301 + 7, F 0 D 7x Desviació típica residual: S (^) Y|X = 12,5 g

Llavors: b 0 = –301 és una estimació de

b 1 = 7,19 és una estimació de (pendent poblacional)

SY|X = 12,5 g és una estimació de

  • Però F 06 2 0 i F 06 2 1 són paràmetres F 0E 0Podem fer inferència sobre els seus valors
  • El formulari ens dóna els mètodes per a estimar per intervals i fer contrast sobre F 06 2 1 el més interessant per el seu significat de - increment unitari i - existència de relació lineal

Interval de CONFIANÇA per a F 06 2 1 (pendent poblacional) 8.4 Inferència sobre F 06 2 1

  • Si triem un nivell de confiança del 95% b 1 F 0B 1 t0, F 0 D 7 on t0,05 : correspon a una t de Student amb gl = n – 2
  • En l’exemple: b 1 = 7,19 g/cm, = 0,953 g/cm i com n =9, tenim gl = 7 F 0E 0 t0,05 = 2, Interval de confiança: = [7,19-2, F 0 D 70,953, 7,19+2, F 0 D 70,953] =[4,9 g/cm, 9,4 g/cm]

Contrast D’HIPÒTESIS sobre F 06 2 1

En plantejar H 0 : F 06 2 1 = 0 (Suposant el model lineal, no depèn de X ) HA: F 06 2 1 F 0B 9 0 (Suposant el model lineal, depèn de X )

En l’exemple, l’stadístic de contrast: t (^) s = =7,54, és un valor de la distribució t de Student amb gl = n – 2=9-2= 0,0001 < p-valor < 0,

5.- El coeficient de correlació.

  • El coeficient de correlació és un índex que mesura la relació lineal entre dues variables quantitatives.
  • El coeficient de correlació poblacional, F 07 2, és un paràmetre definit per:

Covariança de X i Y (^) SERÀ SEMPRE DESCONEGUT

  • (^) El coeficient de correlació mostral, r , és un estadístic ( EL CALCULEM A

PARTIR DE LA MOSTRA ) que aproxima el valor de F 07 2 i es defineix :

EXEMPLE LONGITUD I PES DE SERPS

Tenim: X=longitud (cm) Y=pes (g)

= 63 cm, = 152 g, SSX = 172, SS (^) Y = 9.990, SP (^) XY = 1.

Resulta un coeficient de correlació mostral entre pes i longitud.

Alternativament, com teníem SS(resid) = 1093.

la relació lineal és prou ajustada.

SIMETRIA DEL COEFICIENT DE CORRELACIÓ

A partir de dues variables quantitatives, X, Y, observades aleatòriament sobre una mostra d’individus d’una població F 0E 0 Podem fer la regressió de X sobre Y o la regressió de Y sobre X:

  • La recta de regressió no és simètrica
  • El coeficient de correlació és el mateix

EXEMPLE. LONGITUD I PES DE SERPS

Per a la mostra de n = 9 serps, tenim:

X = longitud (cm) Y = pes (g)

SS (^) X = 172 SSY = 9.990 SPXY = 1. s (^) X = 4,6 s (^) Y = 35,

Recta de regressió de Y (pes) sobre X (longitud) Recta de regressió de X (longitud) sobre Y (pes)