Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Análisis Estadístico de la Relación entre Variables: Contrastes, Correlación y Regresión, Apuntes de Derecho Privado Internacional

Un caso de estudio sobre la relación entre dos variables quantitativas, en este caso, la altura y el espacio pulmonar muerto (epm) en niños. Cómo visualizar la relación entre las variables, calcular la correlación y el coeficiente de correlación, y ajustar una recta de regresión para predicir el epm basándose en la altura. Se utiliza el software r para realizar los cálculos y gráficos.

Tipo: Apuntes

2017/2018

Subido el 12/01/2018

julieta2795
julieta2795 🇪🇸

4

(1)

6 documentos

1 / 20

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Hospital Universitari Vall d’Hebron
Institut de Recerca - VHIR
Institut d’Investigació Sanitària de l’Instituto de Salud Carlos III (ISCIII)
Estadística Bàsica per
la investigació
Biomèdica
Contrastos d’hipòtesis
Correlació i
Regressió lineal
Àlex Sánchez
22/02/13
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14

Vista previa parcial del texto

¡Descarga Análisis Estadístico de la Relación entre Variables: Contrastes, Correlación y Regresión y más Apuntes en PDF de Derecho Privado Internacional solo en Docsity!

Hospital Universitari Vall d’Hebron Institut de Recerca - VHIR^ Institut d’Investigació Sanitària de l’Instituto de Salud Carlos III (ISCIII)

Estadística Bàsica perla investigacióBiomèdicaContrastos d’hipòtesisCorrelació iRegressió lineal^ Àlex Sánchez 22/02/

Relació entre dues variables • Quan es mesuren dues o més variables sobre unmateix individu pot tenir interès estudiar les relacionsentre elles.• En el cas de 2 variables quantitatives (X,Y), podemformular-nos dues menes de preguntes – Estan relacionades les dues variables?Quina és la forma de la relació entre ambdue

s?

– Suposant

que^

ho^ estiguin,

podem

fer^ servir

aquesta

relació per construir un model predictiu? 2

Cas 1. Visualització

•^ Si, com sempre,comencem per mirarles dades veiem queformen un núvol de^ punts

allargats

que

punts^

allargats

que

suggereix^ – Ambdues variablesestan relacionades– La relació és lineal

Visualització amb R

•^ Si tenim les dades enun data.frameanomenat “Ventilacio”podem fer

(^100 80) EPM

plot(EPM~alssada,data=ventilacio) o bé plot(EPM, alssada,data=ventilacio)

110 120 130

140 150

160 170 60 40

alsada EPM

Coeficient de correlació de Pearson^ •^ L’indiquem “r” i és una mesura

adimensional

(sense unitats)

•^ -1^ ≤

r^ ≤^1

•^ valors propers a 0 indiquen absència de relació

lineal^

entre

les^ variablesles^ variables • r > 0 indica una relació directa entre les variables• r < 0 indica valors inversa entre les variables (inversamentproporcional o amb signes canviats)• si r =1 o r = -1 totes les observacions cauen sobre una líniarecta amb pendent positiva o negativa respectivament.

Exemples de correlació

r=0,

33028023018013080 30140 150

160

170 180

190 200

r=0,

13012011010090807060504030140 150

160

170 180

190 200

80706050403020^ r=-0,7 100 140 150

160 170

180

190 200

r=0,99^8

10090 80 70 60 50 40 30140 150

160

170 180

190 200

Correlació no paramètrica

•^ El coeficient de correlacióde pearson es sensible alsoutliers i pot donar valorsbaixos si la relació és^ monòtona

però^ no lineal.

x^ <-^ 1:100;y^ <-^ 2*x

+^3

z^ <-^ exp(x);#^ then,cor(x,y,method='spearman');

will^ equal

1,^ and cor(x,y,method

='pearson

monòtona

però^ no lineal.

•^ En aquests casos pot sermillor el coeficient deSpearman, que converteixels valors en rangs abansde calcular la correlació.

cor(x,y,method

='pearson

cor(x,z,method='spearman');

will^ equal

1,^ and cor(x,z,method='pearson');par(mfrow=c(2,1))plot(x,y,

main="Relacio

lineal", cex.main=0.8)plot(x,z,^ main="Relacio

monòtona", cex.main=0.8)par(mfrow=c(1,1))

Tipus de relació i coeficients

Pearson^

Negatiu peròalt en valor absolut

Positiu però baix

Baix

Spearman

Negatiu peròalt en valor absolut

Positiu i més alt

Baix

Dos aspectes: descriptiva i inferència • El càlcul dels coeficients ens dóna un valor de correlació,

r ,^ entre

els punts de la mostra on ho calculem

, però no garanteix res sobre

la correlació en la població,

ρρ.ρρ

  • Tan si existeix correlació com si no obtindrem algun valor.– Tot i això esperem que^ •^ si la

correlació

és^ real el valor sobre la

mostra^ sigui

alt

-^ si la^ correlació

és^ real el valor sobre la

mostra^ sigui

alt

-^ Si no hi ha correlació, el valor sobre la mostra sigui baix -^ Podem aplicar un test de significació sobre els coeficients percontrastar la hipòtesis: H0:

ρ^ =0 enfront H1:

ρ^ != 0.

-^ Compte!^ –^ El test és vàlid per dades normals–^ Si rebutgem H0 no vol dir que

ρ^ sigui gran, només que és

significativament diferent de zero.

Significació dels coeficients

•^ Per fer-ho amb R es fa elmateix que abans peròseleccionant “Spearman”. •^ Estadística

Pearson's product-moment

correlation data:^ EPM$alsada

and EPM$EPM t = 5.7284,

df =^ 13,^ p-value

=^ 6.956e- alternative

hypothesis: true correlation is

not

equal to 095 percent confidence interval:0.5897084 0.9477102sample^ estimates:^ cor^ 0.

•^ Estadística^ – Resúmenes

  • Test de correlación

•^ Seleccionem coeficient^ – Coeficient de Pearson– Coeficient de Spearman

cor^ 0.8463124 cor.test(EPM$alsada, EPM$EPM,alternative="two.sided",

method="spearman") Spearman's rank

correlation rho data:^ EPM$alsada

and EPM$EPM S = 60.

,^ p-value^

=^ 7.936e- alternative

hypothesis: true rho not

equal^ to 0

sample^ estimates:^ rho^

0.

La recta de regressió

• Quan es tenen dues variables contínuesrelacionades linealment podem buscar quinaés la recta que s’ajusta millor al núvol de punts •^ Aquest

recta

ens^ proporciona un

model

de la

•^ Aquest

recta

ens^ proporciona un

model

de la

relació

entre les dues variables.

• El model pot servir per^ – Explicar la relació– Predir una variable a partir de l’altra

Cas 1: Alçada i EPM

• L’Espai Pulmonar Mort és difícil de mesurarmentre que l’alçada no ho és,• Podem fer servir la relació entre els dos per^ –^ Ajustar una recta de

regressió

–^ Ajustar una recta de

regressió

– Predir quin EPM tindrà un individu mesurant-linomés l’alçada.

Resultats de la regressió amb R lm(formula^

=^ EPM^ ~^

alsada,^

data^ =^ EPM)

Residuals:Min

1Q

Median

3Q

Max

Coefficients

Coeficients del model Error estàndar Significació^ dels^ coeficients

Coefficients

: Estimate

Std.^ Error

t^ value

Pr(>|t|)

(Intercept)

alsada^

1.^
0.^

5.728^ 6.96e-

---Signif.^

codes:^

0 '***'^
0.001^ '**'
0.01^ '*'
0.05^ '.'
0.1^ '^ '

Residual

standard

error:^

13.07^ on

13 degrees

of^ freedom

Multiple

R-squared:

Adjusted

R-squared:

F-statistic:

32.81^ on

1 and^13

DF,^ p-value:

6.956e-

Test per al model Significació

dels^ coeficients

Compte com fem servir la regressió!!^ Aquesta NO és bóna^ Aquesta és bóna Sputum Biomarkers and thePrediction of ClinicalOutcomes in Patients with CysticFibrosis.PLoS ONE 7(8): e42748.