Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Tema 8. Regresión, Apuntes de Biología

Asignatura: Bioestadística, Profesor: Mª Carmen Carollo Limeres, Carrera: Biología, Universidad: USC

Tipo: Apuntes

2012/2013

Subido el 10/05/2013

mireia_v-1
mireia_v-1 🇪🇸

4.3

(21)

10 documentos

1 / 29

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Bioestatística. Grao en Bioloxía. Mª Carmen Carollo-Pedro Faraldo-Mª de los Angeles Fernández Tema 8. regresión
TEMA 8. REGRESIÓN Y CORRELACIÓN
M. Carmen Carollo Limeres
Pedro Faraldo Roca
M. Angeles Fernández Fernández
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d

Vista previa parcial del texto

¡Descarga Tema 8. Regresión y más Apuntes en PDF de Biología solo en Docsity!

TEMA 8. REGRESIÓN Y CORRELACIÓN

M. Carmen Carollo Limeres Pedro Faraldo Roca M. Angeles Fernández Fernández

En muchas ocasiones nos encontramos con situaciones en las que nos interesa analizar conjuntamente dos características cuantitativas de la población.

Ejemplo:

Se quiere estudiar la posible relación entre las distintas variables analizadas

en la muestra de miel extraída en la provincia de Lugo. Por ejemplo, estamos

interesado en saber si existe relación entre las variables acidez total y acidez

libre.

Propiedades de la función de distribución :

^0 ^ F x y ( ,^^ )^ ^1 ^ x y ,  ^2

F^ (^   ,^ )^1 F^ (^   ,^ )^0 F x ( ,^^  )^ F^ (^ ,^ y )^ ^0  F x y ( ,^ ) es no decreciente con respecto a cada una de las componentes.  F x y ( ,^ ) es continua por la derecha con respecto a cada una de las componentes.

 P x  1^ ^ X^ ^ x 2^ ,^ y 1^ ^ Y^ ^ y 2^  ^ F x  2^ ,^ y 2^  ^ F x  1^ ,^ y 2^  ^ F x  2^ ,^ y 1^   F x  1^ , y 1 

Variable aleatoria bidimensional discreta

Si las variables X e Y son discretas, la variable bidimensional (^ X Y ,^ ) es

discreta.

Función de masa de probabilidad : Es el conjunto de valores que toma la variable junto con sus respectivas probabilidades.

pij  P X   x Yi ,  yj 

La función de masa se suele representar en una tabla de doble clasificación:

y 1 ... yj ... ys Marginal

x 1 p 11 … p1j p1s p 1.

xi pi1 ... pij ... pis pi.

xr pr1 ... prj ... prs pr.

Marginal p. 1 ... p. j ... p. s 1

.. 1 1 1 1

1

s r r s i ij j ij ij j i i j

p p p p p    

Ejercicio:

En un estudio dirigido a investigar el efecto de la presencia de una gran planta industrial, sobre una pequeña población de invertebrados en un río que atraviesa la planta, se observaron los invertebrados aguas arriba y aguas abajo. Se obtuvieron los siguientes datos.

Especies A B C D E F G Aguas arriba 37 12 6 18 7 6 0 Aguas abajo 9 3 7 0 0 6 3

 Obtener las distribuciones marginales de las variables "aguas" y "especie"  ¿La especie es independiente del lugar ( aguas arriba o aguas abajo)?

Independencia de variables aleatorias

Si X e Y son variables discretas, diremos que son independientes si y sólo si:

pij P X ( x Yi , y (^) j ) P X ( xi ) ( P Y y (^) j ) pi (^). p. (^) j ( x (^) i , yj )

De la anterior definición se deduce que si X e Y son independientes, entonces:

P x ( 1 (^) X x 2 (^) , y 1 (^) Y y 2 (^) ) P x ( 1 (^) X x 2 (^) ) ( P y 1 (^) Y y 2 )

En el tema anterior hemos visto cómo contrastar la hipótesis de independencia a partir de una muestra aleatoria (estadístico Chi-cuadrado de independencia).

  1. C^ ov^ ^ X Y ,^^ ^0 si X e Y son independientes
  2. V^^ ar aX^ ^ bY^  ^ a Var X^2 ^   b Var Y^2   si X e Y son independientes

Ejercicios:

  1. Sean X e Y variables aleatorias tales que V^ ar^  X^  ^ 2 ,^ Var Y ^  ^ 4 ,^ C^ ov^  X Y ,^  ^2 Calcular

la varianza de la variable aleatoria Z  2 X  4 Y  8

  1. Sean X e Y variables aleatorias independientes tales que V^ ar^  X^  ^ 1,^ Var Y  ^2

Calcular la varianza de la variable aleatoria Z^ ^3 X^ ^2 Y^ ^5

  1. Sean X e Y variables aleatorias independientes que siguen distribuciones de Poisson de parámetros 3 y 2 respectivamente, ¿Cuánto valdrá la media y la desviación típica de la variable aleatoria Z = 3X-4Y?

El problema general de regresión. Regresión mínimo cuadrática

El objetivo de un modelo de regresión es tratar de explicar la relación que existe entre una variable dependiente Y (variable respuesta) y un conjunto de variables independientes X 1 ,..., X n (variables explicativas o covariables). En un modelo de regresión lineal simple tratamos de explicar la relación que existe entre la variable respuesta Y y una única variable explicativa X. Supondremos que las dos variables son de tipo contínuo.

Ejemplo: En la muestra de la miel vamos a ver si existe relación lineal entre la acidez libre (AcLib) y la acidez total (AcTot). Para ver si un modelo de regresión lineal tiene sentido, comenzamos dibujando un diagrama de dispersión.

La covarianza puede interpretarse como una medida de la relación lineal entre X e Y.

2

S XY  SYX S XX  SX

Interpretación del signo de la covarianza muestral:

RELACIÓN DIRECTA S (^) XY  0 , X   Y

+^ _

_ +

+^ ^ x y , 

+

1 1 XY (^ ,^ )^ (^ i )(^ j ) i j i j i j

s C X Y x x y y x y x y n n

  (^)     (^)  

RELACIÓN INVERSA S (^) XY  0 , X   Y

S (^) XY  (^0) NO RELACIÓN

Observemos que el signo del coeficiente de correlación coincide con el

signo de la covarianza.

Para nuestro ejemplo r = 0.960. Como es positivo, esto indica que existe una relación directa entre las variables acidez total y acidez libre. Esta relación directa ya se podía ver en la nube de puntos.

Modelo de regresión lineal Se llama función lineal de una variable, a una función de la forma Y X

: ordenada en el origen (valor de Y cuando X=0) : pendiente (cambio de Y al aumentar X en una unidad) : error aleatorio

Recta de regresión mínimo cuadrática de y sobre x

Para hacer una estimación del modelo de regresión lineal simple, trataremos de buscar una recta de la forma: Y ˆ  abX de modo que se ajuste a la nube de puntos.

Ejemplo

Los estadísticos descriptivos anteriores para las variables AcTot y AcLib (acidez total y acidez libre) son:

2 2

37.998, 33.8727, 90.786, 85.459, 9.5282 9.24439.

X Y X Y

x y S S S S

     

La recta de regresión ajustada es la siguiente:

Y ˆ^  4.469 0.990 X ,

donde Y es la acidez total y X es la acidez libre.

Recta de regresión mínimo cuadrática de x sobre y

Para calcular la recta de regresión de X sobre Y se hace aproximando X por , del modo

X ˆ  abY

donde^ ,^ XY 2 , Y

a x by b S S

  

Es totalmente incorrecto despejar X de la ecuación Y ˆ^ a^ bX para calcular la recta de regresión de X sobre Y.