Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


multivariante 1, Apuntes de Epidemiología

Asignatura: epidemiologia clinica, Profesor: mnjkj knlk, Carrera: Medicina, Universidad: UAM

Tipo: Apuntes

2013/2014

Subido el 02/03/2014

ppperes
ppperes 🇪🇸

3.7

(29)

50 documentos

1 / 4

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Jacobo Trébol EPI.CLIN. 15: ANÁLISIS MULTIVARIANTE I Dr. Carrasco
INTRODUCCIÓN
Hasta ahora hemos estudiado los métodos estadísticos convencionales;
éstos analizan exhaustivamente el comportamiento de una variable en las
muestras y en la población (estimación y comparación) y las leyes que pueden
ligar dos variables entre (relación). Conocemos, por tanto, la estadística
univariante y la estadística bivariante. Pero en la vida una cosa no suele
depender sólo de otra. El gran número de variables habitualmente observadas
en una colección de individuos, y la realidad multidimensional de la vida en que
todas configuran con sus relaciones el fenómeno que se investiga, obliga a
encarar la inevitable complejidad matemática e intenta un tratamiento conjunto
de ellas. Éste es el objetivo de la estadística multivariante.
El Análisis Multivariante engloba los métodos y técnicas estadísticas que
permiten estudiar y tratar, en bloque, un conjunto de variables medidas u
observadas en una colección de individuos.
COEFICIENTE DE CORRELACIÓN-ECUACIÓN DE REGRESIÓN
Pongamos por caso que queremos conocer la posible relación entre dos
variables cuantitativas [temperatura (t) y frecuencia cardiaca (FC), por ejemplo].
Nos hacemos varias preguntas:
1. ¿Hay relación?
La posible correlación se calcula a través de un coeficiente de
correlación, que para las variables cuantitativas es el coeficiente
de correlación de Pearson (r)
2. ¿ Es significativo?
Una vez conocido r lo siguiente es conocer si ese coeficiente es
estadísticamente significativo. En caso contrario no podemos
usarlo para calcular ninguna ecuación de regresión que expresase
la relación entre las dos variables.
3. ¿ Es estilizada la nube de puntos?
La significación estadística del coeficiente de correlación es
necesaria pero no suficiente en sí misma para poder calcular la
ecuación de regresión; dicha ecuación es un modelo teórico de
estimación de la tendencia de dispersión de los valores de nuestra
muestra, de modo que aunque nuestros valores mostrasen una
relación claramente ascendente, pueden estar muy dispersos y
aplicando una ecuación de regresión (que representa una línea en
el espacio) para representarlos cometeríamos mucho error. Por
ello es muy importante tener en cuenta el grado de estilización de
la nube de dispersión que representa los valores de esas
variables en mi muestra. El que la nube de puntos sea estilizada
o no es una condición “estética”, experimental, que decidiremos
en función de lo que nos juguemos (no es lo mismo jugarse la vida
de un paciente que la de varias ratas de laboratorio).
1
pf3
pf4

Vista previa parcial del texto

¡Descarga multivariante 1 y más Apuntes en PDF de Epidemiología solo en Docsity!

Jacobo Trébol EPI.CLIN. 15: ANÁLISIS MULTIVARIANTE I Dr. Carrasco

INTRODUCCIÓN

Hasta ahora hemos estudiado los métodos estadísticos convencionales; éstos analizan exhaustivamente el comportamiento de una variable en las muestras y en la población (estimación y comparación) y las leyes que pueden ligar dos variables entre sí (relación). Conocemos, por tanto, la estadística univariante y la estadística bivariante. Pero en la vida una cosa no suele depender sólo de otra. El gran número de variables habitualmente observadas en una colección de individuos, y la realidad multidimensional de la vida en que todas configuran con sus relaciones el fenómeno que se investiga, obliga a encarar la inevitable complejidad matemática e intenta un tratamiento conjunto de ellas. Éste es el objetivo de la estadística multivariante.

El Análisis Multivariante engloba los métodos y técnicas estadísticas que permiten estudiar y tratar, en bloque, un conjunto de variables medidas u observadas en una colección de individuos.

COEFICIENTE DE CORRELACIÓN-ECUACIÓN DE REGRESIÓN

Pongamos por caso que queremos conocer la posible relación entre dos variables cuantitativas [temperatura (t) y frecuencia cardiaca (FC), por ejemplo]. Nos hacemos varias preguntas:

  1. ¿Hay relación? La posible correlación se calcula a través de un coeficiente de correlación, que para las variables cuantitativas es el coeficiente de correlación de Pearson (r)
  2. ¿ Es significativo? Una vez conocido r lo siguiente es conocer si ese coeficiente es estadísticamente significativo. En caso contrario no podemos usarlo para calcular ninguna ecuación de regresión que expresase la relación entre las dos variables.
  3. (^) ¿ Es estilizada la nube de puntos? La significación estadística del coeficiente de correlación es necesaria pero no suficiente en sí misma para poder calcular la ecuación de regresión; dicha ecuación es un modelo teórico de estimación de la tendencia de dispersión de los valores de nuestra muestra, de modo que aunque nuestros valores mostrasen una relación claramente ascendente, pueden estar muy dispersos y aplicando una ecuación de regresión (que representa una línea en el espacio) para representarlos cometeríamos mucho error. Por ello es muy importante tener en cuenta el grado de estilización de la nube de dispersión que representa los valores de esas variables en mi muestra. El que la nube de puntos sea estilizada o no es una condición “estética”, experimental, que decidiremos en función de lo que nos juguemos (no es lo mismo jugarse la vida de un paciente que la de varias ratas de laboratorio).

r=1 r=

r=0,8 r=- 0,

Coeficientes de correlación En cuanto a la r:

  • Desconfiad de los r=1. Un valor de tan alta correlación indica que se trata en realidad de valores exactamente iguales, esto es, que se trata de la misma variable, ya que sólo ella se correlacionaría tanto consigo misma.
  • En la práctica, que se den r=0,9 es muy raro.
  • La mayoría de las veces los coeficientes de correlación tienen valores de 0,7 ó 0,8. Éstos son considerados indicadores de una buena correlación.
  • Valores de r=0,6 indican menos correlación, pero aún válida.
  • Si son menores de 0,5 no son aceptables (por mucha significación estadística que presenten). En resumen, las condiciones para poder calcular una ecuación de regresión serían: •..1 Un coeficiente de correlación de Pearson aceptable (lo suficientemente alto) y estadísticamente significativo. •..2 Estilización adecuada de la nube de dispersión de nuestros datos, según lo que se pretenda demostrar.

Variables A y B

Cálculo estadístico Coeficiente de correlación

Condición estadística ¿Significativo? NO

SÍ Imposibilidad de aplicación

(x – x) = r x ( F 07 3x/ F 07 3y) x ( y –y)

El problema con respecto a la regresión lineal enunciada hasta ahora es que prácticamente NO existen variables en la naturaleza que mantengan relaciones lineales (“No existen fenómenos biológicos rectilíneos en su distribución”). Es mucho más frecuente que se relacionen ajustándose a modelos logísticos (sigmoideos), exponenciales, logarítmicos, etc. Antes el modelo de regresión lineal solía utilizarse cuando las otras vías eran asumibles a una lineal pero más complejas, con el fin de simplificar cálculos. Hoy en día, los programas informáticos han hecho desaparecer esta posibilidad (la diferencia entre calcular una y otra es apretar uno u otro botón). La metodología para calcular en estos casos la ecuación de regresión es la misma, pero la formula aplicable de la misma será distinta de y = a +bx

Ejemplo real: Se estudiaron 13000 RNV sin ninguna patología para intentar hallar una relación entre alguno de los parámetros fetales y las semanas de gestación. Una de las variables que presentaba mayor correlación era el perímetro craneal. Aplicando una ecuación de regresión lineal se obtenía una r=0,94. Pero la relación lineal entre estas dos variables es “poco biológica” (supondría un crecimiento sin freno de la cabeza, y ésta decae en su crecimiento en las últimas semanas de gestación). Empleando un modelo parabólico, obtuvieron una r=0,99, es decir, mayor correlación y mayor “calidad biológica” de ésta.

SALTO AL ANÁLISIS MULTIVARIANTE

Pocos fenómenos biológicos dependen de una única variable. El r expresa la correlación de una variable sólo con otra. Por ello es frecuente encontrar en la investigación coeficientes de correlación bajos, porque al tener en cuenta la relación de un fenómeno con sólo uno de todos aquellos de los que depende, la correlación que se refleja es “parcial”. De ahí que la estadística avanzada tienda al análisis “multivariante”, que tiene en cuenta varias variables a la vez en la regresión y obtiene resultados hiperdimensionales. La regresión lineal se convierte, así, en Regresión Lineal Múltiple.

La importancia del análisis multivariante es aumentar el ajuste al potenciarlo con varias variables (este “efecto sinérgico” es la clave de la investigación multivariante). Es decir, lo que pretende es buscar ecuaciones que liguen la variable que quieres estudiar (por ejemplo, la fracción de eyección del ventrículo izquierdo, FEVI) con todas aquellas variables que influyan en ella. Si, siguiendo con el ejemplo de la FEVI, haciendo Regresión lineal Simple sabes que el coeficiente de correlación entre la pendiente del ECG y la FEVI es r=0,56 y el del diámetro del ápex con la FEVI es r=0,52 , si consideramos ambas variables (diámetro del ápex y ECG) para conocer la FEVI obtenemos una r=0,7 , evitándonos, por ejemplo, la realización de un cateterismo cardíaco para la medición de la FEVI.