Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Análisis de Datos: Correlación entre Variables Cuantitativas, Apuntes de Ciencia Política

El tema 7 bivariados i se enfoca en la relación entre variables cuantitativas y la correlación como medida de la fuerza y dirección de la relación lineal entre ellas. Se explica cómo un diagrama de dispersión muestra la forma y dirección de la relación y cómo la correlación r mide esta relación. Se destacan las características de la correlación, como que no distingue entre variables independientes y dependientes, ambas variables deben ser cuantitativas, la correlación no tiene unidad de medida, etc.

Tipo: Apuntes

2019/2020

Subido el 25/10/2020

rameses1910
rameses1910 🇪🇸

5

(3)

22 documentos

1 / 2

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Tema 7 Bivariados I: Relaciones entre variables cuantitativas
7.1 Correlación
Un diagrama de dispersión muestra la forma, la dirección y la
fuerza de la relación entre dos variables cuantitativas. Son de
gran importancia las relaciones lineales, pesto que una recta es
una figura común. Se dice que una relación lineal es fuerte si los
puntos del diagrama de dispersión se sitúan cerca de la recta, y
débil si se hallan muy espaciados. Pero de todas maneras dicha
idea es difícil de ver a simple vista ( ver imagen). Por ello, se
necesita una estrategia de análisis de datos y utilizar una medida
numérica que complete el grafico, dicha medida es la
correlación.
La correlación mide la fuerza y la dirección de la relación
lineal entre dos variables cuantitativas. La correlación se
simboliza con la letra r. Supón que tenemos datos de dos variables
x e y para n individuos. Los valores para el primer individuo son
x1 e y1, para el segundo son x2 e y2, etc. Las medias y las
desviaciones típicas de las dos variables son ¯ x y sx para los
valores de x, e ¯ y y sy para los valores de y. La correlación r
entre x e y es:
r=1
n1Σ
(
x
1
−´x
s
x
)
(
y
1
´y
s
y
)
La fórmula es complicada por eso es mejor usar programas o calculadoras para calcularlo. La
formula de r empieza estandarizando las observaciones . La observación estandarizada nos
indica a cuantas desviaciones típicas se halla la observación individual respeto a la media. Los
valores estandarizados no tienen unidades de medida . La correlación r es como una media de los
productos de X estandarizados y de Y estandarizado para n observaciones
7.2 características de la correlación
Cuando r es positivo existe una asociación positiva entre variables, en cambio si r es negativa la
asociación entre x e y es negativa. A continuación, se muestran las siete ideas principales que
sirven para interpretar correctamente la correlación:
1. Da lo mismo llamar a una variable x y a otra y, la correlación no hace distinciones entre
variable independiente y dependiente. No hace distinción entre variables explicativas y
variables respuesta.
2. Ambas variables deben de ser cuantitativas.
3. La correlación no tiene unidad de medida es solo un número.
4. Una r positiva indica una asociación positiva entre las variables. Una r negativa indica
una asociación negativa.
5. La correlación r siempre toma valores entre -1 y 1. Valores cercanos a 0 indican una
relación lineal muy débil mientras que valores cercanos a + - 1 indican una relación
lineal más fuerte.
6. La correlación sólo mide la fuerza de una relación lineal entre dos variables. La
correlación no describe las relaciones curvilíneas entre variables aunque sean muy
fuerte
1Dos diagramas de dispersión con los mismos
datos. Debido a las diferentes escalas, la fuerza
de la relación lineal parece mayor en el gráfico
inferior
pf2

Vista previa parcial del texto

¡Descarga Análisis de Datos: Correlación entre Variables Cuantitativas y más Apuntes en PDF de Ciencia Política solo en Docsity!

Tema 7 Bivariados I: Relaciones entre variables cuantitativas

7.1 Correlación Un diagrama de dispersión muestra la forma, la dirección y la fuerza de la relación entre dos variables cuantitativas. Son de gran importancia las relaciones lineales, pesto que una recta es una figura común. Se dice que una relación lineal es fuerte si los puntos del diagrama de dispersión se sitúan cerca de la recta, y débil si se hallan muy espaciados. Pero de todas maneras dicha idea es difícil de ver a simple vista ( ver imagen). Por ello, se necesita una estrategia de análisis de datos y utilizar una medida numérica que complete el grafico, dicha medida es la correlación. La correlación mide la fuerza y la dirección de la relación lineal entre dos variables cuantitativas. La correlación se simboliza con la letra r. Supón que tenemos datos de dos variables x e y para n individuos. Los valores para el primer individuo son x1 e y1, para el segundo son x2 e y2, etc. Las medias y las desviaciones típicas de las dos variables son ¯ x y sx para los valores de x, e ¯ y y sy para los valores de y. La correlación r entre x e y es:

r =

n − 1

x 1 −´ x

sx )

y 1 − ´ y

s y )

La fórmula es complicada por eso es mejor usar programas o calculadoras para calcularlo. La formula de r empieza estandarizando las observaciones. La observación estandarizada nos indica a cuantas desviaciones típicas se halla la observación individual respeto a la media. Los valores estandarizados no tienen unidades de medida. La correlación r es como una media de los productos de X estandarizados y de Y estandarizado para n observaciones 7.2 características de la correlación Cuando r es positivo existe una asociación positiva entre variables, en cambio si r es negativa la asociación entre x e y es negativa. A continuación, se muestran las siete ideas principales que sirven para interpretar correctamente la correlación:

  1. Da lo mismo llamar a una variable x y a otra y, la correlación no hace distinciones entre variable independiente y dependiente. No hace distinción entre variables explicativas y variables respuesta.
  2. Ambas variables deben de ser cuantitativas.
  3. La correlación no tiene unidad de medida es solo un número.
  4. Una r positiva indica una asociación positiva entre las variables. Una r negativa indica una asociación negativa. 5. La correlación r siempre toma valores entre -1 y 1. Valores cercanos a 0 indican una relación lineal muy débil mientras que valores cercanos a + - 1 indican una relación lineal más fuerte. 6. La correlación sólo mide la fuerza de una relación lineal entre dos variables. La correlación no describe las relaciones curvilíneas entre variables aunque sean muy fuerte 1 Dos diagramas de dispersión con los mismos datos. Debido a las diferentes escalas, la fuerza de la relación lineal parece mayor en el gráfico inferior
  1. Al igual que ocurre con la media y la desviación típica , la correlación se ve fuertemente afectada por unas pocos casos atípicos. Cuando detectes la presencia de observaciones atípicas en el diagrama de dispersión, utiliza r con precaución.

Resumen

La correlación r mide la fuerza y la dirección de la asociación lineal entre dos variables

cuantitativas x e y. Aunque puedes calcular r para cualquier diagrama de dispersión, r sólo mide

la relación lineal. La correlación indica la dirección de una relación lineal con su signo: r 0 > para

asociaciones positivas y r< 0 para asociaciones negativas.

La correlación siempre cumple que -1< r> 1. Valores de r cercanos a-1 o a 1 indican una fuerte

asociación. Cuando los puntos de un diagrama de dispersión se sitúan exactamente a lo largo de

una recta r = 1. La correlación ignora la distinción entre variables explicativas y variables res

puesta. El valor de r no se ve afectado por cambios en las unidades de medida de cada una de las

variables. De todas formas, r se puede ver muy afectada por las observaciones atípicas.

Recuerda que la correlación no es una descripción completa de los datos de dos variables , incluso cuando la relación entre las variables es lineal. Junto con la correlación tienes que dar las medias y las desviaciones típicas de x e y. (Debido a que la fórmula de la correlación utiliza las medias y las desviaciones típicas, estas medidas son las adecuadas para acompañar la correlación.) Conclusiones basadas sólo en las correlaciones puede que tengan que ser revisadas a la luz de una descripción más completa de los datos. 2 Ejemplo de diferentes correlaciones y su efecto visual. (Misma desviación típica y mismas escalas