Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Análisis de Correlación y Regresión: Conceptos y Aplicaciones, Ejercicios de Estadística

Ejercicios estadistica enfocados en frecuencias

Tipo: Ejercicios

2019/2020

Subido el 03/07/2020

Socorro2020
Socorro2020 🇨🇴

1 documento

1 / 12

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Paso 4. Descripción de la Información
Presentado por:
María Del Socorro Suarez CC 30710191
Tutor
Milton Fernando Ortega
Grupo: 204040_86
Universidad Nacional Abierta y a Distancia
Mayo de 2020
pf3
pf4
pf5
pf8
pf9
pfa

Vista previa parcial del texto

¡Descarga Análisis de Correlación y Regresión: Conceptos y Aplicaciones y más Ejercicios en PDF de Estadística solo en Docsity!

Paso 4. Descripción de la Información Presentado por: María Del Socorro Suarez CC 30710191 Tutor Milton Fernando Ortega Grupo: 204040_ Universidad Nacional Abierta y a Distancia Mayo de 2020

Actividad 1. Mapa mental Actividad 2. Definición de conceptos Diagrama de dispersión: Se conoce también conocido como gráfico de dispersión o gráfico de correlación consiste en la representación gráfica de dos variables para un conjunto de datos. En otras palabras, analizamos la relación entre dos variables, conociendo qué tanto se afectan entre sí o qué tan independientes son una de la otra. En este sentido, ambas variables se representan como un punto en el plano cartesiano y de acuerdo a la relación que exista entre ellas, definimos su tipo de correlación. Con base en el comportamiento que toman las variables de estudio, podemos encontrar 3 tipos de correlación: Positiva, negativa y nula. Correlación positiva: Se presenta cuando una variable aumenta o disminuye y la otra también, respectivamente. Hay una relación proporcional. Por ejemplo para un

Covarianza muestral=Cov(X,Y)=∑ni= 1 (xi−x¯¯¯)(yi−y¯¯¯)N− 1 siendo x¯¯¯ e y¯¯¯ la media de cada variable y xi e yi el valor de las variables para la observación i La covarianza depende de las escalas en que se miden las variables estudiadas, por lo tanto, no es comparable entre distintos pares de variables. Para poder hacer comparaciones se estandariza la covarianza, generando lo que se conoce como coeficientes de correlación. Existen diferentes tipos, de entre los que destacan el coeficiente de Pearson, Rho de Spearman y Tau de Kendall. Todos ellos varían entre +1 y - 1. Siendo +1 una correlación positiva perfecta y - 1 una correlación negativa perfecta. Se emplean como medida de fuerza de asociación (tamaño del efecto): 0: asociación nula. 0.1: asociación pequeña. 0.3: asociación mediana. 0.5: asociación moderada. 0.7: asociación alta. 0.9: asociación muy alta. Las principales diferencias entre estos tres coeficientes de asociación son: La correlación de Pearson funciona bien con variables cuantitativas que tienen una distribución normal. En el libro Handbook of Biological Statatistics se menciona que sigue siendo bastante robusto a pesar de la falta de normalidad. Es más sensible a los valores extremos que las otras dos alternativas.

La correlación de Spearman se emplea cuando los datos son ordinales, de intervalo, o bien cuando no se satisface la condición de normalidad para variables continuas y los datos se pueden transformar a rangos. Es un método no paramétrico. La correlación de Kendall es otra alternativa no paramétrica para el estudio de la correlación que trabaja con rangos. Se emplea cuando se dispone de pocos datos y muchos de ellos ocupan la misma posición en el rango, es decir, cuando hay muchas ligaduras. Además del valor obtenido para el coeficiente de correlación, es necesario calcular su significancia. Solo si el p-value es significativo se puede aceptar que existe correlación, y esta será de la magnitud que indique el coeficiente. Por muy cercano que sea el valor del coeficiente de correlación a + 1 o − 1 , si no es significativo, se ha de interpretar que la correlación de ambas variables es 0, ya que el valor observado puede deberse a simple aleatoriedad. El test paramétrico de significancia estadística empleado para el coeficiente de correlación es el t-test. Al igual que ocurre siempre que se trabaja con muestras, por un lado está el parámetro estimado (en este caso el coeficiente de correlación) y por otro su significancia a la hora de considerar la población entera. Si se calcula el coeficiente de correlación entre X e Y en diferentes muestras de una misma población, el valor va a variar dependiendo de las muestras utilizadas. Por esta razón se tiene que calcular la significancia de la correlación obtenida y su intervalo de confianza. t=rN− 2 −−−−−√ 1 −r 2 −−−−−√, df=N− 2

Donde la suma total es la varianza muestral de la variable endógena multiplicada por el tamaño de la muestra; por lo tanto, mide las fluctuaciones de esta variable alrededor de su media; y, la suma residual indica cuál es el nivel de error que se comete con el modelo estimado al explicar la variable endógena. El coeficiente de determinación siempre va a ser menor o igual que 1 (sería igual a 1 si el modelo estimado puede explicar completamente la variable dependiente sin ningún error, lo cual es muy improbable en la práctica) y si, además, el modelo tiene término independiente, entonces el R 2 es mayor o igual que cero. Si el modelo tiene término independiente, existen diferentes expresiones que permiten el cálculo del R 2 , tales como: donde, la suma explicada es el grado de fluctuación de la variable dependiente que el modelo de regresión estimado es capaz de explicar; es el vector de parámetros estimados del modelo, X es la matriz de observaciones de las variables explicativas del modelo, y es el vector de observaciones de la variable dependiente, T es el número de observaciones de las variables del modelo, e es el cuadrado de la media de la variable dependiente.

El R 2 también se puede calcular como el cuadrado del coeficiente de correlación entre y (variable dependiente) e (variable dependiente estimada a través del modelo de regresión). Correlación positiva y correlación negativa Con los diagramas de dispersión podemos ver cómo se relacionan ambas variables entre sí. Esto es lo que se conoce como correlación. Hay tres tipos de correlación: positiva, negativa y nula (sin correlación).

  • Correlación positiva: ocurre cuando una variable aumenta y la otra también. Por ejemplo, la altura de una persona y el tamaño de su pie; mientras aumenta la altura, el pie también.
  • Correlación negativa: es cuando una variable aumenta y la otra disminuye. El tiempo de estudio y el tiempo que pasas jugando videojuegos, tienen una correlación negativa, ya que cuando tu tiempo de estudio aumenta, no te queda tanto tiempo para jugar videojuegos.
  • Sin correlación: no hay una relación aparente entre las variables. Los puntos en tus videojuegos y tu talla de zapato no parece tener ninguna correlación; mientras una aumenta, la otra no tiene ningún efecto. Coeficiente de correlación lineal y qué nos ayuda a medir El coeficiente de correlación lineal es una medida de la asociación lineal que existe entre dos variables y nos ayuda a medir:
  • Asociación lineal positiva o directa.

Actividad 4. Regresión y correlación múltiple