






Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Ejercicios estadistica enfocados en frecuencias
Tipo: Ejercicios
1 / 12
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!







Paso 4. Descripción de la Información Presentado por: María Del Socorro Suarez CC 30710191 Tutor Milton Fernando Ortega Grupo: 204040_ Universidad Nacional Abierta y a Distancia Mayo de 2020
Actividad 1. Mapa mental Actividad 2. Definición de conceptos Diagrama de dispersión: Se conoce también conocido como gráfico de dispersión o gráfico de correlación consiste en la representación gráfica de dos variables para un conjunto de datos. En otras palabras, analizamos la relación entre dos variables, conociendo qué tanto se afectan entre sí o qué tan independientes son una de la otra. En este sentido, ambas variables se representan como un punto en el plano cartesiano y de acuerdo a la relación que exista entre ellas, definimos su tipo de correlación. Con base en el comportamiento que toman las variables de estudio, podemos encontrar 3 tipos de correlación: Positiva, negativa y nula. Correlación positiva: Se presenta cuando una variable aumenta o disminuye y la otra también, respectivamente. Hay una relación proporcional. Por ejemplo para un
Covarianza muestral=Cov(X,Y)=∑ni= 1 (xi−x¯¯¯)(yi−y¯¯¯)N− 1 siendo x¯¯¯ e y¯¯¯ la media de cada variable y xi e yi el valor de las variables para la observación i La covarianza depende de las escalas en que se miden las variables estudiadas, por lo tanto, no es comparable entre distintos pares de variables. Para poder hacer comparaciones se estandariza la covarianza, generando lo que se conoce como coeficientes de correlación. Existen diferentes tipos, de entre los que destacan el coeficiente de Pearson, Rho de Spearman y Tau de Kendall. Todos ellos varían entre +1 y - 1. Siendo +1 una correlación positiva perfecta y - 1 una correlación negativa perfecta. Se emplean como medida de fuerza de asociación (tamaño del efecto): 0: asociación nula. 0.1: asociación pequeña. 0.3: asociación mediana. 0.5: asociación moderada. 0.7: asociación alta. 0.9: asociación muy alta. Las principales diferencias entre estos tres coeficientes de asociación son: La correlación de Pearson funciona bien con variables cuantitativas que tienen una distribución normal. En el libro Handbook of Biological Statatistics se menciona que sigue siendo bastante robusto a pesar de la falta de normalidad. Es más sensible a los valores extremos que las otras dos alternativas.
La correlación de Spearman se emplea cuando los datos son ordinales, de intervalo, o bien cuando no se satisface la condición de normalidad para variables continuas y los datos se pueden transformar a rangos. Es un método no paramétrico. La correlación de Kendall es otra alternativa no paramétrica para el estudio de la correlación que trabaja con rangos. Se emplea cuando se dispone de pocos datos y muchos de ellos ocupan la misma posición en el rango, es decir, cuando hay muchas ligaduras. Además del valor obtenido para el coeficiente de correlación, es necesario calcular su significancia. Solo si el p-value es significativo se puede aceptar que existe correlación, y esta será de la magnitud que indique el coeficiente. Por muy cercano que sea el valor del coeficiente de correlación a + 1 o − 1 , si no es significativo, se ha de interpretar que la correlación de ambas variables es 0, ya que el valor observado puede deberse a simple aleatoriedad. El test paramétrico de significancia estadística empleado para el coeficiente de correlación es el t-test. Al igual que ocurre siempre que se trabaja con muestras, por un lado está el parámetro estimado (en este caso el coeficiente de correlación) y por otro su significancia a la hora de considerar la población entera. Si se calcula el coeficiente de correlación entre X e Y en diferentes muestras de una misma población, el valor va a variar dependiendo de las muestras utilizadas. Por esta razón se tiene que calcular la significancia de la correlación obtenida y su intervalo de confianza. t=rN− 2 −−−−−√ 1 −r 2 −−−−−√, df=N− 2
Donde la suma total es la varianza muestral de la variable endógena multiplicada por el tamaño de la muestra; por lo tanto, mide las fluctuaciones de esta variable alrededor de su media; y, la suma residual indica cuál es el nivel de error que se comete con el modelo estimado al explicar la variable endógena. El coeficiente de determinación siempre va a ser menor o igual que 1 (sería igual a 1 si el modelo estimado puede explicar completamente la variable dependiente sin ningún error, lo cual es muy improbable en la práctica) y si, además, el modelo tiene término independiente, entonces el R 2 es mayor o igual que cero. Si el modelo tiene término independiente, existen diferentes expresiones que permiten el cálculo del R 2 , tales como: donde, la suma explicada es el grado de fluctuación de la variable dependiente que el modelo de regresión estimado es capaz de explicar; es el vector de parámetros estimados del modelo, X es la matriz de observaciones de las variables explicativas del modelo, y es el vector de observaciones de la variable dependiente, T es el número de observaciones de las variables del modelo, e es el cuadrado de la media de la variable dependiente.
El R 2 también se puede calcular como el cuadrado del coeficiente de correlación entre y (variable dependiente) e (variable dependiente estimada a través del modelo de regresión). Correlación positiva y correlación negativa Con los diagramas de dispersión podemos ver cómo se relacionan ambas variables entre sí. Esto es lo que se conoce como correlación. Hay tres tipos de correlación: positiva, negativa y nula (sin correlación).
Actividad 4. Regresión y correlación múltiple