










Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
T7: Organización y representación de los datos T8: Correlación entre variables nominales y ordinales T9: Correlación lineal T10: Conceptos básicos de probabilidad
Tipo: Apuntes
1 / 18
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!











Distribución conjunta de dos variables
Queremos saber si dos variables tienen relación → Modalidades (o ciertas modalidades) se presentan en conjunto
Para saber esto se necesita ver cómo se distribuyen ambas variables simultáneamente ⇨ TABLA DE FRECUENCIAS
Para variables cuantitativas sólo se pueden crear cuando están agrupadas en intervalos , porque al haber muchas modalidades puede transformarse en una registra de 1 al ser todos diferentes.
Ejemplo de tabla de frecuencias para variables cualitativas (nominales):
Representación conjunta de dos variables
Diagrama de barras tridimensional
○ No se suele utilizar ya que si presenta muchas modalidades es más complicado ○ Tiene menos frecuencia absoluta ○ Tiene una utilización cuando se quiere ver el nivel general, es más poblacional.
Diagrama de dispersión
○ Cada punto es un caso ○ Los puntos más próximos entre sí son los que son más parecidos
Concepto de correlación
Variación conjunta de dos o más variables. Existe relación si alguna modalidad o modalidades de una variable están ligadas o se dan de forma conjunta con modalidad o modalidades de otra variable o variables.
Se analiza:
Propiedades:
k: nº filas y columnas
Para interpretar la intensidad se compara el valor del coeficiente C con Cmax si la tabla de contingencia es cuadrada , o con 1 si no es cuadrada. A más próximo al Cmax o 1 mayor intensidad. Siempre es conveniente comparar con los valores obtenidos en otras investigaciones (con las mismas variables y el mismo número de categorías en cada una de ellas).
Para interpretar el sentido se comparan las frecuencias empíricas con las frecuencias teóricas de cada casilla, y se relacionan aquellas modalidades correspondientes a las casillas cuya frecuencia empírica es distinta de la teórica.
○ En estadística inferencial: se interpretan los residuos tipificados mayores que +2 o menores que -2.
Correlación entre variables ordinales: coeficiente de correlación de Spearman (rs)
○ Correlación positiva : Valores bajos de una variable se relacionan con los valores bajos de la otra variable, o los valores altos de una con los valores altos de la otra.
○ Correlación negativa : Valores bajos de una variable se relacionan con valores altos de la otra, o al contrario, los valores altos de una variable se relacionan con los valores bajos de la otra.
○ No existe correlación cuando hay sujetos que ocupan las primeras posiciones en una variable (Y), otros la intermedia y otros las últimas.
En caso de empate se da a todos los que empatan el orden medio.
Propiedades:
Antes de hacer un cálculo de índice lineal se debe comprobar que los casos en un diagrama de dispersión se sitúan sobre una línea recta, ya que podría ser una curva en vez de una recta.
Covarianza (Sxy)
Es el promedio cruzado de las puntuaciones diferenciales. Ayuda a cuantificar la relación lineal → A mayor valor absoluto, más fuerte es la relación.
Siendo N el número de pares de valores (No cada valor)
○ Positiva: relación directa ○ Cero: no hay relación ○ Negativa: relación negativa
Ejemplo 1:
Ejemplo 2:
Sxy = 0: No existe relación lineal entre las dos variables Sxy キ 0: Existe relación lineal entre las dos variables
Sxy > 0: Existe correlación lineal positiva o directa Sxy < 0: Existe correlación lineal negativa o inversa
Si transformamos linealmente las variables X e Y, la covarianza queda multiplicada por el producto de las pendientes.
Además no es un buen índice de intensidad, ya que si se modifica puede tener una intensidad mayor, este índice no debería depender de la herramienta medida. Para solucionar esto se utiliza el:
Coeficiente de correlación de Pearson (rxy)
Este índice me da un rango, por lo que es un buen indicador de intensidad ⇨ -1≤ rxy ≤+
Además, el valor absoluto del coeficiente de correlación de Pearson no varía frente a cualquier transformación lineal de las variables. El signo de la correlación queda multiplicado por el signo de las variables.
|rvw| = |rxy|
Ejemplo:
IMPORTANTE: El coeficiente de correlación de Pearson sólo indica la existencia o inexistencia de relación lineal. Si rxy = 0, solo podemos afirmar que NO existe relación lineal , pero puede existir otro tipo de relación.
Existe correlación, pero no es lineal, es una curva.
rxy = 0: No existe relación lineal entre las dos variables rxy キ 0: Existe relación lineal entre las dos variables
rxy > 0: Existe correlación lineal positiva o directa rxy < 0: Existe correlación lineal negativa o inversa sentido
rxy más próximo a 0: Menor intensidad rxy más próximo a 1 : Mayor intensidad intensidad
SIEMPRE es conveniente comparar con los valores obtenidos en otras investigaciones (con las mismas variables y el mismo número de categorías en cada una de ellas).
r^2 xy es el porcentaje de varianza que tienen en común ambas variables. Permite predecir qué está
pasando, porque tiene la misma varianza (misma variabilidad de comportamiento). Se calcula a partir de la correlación de Pearson al cuadrado, multiplicado por 100 es el porcentaje de varianza.
Correlación no implica Causalidad
FA1 y FR1 son factores NO COMUNES
F1 es FACTOR COMÚN
FACTORES QUE AFECTAN AL VALOR rxy
Aquí la correlación es nula.
Aunque parece tener una relación lineal falta datos que nos dé más información, que cambiaría la relación que creemos. Atenúa el nivel de relación que se piensa que era fuerte. Baja la intensidad.
La probabilidad es al azar , es decir, tiene que ver con eventos que no podemos predecir con certeza ⇨ experimentos aleatorios. Un experimento aleatorio tiene dos o más resultados posibles ⇨ sucesos elementales. En cambio, cuando hay un solo resultado no hay incertidumbre , es una certeza.
Un suceso aleatorio da lugar a un suceso elemental de entre los diferentes posibles. Tiene un conjunto definido de dos o más resultados posibles , que son conocidos con anterioridad. Su resultado no se puede predecir ya que hay factores aleatorios que influyen en el resultado. Puede repetirse teóricamente cuantas veces queramos en condiciones idénticas.
Espacio muestral
Conjunto de todos los resultados posibles de un experimento aleatorio.
Ejemplo: lanzar un dado ⇨ E = {1, 2, 3, 4, 5, 6}
Tipos:
a. FINITO: número finito de elementos Ejemplo: tirar un dado ⇨ E = {1, 2, 3, 4, 5, 6}
b. INFINITO: número infinito pero numerable de elementos. Ejemplo: que la rata elija D en el laberinto ⇨ E = {D, ID, IID, IIID, IIIID. …}
2. CONTINUO : Número infinito NO numerable de elementos. Ejemplo: tiempo en recorrer un laberinto ⇨ E = (0, ∞)
Sucesos
Cualquier subconjunto de un espacio muestral. Decimos que ocurre o se verifica cuando al realizar el experimento aleatorio tiene lugar alguno de sus elementos.
Ejemplo: E ={1, 2, 3, 4, …, 50}; S1= {1}; S2= {1, 5, 8}; S3= {10, 12, 13, … , 50}
Tipos:
1. ELEMENTAL: compuesto por un único elemento. Ejemplo: tirar un dado ⇨ E = {1} 2. COMPUESTO: compuesto por más de un elemento. Ejemplo: tirar un dado ⇨ E = {1, 2, 3} 3. SEGURO: compuesto por todos los elementos del espacio muestral. Ejemplo: tirar un dado ⇨ E = {1, 2, 3, 4, 5, 6} 4. IMPOSIBLE (Ø): compuesto por elementos que NO pertenecen al espacio muestral.
Relaciones entre sucesos
La unión de dos sucesos (A y B) dan lugar a otro suceso del espacio muestral formado por los sucesos elementales de A y B o los dos.
Ejemplo: Día de la semana en que sale un alumno.
Suceso del espacio muestral formado por los sucesos elementales que pertenecen simultáneamente a los sucesos A y B. Se deben cumplir ambas, es decir, V y S.
Ejemplo: Día de la semana en que sale un alumno.
Dos sucesos son mutuamente exclusivos o disjuntos cuando NO tienen elementos en común.
Ejemplo: Día de la semana en que sale un alumno.
Subconjunto del espacio muestral integrado por los sucesos elementales no incluidos en ese suceso. A ሀ Ā = E A በ Ā = Ø ○ DIFERENCIA DE SUCESOS (S 1 - S 2 )
Todos los elementos del espacio muestral tienen las mismas opciones de ocurrir al realizar el experimento ( resultados equiprobables ). Además, debemos conocer todo el espacio muestral y todos los elementos de Si.
Enfoque frecuentista o ‘a posteriori’
P(Si) = 𝑁 ∞
lim →
Es el límite cuando N tira a infinito teniendo en cuenta la frecuencia de un suceso (Ni) partido por la relativa.
Por lo tanto, se debe repetir un número grande de veces.
En la práctica, la frecuencia relativa del suceso se estabiliza muy pronto, por lo tanto, basta con realizar el experimento aleatorio un número pequeño de veces. Con 20 veces bastará para que se estabilice.
Ejemplo:
Probabilidad condicional
Sea un experimento aleatorio y su espacio muestral asociado (E) y sean dos sucesos A y B pertenecientes a E, la probabilidad condicional de A supuesto B [P (A|B)] es la probabilidad de ocurra A suponiendo que ya ha ocurrido B
Probabilidad de la intersección
Sea un experimento aleatorio y su espacio muestral asociado (E) y sean dos sucesos A y B pertenecientes a E, la probabilidad de la intersección [P (A ⋂ B)] es la probabilidad de ocurran simultáneamente A y B.
Independencia de sucesos
Dos sucesos son independientes si se verifica que la ocurrencia de uno no afecta a la probabilidad de la ocurrencia del otro.
La probabilidad de verificación simultánea de dos sucesos independientes es igual al producto de sus probabilidades simples.