Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Estadística Tema 7-10, Apuntes de Estadística

T7: Organización y representación de los datos T8: Correlación entre variables nominales y ordinales T9: Correlación lineal T10: Conceptos básicos de probabilidad

Tipo: Apuntes

2023/2024

Subido el 04/12/2023

yessmnz
yessmnz 🇪🇸

3 documentos

1 / 18

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Distribución conjunta de dos variables
Queremos saber si dos variables tienen relación Modalidades (o ciertas modalidades) se
presentan en conjunto
Para saber esto se necesita ver cómo se distribuyen ambas variables simultáneamente TABLA DE
FRECUENCIAS
Para variables cuantitativas sólo se pueden crear cuando están agrupadas en intervalos,
porque al haber muchas modalidades puede transformarse en una registra de 1 al ser todos
diferentes.
Ejemplo de tabla de frecuencias para variables cualitativas (nominales):
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12

Vista previa parcial del texto

¡Descarga Estadística Tema 7-10 y más Apuntes en PDF de Estadística solo en Docsity!

Distribución conjunta de dos variables

Queremos saber si dos variables tienen relación → Modalidades (o ciertas modalidades) se presentan en conjunto

Para saber esto se necesita ver cómo se distribuyen ambas variables simultáneamente ⇨ TABLA DE FRECUENCIAS

Para variables cuantitativas sólo se pueden crear cuando están agrupadas en intervalos , porque al haber muchas modalidades puede transformarse en una registra de 1 al ser todos diferentes.

Ejemplo de tabla de frecuencias para variables cualitativas (nominales):

Representación conjunta de dos variables

Diagrama de barras tridimensional

○ No se suele utilizar ya que si presenta muchas modalidades es más complicado ○ Tiene menos frecuencia absoluta ○ Tiene una utilización cuando se quiere ver el nivel general, es más poblacional.

Diagrama de dispersión

○ Cada punto es un caso ○ Los puntos más próximos entre sí son los que son más parecidos

Concepto de correlación

Variación conjunta de dos o más variables. Existe relación si alguna modalidad o modalidades de una variable están ligadas o se dan de forma conjunta con modalidad o modalidades de otra variable o variables.

Se analiza:

  • Intensidad : si es débil o fuerte la relación.
  • Sentido : si algo le pasa a una variable qué le pasa a la otra.

Propiedades:

  1. Es igual o mayor a 0 y menor a 1. a. C = 0: No existe relación. b. C > 0: Existe relación.
  2. Para comparar los valores obtenidos es necesario que el número de filas y de columnas sea el mismo.
  3. Para tablas cuadradas (Ej: 2x2) existe un valor máximo posible.

k: nº filas y columnas

  1. Puede calcularse para cualquier tipo de variable siempre que sea categórica o esté categorizada.
  2. No es comparable directamente con otros índices de correlación.

Para interpretar la intensidad se compara el valor del coeficiente C con Cmax si la tabla de contingencia es cuadrada , o con 1 si no es cuadrada. A más próximo al Cmax o 1 mayor intensidad. Siempre es conveniente comparar con los valores obtenidos en otras investigaciones (con las mismas variables y el mismo número de categorías en cada una de ellas).

Para interpretar el sentido se comparan las frecuencias empíricas con las frecuencias teóricas de cada casilla, y se relacionan aquellas modalidades correspondientes a las casillas cuya frecuencia empírica es distinta de la teórica.

○ En estadística inferencial: se interpretan los residuos tipificados mayores que +2 o menores que -2.

Correlación entre variables ordinales: coeficiente de correlación de Spearman (rs)

○ Correlación positiva : Valores bajos de una variable se relacionan con los valores bajos de la otra variable, o los valores altos de una con los valores altos de la otra.

○ Correlación negativa : Valores bajos de una variable se relacionan con valores altos de la otra, o al contrario, los valores altos de una variable se relacionan con los valores bajos de la otra.

ESTO SOLO NOS INDICA EL SENTIDO

No existe correlación cuando hay sujetos que ocupan las primeras posiciones en una variable (Y), otros la intermedia y otros las últimas.

  1. Se ordenan los valores de los sujetos: La ordenación debe seguir el mismo criterio en las dos variables (de menor a mayor o de mayor a menor),

En caso de empate se da a todos los que empatan el orden medio.

  1. Se calculan las diferencias de rango (se restan los resultados de la primera columna con los de la segunda) y las diferencias de rango al cuadrado.

Propiedades:

  1. Está entre -1 y +1. La intensidad es 0-1 y el sentido es +/-. a. = 0: No existe relación b. キ0: Existe relación

A TENER EN CUENTA

Antes de hacer un cálculo de índice lineal se debe comprobar que los casos en un diagrama de dispersión se sitúan sobre una línea recta, ya que podría ser una curva en vez de una recta.

Covarianza (Sxy)

Es el promedio cruzado de las puntuaciones diferenciales. Ayuda a cuantificar la relación lineal → A mayor valor absoluto, más fuerte es la relación.

Siendo N el número de pares de valores (No cada valor)

○ Positiva: relación directa ○ Cero: no hay relación ○ Negativa: relación negativa

Ejemplo 1:

Ejemplo 2:

Sxy = 0: No existe relación lineal entre las dos variables Sxy キ 0: Existe relación lineal entre las dos variables

Sxy > 0: Existe correlación lineal positiva o directa Sxy < 0: Existe correlación lineal negativa o inversa

Si transformamos linealmente las variables X e Y, la covarianza queda multiplicada por el producto de las pendientes.

Además no es un buen índice de intensidad, ya que si se modifica puede tener una intensidad mayor, este índice no debería depender de la herramienta medida. Para solucionar esto se utiliza el:

Coeficiente de correlación de Pearson (rxy)

Este índice me da un rango, por lo que es un buen indicador de intensidad ⇨ -1≤ rxy ≤+

Además, el valor absoluto del coeficiente de correlación de Pearson no varía frente a cualquier transformación lineal de las variables. El signo de la correlación queda multiplicado por el signo de las variables.

|rvw| = |rxy|

Ejemplo:

IMPORTANTE: El coeficiente de correlación de Pearson sólo indica la existencia o inexistencia de relación lineal. Si rxy = 0, solo podemos afirmar que NO existe relación lineal , pero puede existir otro tipo de relación.

Existe correlación, pero no es lineal, es una curva.

rxy = 0: No existe relación lineal entre las dos variables rxy キ 0: Existe relación lineal entre las dos variables

rxy > 0: Existe correlación lineal positiva o directa rxy < 0: Existe correlación lineal negativa o inversa sentido

rxy más próximo a 0: Menor intensidad rxy más próximo a 1 : Mayor intensidad intensidad

SIEMPRE es conveniente comparar con los valores obtenidos en otras investigaciones (con las mismas variables y el mismo número de categorías en cada una de ellas).

r^2 xy es el porcentaje de varianza que tienen en común ambas variables. Permite predecir qué está

pasando, porque tiene la misma varianza (misma variabilidad de comportamiento). Se calcula a partir de la correlación de Pearson al cuadrado, multiplicado por 100 es el porcentaje de varianza.

Correlación no implica Causalidad

FA1 y FR1 son factores NO COMUNES

F1 es FACTOR COMÚN

FACTORES QUE AFECTAN AL VALOR rxy

  1. Variabilidad del grupo: restricción del rango: Si es reducida en una o ambas variables el valor de rxy puede verse reducido.

Aquí la correlación es nula.

  1. Influencia de otras variables: Mediación.

Aunque parece tener una relación lineal falta datos que nos dé más información, que cambiaría la relación que creemos. Atenúa el nivel de relación que se piensa que era fuerte. Baja la intensidad.

  1. Influencia de otras variables: Moderación.
  2. Existencia de valores atípicos bivariados.

La probabilidad es al azar , es decir, tiene que ver con eventos que no podemos predecir con certeza ⇨ experimentos aleatorios. Un experimento aleatorio tiene dos o más resultados posibles ⇨ sucesos elementales. En cambio, cuando hay un solo resultado no hay incertidumbre , es una certeza.

Un suceso aleatorio da lugar a un suceso elemental de entre los diferentes posibles. Tiene un conjunto definido de dos o más resultados posibles , que son conocidos con anterioridad. Su resultado no se puede predecir ya que hay factores aleatorios que influyen en el resultado. Puede repetirse teóricamente cuantas veces queramos en condiciones idénticas.

Espacio muestral

Conjunto de todos los resultados posibles de un experimento aleatorio.

Ejemplo: lanzar un dado ⇨ E = {1, 2, 3, 4, 5, 6}

Tipos:

1. DISCRETO

a. FINITO: número finito de elementos Ejemplo: tirar un dado ⇨ E = {1, 2, 3, 4, 5, 6}

b. INFINITO: número infinito pero numerable de elementos. Ejemplo: que la rata elija D en el laberinto ⇨ E = {D, ID, IID, IIID, IIIID. …}

2. CONTINUO : Número infinito NO numerable de elementos. Ejemplo: tiempo en recorrer un laberinto ⇨ E = (0, ∞)

Sucesos

Cualquier subconjunto de un espacio muestral. Decimos que ocurre o se verifica cuando al realizar el experimento aleatorio tiene lugar alguno de sus elementos.

Ejemplo: E ={1, 2, 3, 4, …, 50}; S1= {1}; S2= {1, 5, 8}; S3= {10, 12, 13, … , 50}

Tipos:

1. ELEMENTAL: compuesto por un único elemento. Ejemplo: tirar un dado ⇨ E = {1} 2. COMPUESTO: compuesto por más de un elemento. Ejemplo: tirar un dado ⇨ E = {1, 2, 3} 3. SEGURO: compuesto por todos los elementos del espacio muestral. Ejemplo: tirar un dado ⇨ E = {1, 2, 3, 4, 5, 6} 4. IMPOSIBLE (Ø): compuesto por elementos que NO pertenecen al espacio muestral.

Relaciones entre sucesos

○ UNIÓN (A ሀ B)

La unión de dos sucesos (A y B) dan lugar a otro suceso del espacio muestral formado por los sucesos elementales de A y B o los dos.

Ejemplo: Día de la semana en que sale un alumno.

○ INTERSECCIÓN DE SUCESOS (A በ B)

Suceso del espacio muestral formado por los sucesos elementales que pertenecen simultáneamente a los sucesos A y B. Se deben cumplir ambas, es decir, V y S.

Ejemplo: Día de la semana en que sale un alumno.

○ MUTUA EXCLUSIVIDAD (DISJUNTOS)

Dos sucesos son mutuamente exclusivos o disjuntos cuando NO tienen elementos en común.

Ejemplo: Día de la semana en que sale un alumno.

A በ B = Ø

○ SUCESOS COMPLEMENTARIOS ( Ŝ)

Subconjunto del espacio muestral integrado por los sucesos elementales no incluidos en ese suceso. A ሀ Ā = E A በ Ā = Ø ○ DIFERENCIA DE SUCESOS (S 1 - S 2 )

Todos los elementos del espacio muestral tienen las mismas opciones de ocurrir al realizar el experimento ( resultados equiprobables ). Además, debemos conocer todo el espacio muestral y todos los elementos de Si.

Enfoque frecuentista o ‘a posteriori’

P(Si) = 𝑁 ∞

lim →

Es el límite cuando N tira a infinito teniendo en cuenta la frecuencia de un suceso (Ni) partido por la relativa.

Por lo tanto, se debe repetir un número grande de veces.

En la práctica, la frecuencia relativa del suceso se estabiliza muy pronto, por lo tanto, basta con realizar el experimento aleatorio un número pequeño de veces. Con 20 veces bastará para que se estabilice.

Ejemplo:

Probabilidad condicional

Sea un experimento aleatorio y su espacio muestral asociado (E) y sean dos sucesos A y B pertenecientes a E, la probabilidad condicional de A supuesto B [P (A|B)] es la probabilidad de ocurra A suponiendo que ya ha ocurrido B

Probabilidad de la intersección

Sea un experimento aleatorio y su espacio muestral asociado (E) y sean dos sucesos A y B pertenecientes a E, la probabilidad de la intersección [P (A ⋂ B)] es la probabilidad de ocurran simultáneamente A y B.

Independencia de sucesos

Dos sucesos son independientes si se verifica que la ocurrencia de uno no afecta a la probabilidad de la ocurrencia del otro.

P(A| B) = P(A) Si P(A) = 7; P(A| B) = 7

La probabilidad de verificación simultánea de dos sucesos independientes es igual al producto de sus probabilidades simples.