Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Esquema de análisis multivariable, Esquemas y mapas conceptuales de Sociología

Asignatura: Análisis multivariable, Profesor: , Carrera: Sociología, Universidad: UCM

Tipo: Esquemas y mapas conceptuales

2017/2018

Subido el 21/01/2018

claviculanox
claviculanox 🇪🇸

2 documentos

1 / 7

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
REGRESIÓN LINEAL
Y= b0 + b1X1 + … + bpXp + e
Técnica de variable dependiente:
- Sirve para predecir valores de una variable dependiente.
- Cuantificar dependencia: R cuadrado.
· r (Pearson): covarianza explicada
· r cuadrado = varianza predicha (>20% MAL; <80% DETERMINANTE; >= 80%
ÓPTIMA)
· r cuadrado ajustada: corrige la sobrestimación cuando no se mantienen números variables.
- Determinar grado de confianza y significatividad: N.C. = 95%; Sig <= 0,05; t = 3
Supuestos básicos:
- Variables relevantes: comparación de medias; tablas de contingencia.
- Linealidad: el efecto de cada variable independiente sobre la dependiente es el mismo
indistintamente del valor de Y.
- Tamaño de la muestra elevado.
- Continua (dummy/rec).
- Adivitividad: suma de los efectos de las variables independientes entre sí.
- Normalidad: correspondencia con la distribución normal.
· Gráficos: residuos (histograma de barras); probabilidad normal (nube de puntos).
· F. de Snedecor.
· T de Student.
· W de Shapiro Wilks (pequeño; 0 = NO CUMPLE; 1 = CUMPLE).
· D de Kolmogorov (grnde; 0 = CUMPLE; 1 = NO CUMPLE).
- Homocedasticidad: para que relación de la variable independiente con la dependiente pueda
medirse con rigor.
Hipótesis nula = varianzas iguales. Se da si se cumple el supuesto de normalidad, también
por la concentración de casos.
Estadísticos: Durbin Watson 1,25 – 2,5; Levane: significatividad.
- Ausencia de colinealidad entre las variables:
r = 0,6 PROBLEMÁTICO
r = 0,8 SEVERO
r = 0,0 NO EXISTE
r = 1 PERFECTA
- Tolerancia: medir la multicolinealidad. Tol = 1 – R^2 ( = 0 PERFECTA; = 0,2 SEVERA;
= 1 AUSENCIA)
- Análisis de la varianza:
R cuadrado = suma de cuadrados de regresión / suma de cuadrados total (S. C. Regresión +
S. C. Residual)
Error típico de estimación =
Intervalo de confianza +/- 1,96
oscilación de la variable
pf3
pf4
pf5

Vista previa parcial del texto

¡Descarga Esquema de análisis multivariable y más Esquemas y mapas conceptuales en PDF de Sociología solo en Docsity!

REGRESIÓN LINEAL

Y= b0 + b1X1 + … + bpXp + e

Técnica de variable dependiente:

  • Sirve para predecir valores de una variable dependiente.
  • Cuantificar dependencia: R cuadrado. · r (Pearson): covarianza explicada · r cuadrado = varianza predicha (>20% MAL; <80% DETERMINANTE; >= 80% ÓPTIMA) · r cuadrado ajustada: corrige la sobrestimación cuando no se mantienen números variables.
  • Determinar grado de confianza y significatividad: N.C. = 95%; Sig <= 0,05; t = 3

Supuestos básicos:

  • Variables relevantes: comparación de medias; tablas de contingencia.
  • Linealidad: el efecto de cada variable independiente sobre la dependiente es el mismo indistintamente del valor de Y.
  • Tamaño de la muestra elevado.
  • Continua (dummy/rec).
  • Adivitividad: suma de los efectos de las variables independientes entre sí.
  • Normalidad: correspondencia con la distribución normal. · Gráficos: residuos (histograma de barras); probabilidad normal (nube de puntos). · F. de Snedecor. · T de Student. · W de Shapiro Wilks (pequeño; 0 = NO CUMPLE; 1 = CUMPLE). · D de Kolmogorov (grnde; 0 = CUMPLE; 1 = NO CUMPLE).
  • Homocedasticidad: para que relación de la variable independiente con la dependiente pueda medirse con rigor. Hipótesis nula = varianzas iguales. Se da si se cumple el supuesto de normalidad, también por la concentración de casos. Estadísticos: Durbin Watson 1,25 – 2,5; Levane: significatividad.
  • Ausencia de colinealidad entre las variables: r = 0,6 PROBLEMÁTICO r = 0,8 SEVERO r = 0,0 NO EXISTE r = 1 PERFECTA
  • Tolerancia: medir la multicolinealidad. Tol = 1 – R^2 ( = 0 PERFECTA; = 0,2 SEVERA; = 1 AUSENCIA)
  • Análisis de la varianza: R cuadrado = suma de cuadrados de regresión / suma de cuadrados total (S. C. Regresión + S. C. Residual) Error típico de estimación = Intervalo de confianza +/- 1, oscilación de la variable

REGRESIÓN LOGÍSTICA

Para análisis de variables categóricas:

  • Su componente básico son los logaritmos
  • Y = 1 OCURRENCIA ; Y = 0 NO OCURRENCIA
  • Variables cualitativas nominales.
  • Determina el grado de relación dependiente entre las variables independientes. Logit (Y) = Incremento de probabilidad = Ajuste global del modelo Razón de verosimilitud: · R ^ 2 de Cox y Snell · R ^ 2 de Nagelkerke
  • Eficacia predictiva del modelo (taabla de clasificación): eficacia del total de casos observados que logran ser clasificados correctamente por el modelo obtenido. (Valor de corte = 0,05) Fórmula del estadístico Phi:

ANÁLISIS DE CONGLOMERADOS

Objetivos:

  • Técnica de interdependencia.
  • Agrupación de datos en casos o variables.
  • Los distintos conglomerados son mutuamente excluyentes.
  • Principio de parsimonia: · Lo más homogéneos dentro de los conglomerados. · Distintos de los otros conglomerados.
    • conglomerados = + homogeneidad.
  • Usos principales del primer conglomerado: · Desarrollo de tipologías /clasificación. · Esquemas conceptuales. · Generalización de hipótesis.
  • No avanza hacia la inferencia.
  • Muy subjetiva.

Selección de variables:

  • Relevantes.
    • relevantes = + atípicos que se ajustan al conglomerado: pueden dejar de serlo durante el proceso.
  • Se ha de hacer estandarización: puntuaciones Z = escoger 1.
  • Modifican cada variable con un rango de 0 a 1.
  • Si las escalas son similares no se necesita.

Decisión sobre el nº de conglomerados: · Criterio teórico. · Coeficientes de conglomeración: indican el valor numérico que propicia la unión de objetos. Hay que observar grandes variaciones en los valores de los coeficientes. Medida de distancia, las variaciones muestran un aumento en los coeficientes; medida de similitud: disminución del coeficiente. · Cálculo incremento = [(valor final – valor inicial) / valor inicial] * 100 · Gráfico de sedimentación: pendiente. · Programas estadísticos. · Dendograma. · Probar con un nº de conglomerados diferente.

  • Interpretación de los resultados: ·Jerárquico: historial de conglomeración (p. 290); matriz de proximidades (p. 305); cluster de pertenencia (p. 294); témpanos (p. 307). · No jerárquico (k-means): centro de clústeres iniciales (p. 299); centro de clústeres finales (p. 300); nº de casos de cada cluster; ANOVA (302); cluster de pertenencia (304); distancias entre centros (301); gráficos de dispersión, pertenencia al conglomerado (308). Tener en cuenta: estandarizar variables, iterar, criterio de convergencia, guardar, centro de cluster.
  • Validación de resultados: · Detección de atípicos z + 0 >= 3 · ANOVA Y MANOVA. · Replicación.

ANÁLISIS FACTORIAL

Objetivos

  • Técnica de interdependencia entre variables, no establece relaciones causales y no diferencia entre VD y VI.
  • Técnica de clasificación: sintetiza info de <

    > variables observadas (indicadores), con la menor pérdida de <> variables no observadas (factores comunes/componentes principales).

  • Obtener puntuaciones factoriales v. típicas o v. sucedáneas para cada factor.
  • El modelo factorial debe ser parsimonioso.

Tipologías de modelos factoriales

  • Análisis factorial exploratorio – A. F. confirmatorio.
  • A. F. R: identificar un nº reducido de dimensiones latentes en el conjunto de la variable. A. F. Q: interrelaciones entre casos, no variables (homogeneidad / no heterogeneidad).
  • A. F. métrico: usa media y varianza. A.F. No métrico: variables cualitativas creadas en ficticias, modelo booleano.
  • A. de componentes principales: · varianza total del conjunto · se relacionan variables latentes con var. Observadas · explican el mayor % de varianza total con el menor nº de componentes · se pueden extraer tantos componentes como variables · los primeros componentes suelen ser los que más cantidad de varianza de las vars resumen · correlación entre las v. de los componentes · componentes no correlacionados · componente ppal en función de las <

    > variables observadas correlacionadas · indicador para predecir el nº mínimo de factores necesarios para explicar % de varianzas

Análisis de factor común: · varianza común · v. observadas y v. latentes se relacionan · variables latentes = factores · cada variable observada X se expresa mediante la combinación lineal de un nº de factores latentes: factor común; factor único: término de error: parte de la varianza no observada · los indicadores son expresados en función de las variables latentes (f. común y f. único) · analiza la covarianza: maximizar la varianza común (comunalidad) · indicado para la identificación de variables latentes · normalmente ACP es previo a AFC

Supuestos básicos y decisiones clave del análisis factoriales

  • Tamaño elevado = + fiabilidad: 200 casos o 5 por cada variable estudiada.
  • Normalidad multivariable: v. observadas y combinaciones distribuidas normalmente = + precisión. Una asimetría severa puede distorsionar los resultados. Gráficos: · histograma de residuos · gráfico de probabilidad normal (P-P) · gráfico de cuartiles (Q – Q) Estadísticos: · W de Shapiro-Wilks (<50): 1 = cumplimiento; 0 = incumplimiento · D de Kolmogorov-Smirnov (<1000): 1 = incumplimiento; 0 = cumplimiento
  • Correlación entre variables: análisis pertinente cuando existe una correlación mínima de +/-0,3. + correlación = + probabilidad de que la varianza se sintetice en un nº menor de factores o componentes.
  • Linealidad: relación entre pares de variables / relación entre variables observadas y factores latentes ha de ser lineal. Gráficos: · Dispersión: relación de cada VI con VD; la nube de puntos ha de acercarse a la recta; detecta atípicos · Regresión parcial: relación neta de cada VI con VD, mostrando relación residual; nube de puntos debe acercarse a la recta; detecta atípicos · Residuos: relaciona residuos de VI con VD a la vez. Residuo = valor pronosticado – valor observado; debe situarse en la recta horizontal Métodos de correción de no linealidad: regresión múltiple.
  • Decisiones a tomar: · Matriz de covarianza: para cuando las variables observadas se encuentren en: varianzas similares o escalas similares. · Matriz de correlaciones: hay que estandarizar las v. originales.
  1. ACP: diagonal principal integrada por 1.
  2. AFC: diagonal ppal integrada por las comunalidades de cada variable: varianza común. Matriz de correlación reducida (R* o R) Estadísticos: r de Pearson: determinante de la matriz de correlación; índice KMO; prueba de esfericidad de Barlett; medida de adecuación de la muestra (MSA); correlación anti-imagen; coeficiente de correlación múltiple cuadrados.

Extracción de factores comunes o componentes principales

  • Componentes principales = variables latentes. Toda la varianza. 1º) Combinación lineal de variables con más varianza. 2º) Combinación lineal de variables con más proporción de varianza residual.
  • Factor principal (más usado): solo varianza compartida, se usa la matriz de correlación reducida, se procede a la extracción de factores, la contribución de cada factor a la