Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad

Definiciones para hacer los problemas de regresión, factorial y cluster, Ejercicios de Criminología

Asignatura: Análisis multivariante de indicadores en Criminología, Profesor: Maria Gloria Cobano, Carrera: Criminología, Universidad: UPO

Tipo: Ejercicios

2016/2017

Subido el 18/05/2017

rosapadilla
rosapadilla 🇪🇸

3.8

(6)

5 documentos

1 / 6

Documentos relacionados


Vista previa parcial del texto

¡Descarga Definiciones para hacer los problemas de regresión, factorial y cluster y más Ejercicios en PDF de Criminología solo en Docsity! GLOSARIO ANÁLISIS MULTIVARIANTE Rosa Padilla Atalaya TEMA 1 -4 niveles de conocimiento: descrip�vo, explica�vo y predic�vo (condiciones que favorecen o dificultan la criminalidad) y aplicado. -Indicadores sinté�cos: herramienta cualita�va que ofrece una evaluación mul�dimensional del concepto social que se está analizando. -Estadís�ca criminal: conjunto de la producción de estadís�cas oficiales sobre la delincuencia, ofrece información sobre una serie de dimensiones cuan�ficables del fenómeno delic�vo. -Diligencias previas: sirven como medida de la ac�vidad de cada juzgado más que del volumen del delito, forman parte de las estadís�cas judiciales. -Fuentes policiales: recogen los hechos que llegan a conocimiento de la policía mediante denuncias o inves�gaciones de oficio. Proporcionan información completa y regular y permite analizar áreas geográficas pequeñas y fenómenos estadís�camente poco frecuentes. -Fuentes judiciales: existe mucho desfase con respecto a las estadís�cas policiales sobre os mismos hechos. Habitualmente las cifras de las diligencias son más que el nº de denuncias. -Fuentes penitenciarias: no son fuentes de conocimiento del delito en sí, sino fuentes de conocimiento solo de un conjunto de ins�tuciones del sistema penal que ges�onan la ejecución de las penas priva�vas de libertad. TEMA 2 -Enfoque no agrega�vo: determina un conjunto o sistema de indicadores sociales, establece áreas de interés común para medir el fenómeno y definir indicadores que reflejen los aspectos más importantes. -Enfoque agrega�vo: establece una metodología de agregación adecuada para construir un indicador sinté�co que recoja dis�ntos aspectos especialmente relevantes, relacionados con el estudio y ú�les para su medición a nivel global. Parten de un sistema de indicadores intermedios ya establecido. Busca construir un solo indicador global que resuma la información de los sistemas de indicadores sociales preexistentes. -Construcción de indicadores: Descripción del contextoF 0 E 0definir los obje�vosF 0 E 0iden�ficación, evaluación y selección de los indicadores que integran el sistemaF 0 E 0aplicación del sistema de indicadores. -Indicador de eficiencia judicial: condenados que cumplen pena en prisión. -Indicador de eficacia judicial: porcentaje de sentencias emi�das sobre asuntos ingresados por juez. TEMA 3 -Regresión: estudia la construcción de modelos para analizar la dependencia entre una variable dependiente y una o más variables independientes. El objeto de análisis es analizar la relación estadís�ca entre una variable dependiente y otra independiente. Y predecir así el comportamiento promedio de la variable dependiente una vez conocidos los de la variable independiente, que se consideran fijos en muestreos repe�dos. Para realizar este análisis primero hay que especificar el modelo de regresión. Los parámetros desconocidos (B) se es�man usando la información de las observaciones muestrales de las variables del modelo. -Nube de puntos: gráfica que representa la relación estadís�ca entre as variables. -Error: diferencia entre el valor real y el valor es�mado. Son una es�mación de la perturbación aleatoria. -Mínimos cuadrados ordinarios (MCO): es un método muy intui�vo y simple para es�mar el modelo de regresión. A par�r de una nube de puntos nos permite encontrar la función más representa�va posible de dicha nube de puntos, la que da lugar a los valores es�mados de Y para que los residuos sean los más pequeños. Minimiza la suma de los errores. -S x y: covarianza de X e Y, puede ser posi�va o nega�va. Si las dos variables son independientes, la covarianza será 0. -S2x: varianza e X, siempre es posi�va. -Coeficiente de regresión: indica la variación esperada ( o en promedio) de la variable dependiente cuando la independiente varía una unidad, suponiendo que el resto de las variables explica�vas permanecen constantes. -Coeficiente de determinación (R2): vale entre 0 y 1, a parir de 0,75 consideramos que es bueno. Cuan�fica la calidad de la explicación que hace x de y. Determina la bondad del ajuste porque valora lo cerca que está la nube de puntos de la recta de regresión. Si el ajuste es bueno, la varianza residual será mínima. Indica el porcentaje de la variabilidad de la variable dependiente que queda explicada por las variables explica�vas del modelo de regresión. Puede usarse para comparar modelos alterna�vos para escoger el que mejor explica el comportamiento de la variable dependiente, pero deben tener la misma Y, el mismo nº de variables explica�vas y el mismo tamaño muestral. -Coeficiente de determinación corregido (R2corregido): penaliza la inclusión de nuevas variables explica�vas en el modelo, o el escaso nº de muestras. Puede tomar valores nega�vos. Determina si el tamaño muestral es lo suficientemente grane para que R2 sea fiable, éste será fiable cuando ambos coeficientes tengan valores similares. -Coeficiente de correlación (R): mide la relación de dependencia. Si se aproxima a 0 hay menos dependencia entre las variables. Su signo está determinado por la covarianza, i e posi�va, la relación será directa y i e nega�va, la relación será inversa. -Grados de libertad: diferencia entre la muestra y el nº de variables explica�vas. Cuantos más altos, más realista será el ajuste. -Modelos anidados: modelos alterna�vos con la misma variable dependiente y dis�nto nº de variables explica�vas. -Coeficiente de correlación parcial (r2,a): determina el grado de relación lineal entre la variable dependiente y alguna de las variables independientes, dejando fuera la influencia común que pudiera tener la variable independiente obre la variable dependiente y sobre X2. -Significa�vidad individual: analizar si cada variable explica (al menos en parte) el comportamiento de la variable dependiente a nivel poblacional con cierto nivel de error. Debemos plantear un contrate e hipótesis: si rechazamos H0 la variable explicaría el comportamiento promedio de Y. para resolver el contraste se emplea el estadís�co t-Student y su p-valor indicará el nivel de significación más bajo al que se puede rechazar la H0 cuando es cierta, la probabilidad de error �po I más pequeña posible. -Significa�vidad global: estudia si las variables independientes pueden explicar de forma conjunta la variable dependiente. La H0 afirma que el modelo es globalmente no significa�vo. Para resolver este contraste se emplea el coeficiente de determinación F de Fisher, que en SPSS se muestra en la tabla ANOVA junto al p- valor. -Normalidad: la perturbación aleatoria se distribuye según una distribución normal. -Cuar�max: método de rotación ortogonal que trata de simplificar las filas. Busca una variable que tenga una carga alta con un factor y baja con las demás. -Equimax: método de rotación ortogonal que combina varimax y cuar�max. -Matriz de puntuaciones principales: permite conocer qué sujetos son los más extremos, la representación gráfica ayuda a detectar cosos a�picos. -Estandarización: es una transformación lineal a una nueva variable que expresa el número de desviaciones �picas que dista de la media cada observación. TEMA 5 -Análisis Clúster: es una técnica mul�variante cuya finalidad es dividir un conjunto de objetos en grupos, de forma que los objetos de un mismo grupo sean muy similares entre sí, mientras que los objetos de clústeres diferentes sean o más dis�ntos posible. Parte de un conjunto de en�dades de los cuales se han registrado una serie de caracterís�cas. -Distancia euclídea: cuando todas las variables han sido medidas en escalas de intervalo, la medida más usada para calcular la disimilaridad es la distancia euclídea. -Concordancia simple: es el método de distancias con variables binarias más usado. -Método jerárquico de agrupamiento: en cada paso del algoritmo sólo un objeto cambia de grupo y los grupos están anidados en los de pasos anteriores. Puede ser aglomera�vo o divisivo. -Vínculos entre grupos (o promedio): mide la proximidad entre 2 grupos calculando la media entre las distancias entre objetos de ambos grupos, o la media de las similitudes sobre objetos de ambos grupos. -Método de Ward: también llamado método de la varianza mínima, ya que lo que hace es buscar los 2 conglomerados cuya unión conlleve al menor incremento de la varianza. -Método no jerárquico: solo hacen una única clasificación de los datos en un determinado nº de conglomerados y el nº de grupos debe ser seleccionado por el inves�gador. Uno de los mayores problemas es que hay que conocer a priori cuál es el mejor valor de k. -K-medias: método no jerárquico que se basa en asignar los elementos a los conglomerados cuyo centroide esté más próximo. -Centroide: punto p-dimensional resultado de promediar en cada variable los valores de los elementos integrantes. TEMA 6 -Igualdad en la ponderación: método de ponderación que establece que los indicadores sinté�cos deben ser obtenidos otorgando a cada indicador la misma importancia y agregando la información mediante una suma ponderada de los valores normalizados de los indicadores iniciales. Al final se ob�ene una medida sinté�ca global, pero ignora las relaciones causales entre los indicadores iniciales. -Ponderaciones basadas en métodos par�cipa�vos: la ponderación se ob�ene a par�r de las valoraciones subje�vas mostradas por el conjunto e expertos. -Basadas en técnicas de análisis mul�variante, análisis de componentes principales: resuelve el problema de la doble contabilización de información y la asignación de valores concretos a las ponderaciones. Sus medidas reflejan la máxima información posible. Debe haber cierto grado de correlación entre los indicadores iniciales y se aplica a los indicadores iniciales normalizados cuando no hay un consenso entre los expertos. Se basa en el uso de los valores obtenidos de las componentes principales seleccionadas.
Docsity logo



Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved