









Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
realcion de ejercicios del tema 1, 4 ejercicios resueltos con tablas
Tipo: Apuntes
1 / 17
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!










1. En el fichero hipótesis.sf3 se recoge la siguiente información para cuatro empresas:
a. Estudie la normalidad univariante para las variables Cotización y Facturación a partir de un análisis gráfico y de un test específico de normalidad.
Primero de todo DescribirAjustes de distribuciones Ajuste de datos no censuradosCotización
El segundo paso del ejercicio es establecer las hipótesis;
H0: normalidad.
H1: no hay normalidad.
Los datos para comprobar que es una normal:
Histograma: Podemos que es un función normal (parábola).
Gráfico cuantil-cuantil: si los puntos están sobre la línea, podemos decir que es normal.
Resumen estadístico ( DescribirDatos númericosAnálisis de una varibleCotización ):
Valores de estos estadísticos fuera del rango de -2 a +2 indican desviaciones significativas de la normalidad, lo que tendería a invalidar cualquier prueba estadística con referencia a la desviación estándar. En este caso, el valor del sesgo estandarizado se encuentra dentro del rango esperado para datos provenientes una distribución normal. El valor de curtosis estandarizada se encuentra dentro del rango esperado para datos provenientes de una distribución normal.
Por último, para comprobarlo de verdad, escogemos el análisis Shapiro-Wilk, si es una muestra pequeña.
Por lo tanto, si se acepta la hipótesis nula podemos decir que hay normalidad.
2. Para analizar la actitud de los trabajadores de un barrio hacia el fraude fiscal se selecciona una muestra de 30 individuos y se realiza la siguiente encuesta (archivo: missing fraude fiscal.sgd):
a) ¿Se observa un comportamiento distinto en la variable EDAD para los casos con datos perdidos y los casos con datos presentes en la variable PERSEGUIR?
La variable “Edad” es una variable cuantitativa, tenemos que relacionarla con perseguir, ya que debemos relacionarlo con los datos presentes que son igual a 1 y los perdidos que son igual 0, debemos seleccionar la variable “perserguirse_dicotómica”, por lo tanto primero vamos a realizarlo con…
Valores presentes=
Normalidad:
H0: se acepta la hipótesis (se acepta).
H1: no hay normalidad.
Procedimiento:
DescribirAjuste de distribucionesAjuste de datos no censurados
Datos: Edad
Selección: Perseguirse dicotómica=
Si es una muestra pequeña (menor que 100). Por lo tanto lo analizamos con Shapiro-Wilk.
Ya que el P.valor es mayor que alfa, la hipótesis nula se acepta. Por lo tanto, no observamos que tenga un comportamiento distinto. Sigue una distribución normal.
Valores perdidos=
Normalidad:
H0: se acepta la hipótesis (se acepta).
H1: no hay normalidad.
Procedimiento:
DescribirAjuste de distribucionesAjuste de datos no censurados
Datos: Edad
Selección: Perseguirse dicotómica=
Si es una muestra pequeña (menor que 100). Por lo tanto lo analizamos con Shapiro-Wilk.
Ya que el P.valor es mayor que alfa, la hipótesis nula se acepta. Por lo tanto, no observamos que tenga un comportamiento distinto. Sigue una distribución normal.
Tenemos que comprobar la igualad de medianas;
H0: las medianas son iguales.
H1: no hay igualdad.
Comparación de Medias
Solo tenemos que cambiar en este cuadro, y poner comparación de medias.
En este caso el P.valor es mayor que 0,05. Por lo tanto la hipótesis nula se acepta y hay igualdad de medias.
Aclaración Si las medias, medianas o varianzas son iguales no se influyen entre ellas mismas (variables), y si son diferente las variables sin influyen (Variables).
b. ¿Existen diferencias significativas en la variable CAMPAÑAS entre las observaciones que tienen valores missing en PERSEGUIR y las que no?
Si Campañas es una variable es ordinal, hay que hacer una comparación de medianas. Dentro de la variable campañas, debemos de descubrir si los missing afectan a la variable, o no afectan a ella. Por lo tanto, si las medianas son iguales no influye en la variable perseguir, y si no son iguales las medianas sí que influye en la variable perseguir.
H0: son iguales las medianas
H1: no son iguales las medianas.
Procedimiento:
Comparar Dos muestras Muestras Independientes (Columnas de Códigos y Datos).
Sabemos que 1=autónomo y 2=cuenta ajena. Por lo tanto, podemos analizar cuantos casos perdidos hay en autónomos y en cuenta ajena.
Seguimos con el ejercicio realizando:
Comparar Dos muestras Pruebas de hipótesisProporciones Binomiales (mirar datos en la tabla que nos salió al hacer la tabulación cruzada).
Ahora llegaremos al cuadro;
Proporción de la muestra 1: cogiendo de la tabla cruzada el primer número que es el 5 dividido entre el total de su fila que es 11 y resultado es 0,454545.
Tamaño Muestra 1: 11
Proporción de la muestra 2: cogiendo de la tabla cruzada el primer número que es el 2 dividido entre el total de su fila que es 19 y resultado es 0,1053.
Tamaño Muestra 2: 19
Se utiliza Prueba-Z
Se rechaza la hipótesis nula, ya que es menor que 0,05. Por lo tanto, no hay igualdad de proporciones.
d) Compruebe si los casos con valores perdidos en distintas variables están relacionados, mediante una prueba de correlaciones dicotomizadas.
Las variables con valores perdidos son PERJUDICA y PERSEGUIRSE, por lo que tenemos que hacer el análisis con estas variables dicotomizadas.
H0: hay correlación.
Procedimiento:
DescribirDatos NuméricosIdentificación de Valores Atípicos.
Analizando los valores atípicos, tenemos que observar los datos que estén fueran de -3 y 3, eso nos dice los valores atípicos.
Aquí este caso, se rechaza la hipótesis nula en la Prueba de Grubbs, por lo tanto se mira la última columna. Y podemos decir que si hay valores atípicos.
Aclaración Si es normal miro la segunda columna y si se rechaza la hipótesis nula, es la 4 y última columna.
Otra manera de verlo es en el gráfico de caja y bigotes, donde podemos aprecias que hay valores atípicos y la distribución es no normal.
Además podemos decir, para comprobar que no es normal que el sesgo y curtosis no se encuentra entre -2 y 2.
b) Calcule las distancias de Mahalanobis y comente su utilidad para la detección multivariante de casos atípicos.
Después de hacer esto, debemos seleccionar una nueva columna,ir a Generar datos y poner en Expresión: CHISQUARE(MDISTS;6;), MDISTS porque es la variable nueva y 6 es porque son las variables independientes que tenemos.
Ahora nos tenemos que fijar en los valores que tenga una diferencia menor a 0,01 , eso conlleva a elegir los 7 primeros. Como podemos en la imagen.
Ahora vamos a GraficarGraficos ExploratoriosGrafico de Cajas y Bigotes Una muestraMDISTS
Vemos que hay siete valores atípicos.