¡Descarga Practica tema 1 Estadistica y más Ejercicios en PDF de Estadística solo en Docsity!
Curso 2016/ Asignatura: Estad´ıstica Estudios: Grado en ADE, FYCO, Econom´ıa, Marketing Universidad de Almer´ıa
PR´ACTICA 1:
AN´ALISIS DE DATOS UNIVARIANTES
Objetivos:
- Conocimiento b´asico de la estructura del SPSS: crear ficheros de datos (definiendo correctamente las variables de estudio), guardar ficheros de datos y guardar ficheros de resultados.
- Representar num´ericamente, mediante la tabla de frecuencias (agrupada en interva- los si fuese necesario), una variable unidimensional e interpretar toda la informaci´on proporcionada en dicha tabla.
- Representar gr´aficamente, con el gr´afico m´as apropiado (sectores, diagrama de barras o histograma), una variable unidimensional.
- Calcular, para la variable de estudio, medidas estad´ısticas de inter´es: media, mediana, moda, percentiles, recorrido intercuart´ılico, varianza, desviaci´on t´ıpica, coeficiente de variaci´on de Pearson y tipificaci´on de variable. Saber interpretar el significado de cada una de ellas.
- Dividir archivos: dividir el fichero de datos en grupos y realizar an´alisis estad´ısticos para cada grupo por separado.
- Generaci´on de nuevas variables: crear, en SPSS, una nueva variable de estudio a partir de otras variables ya definidas en el fichero de datos.
- Obtener otras representaciones gr´aficas de inter´es: gr´aficos de barras con dos variables.
1. INTRODUCCI ´ON.
SPSS (Statistical Package for the Social Sciences) es un software estad´ıstico muy utilizado en la ramas de las ciencias sociales y, de un modo m´as espec´ıfico, por las empresas y profe- sionales de investigaci´on de mercados. Permite realizar informes y gr´aficos estad´ısticos sin necesidad de tener conocimientos sobre el c´alculo manual, lo que permite centrarse principal- mente en el uso e interpretaci´on de an´alisis y gr´aficos estad´ısticos. Por tanto, este software resultar´a de gran utilidad a la hora de llevar a cabo una investigaci´on de car´acter comercial.
La principal ventaja que presenta SPSS respecto a otros programas radica en la capaci- dad que presenta para trabajar con bases de datos de gran tama˜no, as´ı como su f´acil manejo y comprensi´on.
2. ESTRUCTURA DEL PROGRAMA.
SPSS est´a estructurado mediante diferentes tipos de ventanas, que permiten el acceso simult´aneo a archivos de datos, pantallas de gr´aficos y resultados estad´ısticos.
Editor de datos:
Es la ventana principal del sistema, la cual se abre autom´aticamente cuando se inicia una sesi´on del SPSS. Su aspecto es similar al de una hoja de c´alculo y se utiliza para crear un nuevo fichero de datos o modificar uno ya existente. Por tanto, en dicha pantalla, ser´a d´onde crearemos las variables y recogeremos todas las observaciones que hemos obtenido de una determinada muestra o poblaci´on.
Una vez creado el fichero de datos o abierto uno ya existente, permite visualizar los datos
Es imprescindible guardar la ventana de resultados, mediante el men´u:
Archivo/Guardar como/nombre del archivo. spv
Editor de sintaxis:
Es la ventana en la que podemos escribir o pegar instrucciones de programaci´on en el lenguaje de SPSS para ser ejecutadas y obtener los correspondientes resultados. Es una ventana opcional, que no est´a habilitada por defecto.
Es una ventana de gran utilidad, ya que en muchas ocasiones se requieren an´alisis que implica generar ficheros intermedios que deben ser debidamente organizados. Trabajar con sintaxis permite replicar resultados sin volver a realizar todos los pasos del men´u, lo que conlleva un ahorro de tiempo considerable.
Para guardar una ventana de s´ıntaxis:
Archivo/Guardar como/nombre del archivo. sps
3. MEN ´US DE SPSS.
La barras de men´us contienen una serie de submen´us desplegables que permiten controlar la mayor´ıa de las acciones que el SPSS puede llevar a cabo. A continuaci´on se recoge, brevemente, las princiaples operaciones que se pueden realizar con los men´us que figuran en el editor de datos:
- Archivo: permite crear o abrir archivos de SPSS, grabar, imprimir ficheros, y leer datos creados con el SPSS o con otras aplicaciones, entre otras funciones.
- Edici´on: contiene las habituales opciones de Windows para cortar, copiar, buscar y recuperar datos y texto.
- Ver: permite personalizar la barra de herramientas, ocultarla o mostrarla; visualizar las etiquetas o los valores de las variables; cambiar la fuente de las letras; mostrar o no la cuadr´ıcula de la base de datos; etc.
- Datos: contiene opciones para hacer cambios que afectan a todo el archivo de datos (unir archivos, transponer variables y casos, crear subconjuntos de casos, etc.). Estos cambios son temporales mientras no se guarde expl´ıcitamente el archivo.
- Transformar: permite efectuar cambios sobre las variables seleccionadas y crear nuevas variables basadas en los valores de variables ya existentes. Estos cambios son temporales mientras no se guarde expl´ıcitamente el archivo.
- Analizar: dentro de esta opci´on se encuentran todos los procedimientos estad´ısticos.
- Gr´aficos: nos permite ejecutar todos los procedimientos estad´ısticos de car´acter gr´afico: Gr´aficos de Barras, Histogramas, Diagramas de sectores, Gr´aficos de Dis- persi´on, etc.
- Utilidades: permite visualizar la informaci´on completa del archivo de datos, definir grupos de variables, acceder a un ´ındice de comandos SPSS, etc.
- Ventana: se utiliza para activar o desactivar los iconos, para cambiar el dise˜no de la ventana de salida o la de sintaxis, o para cambiar el entorno que tiene definido por de- fecto el SPSS. Posibilita el cambio de unas ventanas a otras, as´ı como su minimizaci´on.
- ?: es un tutorial o asistente estad´ıstico. Este men´u abre una ventana de ayuda que contiene informaci´on sobre el uso de cualquiera de las caracter´ısticas o procedimientos del SPSS.
En la ventana de resultados figuran, a parte de todos los ya comentados, los men´us:
- Insertar: nos permite insertar texto, encabezados, t´ıtulos, saltos de p´aginas, objetos de otras aplicaciones...en el visor de resultados y poder as´ı, elaborar un informe con un formato personalizado. Este men´u tambi´en est´a disponible en el Editor de tablas y el Editor de texto.
- Las palabras reservadas no se pueden utilizar como nombres de variable. Las palabras reservadas son: ALL, AND, BY, EQ, GE, GT, LE, LT, NE, NOT, OR, TO, WITH.
- Los nombres de variable se pueden definir combinando de cualquier manera caracteres en may´usculas y en min´usculas. Dicha distincci´on se conserva en lo que se refiere a la presentaci´on.
- Tipo: num´erico (si la variable es cuantitativa) o cadena (si la variable es cualitativa). Existen m´as opciones a escoger y son las siguientes:
- Coma: Se utiliza cuando se utilizan millares y se pretende usar la coma para el millar, y el punto para los valores decimales.
- Punto: Se utiliza cuando se utilizan millares y se pretende usar el punto de millar, y la coma para los valores decimales.
- Notaci´on cient´ıfica: Se utiliza para expresiones cient´ıficas en las que existen alg´un tipo de letra. Por ejemplo, 1. 64 E2.
- Fecha: Se utiliza para fechas y horas.
- D´olar: Se utiliza cuando se emplea el uso de monedas.
- Moneda personalizada: Se utiliza cuando se emplea el uso de monedas.
- Anchura: es el n´umero m´aximo de caracteres que se permite introducir en una celda de la ventana “Vista de datos”.
- Decimales: nos da la opci´on, para variables cuantitativas, de elegir con cu´antos deci- males queremos trabajar.
- Etiqueta: permite describir de forma clara la variable y recoger alguna observaci´on importante de la misma, como por ejemplo la unidad de medida. A diferencia que en el nombre, s´ı se admiten espacios en blanco, y podemos recoger una frase de la extensi´on que queramos sobre la variable de estudio. Su uso es bastante ´util para facilitar la interpretaci´on de los resultados para las personas que no han participado en la generaci´on de los procedimientos y desconocen el significado del nombre de la variable. El uso de la etiqueta es opcional, el programa en caso de no existir una etiqueta utiliza el nombre de la variable para generar los resultados.
- Valores: se utiliza para codificar los valores que toma una variable cualitativa, asignando a cada posible valor de la variable un n´umero o bien una letra, facilitando as´ı el proceso de introducci´on de datos en el programa. El procedimiento es el siguiente:
- Dentro de la pesta˜na valores, pinchamos el cuadradito que aparece.
- Se abre la una ventana, en la cual rellenamos: valor (el n´umero o letra que queremos usar para simplificar el valor de la variable cualitativa) y etiqueta (que es la palabra que queremos simplificar). A˜nadir.
- Repetimos la operaci´on con todos los valores de la variable cualitativa.
- Cuando ya los tengamos todos introducidos, le damos a Aceptar.
- Perdidos: para dejar constancia de las casillas que se han quedado vac´ıas al no recibir respuesta del entrevistado (casos perdidos) y tenerlo en cuenta a la hora de hacer los an´alisis. A menudo es ´util para saber por qu´e se pierde informaci´on ya que los valores perdidos son razones por las cuales no obtenemos una respuesta. Dentro de los valores perdidos podemos encontrar: No sabe; No responde o se niega a responder; No aplica o sencillamente la pregunta no lo afecta. Por ejemplo: preguntarle a una persona soltera la edad a la que se caso por primera vez, si no se ha casado. Debemos tener claro que los valores perdidos son razones y no errores. Gene- ralmente tendemos a confundir un valor perdido con un valor que no esta dentro de nuestro rango. Por ejemplo, si en la variable g´enero (sexo), tenemos los valores (1 = mujeres y 2 = hombres) y despu´es de revisar el archivo nos damos cuenta que tenemos en algunos registros el valor 3, podr´ıamos cometer el error de pensar que este es un valor perdido, pero no lo es, este tipo de valores los debemos considerar como errores ya sea de digitaci´on o de captura y la forma de corregirlos es ir hasta la fuente (entre- vistas) y determinar a qu´e grupo pertenec´ıa el individuo. Si no podemos determinar el grupo y los valores son muy pocos es recomendable prescindir de estos casos. SPSS maneja dos tipos de valores perdidos: el primero es perdido por el sistema, el cual se identifica por la ausencia total de datos, es decir, casillas vac´ıas y el segundo corresponde a los datos perdidos definidos por el usuario (No sabe, No responde o No aplica). El programa detecta autom´aticamente los valores perdidos por el sistema y los omite, mientras que los valores perdidos por el usuario deben ser definidos al programa o de lo contrario los c´alculos se realizar´an contando con estos valores, lo cual puede afectar severamente los resultados. Los valores de datos especificados como perdidos por el usuario aparecen marcados para un tratamiento especial y se excluyen de la mayor´ıa de los c´alculos. Para definir un valor perdido por el usuario: activar la casilla correspondiente a Perdidos de la variable de inter´es. Marcar Valores perdidos discretos y emplear un valor para los datos perdidos. Normalmente se utiliza el n´umero 9, siempre y cuando no sea este un posible valor que tome la variable.
Introducir los valores observados:
Despu´es de definir las variables que vamos a utilizar, pulsamos la pesta˜na “Vista de datos” para introducir los datos observados de cada variable. Se observa que las variables definidas estan activas, aunque las casillas correspondientes a sus datos est´an vac´ıas, ya que debemos introducir nosotros las observaciones una a una. Las observaciones se introducen por columnas, es decir, cada columna es una variable nueva y debajo de ella escribimos sus correspondientes valores.
En el caso de variables cualitativas, si hemos usado a la hora de definirlas la opci´on de “valores”, para que el programa tome dichos valores debemos activar la pesta˜na “Eti- quetas de valor”.
Edici´on y Modificaci´on de los datos introducidos:
En multitud de ocasiones nos podemos encontrar con el problema de equivocarnos al introducir manualmente los datos, teniendo que suprimir variables o datos o al contrario, teniendo que a˜nadir variables o datos por no haber sido introducidas. A continuaci´on, se recogen las operaciones m´as ´utiles que podemos realizar cuando introducimos datos manual- mente:
- Eliminar variables y casos: para eliminar una variable basta con seleccionar la columna correspondiente, pinchar en el bot´on derecho del rat´on y pulsar “Borrar”. Del mismo modo, para eliminar un caso (una fila), seleccionaremos la fila correspondiente y pulsaremos bot´on derecho del rat´on y “Borrar”.
- Insertar una nueva variable: cuando deseemos insertar una nueva variable se- leccionaremos una columna, pinchamos en el bot´on derecho del rat´on y pulsamos la opci´on “Insertar variable”. SPSS insertar´a una nueva variable a la izquierda de la va- riable que hab´ıamos seleccionado previamente.Tambi´en se puede pinchar directamente en el icono que aparece en la barra de herramientas:
- Insertar un nuevo caso: para insertar un nuevo dato, entre todos los que ya tenemos introducidos, en una posici´on concreta, tenemos que seleccionar la fila justo de debajo donde queremos insertar ese nuevo caso, pinchar en el bot´on derecho del rat´on y elegir “Insertar Caso”. SPSS introducir´a una nueva fila justo encima de la que hab´ıamos seleccionado. Tambi´en se puede pinchar directamente en el icono que aparece en la barra de herramientas:
- Ordenar datos: SPSS permite ordenar los casos del fichero de datos en funci´on de una o varias variables, ya sea en orden ascendente (A) o descendente (D). Para ello en el men´u “Datos” seleccionamos la opci´on “Ordenar casos” y elegimos la variable o el conjunto de variables en funci´on del que queremos que se realice la ordenaci´on, as´ı como el Orden de clasificaci´on (ascendente o descendente) para cada una de ellas. Si se selecciona m´as de una variable de ordenaci´on, los casos ser´an ordenados por cada variable dentro de las categor´ıas de la variable anterior en la lista Ordenar. Por ejemplo, si selecciona GENERO como la primera variable de ordenaci´´ on y ESTADO CIVIL como la segunda variable de ordenaci´on, la clasificaci´on ESTADO CIVIL ordenar´a los casos dentro de cada categor´ıa de g´enero. Hay que tener en cuenta que si ordenamos los datos respecto a variables con valores no num´ericos, estos ser´an organizados alfab´eticamente, donde las letras may´usculas preceden a las min´usculas correspondientes en orden. Por ejemplo, el valor de cadena “S´ı” precede a “s´ı” en orden.
- Obtener representaciones gr´aficas. Con la opci´on Gr´aficos se pueden seleccionar distintos tipos de representaciones gr´aficas. Nosotros nos centraremos en las repre- sentaciones siguientes: - Gr´aficos de Sectores: se utilizar´a para variables de tipo cualitativo. - Gr´aficos de Barras: para variables estad´ısticas discretas. - Histograma: para variables estad´ısticas continuas (agrupadas en intervalos).
En cualquiera de estos gr´aficos, en la opci´on “valores del gr´afico”, pueden etiquetarse los gr´aficos con las frecuencias (la opci´on por defecto) o con los porcentajes.
Si se quiere modificar alg´un aspecto del gr´afico, hacemos doble click en ´el para abrir el“Editor de gr´aficos”. As´ı, por ejemplo, si en el diagrama de sectores queremos que aparezca en cada sector la frecuencia o porcentaje correspondiente, pinchamos dos veces en el gr´afico, bot´on derecho del rat´on y pinchamos en “mostrar etiquetas de datos”.
- Organizar los diferentes valores en orden ascendente o descendente u ordenar las ca- tegor´ıas por sus frecuencias. Con la opci´on Formato se pueden controlar algunos aspectos relacionados con la forma en que aparecer´an las tablas de frecuencias y los estad´ısticos seleccionados, permitiendo ordenar los elementos en la tabla de forma ascendente o descendente seg´un valores o seg´un frecuencias.
Le damos un nombre a la nueva variable que contendr´a los intervalos de clase genera- dos en “variable actual” (obviamente, se le aplican las restricciones ya comentadas para el campo “nombre”) y marcamos la opci´on “L´ımites superiores excluidos” (ya que recordemos que, por convenio, incluimos el l´ımite inferior en el conteo pero no el l´ımite superior).
- Aunque el programa nos da la posibilidad de crear intervalos de distinta amplitud, nosotros trataremos el caso s´olo de intervalos de igual amplitud. Por tanto, debemos pinchar en la opci´on Crear puntos de corte, que es en donde indicaremos cu´antos intervalos queremos y de qu´e amplitud.
Hemos de rellenar, al menos, dos campos:
- Posici´on del primer punto de corte: extremo inferior del primer intervalo+amplitud. Normalmente, se toma como extremo inferior del primer intervalo el xmin regis- trado en la base de datos, pero el investigador puede fijar otro valor de dicho extremo, si lo cree conveniente, para una mejor visualizaci´on de los resultados. En consecuencia, si en los ejercicios no se especifica el l´ımite inferior del primer intervalo que se quiere fijar para calcular a partir de ´el la posici´on del primer punto de corte, se entiender´a que tomaremos, l´ogicamente, como xmin el menor valor observado para la variable que se quiere agrupar.
- Amplitud de los intervalos.
Pinchamos en el campo que ha quedado sin rellenar y vemos que se completa ´el s´olo. Aplicar y Continuar.
- Pinchamos en Crear etiquetas. Continuar.
Realizado todo este proceso, observamos que en el fichero de datos se nos ha a˜nadido una nueva variable (con el nombre que nosotros le hemos dado) que es la variable agrupada en intervalos de clase.
Finalmente, para obtener la tabla de frecuencias agrupada en intervalos, basta seguir el proceso ya explicado:
Analizar/Estad´ısticos Descriptivos/Frecuencias/mostrar tabla de frecuencias
y pasar la variable agrupada que acabamos de crear.
- Continuar y aceptar.
- Comprobamos en el histograma obtenido que las alturas de los rect´angulos nos da el total de la poblaci´on y que se corresponde toda la informaci´on con la obtenida en tabla de frecuencias agrupada en intervalos.
- Cambiar la enumeraci´on del eje X:
- Pinchamos dos veces sobre el gr´afico, para que se nos active el “Editor de gr´aficos”.
- A continuaci´on, pinchamos dos veces sobre cualquier n´umero del eje X y pin- chamos en “Escala”, donde personalizamos nuestros valores: “M´ımino”, “M´aximo” e “Incremento mayor” (amplitud de los intervalos).
Recu´erdese que el Histograma y el diagrama de barras, aunque en apariencias parecen ser muy similares, encierran conceptos muy diferentes. En consecuencia, para variables continuas agrupadas en intervalos de clases no es admisible mostrar diagramas de barras con las barras separadas entre s´ı, para representar estas variables gr´aficamente.
7. DIVIDIR ARCHIVOS.
Suele ser habitual, cuando se realiza un informe estad´ısticos, que resulte de inter´es realizar an´alisis por separado para las diferentes categor´ıas de una variable cualitativa. Por ejemplo, podr´ıamos estar interesados en calcular la media y desviaci´on t´ıpica del n´umero de clientes nuevos obtenidos por comerciales de una empresa, pero haciendo distinci´on seg´un el sexo, interes´andonos esa informaci´on de manera separada por colectivo de hombre y mujer, con objeto de establecer comparativas entre los resultados obtenidos por los comerciales hombre y los comerciales mujer de dicha empresa. En SPSS existe una opci´on que permite organizar por grupos los resultados de cualquier operaci´on que efectuemos con el programa, que es:
Datos/Dividir archivo
El procedimiento es el siguiente:
- En la nueva pantalla que aparece, debemos pasar a la casilla Grupos basados en.. la variable en funci´on de la cual queremos hacer la partici´on del archivo.
- Escogemos alguna de las dos opciones siguientes:
- Comparar los grupos (los grupos de segmentaci´on del archivo se presentan juntos en una misma tabla, de manera que se pueden comparar los resultados de cada categor´ıa f´acilmente).
- Organizar resultados por grupos (los resultados de cada procedimiento se muestran en tablas separadas para cada categor´ıa de la variable de divisi´on del archivo).
Para segmentar un archivo los casos deben ordenarse seg´un los valores de las variables de agrupaci´on, en el mismo orden en el que aparecen las variables en la lista Grupos basados en. Sin embargo, si el archivo de datos no est´a ordenado, basta con seleccionar la opci´on Ordenar archivo seg´un variables de agrupaci´on.