




























































































Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: Estadistica, Profesor: , Carrera: Psicologia, Universidad: UB
Tipo: Apuntes
1 / 149
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!





























































































See discussions, stats, and author profiles for this publication at: https://www.researchgate.net/publication/
Book · September 2012
CITATIONS 2
READS 161
1 author:
Some of the authors of this publication are also working on these related projects:
Attitudes towards statistics in Psychology Degree students View project
Jorge López Puga UCAM Universidad Católica de Murcia 54 PUBLICATIONS 106 CITATIONS SEE PROFILE
All content following this page was uploaded by Jorge López Puga on 28 May 2015. The user has requested enhancement of the downloaded file.
Introducci´on al An´alisis de Datos con R y R Commander en Psicolog´ıa y Educaci´on
Jorge L´opez Puga 2012
´INDICE GENERAL
6
((Hay tres clases de mentiras: las mentiras, las malditas mentiras y las estad´ısticas)) 1.
Esta cita, que se suele atribuir al escritor norteamericano Mark Twain —aunque realmente fue pronunciada por el pol´ıtico y escritor ingl´es Benjamin Disraeli— muestra, de alguna forma, el sentimiento popular que se tiene hacia la estad´ıstica. Siempre que menciono a mis estudiantes esta frase suelo observar el esbozo de una leve sonrisa y un movimiento de asentimiento. Ciertamente, la ciencia es- tad´ıstica no suele tener demasiado ((prestigio)) —yo dir´ıa m´as bien credibilidad— entre la ciudadan´ıa en general. Es f´acil caer en la tentaci´on de pensar que la estad´ıstica se utiliza para enmascarar la verdad, para manipular los resultados o, en el peor de los casos, que no sirve para nada ya que se suele errar habitualmente en sus predicciones —v´ease en las noches electorales—. Sin embargo, la estad´ıstica, o mejor dicho, un buen uso de las herramientas que nos proporciona, es fundamental en nuestra Sociedad. Puede que alguno de los lectores se sorprenda al leer esta afirmaci´on tan rotunda, pero le invito a que reflexione unos momentos y piense en c´omo le afectar´ıa personalmente que se hiciera un mal uso de la estad´ıstica. ¿No?, ¿piensa que a usted no? Le voy a ayudar un poco con algunos ejemplos que le pueden resultar cercanos. Sin una validaci´on estad´ıstica rigurosa, no dispondr´ıamos de medicamentos pues no ser´ıamos capaces de evaluar su efectividad; una elaboraci´on err´onea del Indice de Precios al Consumo (IPC) o del Producto Interior Bruto (PIB) su- pondr´ıa un serio problema para la econom´ıa nacional y, en particular, de la suya;
(^1) ((There are three kinds of lies: lies, dammed lies and statistics)).
un censo mal elaborado trastocar´ıa los planes de servicios que las administracio- nes han de prestar a la comunidad (limpieza, hospitales, colegios,...), y as´ı un largo etc´etera de situaciones en las que la estad´ıstica hace posible elaborar planes de previsi´on, proyecciones de futuro, etc. Todo esto sin mencionar la enorme cantidad de datos con los que diariamente nos bombardean los medios de comunicaci´on, y que hemos de ser capaces de interpretar correctamentes para intentar no ser manipulados.
As´ı pues, considero de especial importancia inculcar una buena formaci´on estad´ıstica en la poblaci´on general y, en particular, en nuestros estudiantes uni- versitarios, pues la mayor´ıa de ellos, antes o despu´es, se tendr´an que enfrentar a situaciones en la que necesiten ((extraer)) la mayor y la mejor informaci´on posible de un conjunto de datos.
Por suerte —esa es mi opini´on particular—, el acceso generalizado a los or- denadores ha posibilitado en acercamiento de la estad´ıstica a un p´ublico m´as amplio, pues ha permitido aplicar t´ecnicas estad´ısticas complejas sin la necesidad de tener una base matem´atica muy potente. No quiero que estas palabras ´ultimas se malinterpreten. No disponer de una formaci´on matem´atica de alto nivel no significa que ((hacer estad´ıstica)) consista en darle al bot´on del ordenador sin ton ni son. Suelo poner la siguiente comparaci´on al respecto, se pueden hacer excelentes textos con un ordenador —v´ease este como ejemplo— sin necesidad saber como est´a montada la placa base o como funciona el procesador de su computadora. Son herramientas que se ponen a nuestra disposici´on y que hemos de utilizar correctamente. Por lo tanto, la aplicaci´on pr´actica de las t´ecnicas estad´ısticas necesita de un conocimiento profundo de las posibilidades de las mismas. Si se quiere ir m´as all´a, ser´a necesario una formaci´on m´as profunda, pero los paquetes estad´ısticos ponen a disposici´on del usuario la posibilidad extraer la informaci´on relevante —en el caso de que la hubiera— de los datos disponibles.
Este texto va en esa l´ınea; con un lenguaje sencillo, adaptado a las personas a quienes va dedicado, se nos presentan diversas t´ecnicas estad´ısticas muy ´utiles para abordar una gran cantidad de situaciones pr´acticas. Adem´as, hace que esto sea posible sin tener que gastar una gran cantidad de dinero, solamente la invertida en el ordenador que est´e usted usando, pues el software aqui utilizado es del libre distribuci´on —no me gusta la palabra gratis
Como se˜nala De la Fuente (1998), podr´ıamos destacar dos grandes problemas a los que nos enfrentamos cuando tratamos de gestionar asignaturas relacionadas con la estad´ıstica en las titulaciones de psicolog´ıa y las asociadas a las ciencias de la educaci´on. En primer lugar, los estudiantes no ven la utilidad pr´actica de los contenidos de ´estas asignaturas. Esto es, piensan que lo que ven en clase´ dif´ıcilmente tendr´a aplicaci´on en el contexto real de su desempe˜no profesional; que nunca van a tener que enfrentarse a una variable que se distribuya normalmente o que jam´as tendr´an que tomar decisiones que impliquen incertidumbre. Por otro lado, aunque los contenidos estad´ısticos forman parte del programa educativo en la ense˜nanza secundaria, tambi´en es cierto que muchos estudiantes tienen un bagaje sobre teor´ıa estad´ıstica relativamente bajo.
Sin desligarme de lo anteriormente expuesto, me gustar´ıa decir que el objeti- vo de este libro es tratar de solventar alguno de ´estos problemas a los que se ha hecho referencia. Sin embargo, mis motivaciones para enrolarme en la ardua, que no desagradable, tarea de escribir este libro responden a otros factores. En primer lugar, desde un punto de vista pragm´atico, podr´ıa indicar que no existe ning´un material a d´ıa de hoy (abril de 2012)^2 , que yo sepa, destinado espec´ıficamente a alumnos de psicolog´ıa y educaci´on que presente el an´alisis de datos utilizando R o R Commander. Por consiguiente, creo que esta empresa que estoy empezando a construir est´a relativamente justificada. M´as a´un, si consideramos las intere- santes ventajas (m´as abajo descritas) que supone el uso de estas herramientas
(^2) Con posterioridad a haber escrito estas palabras (all´a por el mes de julio de 2012 y durante mi asistencia al V European Congress of Methodology) supe de la existencia de un grupo de trabajo de la Universidad del Pa´ıs Vasco que est´a progresando en esta misma l´ınea y que ha producido un libro (Elosua y Etxeberria, 2012) sobre esta tem´atica altamente recomendable para usuarios del campo de las ciencias sociales.
una gran proporci´on) en ingl´es, un grupo de alumnas provenientes de Polonia y Holanda se matricularon en la misma para satisfacer sus necesidades formativas. En esta situaci´on, las alumnas y yo, acordamos celebrar una sesi´on semanal en la que pudi´esemos ir trabajando con R ( de aqu´ı en adelante) los contenidos que se estaban desarrollando en la asignatura los alumnos espa˜noles. As´ı las cosas, cada vez me siento mejor usando y m´as viable veo la idea de usar ´este software como herramienta docente y anal´ıtica. Por ´ultimo, otro motivo por el que escribo ´este libro es porque quiero home- najear a mi profesor, maestro y compa˜nero Fernando Reche Lorite y, en parte, compensarle por no haberle elogiado m´as en los agradecimientos de mi tesis doc- toral (L´opez, 2009). Lo cierto es que gracias a Fernando supe de la existencia de y aprend´ı a utilizarlo. Tambi´en le debo el hecho de que haya organizado cursos de ense˜nanzas propias sobre LATEX en los cuales he participado en dos oca- siones. No s´olo por el hecho de haber tenido la oportunidad de adquirir ciertos conocimientos y/o competencias, sino porque mi forma de pensar y entender la inform´atica cambi´o dr´asticamente desde que me empec´e a familiarizar con estos entornos de trabajo. Me gustar´ıa, a continuaci´on, destacar algunas de las ventajas que presentan y R Commander (Rcmdr^ de aqu´ı en adelante) como herramientas aplicadas y aplicables al an´alisis de datos.
En primer lugar est´a el tema de la pirater´ıa. Soy consciente de que vivi- mos en una cultura donde copiar ilegalmente m´usica, pel´ıculas y programas inform´aticos (entre otros) no est´a mal visto. Es m´as, est´a bien visto. Esto es, el que es capaz de crackear un programa inform´atico para su beneficio es considerado como una persona exitosa, inteligente, como una especie de Robin Hood de las tecnolog´ıas de la informaci´on y la comunicaci´on. Como se˜nala Computer Music (1999), ((algunos ven a las empresas de software como los malos de la pel´ıcula, que venden sus productos a precios abusi- vos mientras que los crackers (con su noble y desinteresado esp´ıritu) nos ayudan a ganarles la partida)) (p. 58). Y no s´olo eso, sino que, pese a estar considerado como delito, la copia ilegal de material inform´atico no genera el m´as m´ınimo remordimiento entre la comunidad universitaria (en ambos, profesorado y alumnado). Pues bien, yo soy cr´ıtico con esta situaci´on. Antes de nada, me gustar´ıa aclarar que no me considero un moralista. Es
decir, yo mismo supongo que he copiado il´ıcitamente m´usica, pel´ıculas y programas inform´aticos (entre otras cosas) en el pasado y, aunque no digo que no vaya a volver a hacerlo en el futuro, tambi´en opino que ((si hay una alternativa libre para ejecutar un proceso inform´atico, ¿por qu´e cometer un delito copiando ilegalmente material protegido por la Ley de Propiedad Intelectual?)) En ´este contexto, cobra protagonismo dado que al ser un programa libre podemos copiarlo, distribuirlo y/o modificarlo sin temor a incurrir en una falta legal.
En segundo lugar, y no menos importante, habr´ıa que destacar, como se˜nala S´aez (2010) y Elosua (2009), que y Rcmdr son gratuitos. Esto no es, si se me´ permite la expresi´on, ((moco de pavo)). Con la situaci´on econ´omica que esta- mos atravesando creo que es de agradecer que se nos presenten alternativas que supongan el menor gasto econ´omico posible. De esta manera, tanto la instituci´on universitaria y el alumnado, as´ı como cualquier usuario poten- cial, tendr´ıan la posibilidad de ejecutar c´alculos relativamente sofisticados que les supondr´ıa una peque˜na inversi´on econ´omica. De ´esta manera, los alumnos podr´ıan seguir ejecutando c´alculos estad´ısticos al terminar sus es- tudios formales en la universidad sin piratear y sin gastar dinero en licencias de software. Por ejemplo, la Universidad de Almer´ıa tiene, en la actualidad, una licencia de servidor para que la comunidad universitaria pueda usar el programa SPSS^3. Esto no est´a mal, excepto cuando el servidor de licencias falla por alg´un motivo. Otro problema aparece cuando tratamos de utilizar SPSS estando fuera de la universidad. Aunque se puede acceder al servicio estando conectado a Internet y disponiendo de una conexi´on VPN, el pro- blema aparece cuando alguien (como es mi caso) no dispone de conexi´on a la red en su hogar.
Otra ventaja que se deriva del uso de ´estos programas inform´aticos, a mi modo de ver, est´a referida al aprendizaje que se desprende de su utilizaci´on. Esto es, aprender a usar y Rcmdr favorece que se aprenda estad´ıstica, entre otras cosas. Dado que en la mayor´ıa de las situaciones el usuario tiene casi el control total sobre lo que est´a haciendo, ´esto favorece que las personas que usan estos sistemas adquieran un conocimiento m´as profundo de las t´ecnicas (^3) Statistical Package for Social Sciences
obstante, ´este inconveniente se ve superado (o se superar´a con la pr´actica) por el gran control que se tienen sobre los gr´aficos y an´alisis que se ejecutan con. Este manuscrito no es un texto completo ni exhaustivo^4. M´as bien, se puede considerar como una introducci´on y/o una gu´ıa para introducirse en el an´alisis de datos en los campos de la psicolog´ıa y la educaci´on. Tambi´en puede considerarse, en algunos de sus pasajes, como una introducci´on o invitaci´on a realizar c´alculos y an´alisis m´as complejos utilizando y Rcmdr. Voy a intentar desarrollar el contenido de este libro tratando de adaptarlo a la mayor parte del p´ublico y, por ello, tratar´e de explicar cada paso y an´alisis desde sus detalles m´as b´asicos o elementales. No obstante, tambi´en es cierto que en algunos pasajes presentar´e la informaci´on de manera pseudo-telegr´afica para favorecer que el usuario juegue un papel activo que le permita aprender de manera m´as profunda. Pero aunque voy a intentar desarrollar el contenido para todos los p´ublicos ser´ıa conveniente enfrentarse al manual con nociones b´asicas de matem´aticas y algo de estad´ıstica. Por tanto, este libro no pretende ser una receta que gu´ıe a los usuarios de por el sendero del an´alisis de datos. No es tampoco un libro de dise˜nos de investigaci´on, aunque en algunos casos se har´an comentarios sobre los dise˜nos que subyacen a tipos particulares de an´alisis de datos. Para las personas interesadas en aprender m´as sobre los dise˜nos de investigaci´on, recomiendo acceder al libro de Le´on y Montero (2003)^5. Me gustar´ıa destacar que, aunque no se van a tratar en este manual, existen paquetes de espec´ıficos dise˜nados para ejecutar tareas y an´alisis estad´ısticos t´ıpicamente asociados a la psicolog´ıa y al campo de trabajo de la educaci´on. Por ejemplo, en el contexto de la medici´on psicol´ogica se han desarrollado paquetes que permiten estimar diferentes modelos de medida basados en la Teor´ıa de Res- puesta al ´Item o trabajar con aspectos clave de la Teor´ıa Cl´asica de Tests (de Leeuw y Mair, 2007; Mair y Hatzinger, 2007). Recomiendo al lector interesado que profundice en estos paquetes dado que le proporcionar´an ideas y alternativas interesantes en sus proyectos de investigaci´on. A lo largo del libro el c´odigo fuente necesario para generar un gr´afico o un (^4) Para un libro m´as completo y exhaustivo, aunque enfocado casi totalmente desde el punto de vista de la interfaz gr´afica de Rcmdr, recomiendo trabajar con el manual de Elosua y Etxeberria (2012). Tambi´en recomiendo el libro de Arriaza et al. (2008) para cubrir un curso introductorio de estad´ 5 ıstica con y Rcmdr. Si te fijas en ´esta referencia se ve claramente la poca creatividad que emana de mis casti- gadas neuronas cuando decid´ı dar un t´ıtulo a ´este libro.
an´alisis aparecer´a numerado y recuadrado de este modo: 1 Esto es un ejemplo # ´Esto es un comentario 2 de c´odigo fuente # ´Esto es otro comentario
as´ı, el usuario podr´a copiar-y-pegar y reciclar el c´odigo para aprender y para satisfacer sus necesidades. Para ir entrando en materia, me gustar´ıa se˜nalar que, como aparece en el recuadro precedente, todo lo que aparezca precedido de un s´ımbolo de almohadilla (#) no ser´a ejecutado por o Rcmdr. Cuando anteponemos el s´ımbolo de almohadilla a una secci´on de c´odigo de programaci´on inform´atica decimos que estamos comentando, y esta porci´on de c´odigo es un comentario que se puede utilizar para aclarar aspectos funcionales del comando en particular que le precede. Dependiendo del lenguaje inform´atico que estemos utilizando el s´ımbolo que indica lo que es un comentario cambia. As´ı, por ejemplo, en la sintaxis de SPSS el s´ımbolo del comentario es el * y en Visual Basic es el ’. Por su parte, cuando te presente salidas de resultados ver´as cuadros como este: 1 Esto es un ejemplo 2 de salida del programa
Me gustar´ıa resaltar, para terminar, que voy a intentar desarrollar todo este libro utilizando software libre (que no gratuito) y que tratar´e de depositrarlo en el Repositorio de la Universidad de Almer´ıa bajo una licencia Creative Commons para que sea accesible a todo el mundo de manera libre (que no gratuita). En primer lugar, este libro est´a siendo compilado con LATEX y editado con TeXnic- Center (http://www.texniccenter.org). Las im´agenes se generar´an, a partir de capturas de pantalla, con el programa Gimp en su versi´on 2.6 (www.gimp.com). Bueno, creo que eso es todo. Espero que disfrutes y que aprendas siguiendo este libro y utilizando y Rcmdr.
Jorge L´opez Puga Universidad de Almer´ıa [email protected] http://www.ual.es/personal/jpuga