Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Apuntes Análisis Multivariado, Apuntes de Psicología

Apuntes de Análisis Multivariado del 2020-2021 Profesora. Carmen

Tipo: Apuntes

2020/2021

Subido el 02/02/2022

wx4Ecbqd
wx4Ecbqd 🇪🇸

4.7

(13)

8 documentos

1 / 76

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Análisis Multivariado
Tema 1. Apartado 1
Página de 1 76
Tema 1. Introducción al análisis multivariado
¿Qué tenemos que tener en cuenta en la investigación? Primero, el tema (¿a dónde vamos?) y un
mapa conceptual de ese tema en el que nos estamos metiendo, el marco teórico (la fundamentación
teórica de ese tema). Luego, el enfoque y alcance de la investigación (¿Cómo?) y, después, a
técnicas concretas para contrastar los objetivos y las hipótesis (¿buscando qué?).
1.Introducción a la Inferencia estadística
1.1. Bases conceptuales del contraste de hipótesis
a El “enfoque” en la investigación
El enfoque es fundamental para hacer la investigación. Cualquier debate científico en realidad
es un debate sobre el enfoque de las investigaciones.
¿Para qué investigamos o hacemos investigación psicológica? A partir de observaciones en
condiciones controladas que están determinadas por el método científico y mediante una
metodología aceptada como científica, elaboramos explicaciones plausibles del comportamiento.
Éstas son las teorías psicológicas, es decir, teorías que tratan de explicar aquellos datos que
recogemos sobre el comportamiento y que tratan de darle un sentido lógico para poder entender,
comprender y predecir el comportamiento.
Así, es importante saber desde dónde estamos elaborando nuestras teorías psicológicas. Hay
distintos paradigmas, destacando el paradigma positivista y el paradigma sociohistórico.
Paradigma positivista. El paradigma positivista es clásico, tradicional, que ha sido el
paradigma dominante durante mucho tiempo en la psicología. Consideraba que la realidad está ahí y
que nosotros, los observadores, nos limitamos a registrarla con aparatos o instrumentos de medida
que nos permitan registrarla de la manera mas fiel posible. Así la tarea del investigador es reflejar la
realidad tal cual es. El arte de investigar consiste en usar el espejo (técnicas o instrumentos) que
mejor refleje la realidad. Esto es lo que se llama la neutralidad en la investigación, la realidad es
neutra y el investigador tiene que ser neutro al observarla.
Paradigma sociohistórico. El punto de partida del paradigma sociohistórico es otro. La
realidad no está ahí de forma neutra y presente al investigador, sino que está pero sólo puede ser
observada desde algún punto de vista. Nosotros no tenemos la capacidad para ver la realidad de una
manera neutra, sino que tenemos un enfoque para observarla porque nuestra especie tiene un
sistema perceptivo limitado y sólo puede observar desde un punto de vista. Así, la tarea del
investigador es incorporar los puntos de vista que están mejor situados para percibir esa realidad. El
arte de investigar consiste en elaborar el relato más explicativo de la realidad, es decir, el que da
sentido al mayor número de evidencias empíricas, el que consigue integrar todos los datos o
resultados que tenemos en un marco que sea capaz de dar cabida a todos ellos.
Así, antes de empezar una investigación, nos tenemos que plantear desde qué paradigma vamos a
investigar (observamos, interpretamos y construimos el conocimiento).
Ejemplo. Imagen del universo. Algunas personas ven en la imagen un fondo negro
con puntos blancos de distintos tamaños y grosor, pero los asociamos
inmediatamente al universo. Nuestra percepción es inmediata, no somos conscientes
de que nuestro sistema perceptivo ya tiene esa categoría incorporada (universo)
*Pregunta de examen*
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c

Vista previa parcial del texto

¡Descarga Apuntes Análisis Multivariado y más Apuntes en PDF de Psicología solo en Docsity!

Tema 1. Introducción al análisis multivariado

¿Qué tenemos que tener en cuenta en la investigación? Primero, el tema ( ¿a dónde vamos? ) y un mapa conceptual de ese tema en el que nos estamos metiendo, el marco teórico (la fundamentación teórica de ese tema). Luego, el enfoque y alcance de la investigación ( ¿Cómo?) y, después, a técnicas concretas para contrastar los objetivos y las hipótesis ( ¿buscando qué? ).

1.Introducción a la Inferencia estadística

1.1. Bases conceptuales del contraste de hipótesis

a

El “enfoque” en la investigación

El enfoque es fundamental para hacer la investigación. Cualquier debate científico en realidad es un debate sobre el enfoque de las investigaciones. ¿Para qué investigamos o hacemos investigación psicológica? A partir de observaciones en condiciones controladas que están determinadas por el método científico y mediante una metodología aceptada como científica, elaboramos explicaciones plausibles del comportamiento. Éstas son las teorías psicológicas , es decir, teorías que tratan de explicar aquellos datos que recogemos sobre el comportamiento y que tratan de darle un sentido lógico para poder entender, comprender y predecir el comportamiento. Así, es importante saber desde dónde estamos elaborando nuestras teorías psicológicas. Hay distintos paradigmas, destacando el paradigma positivista y el paradigma sociohistórico. Paradigma positivista. El paradigma positivista es clásico, tradicional, que ha sido el paradigma dominante durante mucho tiempo en la psicología. Consideraba que la realidad está ahí y que nosotros, los observadores, nos limitamos a registrarla con aparatos o instrumentos de medida que nos permitan registrarla de la manera mas fiel posible. Así la tarea del investigador es reflejar la realidad tal cual es. El arte de investigar consiste en usar el espejo (técnicas o instrumentos) que mejor refleje la realidad. Esto es lo que se llama la neutralidad en la investigación , la realidad es neutra y el investigador tiene que ser neutro al observarla. Paradigma sociohistórico. El punto de partida del paradigma sociohistórico es otro. La realidad no está ahí de forma neutra y presente al investigador, sino que está pero sólo puede ser observada desde algún punto de vista. Nosotros no tenemos la capacidad para ver la realidad de una manera neutra, sino que tenemos un enfoque para observarla porque nuestra especie tiene un sistema perceptivo limitado y sólo puede observar desde un punto de vista. Así, la tarea del investigador es incorporar los puntos de vista que están mejor situados para percibir esa realidad. El arte de investigar consiste en elaborar el relato más explicativo de la realidad, es decir, el que da sentido al mayor número de evidencias empíricas, el que consigue integrar todos los datos o resultados que tenemos en un marco que sea capaz de dar cabida a todos ellos. Así, antes de empezar una investigación, nos tenemos que plantear desde qué paradigma vamos a investigar ( observamos, interpretamos y construimos el conocimiento ). Ejemplo. Imagen del universo. Algunas personas ven en la imagen un fondo negro con puntos blancos de distintos tamaños y grosor, pero los asociamos inmediatamente al universo. Nuestra percepción es inmediata, no somos conscientes de que nuestro sistema perceptivo ya tiene esa categoría incorporada (universo)

inmediatamente cuando aparece esa imagen y no necesita analizar cada elemento. No obstante, si una persona tiene conocimiento en astronomía, vería cosas que los demás no ven en la foto. Vería constelaciones, la osa mayor, etc. Esto pasa porque solo percibimos aquello para lo cual tenemos categorías previas para darle significado, sino las tuviéramos, no lo percibiríamos. Percibimos de la realidad aquello que somos capaces de ver en la realidad, que es aquello para lo cual tenemos categorías ( depende de nuestra experiencia ). Teoría del Interaccionismo Simbólico. La Teoría del Interaccionismo Simbólico dice que el marco ( frame ) es el elemento central en la formación de las visiones del mundo, es decir, definimos las situaciones a través de procesos enmarcadores que faciliten la interpretación de la realidad. Teoría de los Marcos Mentales. La Teoría de los Marcos Mentales ( Framing Theory ), formulada por Lakkoff en 2007, determina que percibimos y pensamos en términos de marcos mentales. Además, afirma que los datos informativos los procesamos en función de los marcos adoptados. Estos marcos mentales tienen existencia material, es decir, se pueden registrar las sinapsis en nuestro cerebro si sacamos neuroimágenes de nuestra actividad cerebral con determinados estímulos. Esto es debido a que cada vez que percibimos, se hacen esas sinapsis muchas veces y esta conexión se queda y se activa de forma automática. Así, los marcos determinan el significado que damos a las cosas. Esto quiere decir que los datos que vamos a observar, les vamos a dar un significado en función de nuestros valores y creencias más profundas. Teoría de las Perspectivas. La Teoría de las Perspectivas ( Prospect Theory ) de Kahneman, 2011, dice que los humanos tenemos dos tipos de pensamiento: el pensamiento tipo 1 y el pensamiento tipo 2. El pensamiento tipo 1 es el que estamos utilizando la mayor parte del tiempo y es automático. Es intuitivo y activa categorías aprendidas y es no consciente. Al ver la imagen, hemos tenido una percepción automática, intuitiva, no consciente, etc. Este tipo de pensamiento reproduce los marcos perceptivos que tenemos. El pensamiento tipo 2 tiene características diferentes. Éste es reflexivo y analítico (analiza). Además, activa categorías críticas (analiza nuestra propia manera de pensar, nuestras propias categorías aprendidas) y es deliberado (lo hacemos voluntariamente). Este tipo de pensamiento elabora los marcos perceptivos que tenemos. Analiza marcos perceptivos que se le ofrecen y, a partir de un análisis crítico, elabora marcos perceptivos. Esto tiene que ver en el enfoque de la investigación, que va a ser determinante para decidir cómo diseño la investigación y, al final, como interpreto los resultados que he obtenido con la investigación. Ejemplo. ¿Cómo es posible que partiendo de los mismos datos, de los mismos resultados, investigadores diferentes lleguen a conclusiones diferentes? Esto es debido al enfoque, cada investigador partió de un enfoque distinto y, así, interpreta los datos y resultados de manera diferente. Gina Rippon discrepa en la división binaria entre un cerebro femenino y uno masculino y propone otro enfoque, otro nuevo planteamiento para abordar las diferencias que se observan en dichos cerebros. Hay distintas teorías que explican esta diferencia porque cada una se basa en un enfoque diferente.

No podemos decir que hay una diferencia estadística a partir de una muestra, sólo si he visto la diferencia en cien muestras y hay diferencias en el 95% de las muestras. Sólo me puede decir que no hay diferencias en el 5% de las muestras ( si hay 20 muestras, sólo me puede salir que no hay diferencias en una muestra). Si no hay el 95% de seguridad, no puedo decir qué hay diferencias en la población. También se llaman diferencias que no se deben al azar , es decir, tenemos muchas probabilidades de que esas diferencias (95%), que nosotros sólo medimos en la muestra, se den en la población. Aunque la media de un grupo sea superior a la del otro grupo, hay casos en los que los individuos del grupo con menor media, superan las puntuaciones de los individuos del grupo con mayor media. Una diferencia estadística simplemente quiere decir que no se debe al azar, que las medias poblacionales son diferentes. Pero, no nos dice nada de si esa diferencia es útil o es relevante, eso no los dirá el marco teórico. En conclusión, decimos que hay diferencias estadísticas (estadísticamente significativas) cuando demostramos con un alto grado de seguridad (al menos el 95%) que en la población hay diferencias entre los grupos que estamos comparando en la variable que estamos midiendo. Otra manera de decirlo, muy usual, es que las diferencias que encontramos en la muestra “no se deben al azar” (o sea, se deben a que hay diferencias en la población) con un grado de seguridad del 95%. Ahora bien, cuando estamos buscando diferencias entre grupos: no sólo nos importa que las haya, sino cuan diferentes son, cuál es el tamaño de esas diferencias. Hasta ahora la estadística no nos ha dicho nada de cuál es el tamaño de esas diferencias porque el tamaño no puede ser el valor bruto de la diferencia. Por ejemplo, no es lo mismo una diferencia de 1cm en distintos tipos de hormigas que en distintos tipos de jirafas. Mientras que en las hormigas va a ser muy relevante, en el segundo no. Así, además de tener en cuenta si hay diferencia estadística, tendremos que analizar cuál es el tamaño de esa diferencia o cuál es el tamaño del efecto. Pero ya nos quedamos con el toque de que la diferencia estadística por sí misma no es suficiente para que sea relevante. Así, la diferencia estadística sólo indica que esa diferencia existe en la población y no sólo en la muestra, sin decirnos si es una diferencia relevante para el problema. Por ejemplo. ¿Es más relevante que una población tenga más ojos azules que otra? ¿o explica esa diferencia el comportamiento? Para el comportamiento psicológico, seguramente no. Podemos encontrar diferencias estadísticamente significativas, pero que las haya no indica que esa diferencia tenga relevancia. Tampoco nos dice nada del origen ni de las consecuencias de esa diferencia. ¿A qué se debe que una población tenga más ojos azules que otra? ¿Cómo afecta eso a otras variables?. La estadística no nos dice nada de esto, sino que las respuestas se van a formular desde el modelo teórico, desde el enfoque. Por ejemplo. Las diferencias cerebrales entre niños y niñas. Se trataban de explicar diferentes comportamientos en función de las diferencias cerebrales entre géneros. En una revisión de un metaanálisis de Maccoby y Jacklin (1974) vieron que la revisión de los estudios que informaban de las diferencias en habilidades cognitivas, motivacionales, etc. entre los sexos eran estadísticamente significativas, pero eran muy pequeñas. Saber de qué

sexo era una persona, no permitía predecir cuál sería su habilidad verbal o espacial, sus intereses, etc. Había diferencias entre los grupos, pero eran tan pequeñas que cuando tenemos una puntuación en alguna de esas habilidades no vamos a poder predecir si es un niño o una niña, porque los grupos se solapan. Además, los resultados eran distintos en función del instrumento que se utilizara para medirlos. Las técnicas estadísticas sólo nos van a decir si hay un efecto estadístico, si hay una relación entre las variables que estamos estudiando, sí hay diferencias entre los grupos que estamos comparando, etc. Todo lo demás lo pone el marco teórico que estamos usando para interpretar esas diferencias. c

Modelos estadísticos

Un modelo es como un ejemplo en el lenguaje común. Es una representación de la realidad. “Yo tengo un modelo para explicar por qué ocurre tal cosa”, en realidad lo que me estoy diciendo es que yo me he representado como funciona tal cosa y de esa manera, me lo explico. Cuanto más se parezca el modelo a la realidad, mejor nos va a permitir comprender, explicar y predecir esa realidad. Un modelo es muy bueno si se ajusta, si se parece, etc. a la realidad. En estadística, a ese parecido con la realidad lo llamamos ajuste ( fit ). Por ejemplo. Si un ingeniero quiere construir un puente, piensa en las características que quiere que tenga y se hace una representación mental del puente. Así, escoge de tres modelos de puente, el que más se ajusta a su representación de cómo quiere el modelo. Así, cuanto más se ajuste a la realidad, cuando lo construya resistirá. Las teorías son modelos. Así, cuanto más se parezcan las teorías a lo que ocurre en la realidad, mejor ajuste tendrá. En estadística, cuando estamos diciendo que hay diferencias entre los grupos, eso es un modelo de lo que ocurre. Eso es un modelo que hacemos a partir de los datos que tenemos. Cuanto más se parezca ese modelo a la realidad, será mejor y podremos predecir mejor. Si construyo un modelo que no integra un gran número de datos que tengo, se parece poco a la realidad. Así, cuando ocurra un fenómeno, me va a servir poco para explicar o predecir lo que va a pasar. En cambio, sí tengo un modelo teórico que integra muchos datos de investigación, se va a parecer más a lo que ocurre en la realidad y va a ser más explicativo y me va a permitir predecir mejor. Por tanto, es muy importante que el modelo se ajuste a la realidad. Así, en estadística, hablamos de ajuste del modelo. Un modelo estadístico también es una representación de un conjunto de datos, como por ejemplo, la media. La media es un modelo estadístico simple porque con un número, estoy intentado representar un conjunto de datos. Un modelo con buen ajuste es cuando la media representa bastante bien al conjunto de datos. Nos equivocaremos poco cuando predigamos que una persona de ese grupo tiene un interés medio (todos los datos están bien representados por la media). Por ejemplo. Tenemos un conjunto de puntuaciones de una muestra. Cuatro sujetos tienen una puntuación de 2,5; otros cuatro tiene 3 y otros cuatro sujetos, tienen una puntuación de 3,5. Si yo quiero hacer un resumen o una representación de ese conjunto de datos, puedo hacer la media, que es 3. Ese 3 representa bastante bien a la muestra porque todas las puntuaciones de los sujetos están muy cerca de 3. Si yo predigo que alguien va a sacar un 3 y saca un 2,5, me voy a equivocar poco. En este caso, este modelo tiene un buen ajuste.

Se dice que el valor de la correlación es alto si los datos están agrupados o encima de la línea en el gráfico. Hay modelos estadísticos lineales y no lineales. Por ejemplo, la relación entre edad y memoria no es lineal. Crece exponencialmente y luego, baja. En psicología, los modelos lineales son los que mas vamos a usar. Ejemplo de modelos para representar las diferencias por sexo. La estadística nos da datos y la interpretación de los datos viene del modelo teórico. El modelo teórico es el que adaptamos cada investigador. Se han encontrado diferencias en el cerebro masculino y femenino, pero diferencias de medias, es decir, diferencias estadísticas. Una manera de interpretar estas diferencias es a través del modelo esencialista. Este modelo considera que hay cerebros innatamente diferentes y esta diferencia produce comportamientos distintos al interaccionar con el ambiente (determinismo genético) y esto explicaría las diferencias en el juego, profesiones, la empatía, etc. En la estadística, no está el origen de las diferencias, sólo nos dice qué hay diferencias. El origen y la interpretación de esas diferencias las pone el investigador, el modelo teórico que tiene éste. Así, un modelo de interpretar esas diferencias es porque los cerebros son innatamente diferentes porque el sexo determina la estructura y la funcionalidad del cerebro. No obstante, otra manera de interpretarlo es el modelo interaccionista. Cada sociedad tiene unos comportamientos que asigna a hombres y mujeres. En función de esa designación, van evolucionando distintas capacidades y habilidades psicológicas. En las niñas, se potencia más el desarrollo de la empatía; mientras que en los niños, el de la competitividad. Esto produce que los individuos al crecer tengan habilidades distintas porque se han cultivado de forma distinta y como la plasticidad del cerebro es enorme, en función de que habilidades se han desarrollado más, vamos a encontrar diferencias entre los cerebros de ambos sexos porque unos han desarrollado unas habilidades y otros, otras. El investigador se va a decantar por un modelo u otro al ir recogiendo datos y al ver cuál de los dos integra mejor los datos recogidos. El modelo que recoja e integre mejor los datos, será el modelo más válido. Pero, la estadística no nos dice el origen de la diferencia. ¿Cómo recogeríamos datos para ver si un modelo tiene más soporte empírico que el otro? El modelo esencialista (peor ajuste) si fuera un modelo correcto de lo que ocurre en la realidad, podríamos predecir el sexo del feto viendo las imágenes de la actividad cerebral pues tenemos la idea de que los cerebros son genéticamente diferentes. En el modelo interaccionista (mejor ajuste) no se podría predecir el sexo a partir de la actividad cerebral porque la diferencia se origina en el ambiente y no por la genética. Este modelo tiene más apoyo porque no se puede predecir el sexo por neuroimagen. En conclusión, el ajuste es mejor cuanta menos variabilidad haya en los datos recogidos. d

Población y muestra

La población es un conjunto de elementos definidos por unas características específicas. Siempre se refiere a una medición concreta. Se refiere a las puntuaciones de un sujeto, no a un sujeto. Por eso, es el conjunto de puntuaciones que hemos extraído de un grupo de sujetos.

El investigador define la población. Quiero explicar el rendimiento de los alumnos de 3 año de psicología de la Universidad Pontificia. Cuanto más compleja sea una población (tiene mucha variabilidad), la muestra va a tener que ser más exigente para poder representarla bien. En estadística, hay dos tipos de poblaciones: finitas e infinitas. No se llaman así por el tamaño, sino para saber bien cómo es la población. Poblaciones finitas. Son aquellas en las que sabemos qué personas en concreto forman parte de esa población. Población de estudiantes de psicología de la UPSA. Puedo conocer a los sujetos de esa población. Por eso, en las poblaciones finitas el N de la población es conocido. Poblaciones infinitas. Las poblaciones infinitas (la mayoría) son aquellas en las que no tenemos un censo de quién o qué forma parte de esa población. No sabemos las personas que forman parte de esa población. Población de personas con depresión, población de personas con enfermedades raras. En este caso, el N de la población es desconocido. Cuando trabajamos con este tipo de poblaciones, vamos a necesitar tamaños muestrales más grandes que cuando son finitas. Así, cuanto más compleja sea la población, más difícil será representarla en la muestra porque la clave es que la muestra represente bien a la población. Para que represente bien a la población tiene que tener en cuenta la diversidad. Cuanto más diversa sea una población, mayor ha de ser el tamaño de la muestra para que la diversidad quede representada adecuadamente en la muestra. Por eso, el tamaño de la muestra para que represente bien a la población, depende de la desviación típica (variabilidad). La muestra es el subconjunto de la población extraído por algún método de muestreo. Hay dos tipos de muestreo: aleatorio - o probabilístico - y no probabilístico. Muestreo probabilístico:

  • (^) En el simple cada miembro de la población tiene la misma probabilidad de pertenecer a la muestra, se extrae al azar cada elemento de la muestra.
  • (^) En el estratificado , se determinan los estratos y se extrae al azar cada elemento del estrato. Cuando nosotros sabemos que en esa población es muy importante una variable como por ejemplo el sexo o la edad y, por ello, definimos unos estratos y de estos, se escogen al azar los sujetos.
  • (^) El conglomerado son pequeñas agrupaciones o es una agrupación natural de elementos de la población que reproduce su diversidad en otras variables. Es decir, se extrae al azar uno o varios conglomerados. Población de maltratadores en una prisión (la prisión podría ser un conglomerado) y se supone que todas las prisiones tendrían las mismas características de maltratadores. Muestreo no probabilístico: - (^) El más común es el casual, incidental o conveniencia, se trata de seleccionar a las personas por su accesibilidad ( personas voluntarias, personas accesibles ). Cuando pides a tus compañeros que realicen tu cuestionario para hacer tu TFG. - (^) El deliberado, intencional o opinático se trata de seleccionar a las personas por su relevancia, porque son típicas de lo que yo quiero estudiar, son típicamente representativos. Por ejemplo, si quiero saber cómo han vivido la pandemia los alumnos de la universidad, voy a tratar de seleccionar aquellos que tengan buena conexión de internet o los que no tengan acceso a

Nuestras inferencias tienen que estar ajustadas al instrumento de medida y tenemos que ser conscientes de que siempre estamos midiendo con una probabilidad de error, es decir, no hay certezas. e

Distribución muestral

Una muestra es buena si se parece a la población y representa dicha población. Cuanto más grande sea la población, más diversidad habrá. Los índices estadísticos los vamos a representar de forma distinta cuando nos estamos refiriendo a la muestra y a la población.

  • (^) Estadísticos. Índices estadísticos que salen de la muestra. Estos son: estadísticos de tendencia central ( media ) y estadísticos de variabilidad o dispersión ( desviación típica y varianza ). Los representamos de la siguiente manera: X ( media ), Sx ( desviación típica ) y Sx^2 ( varianza ). Son empíricos, es decir, proceden de puntuaciones empíricas. - (^) Parámetros. Índices estadísticos que salen de la población. Proceden de la inferencia estadística, es decir, del salto qué vamos a hacer entre el estadístico que sacamos de la muestra y ese valor que inferimos para la población, pero que no procede de puntuaciones empíricas porque metemos por medio teoría empírica. Como normalmente no los medimos, en realidad nosotros estimamos o inferimos cuál podría ser su valor y siempre con una probabilidad de error. Se representan como viene en el cuadro. Cuando hablamos de error muestral nos estamos refiriendo a la diferencia que hay entre estadístico y parámetro. El parámetro sí lo vamos a poder calcular utilizando teoría estadística porque vamos a calcular qué valor va a tener ese parámetro probablemente. Así, podemos calcular esa diferencia con un margen de error. Es decir, no conocemos el valor del parámetro; pero sí podemos conocer la probabilidad de que sea un valor. Así, cuanto mejor represente la muestra a la población, menor va a ser el error muestral, es decir, más se va a parecer el estadístico al parámetro porque la población está muy bien representada por la muestra. De aquí la importancia del muestreo para obtener buenos parámetros. En conclusión, para conocer la probabilidad del valor del parámetro vamos a necesitar la Teoría Estadística. Por ejemplo. Podemos investigar la siguiente pregunta: ¿Hay mayor aceptación de la violencia de género en la población adolescente que en la población adulta joven? cogiendo dos muestras, de 100 adolescentes y la otra de 100 adultos jóvenes a través de un muestreo por cuotas para que estén bien representados ambos géneros. Les podemos aplicar una escala de actitud hacia la violencia de género de 1 a 7. En la muestra adolescente, la media de aceptación es de 5 (mucha aceptación) y en la muestra joven, la media es baja, 2. Sólo podemos concluir que en estas muestras sí hay diferencia, pero no sabemos si sólo ocurren en estas muestras o esto es lo que pasa en la población. Aquí tenemos dos estadísticos, dos medias, y vemos que esos dos estadísticos son diferentes pero de los parámetros de la población no sabemos nada, sólo de la muestra. Necesitamos hablar de la distribución muestral porque es el fundamento a partir del cual, nosotros con los datos de una muestra, nosotros vamos a poder sacar conclusiones de una población. Este

CONCEPTOS PREVIOS

Estadísticos Tendencia central Media Desviación Típica Variabilidad o dispersión Parámetros Varianza Profa. Carmen Delgado

salto de muestra a población lo podemos hacer gracias a la Teoría de la distribución muestral, que es lo que justifica este salto epistemológico. Una muestra es una miniatura de la población y cuanto más se parezca a esta, mejores modelos vamos a tener. Cuando hablamos de índices que extraemos de la muestra, se denominan estadísticos (valores empíricos que hemos obtenido a partir de la muestra); mientras que cuando hablamos de índices de población, los llamamos parámetros (no hemos obtenido de datos empíricos porque no medimos todos los datos de la población, sino que es algo que inferimos a partir de los estadísticos). Nosotros vamos a poder acceder a la muestra y vamos a poder calcular o estimar empíricamente los estadísticos, pero nuestro estadístico no siempre se ajusta al parámetro. No vamos a acertar plenamente con esa muestra cuál es la media de la población, sino que obtengo un valor que se va a aproximar más o se va a aproximar menos. Cuando más se parezca la muestra a la población, más se va a parecer ese estadístico al parámetro de la población. Pero siempre puedo encontrar una diferencia del estadístico que sale de mi muestra y el valor del parámetro real. Esa diferencia se llama error muestral ( la diferencia entre estadístico y parámetro ). Cuando hablemos de error muestral nos vamos a referir específicamente a la diferencia que estimamos que hay entre el estadístico que sale de mi muestra y el parámetro de la población a la que quiero representar. De aquí la importancia del muestreo, pues cuanto más se parezca la muestra a la población, más pequeño será el error muestral. ¿Cómo podemos sacar el error muestral si no conocemos el parámetro? No podemos conocer el valor del parámetro, pero gracias a la Teoría Estadística si podemos saber cuál es la probabilidad de que el parámetro sea un valor determinado. Por ejemplo. La media de estatura de la clase es 1,70 cm y con esa clase, queremos representar toda la universidad. El parámetro sería “dentro de la universidad”. La diferencia que hay del 1,70 de mí muestra y la altura que tendría la población (universidad) sería el error muestral. Pero si no podemos conocer la población, no podemos sacar el parámetro. Así, el valor concreto del parámetro no lo podemos saber, pero gracias a la Teoría estadística podemos decir que posiblemente el parámetro de la población este entre 1,60 y 1,80. Cuanto más se aleje del valor estadístico, será menos probable que la media de la población sea esa. Así, la Teoría estadística nos va a permitir calcular la probabilidad asociada a un valor del parámetro. No nos va a permitir conocer concretamente el parámetro pero sí la probabilidad. Necesitamos la teoría estadística, llamada la Teoría de la probabilidad, para poder hacer esa estimación. Ejemplo. ¿Hay mayor aceptación de la violencia de género en la población adolescente que en la población adulta joven? Como no podemos investigar la población, recurrimos a muestras. Escogemos dos muestras: 100 adolescentes y 100 adultos jóvenes. Se haría un muestreo por cuotas - 50% hombres y 50% mujeres - para que estén representados ambos sexos en cada grupo. Por último, se les aplicaría unas Escalas de actitud hacia la violencia de género de 1 (baja aceptación) a 7 (alta aceptación). La muestra adolescente tiene una media de 5 (alta aceptación) y la muestra adulta joven tiene una media de 2. Lo único que podemos concluir es que en estas muestras concretas sí hay diferencia en el grado de aceptación, pero no sabemos si sólo ocurre en estas muestras o si esto es lo que pasa en la población.

muestral de la media, porque lo que saco de las muestras son medias. También existe la distribución muestral de la desviación típica que sería hacer el gráfico de las desviaciones típicas de cada muestra. Ejemplo. Estamos midiendo el cortisol en sangre, un indicador de estrés post-traumático y nuestra población son excombatientes con dicho estrés. Así tenemos una distribución muestral de la media de dicho cortisol en sangre. Así, en el gráfico vamos a tener puntuaciones que son las medias de las muestras. En la muestra que se concentren personas con menos cortisol, nos va a salir una media baja; mientras que en las muestras que tengan más cortisol, nos va a salir una media más alta. Yo puedo fijarme en dos muestras, la X 1 y la X 2. ¿Cuál de ellas representa mejor a la población? La muestra X 2 porque está más cerca del parámetro y, por ello, tiene menos error muestral que la X 1. No coincide con el parámetro porque la media de cortisol es un poco más alta que en la media total, pero es la que más se acerca al valor del parámetro. ¿Cuándo consideramos que una muestra no representa -pertenece- a la población? En psicología vamos a trabajar con un intervalo de confianza del 95%. Así, las medias que se salgan de ese intervalo de confianza no representan a la población y las medias que caigan dentro de ese intervalo de confianza, las vamos a considerar que sí pertenecen a la población. Cuanto más cerca del parámetro este, más representará a la población. El intervalo de confianza son aquellos valores entre los cuales estaría el parámetro de la población. ¿Cómo sabemos la probabilidad de que la muestra - la media - está dentro del intervalo de confianza? Lo sabemos a través del grado de significación (p). Este es la probabilidad de que la media de una muestra pertenezca a la misma población (que la media de la otra muestra). Oscila entre 0 y 1. Así, si nos sale que el p de una muestra es 0.01 significa que el grado de que pertenezca esa muestra a la población es de 1%. Así, cuando esta probabilidad es muy pequeña diremos que no pertenece a la misma población. Si el p de una muestra cae dentro del intervalo de confianza, diremos que la muestra pertenece a la población. Ese grado de significación o p-value lo sacamos a través del contraste de hipótesis. f

Hipótesis estadísticas

Las hipótesis estadísticas no son lo mismo que las hipótesis de investigación. La hipótesis de investigación la formula el investigador de acuerdo con los resultados que espera encontrar a partir del marco teórico. Por ejemplo. Su hipótesis puede ser que va a haber diferencias en el rechazo de la violencia de género en la población adolescente y en la población adulta joven. A veces, coincide la hipótesis de investigación con la hipótesis estadística. Las hipótesis estadísticas no las formula el investigador, vienen de la técnica estadística; es decir, que no varían. Sea cual sea el objeto de la investigación, las hipótesis estadísticas siempre se formulan de igual manera. Esto nos simplifica mucho el trabajo. Supongamos esta distribución muestral de la media para una variable (ej: cortisol en sangre). Y supongamos dos muestras [1] y [2]. μ Parámetro Las puntuaciones son medias de muestras [2]^ [1] Muestra 1 Muestra 2 De todas las muestras posibles que se podrían formar en la población, la muestra 2 “representa” mejor que la muestra 1, los niveles de cortisol en sangre de esa población. ¿Cuándo consideramos que una muestra NO representa (“no pertenece”) a la población? Media de cortisol un poco más alta que en la población Media de cortisol mucho más alta que en la población

Análisis Multivariado Tema 1. Apartado 1 Página 14 de 76 En estadística tenemos dos tipos de hipótesis: hipótesis nula (H 0 ) e hipótesis alternativa (H 1 ). Toda técnica estadística siempre tiene una nula y una alternativa. Siempre se formulan igual, no varían. Si yo estoy comparando medias, se formula así. Hipótesis nula. La hipótesis nula es que las diferencias entre los parámetros de esas dos muestras es nula. La diferencia de cortisol entre combatientes y población normal es nula. No hay diferencias estadísticas entre las dos muestras, es decir, tienen el mismo parámetro. La podemos encontrar a través de dos formas:

  1. Poniendo el parámetro de la población 1 y el parámetro de la población 2, la diferencia entre ellos es 0.
  2. La media de la población 1 es igual a la de la población 2. En ambos casos, lo que estamos diciendo es que las dos muestras pertenecen a la misma población. Hipótesis alternativa. La hipótesis alternativa es lo contrario. Hay diferencias entre las dos muestras. No tienen el mismo parámetro, es decir, si hay diferencias estadísticas entre ellas. Se puede formular de la siguiente manera: esperamos que la media 1 sea mayor que la media 2. El cortisol en excombatientes es mayor que en la población normal. Esto se llaman contrastes unilaterales porque se está dando una direccionalidad a la diferencia. En general, nosotros trabajamos con contrastes bilaterales. Hay diferencias pero no sabemos cómo. ¿Cómo representaríamos una hipótesis nula? Cuando aceptamos una hipótesis nula, lo que estamos diciendo es algo parecido a esto: nosotros tenemos una muestra con una media y otra muestra con otra media. ¿Hay diferencias en las muestras? Sí. Cuando estamos aceptando la hipótesis nula, lo que estamos diciendo es que estas muestras pertenecen a la misma población porque el parámetro de la población es la misma. Estamos diciendo que si yo en vez de coger las muestras del estudio, cogiera a todos los adolescentes y en vez de a esa muestra adulta, cogiera a la infinita población adulta, y calculara la media, tendrían el mismo parámetro. Las diferencias que me salen en estas muestras me salen porque han coincidido que en la muestra adulta se han reunido personas con puntuaciones más altas que en los adolescentes, pero el parámetro es el mismo. Cuando aceptamos la hipótesis nula lo que estamos diciendo es que es muy probable que la población adolescente y la población adulta en este caso tengan la misma media, el mismo parámetro. Esto lo puedo decir de formas distintas:
  • (^) La diferencia de medias en las muestras se debe al azar. Estoy diciendo que por azar me toco una muestra adulta donde las puntuaciones son mas altas y que por azar me tocó una muestra adolescente donde las puntuaciones son mas bajas. Pero que en la población podría haberme tocado otra muestra y no habría salido esta diferencia.
  • (^) Pertenecen a la misma población de rechazo de violencia de genero.
  • (^) No hay diferencias estadísticamente significativas.
  • Pregunta de examen: si yo estoy diciendo no hay diferencias estadísticamente significativas, ¿estoy diciendo que no hay diferencias en las muestras? No. Estoy diciendo que no hay diferencias Hipótesis estadísticas (^) ≠ Hipótesis de investigación: la formula el inve espera encontra Ejemplo: Habrá adolescente y la Hipótesis estadísticas: No varían; siempre investigación. Hay Hipótesis Nula [H 0 ] :
  • Las hipótesis alternativas pueden ser también unila caso se formularía, por ejemplo: μ 1 > μ 2. No nos de pero en la bibliografía se puede profundizar para qu Profa. Carmen Delgado Las muestras pertenecen a la misma población de rechazo de la VG: tienen el mismo parámetro, no hay diferencias estadísticas entre ellas.

Diferencia entre grado de significación y nivel de significación: El grado de significación es la p, es el valor que me salga a mi en mi contraste. 0 entre 1. El nivel de significación lo comparo con la p. es un valor fijo que adopta cada disciplina. en psicología es 5%. ¿Por qué adoptamos un alfa tan bajo? En estadística, toda hipótesis nula es cierta hasta que no se demuestre lo contrario. Nunca tenemos la certeza. Simplemente cuando no haya dudas razonables de que podemos rechazar la hipótesis nula, la vamos a rechazar. Solamente el conocimiento va a avanzar cuando no haya dudas razonables de que podemos decir que efectivamente hay diferencias entre muestras. Pero tenemos que descartar toda duda razonable. Por tanto, vamos a reducir tanto la posibilidad de equivocarnos como al 5%. Es decir, las decisiones estadísticas se basan en el calculo de probabilidades y son muy cautas. Muchas veces, los investigadores dicen que tienen la seguridad de que un tratamiento funciona, pero no puede demostrarlo porque le salen diferencias entre las muestras control y muestras experimento pero no le salen diferencias estadísticamente significativas. Como la ciencia es tan cuata, hasta que no tengo una probabilidad muy alta de acertar, no se va a poder decir que hay diferencia. Resumiendo: no conocemos los parámetros de las muestras que estamos comparando (no lo hemos medido); pero a partir de lo observado (estadísticos) hacemos una estimación de probabilidades (Teoría de la Distribución Muestral) de que los estadísticos pertenezcan a la misma población y tomamos una decisión estadística (probabilística). Si la probabilidad de pertenecer a la misma población no supera el 5% consideramos probado que no pertenece a la misma población p≤α. Dicho de otra forma: sólo vamos a Rechazar una H cuando la probabilidad de pertenecer a la misma población es tan baja que no supera el 5%. g

Tipos de error: Tipo I (alfa) y Tipo II (beta)

La hipótesis nula siempre es que nunca hay diferencias y consideramos que es cierta hasta que no conseguimos demostrar lo contrario. La hipótesis alternativa es que sí hay diferencias, hay efecto. En todas las pruebas estadísticas trabajamos con un margen de error, que tratamos de controlarlo o reducirlo al mínimo.Siempre hablamos de probabilidad de pertenecer a la misma población o, dicho de otra manera, de aceptar la hipótesis nula, de tener el mismo parámetro; pero nunca hablamos de certeza. ¿Cómo podemos equivocarnos? Podemos equivocarnos de dos maneras: podemos equivocarnos al rechazar la hipótesis nula o al rechazar la hipótesis alternativa. Podemos equivocarnos al rechazar la hipótesis nula. ¿Cuándo nos equivocamos al rechazar la hipótesis nula? Nos equivocamos cuando realmente no hay diferencias y nosotros con el estudio de nuestra muestra erróneamente concluimos que si las hay. Este error que cometemos al rechazar una hipótesis nula verdadera se llama error tipo 1 alfa. Por ejemplo, vamos a suponer que en la población no haya diferencias por sexo en la tasa de transmisión de Covid-19. Suponemos que la tasa de reproducción sea la misma para hombres y para mujeres en la población. Supongamos que nosotros en nuestra investigación con nuestra muestra comparamos hombres y mujeres de estudiantes. Al hacer esa

comparación, nos sale un p-value de 0,04. La conclusión sería que como 0,04 es menor al 0,05 de alfa, rechazaríamos la hipótesis nula: hay diferencias en la población. Cuando estamos tomando esta decisión estadística la estamos tomando con un riesgo de equivocarnos del 4% porque nuestro contraste en nuestra prueba nos dice que hay una probabilidad de 0,04 de que no sea así. Lo admitimos porque es inferior a ese límite que hemos marcado del 5%. Es muy improbable porque es un 4% de probabilidad, pero existe. Entonces esta probabilidad de equivocarnos al rechazar la hipótesis nula verdadera es lo que se llama error de tipo 1 o alfa. Podemos equivocarnos al rechazar la hipótesis alternativa. Por ejemplo, supongamos que en una población realmente no hay diferencias y nosotros cuando la estamos estudiando con la muestra que estamos analizando, lleguemos a la conclusión de que no las hay. Por ejemplo, supongamos que en la población hay diferencias entre jóvenes y mayores en la tasa de asintomáticos de Covid-19. Comparamos en una muestra de jóvenes y mayores de Salamanca y nos sale un p-value de 0,06. La decisión estadística que tenemos que tomar es que como ese 0,06 (6%) de probabilidad es superior a lo permitido que es un 0,05 (5%), vamos a decir que tenemos que aceptar la hipótesis nula; es decir, que no podemos concluir que haya diferencias. Nos habremos equivocado porque hemos perdido la oportunidad de demostrar una diferencia real que había y que nosotros con nuestro estudio no vamos a poder concluir que la hemos encontrado. Este error que cometemos al rechazar una hipótesis alternativa que es verdadera lo llamamos error tipo 2 o beta. Entonces, siempre nos movemos entre dos tipos de error posibles. Un símil de dichos errores es el símil jurídico. Hay una acusado y hay evidencias: el 50% son evidencias a favor de que es culpable y el otro 50% de que es inocente. ¿Qué decisión va a tomar el jurado? Será la decisión probabilística más correcta. En este caso decir que el acusado es inocente equivaldría a la hipótesis nula; mientras que la hipótesis alternativa sería que el acusado sí es culpable. Si es realmente inocente, el jurado tiene una probabilidad del 50% de declararlo inocente y 50% de declararlo culpable (error tipo 1 o alfa). Aunque es 50% y 50%, la decisión que tendría que tomar sería declararlo inocente porque declararlo culpable sin tener pruebas mas que evidentes, sería un error tremendo. Por tanto, ese falso positivo, falso culpable o falso sí hay diferencias es algo que la estadística trata de evitar a toda costa porque es el error más grave que se puede cometer al tomar una decisión estadística. Si suponemos la situación contraria: es culpable (hipótesis alternativa cierta). Habría un 50% de posibilidades de declararlo inocente y de declararlo culpable. ¿Qué error cometeríamos si realmente es culpable y el jurado lo declara inocente? Sería un falso negativo y, por tanto, sería error tipo 2 beta. Así, en estadística funciona el mismo principio jurídico “in dubio, pro reo”, es decir, en caso de duda a favor del acusado. Es decir, la ciencia prefiere un falso negativo a un falso positivo. Prefiere no tener un descubrimiento aunque considere que probablemente si es real, a tener un falso positivo (descubrir algo que realmente no es cierto). Importante: en estadística, la hipótesis nula es cierta siempre hasta que se demuestre lo contrario con una probabilidad de error muy pequeña, es decir, hasta que tengamos muchas garantías de que efectivamente podemos rechazar esa hipótesis nula.

Podemos medir esas variables utilizando las escalas de Stevens que distingue entre cuatro tipos de escalas:

  • (^) Escala nominal. Medimos con un nombre o etiqueta. Por ejemplo, sexo (variable) - hombre y mujer (serían las etiquetas). Lo único que nos dice es si hay igualdad o desigualdad de etiquetas, no podemos decir si uno es superior a otro. Solamente podemos decir que son diferentes. Utilizamos números y esa asignación de números la puedo hacer como quiera pero no puedo operar con ellos, sólo me sirven para facilitarme a mí la codificación. Solo indican igualdad o desigualdad.
  • (^) Escala ordinal. Además de decirnos que son diferentes, nos da un orden: cuál está primero y cuál está después. Pero ese orden no nos dice cuánta diferencia hay entre en primero y el segundo o entre el primero y el tercero. Solo nos dice que uno esta antes y el otro después. Ejemplo. Curso (variable) - 1º, 2º, 3º (ordinales). Los números sólo indican orden; no cuantifica la diferencia entre los puestos, solo sabemos el orden. No podemos saber que el primer corredor ha ganado por 10 segundos al segundo corredor.
  • (^) Escala de intervalo. La mayoría de variables psicológicas están medidas en escalas de intervalo. Por ejemplo, cualquier puntuación de un test, calificación de rendimiento, etc. Medimos con un número. Ejemplo, variable rendimiento - la medimos entre 0-10 puntos. Son puntuaciones que si que podemos calcular diferencias entre ellas, restar, sumar, etc. Los números nos indican que entre dos valores consecutivos, los intervalos son iguales. Por ejemplo, entre 0 y 1 hay la misma diferencia que entre 1 y 2-, pero tener puntuación 0 es arbitrario y no significa ausencia de variable.
  • (^) Escala de razón. Es como la escala de intervalo pero con una restricción mayor y es que el 0 es absoluto, es decir, que por debajo de 0 no hay ningún valor. En la escala de intervalo, sacar un 0 por ejemplo en un examen, no significa que tenga un 0 de conocimiento; quiere decir que no acertó ninguna pregunta del examen. Pero en la escala de razón cualquier cosa por debajo de 0 no existe. Por ejemplo, tiempo de reacción - 10 segundos; no puede tener valor 0 porque significa que no hay tiempo. El 0 aquí indica ausencia de la variable que estamos midiendo. Los números además de indicar intervalos iguales, nos indica 0 absoluto. Medir 0 indica no tener estatura. En estadística, las muestras siempre se refieren a muestras de puntuaciones de una variable. Por ejemplo, muestras de puntuaciones de depresión en hombres; pero no nos estamos refiriendo a “muestra de hombres”. La muestra siempre se refiere a una medida , muestra de la variable que estamos midiendo. Hay dos tipos de muestras: Muestras independientes. Hablamos de este tipo de muestras cuando las muestras de puntuaciones proceden de distintos sujetos. Por ejemplo, estoy tomando una muestra en puntuación de depresión en hombres y en depresión de mujeres. Tengo la misma muestra de puntuaciones (puntuaciones de depresión) pero de distintos sujetos (hombres y mujeres). Otro ejemplo, estoy tomando esas puntuaciones en un grupo control -sin terapia- y en un grupo experimental -con terapia-. Muestras relacionadas o pareadas. Hablamos de este tipo de muestras cuando los datos proceden de los mismos sujetos. Por ejemplo, cuando voy a medir las puntuaciones de depresión en un grupo antes y después de la terapia para Profa. Carmen DelgadoEn Estadística las muestras siempre se refieren a muestras de puntuaciones de una variable. Ejemplo: muestras de puntuaciones de depresión en hombres.Habitualmente damos por sobreentendido que nos estamos refiriendo a las puntuaciones de la variable que estamos midiendo. Ejemplo: decimos “muestra de hombres” pero se refiere a “muestra de puntuaciones en depresión en hombres”. Tipos de Muestras:Relacionadas: las muestras proceden de los mismos sujetos. Ejemplo: depresión antes de una terapia y después de una terapia [Muestra 1] Puntuaciones antes de terapia [Muestra 2] Puntuaciones después de terapia [mismos sujetos] [Muestra 1] Puntuaciones grupo control (no terapia) [Muestra 2] Puntuaciones grupo experimental (terapia)Independientes: las muestras proceden de distintos sujetos. Ejemplo: depresión en un grupo control (sin terapia) y en un grupo experimental (tras recibir terapia) Concepto de Muestra: Retomando conceptos…. [distintos sujetos]

saber si ha sido eficaz. Así, las dos muestras de puntuaciones -la de antes y la de después- proceden de los mismos sujetos. Entonces hacemos contraste estadístico de medias mediante técnicas estadísticas para sacar conclusiones sobre las medias de la población a partir de los datos de las muestras y nos basamos en la teoría de la distribución muestral de medias. Por ejemplo. ¿Hay diferencias por sexo en depresión? esto es lo mismo que decir ¿influye el sexo en la depresión? Lo que haríamos sería coger una muestra de hombres y la comparamos con una muestra de mujeres, para tener los dos sexos representados. Sacaríamos la muestra de puntuaciones de depresión en los hombres y en las mujeres. Medimos la variable depresión en cada sexo y sacamos la media de cada muestra. Vamos a hacer un contraste para poder sacar conclusiones sobre la población, para poder concluir si el parámetro de las puntuaciones de depresión en hombres es igual o diferente del parámetro de las puntuaciones de depresión en mujeres. Esta es la conclusión a la que nos va a permitir llegar un contraste estadístico. Es decir, mediante el contraste estadístico sacamos conclusiones (hacemos inferencias) sobre la población, aunque sólo hemos medido la muestra. Cuando comparamos medias, sí sólo contrastamos una variable -depresión- hablamos de contraste univariado. Las pruebas univariadas son aquellas pruebas en las que solo se contrasta una variable. En nuestro estudio tenemos dos variables: el sexo -hombre y mujer- y la depresión - medirla con inventario de depresión de Beck de 0 a 63 puntos-. Nosotros vamos a contrastar la media de depresión, vamos a ver si hay diferencia en hombres y en mujeres. Es decir, lo que queremos saber es si el sexo influye en la depresión. Sólo si influye, no queremos saber si el sexo es la causa de la depresión. Además, estas pruebas son correlacionales y, por tanto, no nos permiten establecer relaciones de causa-efecto. Solo queremos saber si hay diferencias entre hombres y mujeres. Hay que tener cuidado con la nomenclatura que vamos a usar. Vamos a usar la nomenclatura de “variable independiente” (VI) y “variable dependiente” (VD), pero la vamos a usar con un sentido distinto al que se usa en los diseños experimentales. Esto es una limitación de la disciplina, pues que a veces se usa la misma palabra con significados distintos dependiendo del contexto en el que se use. En estadística también usamos una terminología de variable independiente y variable dependiente; pero variable independiente no significa lo mismo que en el contexto de los diseños experimentales. La variable independiente en nuestra prueba estadística es aquella que estudiamos si influye en la otra. En este caso, sería si el sexo (VI) influye en la depresión (VD). La variable dependiente es aquella que estudiamos si es influida por la otra. En diseños experimentales, sólo hablamos de variable independiente cuando manipulamos la variable: el sexo no lo manipulamos y, por ello, no es VI. Pero en estadística si que podemos decir que el sexo es una variable independiente porque estamos analizando su efecto sobre otra variable. Cuando estamos contrastando medias, la variable independiente va a ser la que nos sirva para seleccionar los sujetos, los grupos, etc. Si yo estoy estudiando como influye el sexo en la depresión, el sexo es la variable independiente y va a ser la variable con la cual yo voy a seleccionar la muestra (voy a tener que tener representado un grupo de hombres y un grupo de mujeres).