Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Analisis datos, Apuntes de Psicología

Asignatura: Analisis de datos, Profesor: Examenes analisis de datos, Carrera: Psicología, Universidad: UNED

Tipo: Apuntes

2014/2015

Subido el 01/12/2015

myriam_mtnez_glez
myriam_mtnez_glez 🇪🇸

1 documento

1 / 13

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
INTRODUCCIÓN AL ANÁLISIS DE DATOS
1
Preguntas más Frecuentes: Tema 2
Pulse sobre la pregunta para acceder directamente a la respuesta
1. ¿Se puede calcular la media a partir de las frecuencias absolutas acumuladas?
2. Al calcular la media aritmética, ¿qué representa Xi cuando los datos están
agrupados en intervalos?, ¿y en distribuciones en las que no hemos agrupado en
intervalos?
3. Una propiedad de la media es que la suma de las desviaciones de cada valor con
respecto a su media es igual a cero. ¿Se cumple esta propiedad cuando se presentan
en una distribución de frecuencias?
4. ¿Qué es una transformación lineal y cuándo se utiliza? ¿Por qué es importante esta
propiedad de la media aritmética?
5. ¿Es necesario conocer la explicación sobre el origen de la fórmula de la mediana
mediante la representación gráfica que se ofrece en las páginas 68 y 69 del libro?
6. ¿Podrían explicarme de manera más detallada cómo se calcula la mediana en el
Ejemplo 2.6?
7. ¿Cómo se calcula la mediana en una variable cuantitativa discreta que se presenta
en una distribución de frecuencias? Un ejemplo es el número de hijos en el ejercicio de
autoevaluación 2.13 del libro (página 83).
8. En función del nivel de medida y del tipo de variable, ¿qué índice de tendencia
central se puede aplicar?
9. ¿Qué son los valores extremos? ¿Qué relación tienen con la asimetría? ¿Y con la
no utilización de la media como índice de tendencia central?
10. ¿Es el percentil un porcentaje?
11. ¿Es necesario invertir la tabla de distribución de frecuencias para calcular la
mediana o cualquier percentil?
12. Cuando calculo un percentil, encuentro resultados diferentes en las frecuencias
acumuladas en función del orden (creciente o decreciente) de la distribución de
frecuencias. ¿Qué hago mal?
13. ¿Cómo se determina el intervalo crítico en el cálculo de la mediana y el resto de
percentiles?
14. ¿Qué dos cuestiones se pueden plantear en relación a los percentiles?
pf3
pf4
pf5
pf8
pf9
pfa
pfd

Vista previa parcial del texto

¡Descarga Analisis datos y más Apuntes en PDF de Psicología solo en Docsity!

Preguntas más Frecuentes: Tema 2

Pulse sobre la pregunta para acceder directamente a la respuesta

  1. ¿Se puede calcular la media a partir de las frecuencias absolutas acumuladas?

  2. Al calcular la media aritmética, ¿qué representa Xi cuando los datos están agrupados en intervalos?, ¿y en distribuciones en las que no hemos agrupado en intervalos?

  3. Una propiedad de la media es que la suma de las desviaciones de cada valor con respecto a su media es igual a cero. ¿Se cumple esta propiedad cuando se presentan en una distribución de frecuencias?

  4. ¿Qué es una transformación lineal y cuándo se utiliza? ¿Por qué es importante esta propiedad de la media aritmética?

  5. ¿Es necesario conocer la explicación sobre el origen de la fórmula de la mediana mediante la representación gráfica que se ofrece en las páginas 68 y 69 del libro?

  6. ¿Podrían explicarme de manera más detallada cómo se calcula la mediana en el Ejemplo 2.6?

  7. ¿Cómo se calcula la mediana en una variable cuantitativa discreta que se presenta en una distribución de frecuencias? Un ejemplo es el número de hijos en el ejercicio de autoevaluación 2.13 del libro (página 83).

  8. En función del nivel de medida y del tipo de variable, ¿qué índice de tendencia central se puede aplicar?

  9. ¿Qué son los valores extremos? ¿Qué relación tienen con la asimetría? ¿Y con la no utilización de la media como índice de tendencia central?

  10. ¿Es el percentil un porcentaje?

  11. ¿Es necesario invertir la tabla de distribución de frecuencias para calcular la mediana o cualquier percentil?

  12. Cuando calculo un percentil, encuentro resultados diferentes en las frecuencias acumuladas en función del orden (creciente o decreciente) de la distribución de frecuencias. ¿Qué hago mal?

  13. ¿Cómo se determina el intervalo crítico en el cálculo de la mediana y el resto de percentiles?

  14. ¿Qué dos cuestiones se pueden plantear en relación a los percentiles?

  1. ¿Cómo se calcula el percentil de X=9 en el ejemplo 2.13 de la página 79?
  2. ¿Cómo se calculan los percentiles si tenemos pocos datos y están sin agrupar en intervalos? Me ayudaría ver un ejemplo.
  3. En el ejercicio de autoevaluación nº 18 del curso virtual, ¿cómo se construye la distribución de frecuencias a partir del histograma?

En cambio, si disponemos de un número mayor de observaciones en la que se repiten valores y éstos se presentan mediante una distribución de frecuencias, la expresión que debemos utilizar para comprobar la propiedad es:

n i 1 i^ i

n(X X) 0

De esta forma, vamos a tener en cuenta el número de veces que aparece cada valor.

En el ejemplo 3.3 de la página 98, tenemos la siguiente distribución con media igual a

X  6 , 12 :

Nota (Xi) ni Xi X n (^) i (XiX) 5 135 -1,12 -151, 6 66 -0,12 -7, 7 45 0,88 39, 8 36 1,88 67, 9 18 2,88 51,

Como se puede observar el número de observaciones es de 300 (n = 300). Aplicamos la expresión y obtenemos que la suma de la última columna es igual a cero.

[ Arriba ]

  1. ¿Qué es una transformación lineal y cuándo se utiliza? ¿Por qué es importante esta propiedad de la media aritmética?

Respuesta

Una transformación lineal es una forma de transformar las puntuaciones de una

variable basada en la ecuación de una recta Yi = bXi + a. Consiste en multiplicar cada

puntuación de una variable X por un valor determinado (denominado b ) y a continuación sumarle una constante ( a ), obteniendo una nueva variable Yi.

Obviamente, dependiendo de para qué utilicemos la transformación en cada caso conviene elegir unos valores en concreto. En cuanto a su utilización, es muy amplia en Psicología, ya que en la aplicación de todo tipo de test se utilizan las transformaciones lineales, y también en investigación básica para evitar valores negativos de las variables.

Un ejemplo que te resultará cercano es el caso de los exámenes. Imagina el caso de un examen de 20 preguntas (una escala de 0 a 20) en el que interesa pasar las puntuaciones de los alumnos a una escala de 0 a 10. Para hacerlo tenemos que aplicar la siguiente transformación lineal a las puntuaciones X :

Y = 0,5 X + 0

En este caso basta dividir las puntuaciones por la mitad cambiar de una escala de 0 a 20 a otra de 0 a 10; por eso, b = 0,5 y a = 0.

Supongamos que tenemos 10 estudiantes en el examen con puntuaciones X: 14, 20, 0, 17, 10, 16, 18, 19, 16, 15.

Aplicando la transformación lineal Yi = 0,5 Xi +0 a todas las puntuaciones, obtendríamos las calificaciones en una escala de 0 a 10:

Xi = 14  Yi = 14 × 0,5 + 0 = 7

Xi = 20  Yi = 20 × 0,5 + 0 = 10

Xi = 0  Yi = 0 × 0,5 + 0 = 0

Xi = 17  Yi = 17 × 0,5 + 0 = 8,

Xi = 10  Yi = 10 × 0,5 + 0 = 5

Xi = 16  Yi = 16 × 0,5 + 0 = 8

Xi = 18  Yi = 18 × 0,5 + 0 = 9

Xi = 19  Yi = 19 × 0,5 + 0 = 9,

Xi = 16  Yi = 16 × 0,5 + 0 = 8

Xi = 15  Yi = 15 × 0,5 + 0 = 7,

Por último, con respecto a la media, la importancia de esta propiedad es que la media de la nueva variable Y se puede calcular directamente aplicando la misma transformación lineal que se ha aplicado a los valores de la variable original.

[ Arriba ]

  1. ¿Es necesario conocer la explicación sobre el origen de la fórmula de la mediana mediante la representación gráfica que se ofrece en las páginas 68 y 69 del libro?

Respuesta

No, no es imprescindible hacer la representación gráfica para calcular la mediana. Sin embargo, conocer la representación gráfica ayuda a entender el concepto de Mediana y a entender la fórmula que se utiliza para calcularla porque todos los términos que intervienen en ella están representados en la gráfica. [ Arriba ]

  1. ¿Podrían explicarme de manera más detallada cómo se calcula la mediana en el Ejemplo 2.6?

Respuesta

X Xi ni na

  1. En función del nivel de medida y del tipo de variable, ¿qué índice de tendencia central se puede aplicar?

Respuesta

En la siguiente tabla se resume la aplicación de los índices de tendencia central.

Nivel de medida Tipo de variable Índice de tendencia central que se puede aplicar

Nominal Cualitativa Mo Ordinal Cuasicuantitativa Mo, Md De intervalos De razón

Cuantitativa discreta Cuantitativa continua

Mo, Md,X

[ Arriba ]

  1. ¿Qué son los valores extremos? ¿Qué relación tienen con la asimetría? ¿Y con la no utilización de la media como índice de tendencia central?

Respuesta

Un valor extremo es un valor muy superior o inferior al resto de valores. El cálculo de la media se desaconseja cuando la distribución es asimétrica con unos pocos valores extremos que pueden afectar a su representatividad como medida de tendencia central.

Eso se debe a que el valor de la media es muy sensible a la presencia de unos pocos valores extremos. Por ese motivo, en estos casos la mediana puede ser una mejor alternativa para resumir la tendencia central de los datos, ya que no se ve afectada por estos valores.

Veamos un ejemplo sencillo en el que se aprecia la sensibilidad de la media.Tenemos el siguiente conjunto de puntuaciones:

5, 7, 10, 16, 17

La mediana es igual a 10 y la media es 11.

Si ahora sustituimos el valor más alto por un valor extremo, por ejemplo 100, el resultado es el siguiente:

5,7,10,16,

Ahora la media aumenta mucho su valor y es igual a 27,6, pero la mediana no se ve afectada y sigue siendo igual a 10.

En una distribución simétrica los valores de media, mediana y moda coinciden. Una distribución es simétrica cuando al dividirla en dos a la altura de la media, las dos mitades se superponen, por lo que visualmente se aprecia un número de dato similar en ambos extremos de la distribución. Si existe algún valor extremo no puede haber

esta simetría distribuyéndose los datos de forma desigual en los extremos de la distribución. [ Arriba ]

  1. ¿Es el percentil un porcentaje?

Respuesta

No, el percentil no es un porcentaje o tanto por cien. El Percentil es un valor que deja por debajo de sí un determinado tanto por cien o porcentaje de las observaciones o casos. En general, el percentil k (Pk) es el valor que deja por debajo de sí el k% de las observaciones (y por tanto el (100-k)% por encima de sí).

La mediana, Md, es el P 50. Es decir, deja por debajo de sí el 50% de las observaciones.

Veámoslo con un ejemplo: imaginemos que 110 es el valor del Cociente Intelectual que deja por debajo de sí al 65% de los alumnos de una muestra determinada. Según la notación habitual, en este ejemplo tenemos que k = 65 y Pk = 110. Esto quiere decir que P 65 = 110, por tanto 110 es la puntuación que deja por debajo de sí al 65% de los alumnos. [ Arriba ]

  1. ¿Es necesario invertir la tabla de distribución de frecuencias para calcular la mediana o cualquier percentil?

Respuesta

No es necesario pero sí recomendable. Cuando disponemos de una distribución de frecuencias para datos agrupados en intervalos, para cualquier variable, es conveniente que esos intervalos aparezcan en orden decreciente (es decir, los intervalos con valores más altos primero). Si los intervalos aparecen en orden creciente es conveniente invertir la tabla para facilitar el cálculo de cualquier percentil, incluida la mediana.

La razón es que para calcular los distintos índices (Mediana, Percentiles, Cuartiles,..) es más intuitivo esa disposición decreciente: no hay que olvidar que, por ejemplo, el P 60 es "el valor que deja por debajo de sí el 60% de las observaciones o casos" y eso se ve más claramente si la disposición de la tabla de la distribución de frecuencias es la que he indicado anteriormente.

Por último, si la tabla está ya ordenada en orden decreciente no hay que modificar el orden. [ Arriba ]

  1. Cuando calculo un percentil, encuentro resultados diferentes en las frecuencias acumuladas en función del orden (creciente o decreciente) de la distribución de frecuencias. ¿Qué hago mal?

Respuesta

Puedes comprobar que calcular la mediana es más intuitivo con los datos ordenados

de manera decreciente. Por ejemplo, al identificar nd (frecuencia absoluta acumulada por debajo del intervalo crítico) en la segunda tabla este valor realmente quedaría en

la linea de abajo, mientras que en la primera tabla estaría en la línea superior del

intervalo crítico. [ Arriba ]

  1. ¿Cómo se determina el intervalo crítico en el cálculo de la mediana y el resto de percentiles?

Respuesta

El intervalo crítico es el intervalo que contiene el índice de posición que se desea obtener con datos agrupados en intervalos. Por ejemplo, para el cálculo de la mediana, el primer paso es determinar en qué intervalo se encontrará. A este intervalo se le denomina intervalo crítico y para determinarlo se requiere obtener las frecuencias acumuladas o proporciones acumuladas. Hecho esto, el intervalo crítico es el primer intervalo cuya frecuencia acumulada sea mayor o igual al 50% de n o cuya proporción acumulada sea mayor o igual a 0,50.

Si en lugar de la mediana, es cualquier otro percentil, por ejemplo el percentil 70, entonces el intervalo crítico es el primer intervalo cuya frecuencia acumulada sea mayor o igual al 70% de n o cuya proporción acumulada sea mayor o igual a 0,70.

[ Arriba ]

  1. ¿Qué dos cuestiones se pueden plantear en relación a los percentiles?

Respuesta

En los percentiles, nos podemos encontrar con dos casos:

(1) se pide directamente el valor del percentil, Pk, y

(2) se pregunta a qué percentil corresponde un determinado valor de la variable.

En el primer caso (1), utilizamos la fórmula (pág. 77 del libro):

I

n

n 100

n k

P L c

d k i  

En el segundo caso (2) podemos utilizar la fórmula (pág. 78 del libro):

n

n I

(P L)n

k

d

k i c 

Esta segunda fórmula ha sido obtenida despejando k en la primera fórmula.

[ Arriba ]

  1. ¿Cómo se calcula el percentil de X=9 en el ejemplo 2.13 de la página 79?

Respuesta

La tabla de la distribución es la siguiente:

X Xi ni na 13-15 14 10 50 10-12 11 18 40 7-9 8 13 22 4-6 5 7 9 1-3 2 2 2 ∑ 50

La puntuación X = 9 está en el intervalo [7-9] que va a ser, por tanto, el intervalo crítico. Se aplica la fórmula y se obtiene lo siguiente:

n

n I

(P L)n

k

d

k i c   

Por lo tanto, a la puntuación X = 9, le corresponde el percentil 40, P 40 = 9.

[ Arriba ]

  1. ¿Cómo se calculan los percentiles si tenemos pocos datos y están sin agrupar en intervalos? Me ayudaría ver un ejemplo.

Respuesta

Cuando se tienen muy pocos datos no es habitual calcular percentiles, porque tienen poca utilidad. Para realizar el cálculo hay que proceder de la misma manera, considerando que los intervalos tienen amplitud 1, o agrupando los pocos datos que hay en intervalos de la amplitud elegida.

Ejemplo:

Con los datos: 3, 5, 2, 7, 6, 4, 9, calcular el D2, D7, P32 y P

Lo primero que hay que hacer es ordenarlos, disponerlos en una tabla (con su correspondiente frecuencia), calcular las frecuencias acumuladas y aplicar la misma fórmula que para datos agrupados en intervalos. Es decir:

Figura 1 : Representación gráfica de las calificaciones de 150 alumnos en una asignatura (X)

El Percentil 30, para los datos de la Figura 1, es: A) 3; B) 4,7; C) 7,

Para construir la tabla de distribución de frecuencias a partir de los datos de la Figura, hay que tener en cuenta es que se trata de un histograma, por lo que en el eje de abcisas (el horizontal) se sitúan los intervalos exactos de la variable. En este caso, para convertir los límites exactos en aparentes basta con sumar 0,5 al límite inferior exacto y restar 0,5 al límite superior exacto.

Según el histograma, el primer intervalo tiene como límites exactos 0,5 – 2,5 por lo que los límites aparentes son 1 – 2. El segundo tiene como límites exactos 2,5 – 4,5 por lo que sus límites aparentes son 3 – 4. Y así sucesivamente con el resto de los intervalos, hasta completar todos los intervalos de la distribución de frecuencias. Para saber las frecuencias absolutas tienes que fijarte en la altura de cada uno de los rectángulos del histograma hasta llegar a la siguiente distribución de frecuencias.

X ni na 9 -10 20 150 7 - 8 40 130 5 - 6 50 90 3 - 4 30 40 1 - 2 10 10 150

El intervalo crítico es el primero cuya frecuencia absoluta acumulada sea superior a nk/100 = 45, por tanto el intervalo 5-6. Y sustituyendo en la fórmula de los percentiles tenemos que:

P ,    

[ Arriba ]