







Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: Analisis de datos, Profesor: Examenes analisis de datos, Carrera: Psicología, Universidad: UNED
Tipo: Apuntes
1 / 13
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!








Pulse sobre la pregunta para acceder directamente a la respuesta
¿Se puede calcular la media a partir de las frecuencias absolutas acumuladas?
Al calcular la media aritmética, ¿qué representa Xi cuando los datos están agrupados en intervalos?, ¿y en distribuciones en las que no hemos agrupado en intervalos?
Una propiedad de la media es que la suma de las desviaciones de cada valor con respecto a su media es igual a cero. ¿Se cumple esta propiedad cuando se presentan en una distribución de frecuencias?
¿Qué es una transformación lineal y cuándo se utiliza? ¿Por qué es importante esta propiedad de la media aritmética?
¿Es necesario conocer la explicación sobre el origen de la fórmula de la mediana mediante la representación gráfica que se ofrece en las páginas 68 y 69 del libro?
¿Podrían explicarme de manera más detallada cómo se calcula la mediana en el Ejemplo 2.6?
¿Cómo se calcula la mediana en una variable cuantitativa discreta que se presenta en una distribución de frecuencias? Un ejemplo es el número de hijos en el ejercicio de autoevaluación 2.13 del libro (página 83).
En función del nivel de medida y del tipo de variable, ¿qué índice de tendencia central se puede aplicar?
¿Qué son los valores extremos? ¿Qué relación tienen con la asimetría? ¿Y con la no utilización de la media como índice de tendencia central?
¿Es el percentil un porcentaje?
¿Es necesario invertir la tabla de distribución de frecuencias para calcular la mediana o cualquier percentil?
Cuando calculo un percentil, encuentro resultados diferentes en las frecuencias acumuladas en función del orden (creciente o decreciente) de la distribución de frecuencias. ¿Qué hago mal?
¿Cómo se determina el intervalo crítico en el cálculo de la mediana y el resto de percentiles?
¿Qué dos cuestiones se pueden plantear en relación a los percentiles?
En cambio, si disponemos de un número mayor de observaciones en la que se repiten valores y éstos se presentan mediante una distribución de frecuencias, la expresión que debemos utilizar para comprobar la propiedad es:
n i 1 i^ i
n(X X) 0
De esta forma, vamos a tener en cuenta el número de veces que aparece cada valor.
En el ejemplo 3.3 de la página 98, tenemos la siguiente distribución con media igual a
X 6 , 12 :
Nota (Xi) ni Xi X n (^) i (XiX) 5 135 -1,12 -151, 6 66 -0,12 -7, 7 45 0,88 39, 8 36 1,88 67, 9 18 2,88 51,
Como se puede observar el número de observaciones es de 300 (n = 300). Aplicamos la expresión y obtenemos que la suma de la última columna es igual a cero.
[ Arriba ]
Respuesta
Una transformación lineal es una forma de transformar las puntuaciones de una
puntuación de una variable X por un valor determinado (denominado b ) y a continuación sumarle una constante ( a ), obteniendo una nueva variable Yi.
Obviamente, dependiendo de para qué utilicemos la transformación en cada caso conviene elegir unos valores en concreto. En cuanto a su utilización, es muy amplia en Psicología, ya que en la aplicación de todo tipo de test se utilizan las transformaciones lineales, y también en investigación básica para evitar valores negativos de las variables.
Un ejemplo que te resultará cercano es el caso de los exámenes. Imagina el caso de un examen de 20 preguntas (una escala de 0 a 20) en el que interesa pasar las puntuaciones de los alumnos a una escala de 0 a 10. Para hacerlo tenemos que aplicar la siguiente transformación lineal a las puntuaciones X :
Y = 0,5 X + 0
En este caso basta dividir las puntuaciones por la mitad cambiar de una escala de 0 a 20 a otra de 0 a 10; por eso, b = 0,5 y a = 0.
Supongamos que tenemos 10 estudiantes en el examen con puntuaciones X: 14, 20, 0, 17, 10, 16, 18, 19, 16, 15.
Aplicando la transformación lineal Yi = 0,5 Xi +0 a todas las puntuaciones, obtendríamos las calificaciones en una escala de 0 a 10:
Xi = 14 Yi = 14 × 0,5 + 0 = 7
Xi = 20 Yi = 20 × 0,5 + 0 = 10
Xi = 0 Yi = 0 × 0,5 + 0 = 0
Xi = 17 Yi = 17 × 0,5 + 0 = 8,
Xi = 10 Yi = 10 × 0,5 + 0 = 5
Xi = 16 Yi = 16 × 0,5 + 0 = 8
Xi = 18 Yi = 18 × 0,5 + 0 = 9
Xi = 19 Yi = 19 × 0,5 + 0 = 9,
Xi = 16 Yi = 16 × 0,5 + 0 = 8
Xi = 15 Yi = 15 × 0,5 + 0 = 7,
Por último, con respecto a la media, la importancia de esta propiedad es que la media de la nueva variable Y se puede calcular directamente aplicando la misma transformación lineal que se ha aplicado a los valores de la variable original.
[ Arriba ]
Respuesta
No, no es imprescindible hacer la representación gráfica para calcular la mediana. Sin embargo, conocer la representación gráfica ayuda a entender el concepto de Mediana y a entender la fórmula que se utiliza para calcularla porque todos los términos que intervienen en ella están representados en la gráfica. [ Arriba ]
Respuesta
Respuesta
En la siguiente tabla se resume la aplicación de los índices de tendencia central.
Nivel de medida Tipo de variable Índice de tendencia central que se puede aplicar
Nominal Cualitativa Mo Ordinal Cuasicuantitativa Mo, Md De intervalos De razón
Cuantitativa discreta Cuantitativa continua
Mo, Md,X
[ Arriba ]
Respuesta
Un valor extremo es un valor muy superior o inferior al resto de valores. El cálculo de la media se desaconseja cuando la distribución es asimétrica con unos pocos valores extremos que pueden afectar a su representatividad como medida de tendencia central.
Eso se debe a que el valor de la media es muy sensible a la presencia de unos pocos valores extremos. Por ese motivo, en estos casos la mediana puede ser una mejor alternativa para resumir la tendencia central de los datos, ya que no se ve afectada por estos valores.
Veamos un ejemplo sencillo en el que se aprecia la sensibilidad de la media.Tenemos el siguiente conjunto de puntuaciones:
5, 7, 10, 16, 17
La mediana es igual a 10 y la media es 11.
Si ahora sustituimos el valor más alto por un valor extremo, por ejemplo 100, el resultado es el siguiente:
5,7,10,16,
Ahora la media aumenta mucho su valor y es igual a 27,6, pero la mediana no se ve afectada y sigue siendo igual a 10.
En una distribución simétrica los valores de media, mediana y moda coinciden. Una distribución es simétrica cuando al dividirla en dos a la altura de la media, las dos mitades se superponen, por lo que visualmente se aprecia un número de dato similar en ambos extremos de la distribución. Si existe algún valor extremo no puede haber
esta simetría distribuyéndose los datos de forma desigual en los extremos de la distribución. [ Arriba ]
Respuesta
No, el percentil no es un porcentaje o tanto por cien. El Percentil es un valor que deja por debajo de sí un determinado tanto por cien o porcentaje de las observaciones o casos. En general, el percentil k (Pk) es el valor que deja por debajo de sí el k% de las observaciones (y por tanto el (100-k)% por encima de sí).
La mediana, Md, es el P 50. Es decir, deja por debajo de sí el 50% de las observaciones.
Veámoslo con un ejemplo: imaginemos que 110 es el valor del Cociente Intelectual que deja por debajo de sí al 65% de los alumnos de una muestra determinada. Según la notación habitual, en este ejemplo tenemos que k = 65 y Pk = 110. Esto quiere decir que P 65 = 110, por tanto 110 es la puntuación que deja por debajo de sí al 65% de los alumnos. [ Arriba ]
Respuesta
No es necesario pero sí recomendable. Cuando disponemos de una distribución de frecuencias para datos agrupados en intervalos, para cualquier variable, es conveniente que esos intervalos aparezcan en orden decreciente (es decir, los intervalos con valores más altos primero). Si los intervalos aparecen en orden creciente es conveniente invertir la tabla para facilitar el cálculo de cualquier percentil, incluida la mediana.
La razón es que para calcular los distintos índices (Mediana, Percentiles, Cuartiles,..) es más intuitivo esa disposición decreciente: no hay que olvidar que, por ejemplo, el P 60 es "el valor que deja por debajo de sí el 60% de las observaciones o casos" y eso se ve más claramente si la disposición de la tabla de la distribución de frecuencias es la que he indicado anteriormente.
Por último, si la tabla está ya ordenada en orden decreciente no hay que modificar el orden. [ Arriba ]
Respuesta
Puedes comprobar que calcular la mediana es más intuitivo con los datos ordenados
de manera decreciente. Por ejemplo, al identificar nd (frecuencia absoluta acumulada por debajo del intervalo crítico) en la segunda tabla este valor realmente quedaría en
la linea de abajo, mientras que en la primera tabla estaría en la línea superior del
intervalo crítico. [ Arriba ]
Respuesta
El intervalo crítico es el intervalo que contiene el índice de posición que se desea obtener con datos agrupados en intervalos. Por ejemplo, para el cálculo de la mediana, el primer paso es determinar en qué intervalo se encontrará. A este intervalo se le denomina intervalo crítico y para determinarlo se requiere obtener las frecuencias acumuladas o proporciones acumuladas. Hecho esto, el intervalo crítico es el primer intervalo cuya frecuencia acumulada sea mayor o igual al 50% de n o cuya proporción acumulada sea mayor o igual a 0,50.
Si en lugar de la mediana, es cualquier otro percentil, por ejemplo el percentil 70, entonces el intervalo crítico es el primer intervalo cuya frecuencia acumulada sea mayor o igual al 70% de n o cuya proporción acumulada sea mayor o igual a 0,70.
[ Arriba ]
Respuesta
En los percentiles, nos podemos encontrar con dos casos:
(1) se pide directamente el valor del percentil, Pk, y
(2) se pregunta a qué percentil corresponde un determinado valor de la variable.
En el primer caso (1), utilizamos la fórmula (pág. 77 del libro):
n
n 100
n k
P L c
d k i
En el segundo caso (2) podemos utilizar la fórmula (pág. 78 del libro):
n
n I
(P L)n
k
d
k i c
Esta segunda fórmula ha sido obtenida despejando k en la primera fórmula.
[ Arriba ]
Respuesta
La tabla de la distribución es la siguiente:
X Xi ni na 13-15 14 10 50 10-12 11 18 40 7-9 8 13 22 4-6 5 7 9 1-3 2 2 2 ∑ 50
La puntuación X = 9 está en el intervalo [7-9] que va a ser, por tanto, el intervalo crítico. Se aplica la fórmula y se obtiene lo siguiente:
n
n I
(P L)n
k
d
k i c
Por lo tanto, a la puntuación X = 9, le corresponde el percentil 40, P 40 = 9.
[ Arriba ]
Respuesta
Cuando se tienen muy pocos datos no es habitual calcular percentiles, porque tienen poca utilidad. Para realizar el cálculo hay que proceder de la misma manera, considerando que los intervalos tienen amplitud 1, o agrupando los pocos datos que hay en intervalos de la amplitud elegida.
Ejemplo:
Con los datos: 3, 5, 2, 7, 6, 4, 9, calcular el D2, D7, P32 y P
Lo primero que hay que hacer es ordenarlos, disponerlos en una tabla (con su correspondiente frecuencia), calcular las frecuencias acumuladas y aplicar la misma fórmula que para datos agrupados en intervalos. Es decir:
Figura 1 : Representación gráfica de las calificaciones de 150 alumnos en una asignatura (X)
El Percentil 30, para los datos de la Figura 1, es: A) 3; B) 4,7; C) 7,
Para construir la tabla de distribución de frecuencias a partir de los datos de la Figura, hay que tener en cuenta es que se trata de un histograma, por lo que en el eje de abcisas (el horizontal) se sitúan los intervalos exactos de la variable. En este caso, para convertir los límites exactos en aparentes basta con sumar 0,5 al límite inferior exacto y restar 0,5 al límite superior exacto.
Según el histograma, el primer intervalo tiene como límites exactos 0,5 – 2,5 por lo que los límites aparentes son 1 – 2. El segundo tiene como límites exactos 2,5 – 4,5 por lo que sus límites aparentes son 3 – 4. Y así sucesivamente con el resto de los intervalos, hasta completar todos los intervalos de la distribución de frecuencias. Para saber las frecuencias absolutas tienes que fijarte en la altura de cada uno de los rectángulos del histograma hasta llegar a la siguiente distribución de frecuencias.
X ni na 9 -10 20 150 7 - 8 40 130 5 - 6 50 90 3 - 4 30 40 1 - 2 10 10 150
El intervalo crítico es el primero cuya frecuencia absoluta acumulada sea superior a nk/100 = 45, por tanto el intervalo 5-6. Y sustituyendo en la fórmula de los percentiles tenemos que:
[ Arriba ]