Prepara tus exámenes
Consigue puntos
Orientación Universidad
Vende en Docsity
Docsity AI

Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity

Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium

Orientación Universidad

Vende en Docsity

Docsity AI

Inicia sesión Regístrate

Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity

Busca documentos

Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity

Busca tu universidad

Encuentra los documentos específicos para los exámenes de tu universidad

Video Cursos

Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades

Quiz

Responde a preguntas de exámenes reales y pon a prueba tu preparación

Docsity AINEW

Resume tus documentos, hazles preguntas, conviértelos en quiz y mapas conceptuales

Ver preguntas

Despeja tus dudas leyendo las respuestas a las preguntas que realizaron otros estudiantes como tú

Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium

Compartir documentos

20 Puntos

Por cada documento subido

Responde a las preguntas

5 Puntos

por cada respuesta dada (máx. 1 al día)

Todos los modos para conseguir puntos gratis

Consigue puntos de inmediato

Elige un plan Premium con todos los puntos que necesitas.

Oportunidades de estudio

Elige tu próximo programa de estudio

Ponte en contacto inmediatamente con las mejores universidades del mundo. Busca entre miles de universidades en todo el mundo. Busca entre miles de universidades partner oficiales

Comunidad

Pregúntale a la comunidad

Pide ayuda a la comunidad y resuelve tus dudas de estudio

Ebooks gratuitos

¡Nuestros e-books salva-estudiantes!

Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity

soluciones ejercicios libro, Ejercicios de Psicología

Universidad Autónoma de Madrid (UAM)Psicología

Prof. Ricardo Olmos

Asignatura: analisis de datos II, Profesor: Ricardo Olmos, Carrera: Psicología, Universidad: UAM

Tipo: Ejercicios

2013/2014

Subido el 28/01/2014

virginiacromero 🇪🇸

3.6

(41)

20 documentos

1 / 46

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

Análisis de datos

en ciencias sociales y de la salud

Ejercicios del volumen I

Soluciones

Capítulo 1

1.1. Las soluciones marcadas con un asterisco se refieren a variables de las que ya hemos señalado que no

pueden ser consideradas estrictamente ordinales. Ya hemos argumentado que estas variables pueden

tratarse, a efectos prácticos, como si estuvieran medidas con una escala de intervalos:

a.Ordinal

b. Nominal.

c.Ordinal

d. Razón.

e. Razón.

f.Ordinal

g.Ordinal

h.Ordinal.

i.Ordinal

j.Ordinal.

k. Razón.

l.Ordinal

m.Ordinal

n. Razón.

ñ. Razón.

o. Nominal.

p. Razón.

q.Ordinal

r. Razón.

s.Ordinal.

t. Razón.

u. Nominal.

v.Ordinal

w. Razón.

x. Nominal.

y.Ordinal

z. Nominal.

1.2. a. Nivel explicativo. Hay control de las condiciones del estudio (palabras sin dibujos, palabras con

dibujos) y asignación aleatoria de los sujetos a las condiciones.

b. Nivel descriptivo. El estudio se limita a observar (constatar) cómo es algo.

c. Nivel relacional. Es posible determinar si se produce una mejora, pero no si esa mejora se debe al

entrenamiento (no hay forma de saber, por ejemplo, si la posible mejora es debida simplemente

al paso del tiempo).

d. Nivel relacional. No hay asignación aleatoria a las condiciones del estudio (hombres, mujeres). Es

posible averiguar si los hombres y las mujeres difieren en su actitud pero no el motivo de esa

diferencia.

e. Nivel explicativo. Hay control de las condiciones del estudio (dosis de alcohol) y asignación alea-

toria de los sujetos a las condiciones.

f. Nivel relacional. No hay asignación aleatoria de los sujetos a las condiciones del estudio. Es

posible saber si los grupos formados difieren, pero no si las diferencias se deben a los años de

relación o a otra cosa.

g. Nivel relacional. No hay asignación aleatoria de los sujetos a las condiciones del estudio (nivel de

ansiedad). Es posible saber si los grupos formados difieren, pero no si esas diferencias se deben

al nivel de ansiedad o a alguna otra variable.

Descubre Ejercicios de Psicología Universidad Autónoma de Madrid (UAM)

Documentos relacionados

Ejercicios ANOVA

(5)

Ejercicios ANOVA

(3)

Ejercicios clase

(2)

ejercicios capitulo 2

(1)

ejercicios capitulo 1

(1)

ejercicios anova resultos

analisis de datos temas 1-5

LA PRUEBA T DE STUDENT PARA MUESTRAS INDEPENDIENTES Es la herramien

(14)

VARIABLES CATEGÓRICAS En las ciencias sociales y de la salud es fre

(14)

ANALISIS DE DATOS II TEORIA

(3)

CAPITULO 4 INFERENCIA CON DOS VARIABLES CUANTITATIVAS

Lo importante no es el tamaño de la muestra

Vista previa parcial del texto

¡Descarga soluciones ejercicios libro y más Ejercicios en PDF de Psicología solo en Docsity!

Análisis de datos

en ciencias sociales y de la salud

Ejercicios del volumen I

Soluciones

Capítulo 1

1.1. Las soluciones marcadas con un asterisco se refieren a variables de las que ya hemos señalado que no pueden ser consideradas estrictamente ordinales. Ya hemos argumentado que estas variables pueden tratarse, a efectos prácticos, como si estuvieran medidas con una escala de intervalos: a. Ordinal *. b. Nominal. c. Ordinal *. d. Razón. e. Razón. f. Ordinal *.

g. Ordinal *. h. Ordinal. i. Ordinal *. j. Ordinal. k. Razón. l. Ordinal *.

m. Ordinal *. n. Razón. ñ. Razón. o. Nominal. p. Razón. q. Ordinal *.

r. Razón. s. Ordinal. t. Razón. u. Nominal. v. Ordinal *. w. Razón.

x. Nominal. y. Ordinal *. z. Nominal.

1.2. a. Nivel explicativo. Hay control de las condiciones del estudio (palabras sin dibujos, palabras con dibujos) y asignación aleatoria de los sujetos a las condiciones. b. Nivel descriptivo. El estudio se limita a observar (constatar) cómo es algo. c. Nivel relacional. Es posible determinar si se produce una mejora, pero no si esa mejora se debe al entrenamiento (no hay forma de saber, por ejemplo, si la posible mejora es debida simplemente al paso del tiempo). d. Nivel relacional. No hay asignación aleatoria a las condiciones del estudio (hombres, mujeres). Es posible averiguar si los hombres y las mujeres difieren en su actitud pero no el motivo de esa diferencia. e. Nivel explicativo. Hay control de las condiciones del estudio (dosis de alcohol) y asignación alea- toria de los sujetos a las condiciones. f. Nivel relacional. No hay asignación aleatoria de los sujetos a las condiciones del estudio. Es posible saber si los grupos formados difieren, pero no si las diferencias se deben a los años de relación o a otra cosa. g. Nivel relacional. No hay asignación aleatoria de los sujetos a las condiciones del estudio (nivel de ansiedad). Es posible saber si los grupos formados difieren, pero no si esas diferencias se deben al nivel de ansiedad o a alguna otra variable.

2 Análisis de datos (vol. I)

h. Nivel relacional. Es posible saber si el número o porcentaje de recuperaciones es distinto en los hombres y en las mujeres, pero no el verdadero motivo de la diferencia. i. Nivel relacional. Es posible averiguar si la calidad percibida mejora con el tiempo, pero no es posible asegurar que la mejora sea debida al paso del tiempo. j. Nivel explicativo. Hay control de las condiciones del estudio (nivel de alcohol en sangre) y asigna- ción aleatoria de los sujetos a las condiciones. k. Nivel relacional. Es posible averiguar si la opinión de los pacientes cambia con la evolución de la terapia, pero no es posible asegurar que la evolución de la terapia sea la responsable de ese cambio. l. Nivel descriptivo. El estudio se limita a observar el número o porcentaje de parados con problemas de depresión. m. Nivel relacional. Es posible determinar si se produce un cambio pero no es posible asegurar que el cambio se deba al tratamiento (podría deberse al paso del tiempo, podría existir un efecto place- bo, etc.). n. Nivel descriptivo. Puesto que sólo se ha registrado el número de aciertos de cada pregunta, lo úni- co que puede saberse es si existen diferencias en la proporción de aciertos.. ñ. Nivel relacional. No hay asignación aleatoria de los sujetos a las condiciones del estudio (diferen- cia de años). Es posible saber si los grupos formados difieren, pero no el motivo de la diferencia. o. Nivel explicativo. Hay control sobre las condiciones del estudio (los dos contextos que rodean a la pregunta) y ambas se aplican a los mismos sujetos. p. Nivel relacional. Es posible determinar si se produce un cambio pero no es posible asegurar que el cambio se deba al tratamiento (podría deberse al paso del tiempo, podría existir un efecto place- bo, etc.). q. Nivel explicativo. Hay control de las condiciones del estudio (tipo de entrenamiento) y asignación aleatoria de los sujetos a las condiciones. r. Nivel relacional. Es posible determinar si el razonamiento abstracto cambia, pero no es posible asegurar que ese cambio se deba al paso del tiempo. s. Nivel explicativo. Hay control de las condiciones del estudio (intensidad del ruido) y asignación aleatoria de los sujetos a las condiciones. t. Nivel relacional. Es posible establecer si el recuerdo cambia con el paso del tiempo, pero no es posible asegurar que el cambio observado se deba al paso del tiempo. u. Nivel explicativo. Hay control de las condiciones (tipo de terapia) y asignación aleatoria de los su- jetos a las condiciones. v. Nivel explicativo. Hay control de las condiciones (intensidad luminosa) y las cuatro condiciones se aplican a las mismas tiendas. w. Nivel explicativo. Hay control de las condiciones del estudio (cantidad de recompensa) y asigna- ción aleatoria de los ratones a las condiciones. x. Nivel relacional. No hay control de las condiciones del estudio (la experiencia del profesor viene dada) ni asignación aleatoria de los sujetos a las condiciones. y. Nivel relacional. Es posible determinar si se produce un cambio pero no es posible asegurar que el cambio se deba a la intervención (podría deberse al paso del tiempo, podría existir un efecto placebo, etc.). z. Nivel relacional. No hay asignación aleatoria de los sujetos a las condiciones del estudio. Es posi- ble determinar el grado de parecido o diferencia existente entre los cocientes intelectuales de los gemelos, pero no aislar la causa del parecido o la diferencia.

4 Análisis de datos (vol. I)

2.4. a. La de potenciales pacientes de la zona de influencia de los hospitales seleccionados. b. El grado de relación entre tabaquismo y enfisema pulmonar. c. No. Es una muestra aleatoria de los pacientes que acuden a consulta. d. Relacional. No existe asignación aleatoria a las condiciones del estudio y, por tanto, no hay forma de excluir el posible efecto de terceras variables.

2.5. a. Verdadera (ver ecuación [2.5]). b. Falsa. Esto sólo será así si los sucesos son exclusivos. c. Falsa. Esto sólo será así si los sucesos son independientes. d. Falso. El resultado de cada lanzamiento es independiente del resultado de cualquier otro lanza- miento. e. Falso. El resultado “5 caras” puede ocurrir de 252 maneras. El resultado “7 caras” puede ocurrir de 120 maneras (combinaciones sin repetición; ver Apéndice 2).

2.6. Puesto que las preguntas tienen cinco alternativas con sólo una correcta, la probabilidad de acertar una pregunta por azar vale: P ( A ) = 1/5 = 0,20; y la de no acertar: P ( nA ) = 1! 0,20 = 0,80. Por tanto: a. 0,80 × 0,80 × 0,80 = 0,512. b. Hay tres formas distintas de obtener un acierto: se puede acertar la primera pregunta, la segunda o la tercera. Por tanto, 0,20 × 0,80 × 0,80 + 0,80 × 0,20 × 0,80 + 0,80 × 0,80 × 0,20 = 0,384. c. Hay tres formas distintas de obtener dos aciertos: se puede fallar la primera pregunta, o la segunda, o la tercera. Por tanto, 0,80 × 0,20 × 0,20 + 0,20 × 0,80 × 0,20 + 0,20 × 0,20 × 0,80 = 0,096. d. 0,20 × 0,20 × 0,20 = 0,008.

2.7. a. 0,50 10 = 0,00098.

b. Hay 10 formas distintas de obtener un acierto: se puede acertar el primer par, el segundo, el tercero, ..., o el décimo. Por tanto, 10 × 0,50 10 = 0,0098.

2.8. a. Sí son independientes: P ( H 1 S ) = P ( H ) P ( S ) = 500 /5.000 = (2.000 /5.000) (1.250 /5.000) = 0,10.

b. P ( M 1 N ) = 2.250 / 5.000 = 0,45. c. P ( S | H ) = P ( S 1 H ) / P ( H ) = 0,10 / (2.000 /5.000) = 0,25. d. P ( H | S ) = P ( H 1 S ) / P ( S ) = 0,10 / (1.250 /5.000) = 0,40.

2.9. Sabemos que P ( H ) = 0,40; P ( M ) = 0,60; P ( D | H ) = 0,10 y P ( D | M ) = 0,20. Por tanto:

a. P ( H 1 D ) = P ( H ) P ( D | H ) = 0,40 × 0,10 = 0,04. b. P ( M 1 D ) = P ( M ) P ( D | M ) = 0,60 × 0,20 = 0,12. c. P ( D ) = P ( H 1 D ) + P ( M 1 D ) = 0,04 + 0,12 = 0,16. d. P ( H | D ) = P ( H 1 D ) / P ( D ) = 0,04 / 0,16 = 0,25.

2.10. a. La enfermedad será detectada tanto si la detectan ambas pruebas como si la detecta sólo una de ellas: P ( A = sí) P ( B = sí) + P ( A = sí) P ( B = no) + P ( A = no) P ( B = sí) = 0,90 × 0,80 + 0,90 × 0,20 + 0,10 × 0,80 = 0,98. b. P ( B = no) P ( C = no) = 0,20 × 0,30 = 0,06. c. P ( A = sí) P ( B = sí) P ( C = sí) = 0,90 × 0,80 × 0,70 = 0,504. d. Que al menos dos de las tres pruebas detecten la enfermedad significa que la detecten las tres o que la detecten sólo dos. Es decir,

Soluciones 5

P ( A = sí) P ( B = sí) P ( C = sí) + P ( A = sí) P ( B = sí) P ( C = no) + P ( A = sí) P ( B = no) P ( C = sí) +

P ( A = no) P ( B = sí) P ( C = sí) = = (0,90 × 0,80 × 0,70) + (0,90 × 0,80 × 0,30) + (0,90 × 0,20 × 0,70) + (0,10 × 0,80 × 0,70) = 0,902.

2.11. Conocemos: P ( P 1 ) = P ( P 2 ) = 0,50; P ( A | P 1 ) = 1/4 = 0,25; P ( A | P 2 ) = 1/5 = 0,20. A partir de aquí se puede calcular la probabilidad de obtener un acierto: P ( A ) = 0,50 × 0,25 + 0,50 × 0,20 = 0,225. Por tanto: a. P ( P 1 | A ) = P ( P 1 1 A ) / P ( A ) = (0,50 × 0,25) / 0,225 = 0,56. b. P ( P 2 | A ) = P ( P 2 1 A ) / P ( A ) = (0,50 × 0,20) / 0,225 = 0,44.

2.12. a. El diagnóstico será correcto si el detector identifica correctamente tanto a una persona que miente ( M 1 m ) como a una persona que no miente ( nM 1 nm ): ! P ( M 1 m ) = P ( M ) P ( m | M ) = 0,20 × 0,90 = 0,18. ! P ( nM 1 nm ) = P ( nM ) P ( nm | nM ) = 0,80 × 0,95 = 0,76. Por tanto, la probabilidad de diagnóstico correcto vale 0,18 + 0,76 = 0,94. b. Puesto que el detector indica que la persona miente ( m ), el diagnóstico sólo será correcto si la per- sona realmente está mintiendo ( M ). Hay que calcular: P ( M | m ). Comencemos con lo que sabemos: ! Probabilidad de que un sujeto mienta: P ( M ) = 0,20. ! Probabilidad de que un sujeto no mienta: P ( nM ) = 0,80. ! P ( M 1 m ) = 0,18 (calculada en el apartado a ). ! P ( nM 1 m ) = 0,04 (calculada en el apartado a ). ! P ( m ) = 0,18 + 0,04 = 0,22. Por tanto, P ( M | m ) = P ( M 1 m ) / P ( m ) = 0,18 / 0,22 = 0,82.

2.13. a. La prueba puede dar un resultado positivo (+) tanto si la enfermedad está presente ( E ) como si no ( nE ). Comencemos con lo que sabemos: ! Probabilidad de que la persona esté enferma: P ( E ) = 0,30. ! Probabilidad de la persona no esté enferma: P ( nE ) = 0,70. ! P ( E 1 +) = P ( E ) P (+ | E ) = 0,30 × 0,90 = 0,27. ! P ( nE 1 +) = P ( nE ) P (+ | nE ) = 0,70 × 0,20 = 0,14. Por tanto, la probabilidad de obtener un resultado positivo vale P (+) = 0,27 + 0,14 = 0,41. b. El diagnóstico será equivocado tanto si la prueba dice que una persona que está enferma ( E ) no lo está (!), como si dice que una persona que no está enferma ( nE ) lo está (+): ! P ( E 1 !) = P ( E ) P (! | E ) = 0,30 × 0,10 = 0,03. ! P ( nE 1 +) = P ( nE ) P (+ | nE ) = 0,70 × 0,20 = 0,14. Por tanto, la probabilidad de que el diagnóstico esté equivocado vale 0,03 + 0,14 = 0,17. c. P ( nE | +) = P ( nE 1 +) / P (+) = 0,14 / 0,41 = 0,34.

2.14. Hay que calcular: P ( S | C ). Comencemos con lo que sabemos:

! Probabilidad de superar la prueba: P ( S ) = 0,40. ! Probabilidad de no superar la prueba: P ( nS ) = 0,60. ! P ( S 1 C ) = 0,40 × 0,80 = 0,32. ! P ( nS 1 C ) = 0,60 × 0,05 = 0,03. ! P ( C ) = 0,32 + 0,03 = 0,35. Por tanto, P ( S | C ) = P ( S 1 C ) / P ( C ) = 0,32 / 0,35 = 0,91.

Soluciones 7

3ª tabla: Pa 2 = 0,20 + 0,30 = 0,50; Pa 4 = 1,00; P 1 = 0,20; P 3 = 0,50! 0,50 = 0; P 4 = 1! 0,50 = 0,50; n 1 = 0,20(100) = 20; n 2 = 0,30(100) = 30; n 3 = 0(100) = 0; n 4 = 0,50(100) = 50. En la 1ª tabla hay una categoría cuya frecuencia es muy pequeña ( n 4 = 1). En la 3ª tabla hay una categoría cuya frecuencia vale cero ( n 3 ).

3.5. n = 80; P 1 = 8/80 = 0,10; % 1 = 0,10(100) = 10; na 1 = 8; Pa 1 = 0,10; % a 1 = 10;

n 2 = 80(0,15) = 12; % 2 = 0,15(100) = 15; na 2 = 8 +12 = 20; Pa 2 = 0,10 + 0,15 = 0,25; % a 2 = 10 +15 = 25; P 3 = 0,60! 0,25 = 0,35; n 3 = 0,35(80) = 28; % 3 = 0,35(100) = 35; na 3 = 20 +28 = 48; % a 3 = 25 + 35 = 60; P 4 = 25/100 = 0,25; n 4 = 0,25(80) = 20; na 4 = 48 + 20 = 68; Pa 4 = 0,60 + 0,25 = 0,85; % a 4 = 60 + 25 = 85; n 5 = 80! 68 = 12; P 5 = 12/80 = 0,15; % 5 = 0,15(100) = 15; na 5 = 68+12 = 80; Pa 5 = 1,00; % a 5 = 100.

3.6. a. La variable n 1 puede tomar valores entre 0 y 10 (es decir, 0 aciertos, 1 acierto, 2 aciertos, ..., 10 aciertos). Y dado que se trata de la suma de 10 ensayos independientes de una variable dicotómica (1 = «acierto», 0 = «error»), es decir, de la suma de 10 ensayos de Bernoulli independientes entre sí, su distribución es la binomial, por lo que puede utilizarse la tabla B del Apéndice final para conocer la probabilidad asociada a cada valor de n 1. La siguiente tabla ofrece esas probabilidades acumuladas ( F ) e individuales ( f ):

n 1 0 1 2 3 4 5 6 7 8 9 10 F ( n 1 ) 0,001 0,011 0,055 0,172 0,377 0,623 0,828 0,945 0,989 0,999 1, f ( n 1 ) 0,001 0,010 0,044 0,117 0,205 0,246 0,205 0,117 0,044 0,010 0,

b. Ecuación [3.7]: E ( n 1 ) = n  1 = 10 (0,50) = 5. Ecuación [3.9]: V ( n 1 ) = n  1 (1! 1 ) = 10 (0,50) (0,50) = 2,5. c. De acuerdo con los datos de la distribución de n 1 obtenida en el apartado a : P ( n 1 > 7) = 1! F (7) = 1! 0,945 = 0,055. d. 100 P ( n 1 > 7) = 100 (0,055) = 11 sujetos.

3.7. Vamos a calcular la probabilidad de obtener con el tratamiento convencional el resultado obtenido con el experimental. Si esa probabilidad es muy baja, significará que el resultado obtenido con el tratamien- to experimental es muy difícil de obtener con el convencional. Tenemos n = 20 ensayos de una variable dicotómica (1 = «recuperación», 0 = «no recuperación») con probabilidad de recuperación  1 = 0,40 en cada ensayo. Tenemos, por tanto, una variable que se distribuye binomialmente. Consultando la tabla de la distribución binomial (Tabla B del Apéndice final) obtenemos: P ( n 1 > 13) = 1! F (13) = 1! 0,994 = 0,006. Por tanto, es muy poco probable (0,006) que con el tratamiento convencional pueda obtenerse el resultado del tratamiento experimental.

3.8. a. El diagnóstico será incorrecto tanto si la prueba dice que una persona que está enferma ( E ) no lo está (!), como si dice que una persona que no está enferma ( nE ) lo está (+): ! P ( E 1 !) = P ( E ) P (! | E ) = 0,30 × 0,10 = 0,03. ! P ( nE 1 +) = P ( nE ) P (+ | nE ) = 0,70 × 0,20 = 0,14. Por tanto, la probabilidad de diagnóstico equivocado será: 0,03 + 0,14 = 0,17. b. Tenemos n = 30 ensayos de una variable dicotómica (1 = «diagnóstico incorrecto», 0 = «diagnósti- co correcto») con probabilidad de diagnóstico incorrecto  1 = 0,17 en cada ensayo. Lo que cabe esperar que ocurra es el valor esperado de la variable n 1 = «número de diagnósticos incorrectos».

8 Análisis de datos (vol. I)

Es decir, E ( n 1 ) = n  1 = 30 (0,17) = 5,1 (ecuación [3.7]). Por tanto, en 30 diagnósticos, lo más pro- bable es que la prueba se equivoque en 5. c. La probabilidad de que no haya más de 2 diagnósticos incorrectos es la probabilidad de que haya dos, uno o ninguno; es decir: P ( n 1 < 3) = P ( n 1 = 0) + P ( n 1 = 1) + P ( n 1 = 2) Aplicando la ecuación [3.4] con n = 30 y  1 = 0,17 se obtiene: ! P ( n 1 = 0) = [30! / (0! 30!)] 0,17^0 (0,83)^30 = 1(0,003735) = 0,003735. ! P ( n 1 = 1) = [30! / (1! 29!)] 0,17^1 (0,83)^29 = 30 (0,000765) = 0,022953. ! P ( n 1 = 2) = [30! / (2! 28!)] 0,17^2 (0,83)^28 = 435 (0,000157) = 0,068167. Por tanto: P ( n 1 < 3) = 0,003735 + 0,022953 + 0,068167 = 0,095.

3.9. Tenemos una variable dicotómica (1 = «acierto», 0 = «error») de la que se realizan n = 20 ensayos. La probabilidad de acierto en cada ensayo vale  1 = 1/5 = 0,20. En la tabla de la distribución binomial (Ta- bla B del Apéndice final) puede comprobarse: P ( n 1 = 7) = 1! 0,913 = 0,087. P ( n 1 = 8) = 1! 0,968 = 0,032. La probabilidad de obtener 7 o más aciertos es mayor que 0,05 (por tanto, 7 aciertos no sirve como pun- to de corte). Sin embargo, la probabilidad de obtener 8 o más aciertos es menor que 0,05. La decisión será, por tanto, aprobar a los estudiantes que obtengan 8 aciertos o más.

3.10. La suma de las puntuaciones del test no es más que el número de aciertos ( n 1 ). Y la varianza del número de aciertos (ver ecuación [3.9]) viene dada por V ( n 1 ) = n (1!  1 ), es decir, k (1!  1 ). Ahora bien, el producto entre dos números que suman 1 es máximo cuando esos números son iguales. Por tanto la varianza de n 1 será máxima cuando = 1!  1 = 0,50. Luego la alternativa d es correcta: el valor máxi- mo de la varianza del test ( n 1 ) es k (0,25). La varianza del test sólo valdrá cero cuando todas las respuestas sean aciertos o todas sean fallos; y no sabemos cuáles son las respuestas (esto descarta la alternativa a ). Y las alternativas b y c se refieren a valores concretos que no están justificados, pues no se dispone de ninguna información para saber cuál es el valor concreto de la varianza.

3.11. Tenemos una variable dicotómica (1 = «en contra», 0 = «a favor») de la que se han realizado n = 20 en- sayos. Siendo n 1 = «número de personas que se manifiestan en contra de la eutanasia» y  1 = «propor- ción de personas en contra de la eutanasia», las probabilidades asociadas a la variable n 1 pueden ob- tenerse en la tabla de la distribución binomial (Tabla B del Apéndice final): P ( n 1 > 10) = 1! F (10) = 1! 0,872 = 0,128.

Capítulo 4

4.1. a. Y

_

b. El 5 % de 20 casos es 0,05 (20) = 1. Por tanto, la media recortada al 5 % es la media aritmética tras eliminar dos casos (un caso de la parte inferior de la distribución y otro caso de la parte superior). Es decir, Y

_

5% = (7^ +^10 +^11 + ·^ ·^ · +^18 +^19 +^19 )^ /^ 18 = 278^ /^ 18 = 15,44.

10 Análisis de datos (vol. I)

c. = =. = = =.

d. = =. = =. = = = =.

e. = = =.

= = =.

f. = = =. = = =.

g. Tanto el histograma como el diagrama de caja muestran una distribución asimétrica negativa. Y el cociente entre el índice de asimetría y su error típico (que es menor que !2) confirma la pre- sencia de asimetría. Los casos que se alejan del centro por la izquierda hacen que en esa zona haya más casos (leptocurtosis) de los que habría en una distribución mesocúrtica. Resumiendo: las 20 puntuaciones obtenidas en la prueba de selección tienen las siguientes características: un centro situado en torno a 16, sin excesiva dispersión y con evidente asimetría negativa.

4.4. a. Y

_

antes = (9^ +^8 +^21 +^14 +^3 +^17 +^14 +^33 +^22 +^ 19)^ /^ 10 = 160^ /^ 10 = 16. Y

_

después = (10^ +^2 +^11 +^6 +^3 +^10 +^3 +^15 +^8 +^ 12)^ /^ 10 = 80^ /^ 10 = 8. b. = [(9 !16) 2 + (8 !16) 2 + · · · + (22 !16) 2 + (19 !16) 2 ] / 9 = 650 / 9 = 72,222. = (72,222)1/2^ = 8,50.

= [(10! 8) 2 + (2! 8) 2 + (11! 8) 2 + · · · + (8! 8) 2 + (12! 8) 2 ] / 9 = 172 / 9 = 19,111. = (19,111)1/2^ = 4,37.

c. Y antes: 3, 8, 9, 14, 14, 17, 19, 21, 22, 33 (puntuaciones ordenadas). ! Q 1 = P 25 : i = k ( n +1)/100 = 25 (10 +1) /100 = 2,75. Hay que trabajar con las posiciones 2ª y 3ª, es decir, con las puntuaciones 8 y 9: P 25 = (1! 0,75) 8 + (0,75) 9 = 8,75. ! Q 2 = P 50 : i = k ( n +1)/100 = 50 (10 +1) /100 = 5,50. Hay que trabajar con las posiciones 5ª y 6ª, es decir, con las puntuaciones 14 y 17: P 50 = (1! 0,50)14 + (0,50)17 = 15,50. ! Q 3 = P 75 : i = k ( n +1)/100 = 75 (10 +1) /100 = 8,25. Hay que trabajar con las posiciones 8ª y 9ª, es decir, con las puntuaciones 21 y 22: P 75 = (1! 0,25) 21 + (0,25) 22 = 21,25.

4.5. a. = = = 0.

= (9!16) + (8!16) + (21!16) + · · · + (22!16) + (19!16) = 0.

b. = ; = = =.

= = 5 + 10 (16) = 165.

Soluciones 11

c. = ; (^) = = =.

= = 16! 8 = 8.

d. = , = 24. = = b (8) = ÷ b = 24 / 8 = 3.

e. = , = 24. = = a + 8 = 13 ÷ a = 13! 8 = 5.

4.6. a. Los puntos de corte deben colocarse en las calificaciones que correspondan al percentil 25, al percentil 25 + 40 = 65 y al percentil 65 + 25 = 90: P 25 : i = k ( n +1)/100 = 25 (30 +1) /100 = 7,75. Hay que trabajar con las posiciones 7ª y 8ª, es decir, con las puntuaciones 4,5 y 4,7: P 25 = (1! 0,75) 4,5 + (0,75) 4,7 = 4,65. P 65 : i = k ( n +1)/100 = 65 (30 +1) /100 = 20,15. Hay que trabajar con las posiciones 20ª y 21ª, es decir, con las puntuaciones 6,4 y 7,0: P 65 = (1! 0,15) 6,4 + (0,15) 7,0 = 6,49. P 90 : i = k ( n +1)/100 = 90 (30 +1) /100 = 27,90. Hay que trabajar con las posiciones 27ª y 28ª, es decir, con las puntuaciones 8,2 y 8,6: P 90 = (1! 0,90) 8,2 + (0,90) 8,6 = 8,56. b. Necesitamos conocer los percentiles 25 y 75. El percentil 25 vale 4,65 (lo hemos calculado en el apartado anterior). P 75 : i = k ( n +1) /100 = 75 (30 +1) / 100 = 23,25. Hay que trabajar con las posi- ciones 23ª y 24ª, es decir, con las puntuaciones 7,6 y 7,8: P 75 = (1! 0,25) 7,6 + (0,25) 7,8 = 7,65. Por tanto, el 50 % de los casos centrales se encuentra entre las calificaciones 4,65 y 7,65.

4.7. a. Media ponderada:

b. (^) = ÷ (^) = =.

4.8. a. Más de la mitad de los casos (el 60 %) obtiene puntuaciones mayores que la media. Por tanto, la media difiere de la mediana. Y esto implica que la distribución es asimétrica. b. Por encima de la media quedan más casos (60 %) que por encima de la mediana (50 %). Por tanto la media es menor que la mediana. Esto es lo que ocurre en una distribución asimétrica negativa, donde los valores que se alejan por la parte baja de la distribución hacen que la media se desplace hacia esa zona.

4.9. Y 1 + Y 2 = 2 (10) = 20 ÷ Y 1 + 3 Y 1 = 20 ÷ Y 1 = 20 / 4 = 5.

Y 2 = 3 Y 1 = 3 (5) = 15.

4.10. La desviación típica no se altera si a las puntuaciones originales se les suma una constante, pero queda multiplicada por la constante multiplicada. Por tanto, la desviación típica de las puntuaciones origi- nales vale 150 /10 = 15.

4.11. No. El valor de la varianza no sólo depende del grado de dispersión de una variable, sino de su métrica. Por tanto, si no se conoce la métrica de las variables no es posible afirmar cuál de ellas es más disper-

Soluciones 13

Capítulo 5

5.1. a. Z (13) = (13 !15) / 4,51 = !0,44 (la media y la desviación típica se han calculado ya en los ejercicios 4.1. a y 4.2. c del capítulo anterior). b. No. Eso sólo ocurrirá si la distribución es normal. Podemos comprobarlo calculando el percentil 33: i = k ( n + 1)/100 = 33 (20 + 1) /100 = 6,93. Hay que trabajar con las posiciones 6ª y 7ª, es decir, con las puntuaciones 14 y 15: P 33 = (1! 0,93) 14 + (0,93) 15 = 14,93 (distinta de 13). c. Simplemente multiplicarlas por 5. d. Llamando X a las puntuaciones transformadas: X = 5 + 2 ZY. e. No. Las puntuaciones típicas no se alteran cuando se efectúan transformaciones lineales. Por tanto, ZX = ZY. f. No. Como resultado de esa transformación se obtienen puntuaciones negativas y con decimales. Las puntuaciones negativas no se entienden bien como puntuaciones de una escala a no ser que el cero se tome como referente del centro de la distribución. Y los decimales pueden dar la falsa impresión de que se está midiendo con un elevado nivel de precisión (cosa que en realidad no se está haciendo).

5.2. a. Si se suman las puntuaciones directas no se consigue el objetivo porque de ese modo tendría más peso la prueba con mayor media (y si las varianzas fueran muy distintas, no habría manera de saber lo que significa esa puntuación final). Antes de sumar las dos puntuaciones hay que tipificarlas. Llamando Y (^) F a las puntuaciones finales, Y 1 a las puntuaciones de la primera prueba e Y 2 a las de la segunda, la forma de obtener puntuaciones finales en las que ambas pruebas tengan el mismo peso es la siguiente: Y (^) F =.

b. Y (^) F =.

c. Primer candidato: Z (^) (14) = (14! 15) / 4,51 = !0,22 ; Z (^) (9) = (9! 8) / 3,24 = 0,31. Y final = !0,22 + 0,31 = 0,09. Segundo candidato: Z (^) (17) = (17! 15) / 4,51 = 0,44 ; Z (^) (6) = (6! 8) / 3,24 = !0,62. Y final = 0,44! 0,62 = !0,18. Por tanto, si ambas pruebas puntúan igual (tienen el mismo peso), el primer sujeto tiene una pun- tuación final más alta (0,09) que el segundo (!0,18). d. Primer candidato: Y final = (2 / 3) (!0,22) + (1 / 3) (0,31) = !0,44. Segundo candidato: Y final = (2 / 3) (0,44) + (1 / 3) (!0,62) = !0,44. Por tanto, si la primera prueba puntúa el doble que la segunda (es decir, tiene el doble de peso que la segunda en la puntuación final), el segundo sujeto tiene una puntuación final más alta (0,09) que el primero (!0,04). e. Llamando Y (^) F a las puntuaciones finales calculadas en los apartados a o b y X a las puntuaciones transformadas: X = 100 + 20.

5.3. Sujeto 1: a partir de su puntuación directa Y = 11 se obtienen las demás. Sujeto 2: si y = 0, entonces Y = y + Y

_

Sujeto 3: si ZY = 0,5, entonces y = 4(0,5) = 2; Y = y + Y

_

Sujeto 4: si X = 45, entonces ZY = (45!50)/10 = !0,5; y = 4(!0,5) = !2; Y = y + Y

_

Sujeto 5: su puntuación diferencial vale 4 (pues la suma de las puntuaciones diferenciales vale cero). A partir de ahí se puede proceder como en el sujeto 2: si y = 4, entonces Y = y + Y

_

14 Análisis de datos (vol. I)

Sujetos Y y ZY X (^1 11) !4,0 !1,0 40 2 15 0 0 50 3 17 2 0,5 55 4 13 !2,0 !0,5 45 5 19 4 1 60

5.4. a. No necesariamente. El valor de una puntuación típica depende de la media y de la desviación típica de la variable. De hecho, el décimo sujeto, que puntúa más alto en el momento antes ( Y antes = 19) que en el momento después ( Y después = 12), tiene una puntuación típica más baja en el momento antes ( Z (^) (antes = 19) = (19 !16) / 8,5 = 0,35) que en el momento después ( Z (^) (antes = 12) = (12! 8) / 4,37 = 0,92). Y lo mismo ocurre con los sujetos 3, 5 y 6 (ver, más abajo, la tabla incluida en el aparta- do e ). b. Sí. En una misma variable, cuanto mayor es una puntuación típica, mayor es también el porcentaje de sujetos que acumula. c. No necesariamente. Los percentiles se basan únicamente en el orden (mayor, menor) de las puntuaciones. Las puntuaciones típicas tienen en cuenta, no sólo el orden, sino la distancia entre las puntuaciones. d. Sí. En una misma variable ( DY ), las puntuaciones directas y las puntuaciones típicas expresan cosas equivalentes: cuanto mayor es una puntuación directa, mayor es también su puntuación típica (esto puede comprobarse más abajo, en la tabla incluida en el siguiente apartado). e. No. La correspondencia que se da entre las puntuaciones típicas de dos variables distintas no es equivalente a la que se da entre sus correspondientes puntuaciones directas. Esto es debido a que cada variable tiene su propia media y su propia desviación típica (ver la respuesta del apartado a de este mismo ejercicio). En la siguiente tabla puede apreciarse que no existe correspondencia entre las variables DY y DZ.

Sujetos Y antes Y después DY ZD (^) Y Z antes Z después DZ 1 9 10! 1 !1,56 !0,82 0,46 !1, 2 8 2 6 !0,35 !0,94 !1,37 0, 3 21 11 10 0,35 0,59 0,69 !0, 4 14 6 8 0,00 !0,24 !0,46 0, (^5 3 3 0) !1,39 !1,53 !1,14 !0, 6 17 10 7 !0,17 0,12 0,46 !0, 7 14 3 11 0,52 !0,24 !1,14 0, 8 33 15 18 1,73 2,00 1,60 0, 9 22 8 14 1,04 0,71 0,00 0, 10 19 12 7 !0,17 0,35 0,91 !0,

f. No. Una vez tipificadas las puntuaciones directas, las medias valen cero y la diferencia entre ellas también. Y eso no refleja el cambio experimentado entre ambos momentos.

5.5. a. 0,1977; 0,7088; 0,8925! 0,3409 = 0,5516; 0,2389 + 0,1788 = 0,4177.

b. 0; !0,62; 1,11; 0,28 y 1,26.

16 Análisis de datos (vol. I)

2,41 SY + 1,53 SY = 541! 147 ÷ 3,94 SY = 394.

SY = 394 / 3,94 = 100.

Y

_

5.13. a. P ( P 25 < Y 1 < P 75 ) × P ( P 25 < Y 2 < P 75 ) = P (!0,67 < Z < 0,67)^2 = (0,50)^2 = 0,25.

b. P ( Z > 0) × P ( Z > 0) = (0,50) 2 = 0,25. c. P ( Z > 2) × P ( Z > 2) = F ( Z = !2) 2 = 0,0228^2 = 0,00052.

5.14. Si la distancia entre Z = !1 y Z = 1 vale 20 puntos, la distancia entre Z = 0 y Z = 1 vale 10 puntos. Por tanto, la desviación típica vale 10 puntos (debe tenerse en cuenta que una puntuación típica no es más que el número de desviaciones típicas que una puntuación directa se aleja de su media). Por otro lado, si el percentil 90 ( Z 0,90 = 1,28) vale 40, entonces 1,28 = (40! Y

_

) /10 ÷ Y

_

5.15. Tenemos una variable dicotómica (1 = «en contra», 0 = «a favor») de la que se han realizado n = 50 ensayos. Siendo n 1 = «número de personas que se manifiestan en contra de la eutanasia» y  1 = «pro- porción de personas en contra de la eutanasia», la variable n 1 sigue el modelo de probabilidad binomial. Como n > 20 (límite de la tabla de la distribución binomial), podemos utilizar la aproxima- ción de la binomial a la normal: = = = =.

5.16. Vamos a calcular la probabilidad de obtener con el tratamiento convencional el resultado obtenido con el experimental. Si esa probabilidad es muy baja, significará que el resultado obtenido con el trata- miento experimental es muy difícil de obtener con el convencional. Tenemos n = 40 ensayos de una variable dicotómica (1 = «recuperación», 0 = «no recuperación») con probabilidad de recuperación  1 = 0,40 en cada ensayo. Tenemos, por tanto, una variable ( n 1 = «nú- mero de recuperaciones») que se distribuye binomialmente. Pero, como n > 20, vamos a recurrir a la aproximación de la distribución binomial a la normal: = = = =.

Es muy poco probable (0,0019) que el resultado obtenido con el tratamiento experimental pueda ob- tenerse con el convencional. Por tanto, parece que el método experimental funciona mejor que el con- vencional.

5.17. a. Se han realizado n = 30 ensayos de una variable dicotómica (1 = «acierto», 0 = «error»). La varia- ble n 1 es la suma de 30 ensayos de Bernoulli independientes entre sí; por tanto, su distribución de probabilidad es la binomial, con E ( n 1 ) = n  1 = 30 (0,50) = 15 (ecuación [3.7]). V ( n 1 ) = n  1 (1! 1 ) = 30 (0,50) (0,50) = 7,5 (ecuación [3.7]). b. Puesto que el tamaño muestral es mayor que 20 (límite de la Tabla B), recurrimos a la aproxima- ción de la distribución binomial a la normal: = = = =.

5.18. Tenemos una variable dicotómica (1 = «acierto», 0 = «error») de la que se han realizado n = 30 ensa- yos, con n 1 = «número de aciertos». Se trata de calcular el valor del percentil 95 cuando los sujetos res- ponden al azar, es decir, cuando la probabilidad de acierto en cada ensayo vale  1 = 1/5 = 0,20:

Soluciones 17

Z 0,95 = = =.

El criterio establecido lleva a colocar el punto de corte para el aprobado en 9,6 aciertos. Es decir, será necesario acertar al menos 10 preguntas para aprobar.

Capítulo 6

6.1. a. = = = (0 + 2 + 4 + 6 + 8) / 5 = 4.

= = = 24! 42 = 8.

= = (0^2 + 22 + 42 + 62 + 82 ) / 5 = 120 / 5 = 24.

b. Número de muestras con reposición: N n^ = 5^2 = 25.

c. Muestras Y

_

f ( Y

_

(0,0) 0 1/ (0,2) (2,0) 1 2/ (0,4) (2,2) (4,0) 2 3/ (0,6) (2,4) (4,2) (6,0) 3 4/ (0,8) (2,6) (4,4) (6,2) (8,0) 4 5/ (2,8) (4,6) (6,4) (8,2) 5 4/ (2,4) (4,2) (6,6) 6 3/ (6,8) (8,6) 7 2/ (8,8) 8 1/

6.2. a. = = = 0 (1/ 25) + 1 (2 / 25) + · · · + 8 (1/ 25) = 4.

= = = 20! 42 = 4.

= = 0^2 (1/ 25) + 12 (2 / 25) + · · · + 82 (1/ 25) = 20.

b. = = 4 ; = = 8 / 2 = 4.

6.3. a. Distribución muestral del número o proporción de aciertos (= respuestas V ).

n (^) V Muestras f ( n (^) V )

0 FFF 1/ 1 VFF, FVF, FFV 3/ 2 VVF, VFV, FVV 3/ 3 VVV 1/ b. = = =.

Soluciones 19

Como desconocemos , utilizamos la distribución t con n! 1 = 24 grados de libertad. P ( Y

_

>$ 43) = P ( T >$ T (43) ) = 1! F ( T (43) ).

= ÷ = =.

P ( Y

_

>$ 43) = P ( T >$ 0,857) = 1! F (0,857) = 1! 0,80 = 0,20.

6.8. Distribución muestral de la media con  Y = 12,  Y desconocida y n = 45. Como desconocemos  Y , utilizamos la distribución t con n! 1 = 44 grados de libertad. P ( Y

_

>$ 14) = P ( T >$ T (14) ) = 1! F ( T (14) )

P ( Y

_

>$ 14) = P ( T >$ 2,582) < 0,01.

La tabla de la distribución t no incluye la probabilidad exacta asociada al valor 2,582, pero sabemos que es menor que 0,01.

6.9. Distribución muestral de la media con  Y = 50,  Y = 9 y n = 36. Buscamos la media concreta que corresponde al percentil 25 en la distribución muestral de la media con  Y^ = 50 y  Y^ = 9/6. Sabemos que en la distribución normal estandarizada N (0, 1), el percentil 25 vale !0,67, pues P ( Z <$ !0,67) = 0,2514 = 0,25. Por tanto,

= ÷^ = =.

Es decir, al percentil 25 le corresponde una media de 48,995. En consecuencia, ése es el promedio que debe obtener el grupo, como mínimo, para que el educador decida aplicar el programa.

6.10 a. La distribución normal es simétrica. Y sabemos que la puntuación 20 deja por debajo de sí un área idéntica a la que deja la puntuación 50 por encima. Esto significa que las puntuaciones 20 y 50 se encuentran a la misma distancia de la media. Por tanto,  Y = (20 + 50) / 2 = 35. Para calcular la varianza, sabemos que Z (50) = Z 0,75 = 0,67. Por tanto,

= ÷ = = ÷ = 22,39^2 = 501,31.

b. Distribución muestral de la media con  Y = 35,  Y = 22,39 y n = 25.

P ( Y

_

>$ 40) = P ( Z >$ ) = P ( Z >$ 1,12) = 1! 0,8686 = 0,1314.

6.11. Distribución muestral de la media con  Y = 1,  Y = 3 y n = 9. Sabemos que ZY_^ = Z 0,75 = 0,67. Por tanto,

= ÷ = = =.

6.12. Distribución muestral de la media con  Y = 40 y  Y = 10. Sabemos que Z (42) = Z 0,99 = 2,326. Por tanto,

= ÷ = ÷ = =.

6.13. Distribución muestral de la media con  Y = 10 y  Y = 2.

20 Análisis de datos (vol. I)

a. Sí. El valor Y

_

= 10 es igual a la media de la población y, por tanto, igual a la media de la distri- bución muestral de la media. En consecuencia, su tipificación valdrá cero independientemente del tamaño muestral. Y a iguales puntuaciones típicas, igual probabilidad asociada. b. No. El valor Y

_

= 20 es mayor que la media de la población. Por tanto, su distancia a la media, una vez tipificado, será tanto menor cuanto mayor sea el tamaño muestral (el cual está dividiendo al tipificar). En consecuencia, P ( Y

_

1 > 20) <^ P^ ( Y

_

6.14. Distribución normal con  Y = 30 y  Y = 10. Y distribución muestral de la media con n = 25. A la media le corresponde una puntuación Z = 0. Y a cada aumento o disminución de 10 puntos en Y (valor de la desviación típica) le corresponde un aumento o disminución de un punto en Z. Con esta información se pueden obtener las puntuaciones Z. También sabemos que la distribución normal es simétrica. Y esto permite obtener las probabilidades acumuladas F ( Z ). Por último, el error típico de la distribución muestral vale 10 / 5 = 2, lo cual significa que cada distancia de 10 puntos en Y se corresponde con una distancia de 2 puntos en Y

_

. Esto permite calcular los valores de Y

_

Y 0 10 20 30 40 50 60 Z (^)! 3! 2! 1 0 1 2 3 F ( Z ) 0,001 0,023 0,16 0,5 0,84 0,977 0, Y

24 26 28 30 32 34 36

6.15. Distribución muestral de la media.

Muestras Y

_

f ( Y

_

(0,0) 0,5 1/ (0,1) (1,0) 0,5 2/ (1,1) 1,0 1/

Por tanto, la probabilidad de que la media valga 1 es 1/4 = 0,25.

6.16. Distribución muestral del número o proporción de aciertos, con n = 50 y  A = 0,50 ( A = acierto). Como el tamaño muestral es grande (> 20), utilizamos la aproximación de la binomial a la normal:

E ( n (^) A ) = n  A = 50 (0,50) = 25. V ( n (^) A ) = n  A (1!  A ) = 50 (0,50) (1! 0,50) = 12,5.

P ( n (^) A > 30) = P ( Z >$ ) = P ( Z >$ 1,70) = 1! 0,9554 = 0,0446.

6.17. Población dicotómica (1, 0) y distribución muestral del número o proporción de aciertos, con n = 20 y  F = 0,65 ( F = «actitud favorable»).

a. E ( X ) = X (^) i f ( X (^) i ) = 0 (0,35) + 1(0,65) = 0,65. V ( X ) = E ( X^2 )! [ E ( X )]^2 = 0,65! 0,65^2 = 0,2275. E ( X^2 ) = X (^) i^2 f ( X (^) i ) = 0^2 (0,35) + 1^2 (0,65) = 0,65. b. E ( n (^) F ) = n  F = 20 (0,65) = 13.