










Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: Estadística, Profesor: José Berrendero, Carrera: Biología, Universidad: UAM
Tipo: Ejercicios
1 / 18
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!











ESTADÍSTICA Universidad Autónoma de Madrid 2º curso del Grado en Biología
A B C D
1
1 2 3 4 5
0
5
10
15
2
0 5 10 15 20 25
0
20
40
60
80
3
0 2 4 6
0
5
10
15
20
25
1
2
3
4
5
A
l
0
1
2
3
4
5
6
7
B
l
l
ll
0
5
10
15
20
25
C
(a) Determina razonadamente el diagrama de cajas al que corresponde cada histograma. (b) Para cada conjunto de datos, determina si la media y la mediana son aproximadamente iguales o no. En este último caso especifica cuál de las dos medidas es mayor.
coeficiente de correlación; varianza; media; cuartil 1; coeficiente de variación; covarianza; mediana; rango intercuartílico; rango; desviación típica. (a) Clasifica las cantidades de la lista anterior en alguno de los tres grupos siguientes:
Medidas de posición de la distribución de un conjunto de datos.
Medidas de dispersión de la distribución de un conjunto de datos.
Cantidades no utilizadas para medir ni la posición ni la dispersión. (b) De las medidas de la lista, enumera todas aquellas cuyo valor no dependa de las unidades en las que se expresen los datos (es decir, las medidas adimensionales).
Se ha registrado el número de clientes diarios de un restaurante de comida rápida durante 30 días, tanto en fin de semana como de lunes a viernes. Para los fines de semana (8 días) se obtuvo un número de clientes medio de 389 , 56, mientras que para los días entre semana (22 días) se obtuvo una media de 402 , 19. Calcula el número medio de clientes globales para los 30 días.
Determina razonadamente si las siguientes afirmaciones son verdaderas o falsas: (a) Las tres muestras corresponden a distribuciones bastante simétricas. (b) Una de las muestras parece proceder de una distribución normal de esperanza cero y varianza uno. (c) El primer cuartil de la muestra 2 es menor que la mediana de las otras dos muestras.
LONG PESO CONC Válidos Perdidos Media Error típ. de la media Mediana Desv. típ. Varianza Rango Mínimo Máximo 25 50 75
N
Percentiles
46,2000 1455,0000 1,
39,0000 873,0000 ,
33,3000 491,0000 ,
65,00 4511,00 3,
25,20 203,00 ,
39,80 4308,00 3,
72,542 766555,869 ,
8,51715 875,53176 ,
39,0000 873,0000 ,
,65132 66,95359 ,
39,9708 1147,9123 1,
0 0 0
171 171 171
Estadísticos
Error típ. de la estimación
R cuadrado R R cuadrado corregida 1 ,464a ,215 ,196 ,
ModeloModelo
Resumen del modelo
a. Variables predictoras: (Constante), edad
B Error típ. Beta t Sig.
Coeficientes Coeficientes no estandarizados tipificados
(Constante) edad
1 ,083 ,025 ,464 3,352 ,
3,996 ,245 16,338 ,
ModeloModelo
Coeficientesa
a. Variable dependiente: logpeptidoC
Página 1
Escribe la ecuación de la recta de mínimos cuadrados y predice el valor de la variable respuesta para un individuo de 2 años de edad. ¿Qué puedes decir sobre la fiabilidad de esta predicción?
25 25 25 25 25 0 0 0 0 0 8,3720 5,6480 43,4800 8,0360 3, 8,2000 4,0000 45,3000 1,9000 2, 2,68631 4,65789 5,87927 10,93114 1, 3,30 1,30 29,00 ,10 1, 12,40 18,40 52,70 34,40 7, 6,4500 2,1000 38,5500 ,2500 2, 8,2000 4,0000 45,3000 1,9000 2, 10,5000 8,0000 47,7500 16,1000 4,
Válidos Perdidos
N Media Mediana Desv. típ. Mínimo Máximo 25 50 75
Percentiles
Proteinas Grasas Carbo Azucar Fibra
Proteinas Grasas Carbo Azucar Fibra
60 50 40
30 20 10
0
6 5
6
Página 4
Determina razonadamente si las siguientes afirmaciones son verdaderas o falsas: (a) En los diagramas de cajas se observa que valores altos en carbohidratos están asociados con valores bajos en fibra, por lo que la correlación entre ambas variables es negativa. (b) Con la información disponible podemos afirmar que todas las variables tienen una distribución bastante simétrica. (c) Con la información disponible podemos concluir que el producto etiquetado como 5 es un dato atípico para todas las variables.
Además de estas 3 variables en la analítica de la sangre se consideró la variable
[Conjunto_de_datos1] C:\Documents and Settings\Javier\Escritorio\Datos\liv er\Copia de liver.sav
sgpt sgot gammagt drinks
drinks
gammagt
sgot
sgpt
FREQUENCIES VARIABLES=sgpt sgot gammagt drinks /NTILES= /PERCENTILES=90.0 95.0 99. /STATISTICS=STDDEV MINIMUM MAXIMUM MEAN MEDIAN /ORDER=ANALYSIS.
Página 1
sgpt sgot gammagt drinks Válidos Perdidos Media Mediana Desv. típ. Mínimo Máximo 25 50 75 90 95 99
N
Percentiles
131,9000 71,780 203,000 16,
67,7000 44,400 115,000 10,
52,0000 35,000 82,800 8,
34,0000 27,000 46,500 6,
26,0000 23,000 25,000 3,
19,0000 19,000 15,000 ,
155,00 82,0 297,0 20,
4,00 5,0 5,0 ,
19,51231 10,0645 39,2546 3,
26,0000 23,000 25,000 3,
30,4058 24,643 38,284 3,
0 0 0 0
345 345 345 345
Estadísticos
Resumen del procesamiento de los casos
Contesta razonadamente a las siguientes preguntas:
(a) Verdadero o falso: Aproximadamente 259 personas de entre las encuestadas beben el equivalente a 6 medias pintas o más de cerveza al día. (b) Verdadero o falso: La persona que más alcohol consume al día (lo correspondiente a 20 medias pintas de cerveza) tiene un nivel de gamma-glutamil transpeptidasa en sangre de 297,0. (c) ¿Qué variables tienen la mayor correlación entre ellas? (d) Verdadero o falso: Todas las variables consideradas son simétricas. (e) Verdadero o falso: Mediante una regresión lineal podemos predecir el valor de la variable drinks si conocemos el valor de la variable sgot.
fat
50,
40,
30,
20,
10,
,
216
Página 1
Abdomen
160,
140,
120,
100,
80,
60,
39
41 216
Página 1
B Error típ. Beta t Sig.
Coeficientes Coeficientes no estandarizados tipificados
(Constante) Abdomen
1 ,585 ,026 ,814 22,134 ,
-35,197 2,462 -14,294 ,
ModeloModelo
Coeficientes a
a. Variable dependiente: fat
f ( x ) =
500 e
− 500 x (^) si x > 0 0 en el resto
Calcular la mediana del tiempo de vida activa. ¿Cuál es su significado?
f ( x ) =
15000 e
− 15000 x (^) si x > 0 0 en el resto. (a) Calcular el tiempo medio transcurrido hasta el fallo. (b) Calcular el porcentaje de piezas que duran entre 10000 y 15000 horas.
(a) por lo menos una niña, (b) por lo menos un niño, (c) por lo menos dos niños y una niña.
(a) Hallar la probabilidad de que la compañía tenga que pagar a más de tres asegurados, por dicho accidente, en un año determinado. (b) ¿Cuál es el número medio de accidentes por año?
(a) exactamente tres, (b) más de 2.
Hallar el porcentaje de parcelas en las que el número de Kg. recogidos será inferior a 115.
(a) Calcula la probabilidad de que, al seleccionar aleatoriamente un faisán de la población, su nivel de mercurio supere 0,30 ppm. (b) Si se seleccionan aleatoria e independientemente 100 faisanes, clacula la probabilidad de que al menos 45 de ellos tengan un nivel de mercurio superior a 0,25 ppm. (c) Si se seleccionan aleatoria e independientemente cuatro faisanes, calcula la probabilidad de que su nivel medio de mercurio sea superior a 0,30 ppm.
(a) Si p = 0 , 30, hallar la probabilidad de que en 6 ejemplares capturados haya al menos 2 de los que le interesan. (b) Si p = 0 , 03, calcular la probabilidad de que en 200 haya exactamente 3 de los que le interesan. (c) Si p = 0 , 40, calcular la probabilidad de que en 200 haya entre 75 y 110 de los que le interesan.
(a) Calcula la probabilidad de que un individuo seleccionado al azar en esta población sea hipertenso. (b) Si se seleccionan aleatoriamente 100 individuos de la población, calcula la probabilidad aproximada de que entre ellos haya más de 40 hipertensos.
Valores 0 1 2 Frecuencias 25 20 15
(a) Estima el valor de θ a partir de las observaciones disponibles usando el método de los momentos. (b) Estima el valor de θ a partir de las observaciones disponibles usando el método de máxima verosimili- tud.
Este análisis de aliento se aplica a un grupo aleatorio de 50 personas de una población de riesgo, obteniéndose 10 resultados positivos y 40 negativos. (a) Estima q =“Proporción de resultados positivos”, razonando tu respuesta. (b) Halla la relación entre p =“Proporción de personas con cáncer de estómago” en esa población de riesgo y q =“Proporción de resultados positivos”, y utilízala para estimar p.
(a) Estudia la relación entre la probabilidad p de que un caballo esté enfermo y la probabilidad q de que la prueba resulte positiva. (b) Si se realizó la prueba a 500 caballos y resultó positiva en 95 casos, ¿cuál es el estimador de máxima verosimilitud de q? A partir del resultado del apartado (a), calcula una estimación de p.
A partir de toda esta información, y suponiendo que los indecisos terminarán manteniendo un patrón de comportamiento similar al de las últimas elecciones, se puede calcular la estimación de voto.
Individuo 1 2 3 4 5 6 7 8 9 Después del producto 79 48 52 15 61 107 77 54 5 Después del placebo 78 54 142 25 101 99 94 107 64
(a) Hallar un intervalo de confianza al 95 % para la diferencia de las sensaciones medias de hambre con el producto y con placebo (asumir Normalidad). (b) Lo mismo, pero trabajando (equivocadamente) con las muestras como si fueran independientes (asumir Normalidad e igualdad de varianzas).
© H 0 : μN ≤ μG. © H 0 : μG ≤ μN.
© H 0 : μN = μG. © Ninguna de las restantes.
© Tendremos que calcular nuevamente el p -valor para rechazar o aceptar H 0 con α = 0 , 01. © Siempre rechazamos H 0 con el nivel de significación α = 0 , 01. © Nunca rechazamos H 0 con el nivel de significación α = 0 , 01. © La decisión dependerá del valor del p -valor que nos dio el ordenador inicialmente.
La concentración media de dióxido de carbono en el aire a cierta altura es habitualmente de unas 355 p.p.m. (partes por millón). Se sospecha que esta concentración es mayor en la capa de aire más próxima a la superficie. Para contrastar esta hipótesis se analizó el aire en 20 puntos elegidos aleatoriamente a una misma altura cerca del suelo. Resultó una media muestral de 580 p.p.m. y una cuasi-desviación típica muestral de
Suponiendo normalidad para las mediciones, ¿proporcionan estos datos suficiente evidencia estadística, al nivel 0.01, a favor de la hipótesis de que la concentración es mayor cerca del suelo? Indicar razonadamente si el p -valor es mayor o menor que 0 , 01.
Un fabricante de materiales para insonorización produce dos tipos A y B. De los 1000 primeros lotes vendidos, 560 fueron del tipo A. ¿Proporcionan estos datos suficiente evidencia estadística (al nivel de significación 0.01) para concluir que los consumidores prefieren mayoritariamente el tipo A?
Se están estudiando dos colonias de ñúes azules, una que vive en un parque de Tanzania, y otra que vive en un parque de Kenia. Parece que la altura en Tanzania es mayor que la altura en Kenia. Se estudia una muestra de 10 ñúes en Tanzania, obteniéndose una altura media muestral de 130 cm con una cuasi-varianza muestral de 80, y otra muestra de 15 ñúes en Kenia, obteniéndose una altura media muestral de 124 cm con una cuasi-varianza muestral de 75. Asumiendo Normalidad para las alturas en las dos colonias, se pide:
(a) Con un nivel de significación de 0 , 10, ¿podemos aceptar igualdad de varianzas de las alturas en las dos colonias? (b) ¿Disponemos de suficiente evidencia muestral para asegurar que la altura media en Tanzania es mayor que en Kenia (al nivel de significación 0 , 10)?
Estadísticos de grupo
RIO N Media
Desviación típ.
Error típ. de la media CONC ,00 (^73) 1,0781 ,64861 , 1,00 (^98) 1,2764 ,82915 ,
Prueba de muestras independientes
-1,694 169 ,092 -,19835 ,11712 -,42954 , -1,755 168,570 ,081 -,19835 ,11304 -,42150 ,
Se han asumido varianzas iguales No se han asumido varianzas iguales
CONC
t gl Sig. (bilateral)
Diferencia de medias
Error típ. de la diferencia Inferior Superior
95% Intervalo de confianza para la diferencia
Prueba T para la igualdad de medias
(a) ¿Existe evidencia estadística para afirmar al nivel α = 0 , 05 que el nivel medio de concentración en el río Wacamaw (1) es superior al nivel medio en el río Lumber (0)? (b) Indica las suposiciones previas necesarias para garantizar la validez del procedimiento empleado.
Prueba T
Estadísticos de grupo
20 366,3000 50,8052 11, 20 402,9500 42,7286 9,
GRUPO comun trans
PESO
N Media
Desviación típ.
Error típ. de la media
Prueba de muestras independientes
,638 , Se han asumido varianzas iguales No se han asumido varianzas iguales
PESO
F Sig.
Prueba de Levene para la igualdad de varianzas
Página 1
Prueba T
Estadísticos de grupo
20 366,3000 50,8052 11, 20 402,9500 42,7286 9,
GRUPO comun trans
PESO
N Media
Desviación típ.
Error típ. de la media
Prueba de muestras independientes
PESO Se han asumidovarianzas iguales -2,469 38 ,018 -36,
t gl Sig. (bilateral)
Diferencia de medias
Error típ. de la diferencia
Prueba T para la igualdad de medias
Página 1
(a) La opción de SPSS utilizada para producir esta salida ha sido © Prueba T para una muestra © Prueba T para muestras independientes © Prueba T para muestras relacionadas (b) Se desea encontrar evidencia empírica de que la ganancia media de peso de los pollos con dieta transgénica es superior a la de los pollos con dieta común. El p-valor del contraste correspondiente es © 0 , 018; © 0 , 036; © 0 , 009. (c) La hipótesis nula de que la dieta que siguen los pollos no influye en su ganancia media de peso se rechaza al nivel de significación α si © α > 0 , 018; © α/ 2 > 0 , 018; © α < 0 , 018. (d) En la salida de SPSS se ha omitido el error típico de la diferencia de medias. Este error típico © Es aproximadamente igual a 14 , 8440. © No se puede calcular con los datos disponibles. © Es aproximadamente igual a 20 , 9148.
Frecuencias 43 49 56 45 66 41
Al nivel de significación 0,05, ¿se puede aceptar que el dado es regular?
Al nivel de significación 0.05, ¿se puede aceptar que la densidad de la tierra se ajusta a una distribución Normal? Observación: Utilizar los intervalos A 1 =“Menor o igual que 5,30”, A 2 =(5,30; 5,45] , A 3 =(5,45; 5,60] , A 4 =“Mayor que 5,60”, y el hecho de que, a partir de los datos, se obtiene que ˆ μ = 5 , 45 y que ˆ σ = 0 , 22.
¿Se puede aceptar, al nivel α = 0 , 01, que el programa funciona correctamente?
Cifra final 0 1 2 3 4 5 6 7 8 9 Frecuencia 20 8 13 20 27 30 26 20 20 16
¿Se puede aceptar, al nivel de significación del 1 %, que todas las terminaciones son igualmente probables?
¿Se ajustan los datos a dicho modelo genético, al nivel de significación 0,05?