Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Problemas Estadística, Ejercicios de Estadística

Asignatura: Estadística, Profesor: José Berrendero, Carrera: Biología, Universidad: UAM

Tipo: Ejercicios

2016/2017

Subido el 13/09/2017

luis_gegundez
luis_gegundez 🇪🇸

4.1

(68)

45 documentos

1 / 18

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
ESTADÍSTICA Universidad Autónoma de Madrid
curso del Grado en Biología
Problemas y cuestiones de estadística descriptiva
1
. Si la muestra está formada por los puntos que se ven en la figura, ¿en cuál de las posiciones
A,B,C, D
está
la media?
ABCD
2. La siguiente figura muestra histogramas y diagramas de cajas para tres conjuntos de datos diferentes:
1
12345
0 5 10 15
2
0 5 10 15 20 25
0 20 40 60 80
3
0 2 4 6
0 5 10 15 20 25
12345
A
01234567
B
0 5 10 15 20 25
C
(a) Determina razonadamente el diagrama de cajas al que corresponde cada histograma.
(b)
Para cada conjunto de datos, determina si la media y la mediana son aproximadamente iguales o no.
En este último caso especifica cuál de las dos medidas es mayor.
3. Consideramos la siguiente lista de medidas utilizadas en estadística:
coeficiente de correlación; varianza; media; cuartil 1; coeficiente de variación;
covarianza; mediana; rango intercuartílico; rango; desviación típica.
(a) Clasifica las cantidades de la lista anterior en alguno de los tres grupos siguientes:
1. Medidas de posición de la distribución de un conjunto de datos.
2. Medidas de dispersión de la distribución de un conjunto de datos.
3. Cantidades no utilizadas para medir ni la posición ni la dispersión.
(b)
De las medidas de la lista, enumera todas aquellas cuyo valor no dependa de las unidades en las que se
expresen los datos (es decir, las medidas adimensionales).
4
. Se ha registrado el número de clientes diarios de un restaurante de comida rápida durante 30 días, tanto
en fin de semana como de lunes a viernes. Para los fines de semana (8 días) se obtuvo un número de clientes
medio de 389
,
56, mientras que para los días entre semana (22 días) se obtuvo una media de 402
,
19. Calcula
el número medio de clientes globales para los 30 días.
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12

Vista previa parcial del texto

¡Descarga Problemas Estadística y más Ejercicios en PDF de Estadística solo en Docsity!

ESTADÍSTICA Universidad Autónoma de Madrid 2º curso del Grado en Biología

Problemas y cuestiones de estadística descriptiva

  1. Si la muestra está formada por los puntos que se ven en la figura, ¿en cuál de las posiciones A, B, C, D está la media?

A B C D

  1. La siguiente figura muestra histogramas y diagramas de cajas para tres conjuntos de datos diferentes:

1

1 2 3 4 5

0

5

10

15

2

0 5 10 15 20 25

0

20

40

60

80

3

0 2 4 6

0

5

10

15

20

25

1

2

3

4

5

A

l

0

1

2

3

4

5

6

7

B

l

l

ll

0

5

10

15

20

25

C

(a) Determina razonadamente el diagrama de cajas al que corresponde cada histograma. (b) Para cada conjunto de datos, determina si la media y la mediana son aproximadamente iguales o no. En este último caso especifica cuál de las dos medidas es mayor.

  1. Consideramos la siguiente lista de medidas utilizadas en estadística:

coeficiente de correlación; varianza; media; cuartil 1; coeficiente de variación; covarianza; mediana; rango intercuartílico; rango; desviación típica. (a) Clasifica las cantidades de la lista anterior en alguno de los tres grupos siguientes:

  1. Medidas de posición de la distribución de un conjunto de datos.

  2. Medidas de dispersión de la distribución de un conjunto de datos.

  3. Cantidades no utilizadas para medir ni la posición ni la dispersión. (b) De las medidas de la lista, enumera todas aquellas cuyo valor no dependa de las unidades en las que se expresen los datos (es decir, las medidas adimensionales).

  4. Se ha registrado el número de clientes diarios de un restaurante de comida rápida durante 30 días, tanto en fin de semana como de lunes a viernes. Para los fines de semana (8 días) se obtuvo un número de clientes medio de 389 , 56, mientras que para los días entre semana (22 días) se obtuvo una media de 402 , 19. Calcula el número medio de clientes globales para los 30 días.

  1. La siguiente figura muestra los diagramas de cajas correspondientes a tres muestras:

Determina razonadamente si las siguientes afirmaciones son verdaderas o falsas: (a) Las tres muestras corresponden a distribuciones bastante simétricas. (b) Una de las muestras parece proceder de una distribución normal de esperanza cero y varianza uno. (c) El primer cuartil de la muestra 2 es menor que la mediana de las otras dos muestras.

  1. Determina razonadamente si las siguientes afirmaciones son verdaderas o falsas: (a) Como son dos medidas de posición, la media y la mediana del mismo conjunto de datos siempre toman valores parecidos. (b) Si se transforman de gramos a kilos las unidades de medida de un conjunto de datos sobre pesos, la correspondiente varianza no cambia. (c) Si se añade un punto de regalo a todas las notas de los alumnos de una clase, la desviación típica de la notas de la clase no cambia.
  2. El agua de los ríos contiene pequeñas concentraciones de mercurio que se pueden ir acumulando en los tejidos de los peces. Se ha realizado un estudio en los ríos Wacamaw y Lumber en Carolina del Norte (EE.UU.), analizando la cantidad de mercurio que contenían 171 ejemplares capturados de una cierta especie de peces. En cada ejemplar capturado se han medido las siguientes variables: LONG ≡ Longitud (en cm) del pez; PESO ≡ Peso (en g) del pez; CONC ≡ Concentración (en ppm) de mercurio. Los resultados de un primer análisis descriptivo son los siguientes:

LONG PESO CONC Válidos Perdidos Media Error típ. de la media Mediana Desv. típ. Varianza Rango Mínimo Máximo 25 50 75

N

Percentiles

46,2000 1455,0000 1,

39,0000 873,0000 ,

33,3000 491,0000 ,

65,00 4511,00 3,

25,20 203,00 ,

39,80 4308,00 3,

72,542 766555,869 ,

8,51715 875,53176 ,

39,0000 873,0000 ,

,65132 66,95359 ,

39,9708 1147,9123 1,

0 0 0

171 171 171

Estadísticos

Error típ. de la estimación

R cuadrado R R cuadrado corregida 1 ,464a ,215 ,196 ,

ModeloModelo

Resumen del modelo

a. Variables predictoras: (Constante), edad

B Error típ. Beta t Sig.

Coeficientes Coeficientes no estandarizados tipificados

(Constante) edad

1 ,083 ,025 ,464 3,352 ,

3,996 ,245 16,338 ,

ModeloModelo

Coeficientesa

a. Variable dependiente: logpeptidoC

Página 1

Escribe la ecuación de la recta de mínimos cuadrados y predice el valor de la variable respuesta para un individuo de 2 años de edad. ¿Qué puedes decir sobre la fiabilidad de esta predicción?

  1. En un estudio sobre las propiedades nutricionales de los alimentos de una panadería se ha analizado la información contenida en las etiquetas de 25 productos. En primer lugar se ha llevado a cabo un análisis descriptivo básico de las siguientes variables relativas a 100 g de cada producto: Proteinas (proteínas en g), Grasas (grasas en g), Carbo (carbohidratos en g), Azucar (azúcares en g) y Fibra (fibra en g). Los resultados fueron los siguientes: Estadísticos

25 25 25 25 25 0 0 0 0 0 8,3720 5,6480 43,4800 8,0360 3, 8,2000 4,0000 45,3000 1,9000 2, 2,68631 4,65789 5,87927 10,93114 1, 3,30 1,30 29,00 ,10 1, 12,40 18,40 52,70 34,40 7, 6,4500 2,1000 38,5500 ,2500 2, 8,2000 4,0000 45,3000 1,9000 2, 10,5000 8,0000 47,7500 16,1000 4,

Válidos Perdidos

N Media Mediana Desv. típ. Mínimo Máximo 25 50 75

Percentiles

Proteinas Grasas Carbo Azucar Fibra

Proteinas Grasas Carbo Azucar Fibra

60 50 40

30 20 10

0

6 5

6

Página 4

Determina razonadamente si las siguientes afirmaciones son verdaderas o falsas: (a) En los diagramas de cajas se observa que valores altos en carbohidratos están asociados con valores bajos en fibra, por lo que la correlación entre ambas variables es negativa. (b) Con la información disponible podemos afirmar que todas las variables tienen una distribución bastante simétrica. (c) Con la información disponible podemos concluir que el producto etiquetado como 5 es un dato atípico para todas las variables.

  1. Se realizó un estudio sobre afecciones hepáticas que pueden aparecer a causa de la ingesta excesiva de alcohol midiendo 3 variables de interés en la analítica de un total de 345 varones.
  • x 1 = sgpt (alanina aminotransferasa).
  • x 2 = sgot (aspartato aminotransferasa).
    • x 3 = gammagt (gamma-glutamil transpeptidasa).

Además de estas 3 variables en la analítica de la sangre se consideró la variable

  • x 4 = drinks (número de medias pintas de cerveza o equivalentes en bebidas alcohólicas consumidas al día).

Gráfico

[Conjunto_de_datos1] C:\Documents and Settings\Javier\Escritorio\Datos\liv er\Copia de liver.sav

sgpt sgot gammagt drinks

drinks

gammagt

sgot

sgpt

FREQUENCIES VARIABLES=sgpt sgot gammagt drinks /NTILES= /PERCENTILES=90.0 95.0 99. /STATISTICS=STDDEV MINIMUM MAXIMUM MEAN MEDIAN /ORDER=ANALYSIS.

Frecuencias

Página 1

[Conjunto_de_datos1] C:\Documents and Settings\Javier\Escritorio\Datos\liv

er\Copia de liver.sav

sgpt sgot gammagt drinks Válidos Perdidos Media Mediana Desv. típ. Mínimo Máximo 25 50 75 90 95 99

N

Percentiles

131,9000 71,780 203,000 16,

67,7000 44,400 115,000 10,

52,0000 35,000 82,800 8,

34,0000 27,000 46,500 6,

26,0000 23,000 25,000 3,

19,0000 19,000 15,000 ,

155,00 82,0 297,0 20,

4,00 5,0 5,0 ,

19,51231 10,0645 39,2546 3,

26,0000 23,000 25,000 3,

30,4058 24,643 38,284 3,

0 0 0 0

345 345 345 345

Estadísticos

EXAMINE VARIABLES=sgpt sgot gammagt drinks

/COMPARE VARIABLE

/PLOT=BOXPLOT

/STATISTICS=NONE

/NOTOTAL

/MISSING=LISTWISE.

Explorar

[Conjunto_de_datos1] C:\Documents and Settings\Javier\Escritorio\Datos\liv

er\Copia de liver.sav

Resumen del procesamiento de los casos

Contesta razonadamente a las siguientes preguntas:

(a) Verdadero o falso: Aproximadamente 259 personas de entre las encuestadas beben el equivalente a 6 medias pintas o más de cerveza al día. (b) Verdadero o falso: La persona que más alcohol consume al día (lo correspondiente a 20 medias pintas de cerveza) tiene un nivel de gamma-glutamil transpeptidasa en sangre de 297,0. (c) ¿Qué variables tienen la mayor correlación entre ellas? (d) Verdadero o falso: Todas las variables consideradas son simétricas. (e) Verdadero o falso: Mediante una regresión lineal podemos predecir el valor de la variable drinks si conocemos el valor de la variable sgot.

fat

50,

40,

30,

20,

10,

,

216

Página 1

Abdomen

160,

140,

120,

100,

80,

60,

39

41 216

Página 1

B Error típ. Beta t Sig.

Coeficientes Coeficientes no estandarizados tipificados

(Constante) Abdomen

1 ,585 ,026 ,814 22,134 ,

-35,197 2,462 -14,294 ,

ModeloModelo

Coeficientes a

a. Variable dependiente: fat

Problemas y cuestiones de modelos de probabilidad

  1. El “tiempo de vida activa (en días)” de un plaguicida, X , viene representado por la función de densidad:

f ( x ) =

500 e

− 500 x (^) si x > 0 0 en el resto

Calcular la mediana del tiempo de vida activa. ¿Cuál es su significado?

  1. La variable aleatoria X =“Tiempo transcurrido (en horas) hasta el fallo de una pieza” tiene función de densidad

f ( x ) =

15000 e

− 15000 x (^) si x > 0 0 en el resto. (a) Calcular el tiempo medio transcurrido hasta el fallo. (b) Calcular el porcentaje de piezas que duran entre 10000 y 15000 horas.

  1. Suponiendo que la probabilidad de que un niño que nace sea varón es 0,50, hallar la probabilidad de que una familia de 6 hijos tenga

(a) por lo menos una niña, (b) por lo menos un niño, (c) por lo menos dos niños y una niña.

  1. Una compañía de seguros con 10000 asegurados halla que el 0 , 005 % de la población fallece cada año de un cierto tipo de accidente.

(a) Hallar la probabilidad de que la compañía tenga que pagar a más de tres asegurados, por dicho accidente, en un año determinado. (b) ¿Cuál es el número medio de accidentes por año?

  1. La probabilidad de que un individuo tenga una reacción alérgica al inyectarle un suero es 0,001. Hallar la probabilidad de que en 2000 individuos tengan reacción alérgica

(a) exactamente tres, (b) más de 2.

  1. Se considera que la variable aleatoria “Kg. de algodón recogidos por parcela” sigue una distribución N ( μ = 100; σ = 10).

Hallar el porcentaje de parcelas en las que el número de Kg. recogidos será inferior a 115.

  1. En 1969 se descubrió que los faisanes de Montana (Estados Unidos) padecían una apreciable contamina- ción por mercurio debida a que habían comido semillas tratadas para su crecimiento con metilo de mercurio. Se sabe que el nivel de mercurio (medido en ppm) de un faisán seleccionado aleatoriamente en la población es una variable aleatoria con distribución N ( μ = 0 , 25; σ = 0 , 10).

(a) Calcula la probabilidad de que, al seleccionar aleatoriamente un faisán de la población, su nivel de mercurio supere 0,30 ppm. (b) Si se seleccionan aleatoria e independientemente 100 faisanes, clacula la probabilidad de que al menos 45 de ellos tengan un nivel de mercurio superior a 0,25 ppm. (c) Si se seleccionan aleatoria e independientemente cuatro faisanes, calcula la probabilidad de que su nivel medio de mercurio sea superior a 0,30 ppm.

  1. Un zoólogo estudia una cierta especie de ratones de campo. Para ello captura ejemplares de una población grande en la que la proporción de dicha especie es p.

(a) Si p = 0 , 30, hallar la probabilidad de que en 6 ejemplares capturados haya al menos 2 de los que le interesan. (b) Si p = 0 , 03, calcular la probabilidad de que en 200 haya exactamente 3 de los que le interesan. (c) Si p = 0 , 40, calcular la probabilidad de que en 200 haya entre 75 y 110 de los que le interesan.

  1. Se sabe que el nivel de tensión sanguínea diastólica (en mmHg) en una población es una variable con distribución normal de media μ = 87 y desviación típica σ = 7 , 5. Un individuo se clasifica como hipertenso si su presión es mayor de 90 mmHg.

(a) Calcula la probabilidad de que un individuo seleccionado al azar en esta población sea hipertenso. (b) Si se seleccionan aleatoriamente 100 individuos de la población, calcula la probabilidad aproximada de que entre ellos haya más de 40 hipertensos.

Problemas y cuestiones de estimación puntual

  1. Dada una muestra aleatoria de tamaño n de una variable X , calcular el estimador de máxima verosimili- tud y el del método de los momentos, en los siguientes casos: (a) X ∼ Bernoulli de parámetro p. (b) X ∼ Poisson ( λ ). (c) X ∼ Exponencial ( λ ); es decir, ( x ) = λeλx , para x > 0 ( λ > 0). (d) XN ( μ, σ ).
  2. La proporción de genes dañados en un tejido celular tras una sesión de radiación es una variable aleatoria continua X con función de densidad f ( x ) = θxθ −^1 , para valores de x ∈ (0 , 1), siendo θ > 0 un parámetro desconocido que depende del tipo de tejido. (a) Dada una muestra aleatoria ( X 1 ,... , Xn ) de X , calcúlese el estimador de θ por el método de los momentos y por el método de máxima verosimilitud. (b) Tras analizar una muestra de 3 tejidos celulares, se obtuvieron los valores 0 , 10, 0 , 15 y 0 , 25. ¿Cuáles son la estimaciones concretas de θ con estos datos con los dos métodos?
  3. En una gran piscifactoría hay una proporción desconocida, p , de cierto tipo de truchas. Para obtener información sobre esa proporción desconocida, vamos a ir sacando peces al azar hasta obtener una trucha de ese tipo, en tres ubicaciones diferentes: En la primera ubicación se obtiene la primera trucha de ese tipo en la décima extracción. En la segunda ubicación se obtiene la primera trucha de ese tipo en la decimoquinta extracción. En la tercera ubicación se obtiene la primera trucha de ese tipo en la decimoctava extracción. Escribir la función de verosimilitud y obtener la estimación de máxima verosimilitud de p.
  4. Un modelo genético para las moscas de cierta variedad nos dice que pueden ser de tres tipos: homo- cigóticas AA (con probabilidad p^2 ), homocigóticas BB (con probabilidad q^2 ) y heterocigóticas AB (con probabilidad 2 pq ), donde naturalmente p + q = 1. En una muestra aleatoria de 100 moscas obtenemos 10 de tipo AA, 50 de tipo BB, y 40 de tipo AB. Hallar la estimación de máxima verosimilitud de p con los datos obtenidos.
  5. Una variable relacionada con el número de mutaciones en una secuencia de ADN puede tomar los valores 0, 1 ó 2 con probabilidades (1 + 2 θ ) / 3, (1 − θ ) / 3 y (1 − θ ) / 3 respectivamente, donde θ es un parámetro desconocido. Se han obtenido 60 observaciones independientes de esta variable resultando la siguiente tabla de frecuencias absolutas:

Valores 0 1 2 Frecuencias 25 20 15

(a) Estima el valor de θ a partir de las observaciones disponibles usando el método de los momentos. (b) Estima el valor de θ a partir de las observaciones disponibles usando el método de máxima verosimili- tud.

  1. En el artículo “A nanomaterial-based breath test for distinguishing gastric cancer from benign gastric conditions” publicado en British Journal of Cancer en 2013 se describe un análisis de aliento sencillo que se puede usar para el diagnóstico precoz de cáncer de estómago, a partir de la medición de cinco sustancias: 2-propenonitrilo, 2-butoxietanol, furfural, 6-metil-5-hepten-2-ona e isopreno. La sensibilidad de la prueba (probabilidad de dar positivo teniendo cáncer) es del 89 %, y su especificidad (probabilidad de dar negativo estando sano) es del 94 %.

Este análisis de aliento se aplica a un grupo aleatorio de 50 personas de una población de riesgo, obteniéndose 10 resultados positivos y 40 negativos. (a) Estima q =“Proporción de resultados positivos”, razonando tu respuesta. (b) Halla la relación entre p =“Proporción de personas con cáncer de estómago” en esa población de riesgo y q =“Proporción de resultados positivos”, y utilízala para estimar p.

  1. Para estudiar la proporción p de caballos afectados por la peste equina se les va a someter a una prueba. Se sabe que la prueba resulta positiva si el animal está enfermo. Además, si el animal está sano, hay una probabilidad 0.04 de que la prueba resulte positiva.

(a) Estudia la relación entre la probabilidad p de que un caballo esté enfermo y la probabilidad q de que la prueba resulte positiva. (b) Si se realizó la prueba a 500 caballos y resultó positiva en 95 casos, ¿cuál es el estimador de máxima verosimilitud de q? A partir del resultado del apartado (a), calcula una estimación de p.

  1. Unos laboratorios desarrollan una prueba sencilla para detectar la gripe del pollo. La prueba tiene una fiabilidad muy aceptable: proporciona un 4 % de falsos positivos (prueba positiva cuando el pollo está sano) y un 0 % de falsos negativos (prueba negativa cuando el pollo está enfermo). En una granja avícola, se detecta un brote de gripe del pollo. Mediante la utilización de la prueba sencilla que se ha descrito anteriormente, se quiere estimar la incidencia de la enfermedad en esa granja. Para esto, se seleccionan al azar 100 pollos, se les efectúa la prueba y se obtienen 20 casos positivos. Estimar la proporción p de pollos enfermos en la granja, explicando todo el proceso seguido.
  2. La diferencia entre intención de voto directo y estimación de voto. En cierto país con dos partidos políticos, A y B , se lleva a cabo un sondeo sobre opinión electoral (lo podemos llamar barómetro) en el que se pregunta: Suponiendo que mañana se celebrasen elecciones, ¿a qué partido votaría? Los resultados son: 23 % votaría A , 27 % votaría B, y 50 % de indecisos. Por tanto, en la intención de voto directo, saldría triunfador el partido B. Pero hay un 50 % de indecisos, de los cuales se puede intentar predecir el comportamiento, ya que en ese mismo sondeo, se hacen otras preguntas mediante las cuales se puede hacer un perfil (conservador o progresista) de las personas, y además, se les pregunta qué votaron en las últimas elecciones. Supongamos que los resultados de ese sondeo son los siguientes: (i) Del 50 % de indecisos, un 30 % tiene un perfil progresista. De estos, un 10 % votaron A en las últimas elecciones, y un 60 % votaron B (el resto no votaron o votaron en blanco). (ii) Del 50 % de indecisos, un 70 % tiene un perfil conservador. De estos, un 60 % votaron A en las últimas elecciones, y un 10 % votaron B (el resto no votaron o votaron en blanco).

A partir de toda esta información, y suponiendo que los indecisos terminarán manteniendo un patrón de comportamiento similar al de las últimas elecciones, se puede calcular la estimación de voto.

  1. Se quiere estimar la proporción de manatíes en el Caribe que han sido heridos por hélices de barcos. ¿A cuántos manatíes tendremos que examinar para asegurar que la estimación tiene un error máximo del 10 % con un nivel de confianza del 95 %?
  2. Se admite que el número de microorganismos en una muestra de 1 mm cúbico de agua de un río sigue una distribución de Poisson de parámetro λ. En 40 muestras se han detectado, en total, 833 microorganismos. Calcula un estimador puntual y un intervalo de confianza al 90 % para λ.
  3. Nueve personas participan en el estudio de un producto que intenta reducir el apetito (clorofenilpi- peracina). Cada uno de ello recibe este producto durante 2 semanas y placebo durante otras 2 semanas (naturalmente, el orden de los períodos de 2 semanas es aleatorio y ellos no lo conocen). Al final de cada período, se les pide que expresen su sensación de hambre (en una escala del 0 al 150). Los resultados son los siguientes:

Individuo 1 2 3 4 5 6 7 8 9 Después del producto 79 48 52 15 61 107 77 54 5 Después del placebo 78 54 142 25 101 99 94 107 64

(a) Hallar un intervalo de confianza al 95 % para la diferencia de las sensaciones medias de hambre con el producto y con placebo (asumir Normalidad). (b) Lo mismo, pero trabajando (equivocadamente) con las muestras como si fueran independientes (asumir Normalidad e igualdad de varianzas).

Problemas y cuestiones de contrastes de hipótesis

  1. Una farmacéutica desea sacar al mercado un antiinflamatorio con un nuevo tipo de ibuprofeno que reduzca el tiempo que tarda en hacer efecto (tiempo de efecto) respecto al de los medicamentos genéricos. Llamamos μN y μG al tiempo medio de efecto del nuevo medicamento y del genérico, respectivamente. Para poder sacar al mercado este nuevo medicamento tendremos que contrastar:

© H 0 : μNμG. © H 0 : μGμN.

© H 0 : μN = μG. © Ninguna de las restantes.

  1. El ordenador nos proporciona un p -valor para un contraste con el que rechazamos la hipótesis nula, H 0 , con significación α = 0 , 05. Ahora queremos decidir si rechazar o aceptar H 0 con α = 0 , 01.

© Tendremos que calcular nuevamente el p -valor para rechazar o aceptar H 0 con α = 0 , 01. © Siempre rechazamos H 0 con el nivel de significación α = 0 , 01. © Nunca rechazamos H 0 con el nivel de significación α = 0 , 01. © La decisión dependerá del valor del p -valor que nos dio el ordenador inicialmente.

  1. La concentración media de dióxido de carbono en el aire a cierta altura es habitualmente de unas 355 p.p.m. (partes por millón). Se sospecha que esta concentración es mayor en la capa de aire más próxima a la superficie. Para contrastar esta hipótesis se analizó el aire en 20 puntos elegidos aleatoriamente a una misma altura cerca del suelo. Resultó una media muestral de 580 p.p.m. y una cuasi-desviación típica muestral de

  2. Suponiendo normalidad para las mediciones, ¿proporcionan estos datos suficiente evidencia estadística, al nivel 0.01, a favor de la hipótesis de que la concentración es mayor cerca del suelo? Indicar razonadamente si el p -valor es mayor o menor que 0 , 01.

  3. Un fabricante de materiales para insonorización produce dos tipos A y B. De los 1000 primeros lotes vendidos, 560 fueron del tipo A. ¿Proporcionan estos datos suficiente evidencia estadística (al nivel de significación 0.01) para concluir que los consumidores prefieren mayoritariamente el tipo A?

  4. Se están estudiando dos colonias de ñúes azules, una que vive en un parque de Tanzania, y otra que vive en un parque de Kenia. Parece que la altura en Tanzania es mayor que la altura en Kenia. Se estudia una muestra de 10 ñúes en Tanzania, obteniéndose una altura media muestral de 130 cm con una cuasi-varianza muestral de 80, y otra muestra de 15 ñúes en Kenia, obteniéndose una altura media muestral de 124 cm con una cuasi-varianza muestral de 75. Asumiendo Normalidad para las alturas en las dos colonias, se pide:

(a) Con un nivel de significación de 0 , 10, ¿podemos aceptar igualdad de varianzas de las alturas en las dos colonias? (b) ¿Disponemos de suficiente evidencia muestral para asegurar que la altura media en Tanzania es mayor que en Kenia (al nivel de significación 0 , 10)?

  1. Se han analizado con SPSS los datos del fichero mercurio.txt con el fin de analizar si el nivel medio de contaminación por mercurio en los dos ríos es o no diferente. La salida obtenida ha sido la siguiente:

Estadísticos de grupo

RIO N Media

Desviación típ.

Error típ. de la media CONC ,00 (^73) 1,0781 ,64861 , 1,00 (^98) 1,2764 ,82915 ,

Prueba de muestras independientes

-1,694 169 ,092 -,19835 ,11712 -,42954 , -1,755 168,570 ,081 -,19835 ,11304 -,42150 ,

Se han asumido varianzas iguales No se han asumido varianzas iguales

CONC

t gl Sig. (bilateral)

Diferencia de medias

Error típ. de la diferencia Inferior Superior

95% Intervalo de confianza para la diferencia

Prueba T para la igualdad de medias

(a) ¿Existe evidencia estadística para afirmar al nivel α = 0 , 05 que el nivel medio de concentración en el río Wacamaw (1) es superior al nivel medio en el río Lumber (0)? (b) Indica las suposiciones previas necesarias para garantizar la validez del procedimiento empleado.

  1. El maíz común no tiene la cantidad de aminoácido lisina que necesitan los animales en su pienso. Sin embargo, unos científicos han desarrollado una variedad de maíz transgénico con alto contenido en lisina dedicado a pienso animal. En un experimento, un grupo de 20 pollos recibió una ración del maíz transgénico mientras que otros 20 pollos recibieron una ración de maíz común. Se registraron las ganancias en peso (en gramos) de los 40 pollos y se procesaron los datos obtenidos con SPSS obteniéndose los siguientes resultados:

Prueba T

Estadísticos de grupo

20 366,3000 50,8052 11, 20 402,9500 42,7286 9,

GRUPO comun trans

PESO

N Media

Desviación típ.

Error típ. de la media

Prueba de muestras independientes

,638 , Se han asumido varianzas iguales No se han asumido varianzas iguales

PESO

F Sig.

Prueba de Levene para la igualdad de varianzas

Página 1

Prueba T

Estadísticos de grupo

20 366,3000 50,8052 11, 20 402,9500 42,7286 9,

GRUPO comun trans

PESO

N Media

Desviación típ.

Error típ. de la media

Prueba de muestras independientes

PESO Se han asumidovarianzas iguales -2,469 38 ,018 -36,

t gl Sig. (bilateral)

Diferencia de medias

Error típ. de la diferencia

Prueba T para la igualdad de medias

Página 1

(a) La opción de SPSS utilizada para producir esta salida ha sido © Prueba T para una muestra © Prueba T para muestras independientes © Prueba T para muestras relacionadas (b) Se desea encontrar evidencia empírica de que la ganancia media de peso de los pollos con dieta transgénica es superior a la de los pollos con dieta común. El p-valor del contraste correspondiente es © 0 , 018; © 0 , 036; © 0 , 009. (c) La hipótesis nula de que la dieta que siguen los pollos no influye en su ganancia media de peso se rechaza al nivel de significación α si © α > 0 , 018; © α/ 2 > 0 , 018; © α < 0 , 018. (d) En la salida de SPSS se ha omitido el error típico de la diferencia de medias. Este error típico © Es aproximadamente igual a 14 , 8440. © No se puede calcular con los datos disponibles. © Es aproximadamente igual a 20 , 9148.

Problemas y cuestiones de bondad de ajuste

  1. Después de lanzar un dado 300 veces, se han obtenido las siguientes frecuencias:

Frecuencias 43 49 56 45 66 41

Al nivel de significación 0,05, ¿se puede aceptar que el dado es regular?

  1. En 1778, H. Cavendish realizó una serie de 29 experimentos con objeto de medir la densidad de la tierra. Sus resultados, tomando como unidad la densidad del agua, fueron: 5’50 5’61 4’88 5’07 5’26 5’55 5’36 5’29 5’58 5’ 5’57 5’53 5’62 5’29 5’44 5’34 5’79 5’10 5’27 5’ 5’42 5’47 5’63 5’34 5’46 5’30 5’75 5’68 5’

Al nivel de significación 0.05, ¿se puede aceptar que la densidad de la tierra se ajusta a una distribución Normal? Observación: Utilizar los intervalos A 1 =“Menor o igual que 5,30”, A 2 =(5,30; 5,45] , A 3 =(5,45; 5,60] , A 4 =“Mayor que 5,60”, y el hecho de que, a partir de los datos, se obtiene que ˆ μ = 5 , 45 y que ˆ σ = 0 , 22.

  1. Nos dicen que un programa de ordenador genera observaciones de una distribución N (0; 1). Como no estamos seguros de ello, obtenemos una muestra aleatoria de 450 observaciones, mediante dicho programa, obteniéndose los siguientes resultados: 30 observaciones menores que -2; 80 observaciones entre -2 y -1; 140 observaciones entre -1 y 0; 110 observaciones entre 0 y 1; 60 observaciones entre 1 y 2; 30 observaciones mayores que 2.

¿Se puede aceptar, al nivel α = 0 , 01, que el programa funciona correctamente?

  1. La tabla que aparece a continuación, muestra la frecuencia de la cifra final del gordo de 200 sorteos de la Lotería de Navidad:

Cifra final 0 1 2 3 4 5 6 7 8 9 Frecuencia 20 8 13 20 27 30 26 20 20 16

¿Se puede aceptar, al nivel de significación del 1 %, que todas las terminaciones son igualmente probables?

  1. Se desea estudiar el número de erratas por página que se producen en la edición de una enciclopedia, antes de su lanzamiento. Para ello se analizan 200 páginas seleccionadas al azar, encontrando los siguientes resultados: Número de erratas por página 0 1 2 3 Número de páginas 150 42 5 3 (a) Asumiendo que el “número de erratas por página” sigue un modelo de Poisson, calcula un intervalo (al 90 % de confianza) para el número medio de erratas por página en toda la enciclopedia. (b) Con los datos obtenidos, ¿es realmente aceptable, al nivel de significación del 10 %, que el “número de erratas por página” sigue una distribución de Poisson?
  2. Un modelo genético para las moscas de cierta variedad nos dice que pueden ser de tres tipos: homo- cigóticas AA (con probabilidad p^2 ), homocigóticas BB (con probabilidad q^2 ) y heterocigóticas AB (con probabilidad 2 pq ), donde naturalmente p + q = 1. En una muestra aleatoria de 100 moscas obtenemos 10 de tipo AA, 50 de tipo BB, y 40 de tipo AB.

¿Se ajustan los datos a dicho modelo genético, al nivel de significación 0,05?

  1. Se clasificaron 1000 individuos de una población según el sexo y según fueran normales o daltónicos.