Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Problemas estadistica, Ejercicios de Estadística

Asignatura: Estadística, Profesor: rafael olive, Carrera: Biología, Universidad: UAM

Tipo: Ejercicios

2014/2015

Subido el 26/11/2015

joaaquuiin
joaaquuiin 🇪🇸

3.8

(23)

11 documentos

1 / 19

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
ESTAD´
ISTICA
2ocurso de Biolog´ıa
Curso 2015-2016
ESTAD´
ISTICA DESCRIPTIVA
1. Estamos interesados en la variable X=“Tiempo de vida (en d´ıas)” de una especie de insectos.
a) En una muestra peque˜na de 11 insectos, los resultados muestrales fueron:
20, 25, 13, 18, 32, 25, 20, 15, 28, 40, 27
Hallar el tiempo medio de vida, el tiempo mediano de vida, y la desviaci´on t´ıpica.
b) En una muestra grande, los resultados obtenidos se resumen de la siguiente forma:
Percentil 30 50 70 100
Tiempo de vida 18 22 26 30
Hallar el tiempo medio de vida (indicando previamente las clases, marcas de clase y frecuencias
proporcionadas por la informaci´on muestral).
2. Con el fin de controlar la contaminaci´on de un r´ıo, todas las semanas se hace una medici´on del nivel
de ´acido ´urico.
a) Las mediciones durante 9 semanas fueron:
13 10 7 5 12 7 9 5 5
Hallar el nivel medio de ´acido ´urico, el nivel mediano, y la desviaci´on t´ıpica.
b) En un estudio as completo, las mediciones semanales de ´acido ´urico se resumieron de la siguiente
forma:
Percentil 20 40 70 100
Nivel de ´acido ´urico 6 8 12 18
Hallar el nivel medio de ´acido ´urico y dibujar el histograma (indicando previamente las clases,
marcas de clase y frecuencias proporcionadas por la informaci´on muestral).
3. Los babuinos constituyen un enero de primates catarrinos de la familia Cercopithecidae. Se lleva a
cabo un amplio estudio con 100 babuinos macho y los resultados sobre su altura hasta los hombros
se resumen en la siguiente tabla:
Altura en cm Entre 40 y 50 Entre 50 y 55 Entre 55 y 60 Entre 60 y 70
umero de individuos 19 28 30 23
(a) Calcular la media muestral de estos datos.
(b) Representar los datos en un histograma.
(c) Calcular (aproximadamente) el primer cuartil y la mediana de los datos.
4. En una explotaci´on ganadera, se midi´o la cantidad de triacilglic´eridos (en gramos por litro) en la
leche de 100 vacas, obteni´endose los siguientes resultados:
Gramos por litro Entre 26 y 28 Entre 28 y 30 Entre 30 y 32 Entre 32 y 40
umero de reses 10 30 35 25
(a) Obtener el umero medio de gramos de triacilglic´eridos por litro
(b) Representar estos datos mediante un histograma.
(c) Obtener (aproximadamente) el percentil 20 de estos datos.
1
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13

Vista previa parcial del texto

¡Descarga Problemas estadistica y más Ejercicios en PDF de Estadística solo en Docsity!

ESTAD´ISTICA

2 o^ curso de Biolog´ıa Curso 2015-

ESTAD´ISTICA DESCRIPTIVA

  1. Estamos interesados en la variable X=“Tiempo de vida (en d´ıas)” de una especie de insectos.

a) En una muestra peque˜na de 11 insectos, los resultados muestrales fueron: 20, 25, 13, 18, 32, 25, 20, 15, 28, 40, 27 Hallar el tiempo medio de vida, el tiempo mediano de vida, y la desviaci´on t´ıpica. b) En una muestra grande, los resultados obtenidos se resumen de la siguiente forma:

Percentil 30 50 70 100 Tiempo de vida 18 22 26 30

Hallar el tiempo medio de vida (indicando previamente las clases, marcas de clase y frecuencias proporcionadas por la informaci´on muestral).

  1. Con el fin de controlar la contaminaci´on de un r´ıo, todas las semanas se hace una medici´on del nivel de ´acido ´urico. a) Las mediciones durante 9 semanas fueron: 13 10 7 5 12 7 9 5 5 Hallar el nivel medio de ´acido ´urico, el nivel mediano, y la desviaci´on t´ıpica. b) En un estudio m´as completo, las mediciones semanales de ´acido ´urico se resumieron de la siguiente forma:

Percentil 20 40 70 100 Nivel de ´acido ´urico 6 8 12 18

Hallar el nivel medio de ´acido ´urico y dibujar el histograma (indicando previamente las clases, marcas de clase y frecuencias proporcionadas por la informaci´on muestral).

  1. Los babuinos constituyen un g´enero de primates catarrinos de la familia Cercopithecidae. Se lleva a cabo un amplio estudio con 100 babuinos macho y los resultados sobre su altura hasta los hombros se resumen en la siguiente tabla:

Altura en cm Entre 40 y 50 Entre 50 y 55 Entre 55 y 60 Entre 60 y 70 N´umero de individuos 19 28 30 23

(a) Calcular la media muestral de estos datos. (b) Representar los datos en un histograma. (c) Calcular (aproximadamente) el primer cuartil y la mediana de los datos.

  1. En una explotaci´on ganadera, se midi´o la cantidad de triacilglic´eridos (en gramos por litro) en la leche de 100 vacas, obteni´endose los siguientes resultados:

Gramos por litro Entre 26 y 28 Entre 28 y 30 Entre 30 y 32 Entre 32 y 40 N´umero de reses 10 30 35 25

(a) Obtener el n´umero medio de gramos de triacilglic´eridos por litro (b) Representar estos datos mediante un histograma. (c) Obtener (aproximadamente) el percentil 20 de estos datos.

  1. Se piensa que la frecuencia del canto de los grillos (en una hora) tiene una estrecha relaci´on con la temperatura. Para poder expresar la frecuencia del canto (Y ) en funci´on de la temperatura en grados Farenheit (X) se recogen cinco pares de datos que se resumen a continuaci´on: ∑ xi = 394

yi = 84

x^2 i = 31316

y^2 i = 1426

xiyi = 6672

(a) Obtener la recta de regresi´on para expresar la frecuencia del canto en funci´on de la temperatura. (b) Evaluar el ajuste. La asociaci´on entre X e Y , ¿es positiva o negativa?

  1. El peso de los animales salvajes es siempre m´as dif´ıcil de determinar que su altura. Para poder expresar (aproximadamente) el peso de los ˜n´ues azules (connochaetes taurinus) en funci´on de su altura, se apresan 10 ejemplares adultos, y se anota su altura en cm (X) y su peso en Kg (Y ). Los resultados se resumen a continuaci´on: ∑ xi = 1255

yi = 2275

x^2 i = 158325

y^2 i = 519875

xiyi = 286850

(a) Con los datos anteriores, halla la recta de regresi´on del peso (Y ) sobre la altura (X). (b) ¿Cu´al ser´ıa el peso aproximado de un ˜nu cuya altura es de 125 cm?

  1. El equipo del profesor Manalis ha desarrollado recientemente, en el Instituto Tecnol´ogico de Mas- sachusetts (MIT), un dispositivo para medir la masa de part´ıculas min´usculas como, por ejemplo, nanopart´ıculas sint´eticas y componentes biol´ogicos de las celulas, cuyas masas se miden en at- togramos (1 attogramo = 10^18 gramos). Con la idea de calibrar este dispositivo, se mide la masa de 10 nanopart´ıculas sint´eticas con un dispositivo m´as antiguo (X) y con el nuevo dispositivo (Y ), obteni´endose una masa media de 46,4 attogramos con el antiguo dispositivo, y una masa media con el nuevo dispositivo de 50, attogramos. Adem´as: ∑ x^2 i = 22390

y^2 i = 26142

xiyi = 24174

(a) Halla la recta de regresi´on para expresar Y en funci´on de X. (b) Estima cuanto valdr´ıa la masa de una nanopart´ıcula con el nuevo procedimiento, si con el antiguo ha resultado ser de 60 attogramos. (c) Calcula y comenta el coeficiente de correlaci´on entre X e Y.

  1. (Ordenador) En 1778, H. Cavendish realiz´o una serie de 29 experimentos con objeto de medir la densidad de la tierra. Sus resultados, tomando como unidad la densidad del agua, fueron: 5’50 5’61 4’88 5’07 5’26 5’55 5’36 5’29 5’58 5’ 5’57 5’53 5’62 5’29 5’44 5’34 5’79 5’10 5’27 5’ 5’42 5’47 5’63 5’34 5’46 5’30 5’75 5’68 5’ a) Representa los datos por medio de un diagrama de tallos y hojas. b) Representa los datos por medio de un diagrama de caja y bigotes. c) Halla la media y la desviaci´on t´ıpica.
  2. (Ordenador) Para evaluar la viabilidad de un proyecto de reforestaci´on de una zona sometida a una fuerte actividad tur´ıstica, se analiza la composici´on en mg por cm^3 de desechos org´anicos del territorio. Los datos que se obtienen son:
  1. (Ordenador) Los manat´ıes son unos animales grandes y d´ociles que viven a lo largo de la costa de Florida. Cada a˜no las lanchas motoras hieren o matan muchos de ellos. A continuaci´on se presenta una tabla que contiene, para cada a˜no, el n´umero de licencias para motoras (expresado en miles de licencias) expedidas en Florida y el n´umero de manat´ıes muertos en los a˜nos 1977 a 1990. a) Queremos analizar la relaci´on entre el n´umero de licencias expedidas anualmente en Florida y el n´umero de manat´ıes muertos. ¿ Cual es la variable explicativa? Dibuja un diagrama de dispersi´on con esos datos. ¿Qu´e nos dice el diagrama sobre la relaci´on entre esas dos variables? Las variables ¿est´an asociadas positiva o negativamente? b) Halla la recta de regresi´on para expresar el n´umero de manat´ıes muertos en funci´on del n´umero de licencias. c) Describe la fuerza de la relaci´on. ¿Se puede predecir con precisi´on el n´umero de manat´ıes muertos cada a˜no conociendo el n´umero de licencias expedidas ese a˜no? Si Florida decidiera congelar el n´umero de licencias en 700.000, ¿cu´antos manat´ıes matar´ıan, aproximadamente, las lanchas motoras?

A˜no Licencias Manat´ıes A˜no Licencias Manat´ıes 1977 447 13 1984 559 34 1978 460 21 1985 585 33 1979 481 24 1986 614 33 1980 498 16 1987 645 39 1981 513 24 1988 675 43 1982 512 20 1989 711 50 1983 526 15 1990 719 47

  1. (Ordenador) Los corredores buenos dan m´as pasos por segundo a medida que aumentan la velocidad. He aqu´ı el promedio de pasos por segundo de un grupo de corredoras de ´elite a distintas velocidades. La velocidad se expresa en metros por segundo.

Velocidad (m/s) 4 , 83 5 , 14 5 , 33 5 , 67 6 , 08 6 , 42 6 , 74 Pasos por segundo 3 , 05 3 , 12 3 , 17 3 , 25 3 , 36 3 , 46 3 , 55

a) Se quiere predecir el n´umero de pasos por segundo a partir de la velocidad. En primer lugar, dibuja un diagrama de dispersi´on. b) Halla la recta de regresi´on del n´umero de pasos por segundo con relaci´on a la velocidad. c) Halla el coeficiente de correlaci´on lineal.

  1. (Ordenador) La tabla siguiente presenta tres conjuntos de datos preparados por el estad´ıstico Frank Anscombe para ilustrar los peligros de hacer c´alculos sin antes representar los datos. Los tres conjuntos de datos tienen la misma correlaci´on y la misma recta de regresi´on.

Conjunto de datos A:

X 10 8 13 9 11 14 6 4 12 7 5

Y 8 , 04 6 , 95 7 , 58 8 , 81 8 , 33 9 , 96 7 , 24 4 , 26 10 , 84 4 , 82 5 , 68

Conjunto de datos B:

X 10 8 13 9 11 14 6 4 12 7 5

Y 9 , 14 8 , 14 8 , 74 8 , 77 9 , 26 8 , 10 6 , 13 3 , 10 9 , 13 7 , 26 4 , 74

Conjunto de datos C:

X 8 8 8 8 8 8 8 8 8 8 19

Y 6 , 58 5 , 76 7 , 71 8 , 84 8 , 47 7 , 04 5 , 25 5 , 56 7 , 91 6 , 89 12 , 50

a) Calcular la correlaci´on y la recta de regresi´on para los tres conjuntos de datos y comprobar que son iguales.

b) Dibujar un diagrama de dispersi´on para cada uno de los conjuntos de datos con las rectas de regresi´on correspondientes.

c) ¿En cu´al de los tres casos utilizar´ıamos la recta de regresi´on para predecir Y dado X = 14.

Conclusi´on: Representa siempre tus datos.

  1. Se sabe que el nivel de tensi´on sangu´ınea diast´olica (en mmHg) en una poblaci´on es una variable con distribuci´on normal de media μ = 87 y desviaci´on t´ıpica σ = 7.5. Un individuo se clasifica como hipertenso si su presi´on es mayor de 90 mmHg. (a) Calcula la probabilidad de que un individuo seleccionado al azar en esta poblaci´on sea hipertenso. (b) Si se seleccionan aleatoriamente 100 individuos de la poblaci´on, calcula la probabilidad aproxi- mada de que entre ellos haya m´as de 40 hipertensos. (c) Calcula el valor aproximado del primer cuartil de la poblaci´on, es decir, el valor Q 1 tal que la tensi´on sangu´ınea del 25% de los individuos de la poblaci´on es menor que Q 1. (d) Si se seleccionan aleatoriamente 9 individuos de la poblaci´on, calcula la probabilidad de que su tensi´on media sea superior a 90 mmHg.
  2. La capacidad de enrollar la lengua est´a controlada por una pareja de genes: el gen E que determina su enrollamiento y el gen e que lo impide. El gen E es dominante, de modo que una persona Ee ser´a capaz de enrollar la lengua. En una ciudad grande se sabe que aproximadamente el 40% no puede enrollar la lengua y el 60% si puede. Si elegimos 200 personas al azar, ¿cu´al es la probabilidad de que m´as de 70 no puedan enrollar su lengua?
  3. En una granja dedicada a la helicicultura se cr´ıan dos tipos de caracoles: el com´un y el romano. La velocidad (en metros por hora) del caracol com´un de jard´ın (Helix aspersa) sigue una distribuci´on N (μ = 50; σ = 5). La velocidad (en metros por hora) del caracol romano (Helix pomatia) sigue una distribuci´on N (μ = 42; σ = 5). (a) Calcular el porcentaje de caracoles comunes de jard´ın que recorren menos de 60 metros en un hora. (b) Calcular la probabilidad de que un caracol de jard´ın elegido al azar recorra menos espacio en una hora que un caracol romano.
  4. Se sabe que los niveles de triglic´eridos (en mg/dL) en una poblaci´on, tanto para los hombres como para las mujeres, tienen distribuci´on normal. Para los hombres la distribuci´on es N (μ = 100; σ = 30), y para las mujeres la distribuci´on es N (μ = 90; σ = 25). (a) Seleccionando un hombre al azar, ¿cu´al es la probabilidad de que su nivel de triglic´eridos sea inferior a 130 mg/dL? (b) Si se seleccionan aleatoria e independientemente un hombre y una mujer, ¿cu´al es la probabilidad de que el nivel de triglic´eridos de la mujer sea superior al del hombre?
  5. Una l´ınea el´ectrica se aver´ıa cuando la tensi´on sobrepasa la capacidad de la l´ınea. Si la tensi´on es N (100; 20) y la capacidad es N (140; 10), calcular la probabilidad de aver´ıa.
  6. La concentraci´on de ´acido ´urico en sangre (mg/dl) en la poblaci´on de pacientes con s´ındrome de apnea-hipopnea durante el sue˜no (SAHS) sigue una distribuci´on normal, N (μ = 6, 30; σ = 1, 50). Se recomienda que la concentraci´on de ´acido ´urico se mantenga por debajo de 7,20 mg/dl ya que, por encima de ese valor, comienzan a surgir problemas (c´alculos renales, gota, ...). (a) Calcula el porcentaje de pacientes de la poblaci´on anterior, cuya concentraci´on de ´acido ´urico se mantiene por debajo de 7,20 mg/dl. (b) Si se seleccionan 50 pacientes al azar en esa poblaci´on, calcula la probabilidad aproximada de que m´as de 30 de ellos tengan un nivel de ´acido ´urico aceptable (por debajo de 7,20 mg/dl). (c) Si se seleccionan al azar dos pacientes en esa poblaci´on, ¿cu´al es la probabilidad de que la diferencia de ´acido ´urico entre ellos sea inferior a 1 mg/dl?

ESTIMACI ON PUNTUAL´

  1. Dada una muestra aleatoria de tama˜no n de una variable X, calcular el estimador de m´axima verosimilitud y el del m´etodo de los momentos, en los siguientes casos: a) X ∼ Bernoulli de par´ametro p. b) X ∼ Poisson (λ). c) X ∼ Exponencial (λ); es decir, fλ(x) = λeλx, para x > 0 (λ > 0). d) X ∼ N (μ, σ).
  2. La proporci´on de genes da˜nados en un tejido celular tras una sesi´on de radiaci´on es una variable aleatoria continua X con funci´on de densidad f (x) = θxθ^1 , para valores de x ∈ (0, 1), siendo θ > 0 un par´ametro desconocido que depende del tipo de tejido. (a) Dada una muestra aleatoria (X 1 ,... , Xn) de X, calc´ulese el estimador de θ por el m´etodo de los momentos y por el m´etodo de m´axima verosimilitud. (b) Tras analizar una muestra de 3 tejidos celulares, se obtuvieron los valores 0, 10 , 0 , 15 y 0, 25. ¿Cu´ales son la estimaciones concretas de θ con estos datos con los dos m´etodos?
  3. En una gran piscifactor´ıa hay una proporci´on desconocida, p, de cierto tipo de truchas. Para obtener informaci´on sobre esa proporci´on desconocida, vamos a ir sacando peces al azar hasta obtener una trucha de ese tipo, en tres ubicaciones diferentes: En la primera ubicaci´on se obtiene la primera trucha de ese tipo en la d´ecima extracci´on. En la segunda ubicaci´on se obtiene la primera trucha de ese tipo en la decimoquinta extracci´on. En la tercera ubicaci´on se obtiene la primera trucha de ese tipo en la decimoctava extracci´on. Escribir la funci´on de verosimilitud y obtener la estimaci´on de m´axima verosimilitud de p.
  4. Un modelo gen´etico para las moscas de cierta variedad nos dice que pueden ser de tres tipos: homocig´oticas AA (con probabilidad p^2 ), homocig´oticas BB (con probabilidad q^2 ) y heterocig´oticas AB (con probabilidad 2pq), donde naturalmente p + q = 1. En una muestra aleatoria de 100 moscas obtenemos 10 de tipo AA, 50 de tipo BB, y 40 de tipo AB. Hallar la estimaci´on de m´axima verosimilitud de p con los datos obtenidos.
  5. Una variable relacionada con el n´umero de mutaciones en una secuencia de ADN puede tomar los valores 0, 1 ´o 2 con probabilidades (1 + 2θ)/3, (1 − θ)/3 y (1 − θ)/3 respectivamente, donde θ es un par´ametro desconocido. Se han obtenido 60 observaciones independientes de esta variable resultando la siguiente tabla de frecuencias absolutas:

Valores 0 1 2 Frecuencias 25 20 15

(a) Estima el valor de θ a partir de las observaciones disponibles usando el m´etodo de los momentos. (b) Estima el valor de θ a partir de las observaciones disponibles usando el m´etodo de m´axima verosimilitud.

  1. En el art´ıculo “A nanomaterial-based breath test for distinguishing gastric cancer from benign gastric conditions” publicado en British Journal of Cancer en 2013 se describe un an´alisis de aliento sencillo que se puede usar para el diagn´ostico precoz de c´ancer de est´omago, a partir de la medici´on de cinco sustancias: 2-propenonitrilo, 2-butoxietanol, furfural, 6-metil-5-hepten-2-ona e isopreno. La sensibilidad de la prueba (probabilidad de dar positivo teniendo c´ancer) es del 89%, y su especi- ficidad (probabilidad de dar negativo estando sano) es del 94%. Este an´alisis de aliento se aplica a un grupo aleatorio de 50 personas de una poblaci´on de riesgo, obteni´endose 10 resultados positivos y 40 negativos. (a) Estima q=“Proporci´on de resultados positivos”, razonando tu respuesta. (b) Halla la relaci´on entre p=“Proporci´on de personas con c´ancer de est´omago” en esa poblaci´on de riesgo y q=“Proporci´on de resultados positivos”, y util´ızala para estimar p.

INTERVALOS DE CONFIANZA

  1. En 1778, Henry Cavendish realiz´o mediciones de la densidad terrestre (mediante un experimento con una balanza de torsi´on) obteniendo los siguientes resultados:

5.50 5.61 4.88 5.07 5.26 5.55 5.36 5.29 5.58 5. 5.57 5.53 5.62 5.29 5.44 5.34 5.79 5.10 5.27 5. 5.42 4.47 5.63 5.34 5.46 5.30 5.75 5.68 5.

a) Asumiendo Normalidad, obtener un intervalo de confianza de nivel 0.95 para la media. b) ¿Cu´antas observaciones habr´ıa necesitado para estimar la media con un error inferior a 0.04, al nivel de confianza 0.95?

  1. La alimentaci´on en cierta comarca es rica en alimentos con alto contenido en purinas (compuestos con nitr´ogeno), y esto puede producir un mayor nivel de ´acido ´urico en sangre. Se mide el nivel de ´acido ´urico en la sangre de 10 individuos elegidos al azar en esa comarca, y se obtienen los siguientes valores (con sus correspondientes res´umenes): Valores obtenidos: 5,1 6,1 5,2 5,9 5,4 5,5 5,9 6,1 4,8 6, ∑ xi = 56, 5

x^2 i = 321, 79 (a) Halla la mediana y los cuartiles. (b) Asumiendo normalidad, halla un intervalo (con nivel de confianza 0,90) para el nivel medio de ´acido ´urico en sangre en esa comarca. (c) Halla un intervalo (con nivel de confianza 0,90) para la varianza del nivel de ´acido ´urico en esa comarca.

  1. Las toxinas producidas por cianobacterias (microorganismos procariotas capaces de realizar fo- tos´ıntesis oxig´enica) en los embalses han sido reconocidas como un problema de salud (Chorus & Bartram, 2002); por ello, la nueva legislaci´on europea sobre aguas de ba˜no incluye el seguimiento y control de estas bacterias en los embalses. (a) De 33 embalses muestreados en Espa˜na, 17 presentan una gran abundancia de cianobacterias, frente a 16 que no presentan una cantidad preocupante. A partir de estos datos, dar un inter- valo de confianza para estimar la proporci´on de embalses espa˜noles con una gran abundancia de cianobacterias (con un nivel de confianza del 90%). (b) ¿Cu´antos embalses habr´ıa que muestrear para que el error en la estimaci´on de esa proporci´on quede por debajo de 0,04?
  2. Un equipo de investigadores quiere estimar la proporci´on p de vacas que sufren el mal de las vacas locas en una gran explotaci´on ganadera, mediante un intervalo con un error m´aximo de 0.015 y nivel de confianza 0.95. ¿A cu´antas vacas deben analizar para alcanzar aproximadamente este objetivo, sabiendo que en un peque˜no sondeo orientativo (muestra piloto) result´o que el 15% de las vacas estaban afectadas por la enfermedad?
  3. El ma´ız es un alimento importante para los animales. De todas formas, este alimento carece de algunos amino´acidos que son esenciales. Un grupo de cient´ıficos desarroll´o una nueva variedad que s´ı conten´ıa niveles apreciables de dichos amino´acidos. Para comprobar la utilidad de esta nueva variedad para la alimentaci´on animal se llev´o a cabo el siguiente experimento: a un grupo de 20 pollos de 1 d´ıa se les suministr´o un pienso que conten´ıa harina de ma´ız de la nueva variedad. A otro grupo de 20 pollos (grupo de control) se le aliment´o con un pienso que s´olo se diferenciaba del anterior en que no conten´ıa harina de la variedad mejorada de ma´ız. Los resultados que se obtuvieron sobre las ganancias de peso de los pollos (en gramos) al cabo de 21 d´ıas de alimentaci´on fueron los siguientes: - Variedad normal 380 321 366 356 283 349 402 462 356 410 329 399 350 384 316 272 345 455 360 431 - Variedad mejorada 361 447 401 375 434 403 393 426 406 318 467 407 427 420 477 392 430 339 410 326

Asumiendo normalidad e igualdad de varianzas, obtener un intervalo de confianza (al 95%) para estimar la diferencia entre las ganancias medias de peso con las dos variedades de pienso.

  1. Se desea estimar la proporci´on p de ´anades en la poblaci´on de un parque natural que presenta altos niveles de contaminaci´on por metales pesados. Para ello se realiza un sondeo preliminar con 50 ejemplares, de los cuales 9 resultaron tener altos niveles de contaminaci´on. a) Construir un intervalo de confianza, de nivel 0.95, para p a partir de los resultados. b) ¿Qu´e tama˜no muestral deber´ıa utilizarse en un nuevo sondeo para estimar p con un error m´aximo del 2.5% y un nivel de confianza del 0.92?
  2. Una empresa de metalurgia est´a interesada en la temperatura media que alcanza cierta m´aquina utilizada en el proceso de fabricaci´on. Para su estimaci´on se obtienen 6 mediciones en grados cent´ıgrados: 41,60 41,84 42,34 41,95 41,86 42, Asumiendo Normalidad, se pide: a) Obtener el intervalo de confianza al 95% para la temperatura media, suponiendo que σ = 0, 30. b) Deducir el tama˜no muestral necesario para conseguir un intervalo de confianza al 95% con una longitud menor o igual que 0,1 grados. c) Obtener el intervalo de confianza al 95% para la temperatura media, suponiendo que desconoce- mos el valor de σ.
  3. Estamos interesados en la concentraci´on, X, de particulas contaminantes (expresada en ppm) en situaciones de altas presiones atmosf´ericas. Medimos dicha concentraci´on en 6 estaciones de la Red de Control de la Calidad del Aire, tras cinco d´ıas de altas presiones, encontrando una concentraci´on media de 150 ppm, con una cuasidesviaci´on t´ıpica de 16 ppm. (a) Asumiendo Normalidad, calcula un intervalo de confianza para la concentraci´on media de part´ıculas contaminantes en esas condiciones, con un nivel de confianza del 95%. (b) ¿En cu´antas estaciones deber´ıamos medir dicha concentraci´on, para estimar la concentraci´on media con un error inferior a 5 ppm (con el mismo nivel de confianza)?
  4. La envergadura (en cm) del c´ondor de California (X) en su edad adulta es modelizada con una distribuci´on Normal. En una muestra de 5 c´ondores adultos se obtiene que

xi = 1350 y

x^2 i =

(a) Obtener un intervalo de confianza para estimar la envergadura media de toda la poblaci´on, con una confianza del 90%. (b) ¿Cu´antos c´ondores ser´ıa necesario observar para poder estimar la envergadura media con la misma confianza y un error inferior a 5 cm?

  1. Se admite que el n´umero de microorganismos en una muestra de 1 mm c´ubico de agua de un r´ıo sigue una distribuci´on de Poisson de par´ametro λ. En 40 muestras se han detectado, en total, 833 microorganismos. Calcula un estimador puntual y un intervalo de confianza al 90% para λ.
  2. Nueve personas participan en el estudio de un producto que intenta reducir el apetito (clorofe- nilpiperacina). Cada uno de ello recibe este producto durante 2 semanas y placebo durante otras 2 semanas (naturalmente, el orden de los per´ıodos de 2 semanas es aleatorio y ellos no lo conocen). Al final de cada per´ıodo, se les pide que expresen su sensaci´on de hambre (en una escala del 0 al 150). Los resultados son los siguientes:

Individuo 1 2 3 4 5 6 7 8 9 Despu´es del producto 79 48 52 15 61 107 77 54 5 Despu´es del placebo 78 54 142 25 101 99 94 107 64

(a) Hallar un intervalo de confianza al 95% para la diferencia de las sensaciones medias de hambre con el producto y con placebo (asumir Normalidad). (b) Lo mismo, pero trabajando (equivocadamente) con las muestras como si fueran independientes (asumir Normalidad e igualdad de varianzas).

CONTRASTES DE HIP OTESIS´

  1. El flamenco andino es una de las seis especies reconocidas de flamencos. Su tama˜no medio es de 110 cent´ımetros. Se detecta una nueva colonia de flamencos andinos en un humedal y se procede a su estudio. En una muestra de 9 flamencos se obtienen los siguientes tama˜nos: 103 108 112 117 100 108 109 117 118 (a) ¿Cu´anto vale la mediana muestral? ¿Y los cuartiles? (b) Asumiendo Normalidad, ¿se puede aceptar que el tama˜no medio de esta nueva colonia es tambi´en de 110 cent´ımetros? Dar una respuesta al nivel de significaci´on 0,05. Para facilitar los c´alculos:

xi = 992

x^2 i = 109664 (c) En el apartado anterior, ¿el p-valor es mayor o menor que 0,05? Contestar razonadamente sin calcular el p-valor.

  1. Se analiza un env´ıo de botellas sobre las que se afirma que contienen 100 cl. de agua. Exami- nada una muestra de 5 botellas se obtiene que la media es de 95 cl. y la cuasivarianza muestral es s^2 = 1.1. Al nivel de significaci´on 5%, ¿existe evidencia emp´ırica para afirmar que la cantidad media de agua no es de 100 cl.?
  2. Un soci´ologo afirma que el 40% de los universitarios han viajado al extranjero al menos una vez. En una muestra de 100 universitarios, se observa que 36 han salido del pa´ıs en alguna ocasi´on. Contrastar la hip´otesis del soci´ologo para un nivel de significaci´on del 10%.
  3. La concentraci´on media de di´oxido de carbono en el aire a cierta altura es habitualmente de unas 355 p.p.m. (partes por mill´on). Se sospecha que esta concentraci´on es mayor en la capa de aire m´as pr´oxima a la superficie. Para contrastar esta hip´otesis se analiz´o el aire en 20 puntos elegidos aleatoriamente a una misma altura cerca del suelo. Result´o una media muestral de 580 p.p.m. y una cuasi-desviaci´on t´ıpica muestral de 180. Suponiendo normalidad para las mediciones, ¿propor- cionan estos datos suficiente evidencia estad´ıstica, al nivel 0.01, a favor de la hip´otesis de que la concentraci´on es mayor cerca del suelo? Indicar razonadamente si el p-valor es mayor o menor que 0.01.
  4. Un fabricante de materiales para insonorizaci´on produce dos tipos A y B. De los 1000 primeros lotes vendidos, 560 fueron del tipo A. ¿Proporcionan estos datos suficiente evidencia estad´ıstica (al nivel de significaci´on 0.01) para concluir que los consumidores prefieren mayoritariamente el tipo A?
  5. Se tienen dos m´etodos, A y B, para determinar el calor latente de fusi´on del hielo. La siguiente tabla da los resultados obtenidos (en calor´ıas por gramo de masa para pasar de -0.72◦C a 0◦C) utilizando ambos m´etodos independientemente:

M´etodo A 79.98 80.04 80.02 80.04 80.03 80.03 80.04 79.97 80.05 80.03 80.02 80.00 80. M´etodo B 80.02 79.94 79.98 79.97 79.97 80.03 79.95 79.

Asumiendo Normalidad e igualdad de varianzas, ¿existen diferencias significativas entre los resul- tados medios proporcionados por los dos m´etodos (a un nivel de significaci´on del 10%)?

  1. El ma´ız es un alimento importante para los animales. De todas formas, este alimento carece de algunos amino´acidos que son esenciales. Un grupo de cient´ıficos desarroll´o una nueva variedad que s´ı conten´ıa niveles apreciables de dichos amino´acidos. Para comprobar la utilidad de esta nueva variedad para la alimentaci´on animal se llev´o a cabo el siguiente experimento: a un grupo de 20 pollos de 1 d´ıa se les suministr´o un pienso que conten´ıa harina de ma´ız de la nueva variedad. A otro grupo de 20 pollos (grupo de control) se le aliment´o con un pienso que s´olo se diferenciaba del anterior en que no conten´ıa harina de la variedad mejorada de ma´ız. Los resultados que se obtuvieron sobre las ganancias de peso de los pollos (en gramos) al cabo de 21 d´ıas de alimentaci´on fueron los siguientes:
  • Variedad normal 380 321 366 356 283 349 402 462 356 410 329 399 350 384 316 272 345 455 360 431
  • Variedad mejorada 361 447 401 375 434 403 393 426 406 318 467 407 427 420 477 392 430 339 410 326

a) Asumiendo Normalidad e igualdad de varianzas, ¿se puede considerar que hay suficiente evidencia estad´ıstica para afirmar que la ganancia media de peso es mayor con la variedad mejorada? Dar una respuesta con un nivel de significaci´on 0,10. b) ¿Era razonable aceptar la hip´otesis de igualdad de varianzas? Dar una respuesta con un nivel de significaci´on 0,10.

  1. Se desea comparar la proporci´on de viviendas con calefacci´on en Extremadura y en Galicia. Se hace un muestreo en las dos comunidades con los siguientes resultados: Extremadura: De 500 viviendas elegidas al azar, 300 disponen de calefacci´on. Galicia: De 1000 viviendas elegidas al azar, 680 disponen de calefacci´on. ¿Hay suficiente evidencia estad´ıstica para concluir, con un nivel de significaci´on del 5%, que es menor la proporci´on de viviendas con calefacci´on en Extremadura que en Galicia?
  2. Se est´an estudiando dos colonias de ˜n´ues azules, una que vive en un parque de Tanzania, y otra que vive en un parque de Kenia. Parece que la altura en Tanzania es mayor que la altura en Kenia. Se estudia una muestra de 10 ˜n´ues en Tanzania, obteni´endose una altura media muestral de 130 cm con una cuasi-varianza muestral de 80, y otra muestra de 15 ˜n´ues en Kenia, obteni´endose una altura media muestral de 124 cm con una cuasi-varianza muestral de 75. Asumiendo Normalidad para las alturas en las dos colonias, se pide: (a) Con un nivel de significaci´on de 0.10, ¿podemos aceptar igualdad de varianzas de las alturas en las dos colonias? (b) ¿Disponemos de suficiente evidencia muestral para asegurar que la altura media en Tanzania es mayor que en Kenia (al nivel de significaci´on 0.10)?
  3. Un grupo de 23 voluntarios contrajo un resfriado tras haber sido expuesto a un virus. Diez de los voluntarios tomaron durante varios d´ıas un comprimido que conten´ıa 1 g de vitamina C mientras que los trece restantes tomaron un placebo. Para todos ellos se observ´o el tiempo en d´ıas que dur´o el resfriado. Un resumen de los resultados aparece en la siguiente tabla:

Vitamina C Placebo Media 6 , 45 7, Cuasidesviaci´on t´ıpica 0 , 76 0 , 88

(a) Suponiendo normalidad e igualdad de varianzas, ¿permiten estos datos afirmar a nivel α = 0, 05 que el tratamiento con vitamina C es eficaz para reducir la duraci´on del resfriado? Determina razonadamente si el p-valor del contraste es mayor o menor que 0, 05. (b) Contrasta si la hip´otesis de igualdad de varianzas es aceptable a nivel α = 0, 05.

  1. Nueve personas participan en el estudio de un producto que intenta reducir el apetito (clorofe- nilpiperacina). Cada uno de ello recibe este producto durante 2 semanas y placebo durante otras 2 semanas (naturalmente, el orden de los per´ıodos de 2 semanas es aleatorio y ellos no lo conocen). Al final de cada per´ıodo, se les pide que expresen su sensaci´on de hambre (en una escala del 0 al 150). Los resultados son los siguientes:

Individuo 1 2 3 4 5 6 7 8 9 Despu´es del producto 79 48 52 15 61 107 77 54 5 Despu´es del placebo 78 54 142 25 101 99 94 107 64

  1. La existencia de trazas de metales en el agua afecta a su sabor y, si las concentraciones son altas, puede afectar a la salud. En un estudio se seleccionaron seis localizaciones en un r´ıo y, para cada localizaci´on, se determin´o la concentraci´on de zinc en el agua de la superficie y en el agua del fondo (en mg/l). Los resultados fueron los siguientes: Localizaci´on 1 2 3 4 5 6 Concentraci´on en el fondo (y) 0,43 0,27 0,57 0,53 0,71 0, Concentraci´on en la superficie (x) 0,41 0,24 0,39 0,41 0,60 0, Con el fin de facilitar los c´alculos, se recomienda trabajar con los siguientes res´umenes ∑n i=1 xi^ = 2,^66

∑n i=1 x 2 i = 1,^278

∑n i=1 yi^ = 3,^23

∑n i=1 y 2 i = 1,^886

∑n i=1 xiyi^ = 1 , 546 y se recomienda mantener tres cifras decimales en los c´alculos, para evitar problemas con los re- dondeos. (a) Calcula la recta de regresi´on que resulta ´util para predecir la concentraci´on de zinc en el fondo a partir de la concentraci´on en la superficie. (b) Eval´ua el grado de ajuste de la recta a los datos. Si la concentraci´on de zinc en la superficie es de 0,50 mg/l, ¿cu´al ser´ıa la concentraci´on de zinc predicha en el fondo en esa misma localizaci´on? (c) Asumiendo Normalidad, ¿existe evidencia emp´ırica para afirmar, con un nivel de significaci´on α = 0, 05, que la concentraci´on media de zinc en el fondo es diferente a la concentraci´on media en la superficie?

  1. El contenido medio habitual de ars´enico en un Parque Nacional es de 9 p.p.m. Se cree que ´ultimamente este contenido medio ha podido aumentar. Para estudiar esta posible contaminaci´on, se toma una muestra del contenido de ars´enico en 20 puntos diferentes del Parque, resultando una media muestral de 10 p.p.m. , y una cuasi-varianza muestral de 2,1. ¿Los datos son lo suficientemente concluyentes como para poder afirmar que, efectivamente, ha habido una contaminaci´on, es decir, que el contenido medio en la actualidad es superior al habitual de 9 p.p.m.? Dar una respuesta, al nivel de significaci´on 0,05, asumiendo Normalidad en los datos. ¿El p-valor de estos datos es superior o inferior a 0,05? Dar una respuesta razonada sin hacer c´alculos adicionales.
  2. El hematocrito es el porcentaje del volumen total de la sangre compuesto por gl´obulos rojos y depende tanto del n´umero de gl´obulos rojos como de su tama˜no. En una muestra de 21 hombres se obtuvo un valor medio de hematocrito de 48.8 y una cuasidesviaci´on t´ıpica de 2.8. En otra muestra de 21 mujeres se obtuvo un valor medio de hematocrito de 40.6 y una cuasidesviaci´on t´ıpica de 2.9. Asumiendo normalidad: (a) Calcula un intervalo de confianza de nivel 95% para la varianza del nivel de hematocrito en la poblaci´on de hombres. (b) ¿Podemos aceptar igualdad de varianzas en la poblaci´on de hombres y de mujeres (a nivel 0.10)? (c) ¿Permiten los datos afirmar (a nivel 0.05) que el nivel medio de hematocrito en la poblaci´on de hombres es superior al nivel medio en la poblaci´on de mujeres? Determina razonadamente si el p-valor del contraste es mayor o menor que 0.05.
  3. Se desea estudiar la efectividad de un insecticida ecol´ogico contra los ´afidos en la cosecha de patatas.

Por un lado, se tratan 100 plantas con el insecticida y se comprueba que 10 de ellas tienen ´afidos. Por otro lado, se tiene un grupo de control de otras 100 plantas diferentes que no reciben tratamiento y se comprueba que 15 de ellas tienen ´afidos. ¿Podemos concluir, al nivel de significaci´on 0,05, que la proporci´on de plantas con ´afidos es menor cuando son tratadas con el insecticida?

  1. La producci´on de trigo (en Tm/Ha) que se obtiene un a˜no en 5 parcelas es la siguiente:

11,04 15,13 9,04 20,60 31,

Se quiere estudiar la efectividad de un nuevo fertilizante. Para esto, se observa la producci´on de trigo que se obtiene al a˜no siguiente, usando el nuevo fertilizante. Los resultados en las mismas 5 parcelas son los siguientes: 12,08 17,28 10,82 18,90 32, ¿Podemos afirmar que el nuevo fertilizante aumenta la producci´on media? Responder razonada- mente, al nivel de significaci´on 0,01.

  1. El nivel cer´aunico de un lugar es el n´umero de d´ıas al cabo del a˜no en los que hay tormenta (se considera d´ıa con tormenta a aquel en el que al menos se oye un trueno). En cierta comarca, se conoce por datos hist´oricos que el nivel cer´aunico sigue una distribuci´on de Poisson con una media (λ) de 20 d´ıas. Sin embargo, se piensa que ´ultimamente su nivel cer´aunico ha aumentado, como consecuencia del cambio clim´atico. En un seguimiento de los ´ultimos 50 a˜nos, se ha obtenido que el n´umero medio de d´ıas al a˜no con tormenta ha sido de 22. ¿Se puede afirmar que efectivamente se ha producido un aumento del nivel cer´aunico? Dar una respuesta razonada, al nivel de significaci´on del 5%.
  1. Un modelo gen´etico para las moscas de cierta variedad nos dice que pueden ser de tres tipos: homocig´oticas AA (con probabilidad p^2 ), homocig´oticas BB (con probabilidad q^2 ) y heterocig´oticas AB (con probabilidad 2pq), donde naturalmente p + q = 1. En una muestra aleatoria de 100 moscas obtenemos 10 de tipo AA, 50 de tipo BB, y 40 de tipo AB. ¿Se ajustan los datos a dicho modelo gen´etico, al nivel de significaci´on 0,05?
  2. Se clasificaron 1000 individuos de una poblaci´on seg´un el sexo y seg´un fueran normales o dalt´onicos.

Masculino Femenino Normal 442 514 Dalt´onicos 38 6

Seg´un un modelo gen´etico, las probabilidades deber´ıan ser:

1 2 p^

1 2 p

(^2) + pq

1 2 q^

1 2 q

2

donde q = 1 − p = proporci´on de genes defectuosos en la poblaci´on. A partir de la muestra se ha estimado que q = 0, 087. ¿Concuerdan los datos con el modelo, al nivel de significaci´on 0,05?

  1. Un Ayuntamiento decide poner 4 contenedores para reciclar papel en una zona de la ciudad, con la idea de que sean utilizados por la misma cantidad de personas (aproximadamente). Para ver si esto es cierto, hace una encuesta en la zona a 300 personas, pregunt´andoles que contenedor utilizan. Los resultados obtenidos son los siguientes: El contenedor 1 es utilizado por 80 personas. El contenedor 2 es utilizado por 70 personas. El contenedor 3 es utilizado por 85 personas. El contenedor 4 es utilizado por 65 personas. a) Como consecuencia de estos resultados, ¿resulta aceptable que los 4 contenedores tienen el mismo nivel de utilizaci´on? Dar una respuesta razonada, con un nivel de significaci´on de 0.10. b) El p-valor del contraste anterior, ¿es inferior o superior a 0.10? Dar una respuesta razonada.