Libro de ejercicios resueltos de Bioestadística, Ejercicios de Ingeniería de Telecomunicaciones
manolobarea
manolobarea

Libro de ejercicios resueltos de Bioestadística, Ejercicios de Ingeniería de Telecomunicaciones

154 páginas
50Número de descargas
589Número de visitas
86%de 36 votosNúmero de votos
2Número de comentarios
Descripción
Asignatura: Bioestadística, Profesor: Germán Ros Magán, Carrera: Ingeniería en Sistemas de Telecomunicación, Universidad: UAH
80 Puntos
Puntos necesarios para descargar
este documento
Descarga el documento
Vista previa3 páginas / 154
Esta solo es una vista previa
3 páginas mostradas de 154 páginas totales
Esta solo es una vista previa
3 páginas mostradas de 154 páginas totales
Esta solo es una vista previa
3 páginas mostradas de 154 páginas totales
Esta solo es una vista previa
3 páginas mostradas de 154 páginas totales

Bioestadística Problemas resueltos

Manuel Angel Barea Gómez

19 de diciembre de 2012

Usted es libre de:

copiar, distribuir y comunicar públicamente la obra Remezclar— transformar la obra

Bajo las siguientes condiciones:

b Reconocimiento— Debe reconocer los créditos de la obra de la manera especificada por el autor o el licenciador (pero no de una manera que sugiera que tiene su apoyo o apoyan el uso que hace de su obra).

e No comercial— No puede utilizar esta obra para fines comerciales.

a Compartir bajo la misma licencia— Si altera o transforma esta obra, o genera una obra derivada, sólo puede distribuir la obra generada bajo una licencia idéntica a ésta.

Este obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial-CompartirIgual 3.0 Unported.

Manuel Angel Barea Gómez 2

Índice general

Página

Índice general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

Capítulo 1 Estadística Descriptiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

Capítulo 2 Variables Bidimensionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

Capítulo 3 Probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

Capítulo 4 Variables aleatorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

Capítulo 5 Intervalos de confianza y contrastes de hipótesis paramétricas de una población. . . . . . . . . . . . . . . . . . . 97

Capítulo 6 Intervalos de confianza y constrates de hipótesis paramétricos en dos o más poblaciones. . . . . . . . . . . . . . 108

Capítulo 7 Contrastes de hipótesis no paramétricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137

3

CAPÍTULO

1 Estadística Descriptiva

Problema 1.1. En el siguiente conjunto de números, se proporcionan los pesos (redondeados a la libra más próxima) de los bebés nacidos durante un cierto intervalo de tiempo en un hospital:

4 8 4 6 8 6 7 7 7 8 10 9 7 6 10 8 5 9 6 3 7 6 4 7 6 9 7 4 7 6 8 8 9 11 8 7 10 8 5 7 7 6 5 10 8 9 7 5 6 5

(a) Construir una distribución de frecuencias de estos pesos.

(b) Encontrar las frecuencias relativas.

(c) Encontrar las frecuencias acumuladas.

(d) Encontrar las frecuencias relativas acumuladas.

(e) Dibujar un histograma con los datos.

(f) Calcular las medidas de tendencia central.

(g) Encontrar el percentil 24.

xi ni Ni fi Fi xi ·ni x2i ·ni 3 1 1 0,02 0,02 3 9 4 4 5 0,08 0,1 16 64 5 5 10 0,1 0,2 25 125 6 9 19 0,18 0,38 54 324 7 12 31 0,24 0,62 84 588 8 9 40 0,18 0,8 72 576 9 5 45 0,1 0,9 45 405 10 4 49 0,08 0,98 40 400 11 1 1 0,02 1 11 121 ∑ 50 350 2612

Los apartados a,b,c y d se encuentran resueltos en la tabla proporcionada

4

CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

Peso

F re

cu en

ci a

4 6 8 10

0 2

4 6

8 10

12

x= ∑(xi ·ni) n

= 35050 = 7

Mo = 7 yMe = 7

R= xmax− xmin = 11− 3= 8

s2 = ∑(xi−x)·ni n

= ∑ ni·x2i n

− x2 = 261250 − 72 = 3,24

s= √ 3,24= 1,8

CV = s x = 1,87 = 0,257

Para el cálculo del P24 → n·k100 = 50·24100 = 12 que se corresponde con P24 = 6

Problema 1.2. A continuación se dan los resultados obtenidos con una muestra de 50 universitarios. la característica es el tiempo de reacción ante un estímulo auditivo:

0,110 0,110 0,110 0,112 0,117 0,113 0,135 0,107 0,122 0,113 0,098 0,098 0,105 0,103 0,119 0,100 0,117 0,113 0,124 0,118 0,118 0,108 0,115 0,120 0,107 0,123 0,109 0,117 0,111 0,111 0,101 0,112 0,111 0,119 0,103 0,100 0,108 0,120 0,120 0,102 0,129 0,115 0,121 0,130 0,134 0,118 0,106 0,106 0,094 0,1114

(a) ¿Cuál es la amplitud total de la distribución de los datos?

(b) Obtenga la distribución de frecuencias absolutas y relativas.

(c) Obtenga la distribución de frecuencias acumuladas, absolutas y relativas.

(d) Calcular la media, varianza y coeficiente de variación.

(e) Dibuje el polígono de frecuencias relativas.

(f) Dibuje el polígono de frecuencias relativas acumuladas.

Manuel Angel Barea Gómez 5

CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

Intervalo xi ni Ni fi Fi xi ·ni x2i ·ni [0,0900− 0,0950] 0,0925 1 1 0,02 0,02 0,0925 0,0086 [0,0950− 0,1000] 0,0975 4 5 0,08 0,1 0,3900 0,0380 [0,1000− 0,1050] 0,1025 5 10 0,1 0,2 0,5125 0,0525 [0,1050− 0,1100] 0,1075 8 18 0,16 0,36 0,8600 0,0925 [0,1100− 0,1150] 0,1125 11 29 0,22 0,58 1,2375 0,1392 [0,1150− 0,1200] 0,1075 9 38 0,18 0,76 0,9675 0,1040 [0,1200− 0,1250] 0,1225 5 43 0,1 0,86 0,6125 0,0750 [0,1250− 0,1300] 0,1275 4 47 0,08 0,94 0,5100 0,0650 [0,1300− 0,1350] 0,1325 3 50 0,06 1 0,3975 0,0527

∑ 50 5,58 0,63

R= xmax− xmin = 0,134− 0,094= 0,04

x= ∑(xi ·ni) n

= 5,5850 = 0,11

s2 = ∑(xi−x)·ni n

= ∑ ni·x2i n

− x2 = 0,6350 − 0,112 = 0,0005

s= √ 0,0005= 0,022

CV = s x = 0,0220,11 = 0,203

0.10 0.11 0.12 0.13

0. 05

0. 10

0. 15

0. 20

Poligono de frecuencias relativas

X

f

0.10 0.11 0.12 0.13

0. 0

0. 2

0. 4

0. 6

0. 8

1. 0

Poligono de frecuencias relativas acumulada

X

F

Problema 1.3. Con el fin de observar la relación entre la inteligencia y el nivel socioeconómico (medido por el salario mensual familiar) se tomaron dos grupos, uno formado con sujetos de cociente intelectual inferior a 95 y otro formado por los demás; De

cada sujeto se anotó el salario mensual familiar. Teniendo en cuenta los resultados que se indican en la tabla:

Nivel socioeconómico Sujetos conCI < 95 Sujetos conCI ≥ 95 Intervalos Frecuencia Frecuencia

10 o menos≡ (4,10] 75 19 10− 16 35 26 16− 22 20 25 22− 28 30 30 28− 34 25 54

más de 34≡ (34,40] 15 46

Manuel Angel Barea Gómez 6

CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

(a) Dibuje un gráfico que permita comparar ambos grupos.

(b) Calcule las medidas de tendencia central para aquellos sujetos con CI < 95.

(c) Calcular las medidas de dispersión para aquellos sujetos con CI ≥ 95.

Nivel

C I +

In te

lig en

ci a

20

30

40

50

60

70

10 15 20 25 30 35

Nivel socioeconómico Marca de clase CI < 95 CI ≥ 95 Intervalos x1 ni Ni xi ·ni x2i ·ni ni Ni xi ·ni x2i ·ni

10 o menos ≡ (4,10] 7 75 75 525 3675 19 19 133 931 10− 16 13 35 110 455 5915 26 45 338 4394 16− 22 19 20 130 380 7220 25 70 475 9025 22− 28 25 30 160 750 18750 30 100 750 18750 28− 34 31 25 185 775 24025 54 154 1674 51894

más de 34≡ (34,40] 37 15 200 555 20535 46 200 1702 62974 ∑ 200 3440 80120 200 5072 147968

xCI<95 = ∑(xi·ni)

n = 3440200 = 17,2

El intervalo mediano es n2 = 200 2 = 100 [10− 16]

Me = Lin f + n·k 100−Ni−1

ni ·ai = 10+ 100−7535 ·6= 14,28

xCI≥95 = ∑(xi·ni)

n = 5072200 = 25,36

s2 = ∑(xi−x)·ni n

= ∑ ni·x2i n

− x2 = 147968200 − 25,362 = 96,71

s= √ 96,71= 9,83

CV = s x = 9,8325,36 = 0,387

Problema 1.4. Un estudio consistió en anotar el número de palabras leídas en 15seg por un grupo de 120 sujetos disléxicos y 120 individuos normales. Teniendo en cuenta los resultados de la tabla:

Manuel Angel Barea Gómez 7

CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

Nº de palabras leidas Disléxicos nd Normales nn 25 o menos≡ 25 56 1

26 24 9 27 16 21 28 12 29 29 10 28

30 o más ≡ 30 2 32

Calcule:

(a) Las medias aritméticas de ambos grupos.

(b) Las medianas de ambos grupos.

(c) El porcentaje de sujetos disléxicos que superaron la mediana de los normales.

(d) Compare la variabilidad relativa de ambos grupos.

Nº de palabras leidas nd Nd xi ·ndi x2i ·ndi nn Nn xi ·nni x2i ·nni 25 o menos≡ 25 56 56 1400 35000 1 1 25 625

26 24 80 624 16224 9 10 234 6084 27 16 96 432 11664 21 31 567 15309 28 12 108 336 9408 29 60 812 22736 29 10 118 290 8410 28 88 812 23548

30 o más ≡ 30 2 120 60 1800 32 120 960 28800 ∑ 120 3142 82506 3410 97102

xd = ∑(xi·ni)

n = 3142120 = 26,18

xd = ∑(xi·ni)

n = 3410120 = 28,41

La mediana se encuentra en n2 = 120 2 = 60 para los disléxicosMe = 26 y para los normalesMen = 28.

El grupo de disléxicos superaron la mediana son 16+ 12+ 10+ 2= 40 El porcentaje de disléxicos que superan la mediana son es 40 120 = 0,33

s2d = ∑(xi−x)·ni

n =

∑ni·x2i n

− xd2 = 82506120 − 26,182 = 1,98

sd = √ 1,98= 1,407

CV = sd xd

= 1,40626,18 = 0,05

s2n = ∑(xi−x)·ni

n = ∑

ni·x2i n

− xn2 = 97102120 − 28,412 = 1,67

sd = √ 1,67= 1,29

CV = sd xd

= 12928,41 = 0,045

Problema 1.5. La tabla siguiente muestra la composición por edad, sexo y trabajo de un grupo de personas con tuberculosis pulmonar en la provincia de Vizcaya en el año 1979:

Manuel Angel Barea Gómez 8

CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

Edad Trabajadores No trabajadores Totales

Varón Mujer Total Varón Mujer Total Varón Mujer Total 14–19 2 1 3 25 40 65 27 41 68 19–24 10 4 14 20 36 56 30 40 70 24–29 32 10 42 15 50 65 47 60 107 29–34 47 12 59 13 34 47 60 46 106 34–39 38 8 46 10 25 35 48 33 81 39–44 22 4 26 7 18 25 29 22 51

(a) Representar gráficamente la distribución de frecuencias de aquellas personas trabajadoras que padecen tuberculosis.

(b) Representar gráficamente la distribución de frecuencias de los varones no trabajadores que padecen tuberculosis.

(c) Representar gráficamente la distribución de frecuencias del número total de mujeres que padecen tuberculosis.

(d) ¿Por debajo de qué edad está el 50% de los varones?

(e) ¿Por encima de qué edad se encuentra el 80% de las mujeres?

(f) Obtener la media, mediana y desviación típica de la distribución de las edades de la muestra total.

1

1

1 1

1

1

20 25 30 35 40

0 10

20 30

40

Trabajadores con tuberculósis

Edad

P ob

la ci

ón

2

2

2

2

2

2

1 2

Mujer Varón

20 25 30 35 40

10 15

20 25

No trabajadores varones con tubercólisis

Edad

V ar

ón

20 25 30 35 40

30 40

50 60

Total de mujeres con tuberculósis

Edad

M uj

er es

Manuel Angel Barea Gómez 9

CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

Edad Varón Ni 14–19 27 27 19–24 30 57 24–29 47 104 29–34 60 164 34–39 48 212 39–44 29 241

n 2 =

241 2 = 120,5 Luego está en el intervalo [29− 34]

Me = Lin f + n·k 100−Ni−1

ni ·ai = 29+ 120,5−10460 ·5= 30,375

Edad Mujer Ni 14–19 41 41 19–24 40 81 24–29 60 141 29–34 46 187 34–39 33 220 39–44 22 242

Las mujeres que se encuentran por encima el 80% de las mujeres, es lo mimo que hallar P20, el intervalo para este percentil es n·k 100 =

242·20 100 = 48,4 Luego el intervalo es [19− 24]

Me = Lin f + n·k 100−Ni−1

ni ·ai = 19+ 48,4−4140 ·5= 19,925

Edad xi ni Ni xi ·ni x2i ·ni 14–19 16,5 68 68 1122 18513 19–24 21,5 70 138 1505 32358 24–29 26,5 107 245 2836 75141 29–34 31,5 106 351 3339 105179 34–39 36,5 81 432 2957 107912 39–44 41,5 51 483 2117 87835

∑ 483 13874,50 426936,75

x= ∑(xi·ni) n

= 13874,50483 = 28,72

s2 = ∑(xi−x)·ni n

= ∑ ni·x2i n

− x2 = 426936,75483 − 28,722 = 58,76

s= √ 59,76= 7,66.

n 2 =

483 2 = 241,5 Luego está en el intervalo [24− 29]

Me = Lin f + n·k 100−Ni−1

ni ·ai = 24+ 241,5−138107 ·5= 28,83

Problema 1.6. En una epidemia de escarlatina, se ha recogido el número de muertos en 40 ciudades de un país, obteniéndose la siguiente tabla:

Manuel Angel Barea Gómez 10

CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

Nª de muertos 0 1 2 3 4 5 6 7 Ciudades 7 11 10 7 1 2 1 1

(a) Representar gráficamente estos datos.

(b) Obtener la distribución acumulada y representarla.

(c) Calcular media, mediana y moda.

(d) Calcular la varianza y la desviación típica.

(e) Porcentaje de ciudades con al menos 2 muertos.

(f) Porcentaje de ciudades con más de 3 muertos.

(g) Porcentaje de ciudades con a lo sumo 5 muertos.

0 1 2 3 4 5 6 7

2 4

6 8

10

Nº de muertos por ciudad

Muertes

C iu

da de

s

Muertes ni Ni fi Fi xi ·ni x2i ·ni 0 7 7 0,18 0,18 0 0 1 11 18 0,28 0,45 11 11 2 10 28 0,25 0,70 20 40 3 7 35 0,18 0,88 21 63 4 1 36 0,03 0,90 4 16 5 2 38 0,05 0,95 10 50 6 1 39 0,03 0,98 6 36 7 1 40 0,03 1,00 7 49 ∑ 40 79 265

Manuel Angel Barea Gómez 11

CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

0 2 4 6 8

0. 0

0. 2

0. 4

0. 6

0. 8

1. 0

Distribucion de frecuencia acumulada

Edad

F re

cu en

ci a

x= ∑(xi·ni) n

= 7940 = 1,97,Me = 2 yM0 = 1

s2 = ∑(xi−x)·ni n

= ∑ ni·x2i n

− x2 = 26540 − 1,972 = 2,72

s= √ 2,72= 1,6

El porcentaje de ciudades con al menos 2 muertos es igual 1−P(X < 2) = 1− 0,45= 0,55. El porcentaje de ciudades con al menos 2 muertos es igual 1−P(X ≤ 3) = 1− 0,88= 0,12. El porcentaje con a lo sumo 5 muertes 0,95

Problema 1.7. Se le ha tomado la temperatura corporal a un grupo de pacientes afectados de gripe, con los resultados siguientes:

Temperatura ºC 37 37,2 37,5 38 38,1 38,5 39 Nº pacientes 1 5 15 6 10 5 2

Calcule:

(a) Media aritmética.

(b) Moda y mediana.

(c) Coeficiente de variación de Pearson.

xi ni Ni xi ·ni x2i ·ni 37,00 1 1 37 1369 37,20 5 6 186 6919 37,50 15 21 563 21094 38,00 6 27 228 8664 38,10 10 37 381 14516 38,50 5 42 193 7411 39,00 2 44 78 3042

∑ 44 1665 63015,30

x= ∑(xi·ni) n

= 166544 = 37,82º

Manuel Angel Barea Gómez 12

CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

M0 = 37,5º y n 2 =

44 2 = 22así queMe = 38º

s2 = ∑ (xi−x)·ni

n =

∑ni·x2i n

− x2 = 6305,30544 − 37,822 = 0,2471

s= √ 0,2471= 0,4971

CV = s x = 0,247137,92 = 0,013º

Problema 1.8. Un ecólogo está interesado en el tamaño de la hoja de una determinada especie vegetal. Para ello recoge una muestra con los siguientes resultados:

Longitud cm 2,5 3,2 4 5,5 5,8 6,1 Nº hojas 2 4 9 6 6 3

Determine los valores de:

(a) Primer y tercer cuartiles.

(b) Moda y mediana.

(c) Percentiles 42 y 86

xi ni Ni xi ·ni x2i ·ni 2,50 2 2 5 13 3,20 4 6 13 41 4,00 9 15 36 144 5,50 6 21 33 182 5,80 6 27 35 202 6,10 3 30 18 112

∑ 30 139,90 692,43

30 4 = 7,5 así que Q1 = 4

30·3 4 = 22,5 así que Q3 = 5,80

M0 = 4 yMe = 4

30·42 100 = 12,6→ P42 = 6 y 30·86100 = 25,8→ P86 = 5,80

Problema 1.9. La siguiente distribución de frecuencias se refiere a las edades de los empleados de una empresa:

Intervalos Frecuencia 16-22 11 22-28 15 28-34 32 34-40 28 40-46 16 46-52 25 52-58 14 58-64 10 64-70 6

Manuel Angel Barea Gómez 13

CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

Calcule:

(a) Media aritmética, intervalo mediano, mediana, intervalo modal, cuartiles de primer y tercer orden, percentiles 32 y 81.

(b) Desviación típica, coeficiente de variación de Pearson y recorrido semiintercuartílico.

Intervalos xi ni Ni xi ·ni x2i ·ni 16-22 19 11 11 209 3971 22-28 25 15 26 375 9375 28-34 31 32 58 992 30752 34-40 37 28 86 1036 38332 40-46 43 16 102 688 29584 46-52 49 25 127 1225 60025 52-58 55 14 141 770 42350 58-64 61 10 151 610 37210 64-70 67 6 157 402 26934

∑ 157 6307 278533

x= ∑(xi·ni) n

= 6307157 = 40,17

El intervalo mediano n2 = 157 2 = 78,5 será [34− 40]

Me = Lin f + n·k 100−Ni−1

ni ·ai = 34+ 78,5−5837 ·6= 37,32

El intervalo modal es [28− 34] El primer cuartil n4 =

157 4 = 39,25 luego se encuentra en el intervalo [28− 34]

Q1 = Lin f + n·k 100−Ni−1

ni ·ai = 28+ 39,25−2632 ·6= 30,48

El tercer cuartil 3·n4 = 3·157 4 = 117,75 luego se encuentra en el intervalo [46− 52]

Q3 = Lin f + n·k 100−Ni−1

ni ·ai = 46+ 117,75−10225 ·6= 49,78

El percentil 32 k·n100 = 32·157 100 = 50,24 luego se encuentra en el intervalo [28− 34]

P32 = Lin f + n·k 100−Ni−1

ni ·ai = 28+ 50,24−2632 ·6= 32,54

El percentil 81 k·n100 = 81·157 100 = 127,17 luego se encuentra en el intervalo [52− 58]

P81 = Lin f + n·k 100−Ni−1

ni ·ai = 52+ 127,17−12710 ·6= 52,10

s2 = ∑(xi−x)·ni n

= ∑ ni·x2i n

− x2 = 278533157 − 40,172 = 160,30

s= √ 160,30= 12,66

CV = s x = 12,6640,17 = 0,315

Rsi = Q3−Q1

2 = 49,78−30,48

2 = 0,65

Manuel Angel Barea Gómez 14

CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

Problema 1.10. Dadas las observaciones siguientes:

11 23 26 20 20 27 15 26 21 31 15 13 20 24 10 33 29 25 16 27 19 25 27 22 28 29 29 20 18 20

(a) Agrupe los datos en cinco intervalos de longitud constante, comenzando por el valor 10.

(b) Utilizando los intervalos anteriores, calcule: media, intervalo mediano, mediana, intervalo modal,

(c) cuartiles de primer y tercer orden y el percentil 82.

(d) desviación típica, coeficiente de variación y recorrido intercuartílico.

Intervalos xi ni Ni xi ·ni x2i ·ni 10-15 12,5 3 3 37,5 468,75 15-20 17,5 5 8 87,5 1531,25 20-25 22,5 9 17 202,5 4556,25 25-30 27,5 11 28 302,5 8318,75 30-35 32,5 2 30 65 2112,5

∑ 30 695 16987,5

x= ∑(xi·ni) n

= 69530 = 23,2

El intervalo mediano n2 = 30 2 = 15 será [20− 25]

Me = Lin f + n·k 100−Ni−1

ni ·ai = 20+ 15−89 ·5= 23,8

El intervalo modal es [25− 30] El primer cuartil n4 =

15 4 = 3,75 luego se encuentra en el intervalo [15− 204]

Q1 = Lin f + n·k 100−Ni−1

ni ·ai = 14+ 3,75−365 ·5= 19,5

El tercer cuartil 3·n4 = 3·30 4 = 11,25 luego se encuentra en el intervalo [20− 25]

Q3 = Lin f + n·k 100−Ni−1

ni ·ai = 20+ 11,25−95 ·5= 27,5

El percentil 82 k·n100 = 82·30 100 = 24,6 luego se encuentra en el intervalo [25− 30]

P82 = Lin f + n·k 100−Ni−1

ni ·ai = 25+ 24,6−1711 ·5= 28,5

s2 = ∑(xi−x)·ni n

= ∑ ni·x2i n

− x2 = 16987,530 − 23,22 = 29,16

s= √ 29,16= 5,4

CV = s x = 5,423,2 = 0,2346

RI = Q3−Q1 = 27,5− 19,5= 8

Problema 1.11. En un estudio acerca del comportamiento de la mosca del vinagre Drosophila melanogaster, un biólogo midió el tiempo en segundos que una mosca pasaba aseándose en un determinado periodo de 6 minutos de duración. Los tiempos de aseo

observados para 20 moscas distintas fueron:

Manuel Angel Barea Gómez 15

CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

34 24 10 16 52 76 33 31 46 24 18 26 57 32 25 48 22 48 29 19

(a) Construya un diagrama de tallo y hojas para este conjunto de datos.

(b) Calcule el valor del coeficiente de variación de Pearson.

1 0689 2 244569 3 1234 4 688 5 27 6 7 6

x= ∑(xi·ni) n

= 34+24+..+29+1920 = 32,55

s2 = ∑(xi−x)·ni n

= ∑ ni·x2i n

− x2 = 2714120 − 32,552 = 297,54

s= √ 297,54= 17,25

CV = s x = 17,2532,55 = 0,53

Problema 1.12. Al examinar 158 casos de parálisis de Bell se anotaron las diferentes terapias seguidas por estos pacientes, resul- tando el conjunto de datos:

C Corticoides

DQ Descomprensiónquirúrgica

ET Electroterapia

NT Ningúntratamiento

OT Otrasmodalidades

Tratamiento C DQ ET NT OT Nº de pacientes 73 36 19 21 9

(a) Obtenga la tabla de frecuencias e indique qué porcentaje de pacientes toma corticoides.

(b) Construya el diagrama de sectores.

xi ni Ni fi Fi C 73 73 0,46 0,46 DQ 36 109 0,23 0,69 ET 19 128 0,12 0,81 NT 21 149 0,13 0,94 OT 9 158 0,06 1,00 ∑ 158

Toman corticoides el 46% de los pacientes.

Manuel Angel Barea Gómez 16

CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

C

DQ

ET

NT

OT

Terapias

Problema 1.13. Los siguientes datos representan el número de días de hospitalización por una apendicectomía:

Nº de días 3 4 5 6 7 8 más de 8 Nº de casos 15 58 43 22 8 3 1

(a) Obtener la media y la varianza, así como los coeficientes de asimetría, curtosis y variación.

(b) Representar el correspondiente diagrama de barras.

Nº de días xi ni Ni xi ·ni x2i ·ni (xi− x)3 ·ni (xi− x)4 ·ni 3 3 15 15 0,10 0,10 -80,85 141,76 4 4 58 73 0,39 0,49 -24,80 18,68 5 5 43 116 0,29 0,77 0,65 0,16 6 6 22 138 0,15 0,92 42,63 53,14 7 7 8 146 0,05 0,97 90,72 203,82 8 8 3 149 0,02 0,99 102,67 333,33

más de 8 9 1 150 0,01 1,00 76,59 325,23 ∑ 150 713 3595 207,60 1076,12

x= ∑(xi·ni) n

= 713150 = 4,75

s2 = ∑(xi−x)·ni n

= ∑ ni·x2i n

− x2 = 3539150 − 4,752 = 1,37

s= √ 1,37= 1,17

CV = s x = 1,174,75 = 0,25

C.A.= ∑(xi−x) 3·ni

n·s3 = 297,60

150·1,173 = 0,864

K = ∑ (xi−x)4·ni n·s4 − 3=

1076,12 150·1,174 − 3= 0,8085

Manuel Angel Barea Gómez 17

CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

3 4 5 6 7 8 9

Dias de hospitalizacion

Dias

n

0 10

20 30

40 50

Problema 1.14. La siguiente tabla muestra la distribución de edades de 75 casos de una determinada enfermedad durante un año y en un hospital determinado:

Edad Nº de casos 5-15 5 15-25 10 25-35 20 35-45 22 45-55 13 55-65 5

(a) Calcular la media, mediana, varianza, desviación típica y coeficiente de variación.

Edad xi ni Ni xi ·ni x2i ·ni 5-15 10 5 5 50 500 15-25 20 10 15 200 4000 25-35 30 20 35 600 18000 35-45 40 22 57 880 35200 45-55 50 13 70 650 32500 55-65 60 5 75 300 18000

∑ 75 2680 108200

x= ∑(xi·ni) n

= 268075 = 35,73

s2 = ∑ (xi−x)·ni

n =

∑ni·x2i n

− x2 = 10820075 − 35,7352 = 165,80

s= √ 165,80= 12,887

CV = s x = 12,8835,73 = 0,36

El intervalo mediano n2 = 75 2 = 37,5 será [35− 45]

Me = Lin f + n·k 100−Ni−1

ni ·ai = 35+ 37,5−3522 ·10= 36,14

Manuel Angel Barea Gómez 18

CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

Problema 1.15. Como parte de un proyecto de investigación, cierto investigador obtuvo los siguientes niveles de SLP de una muestra de 10 individuos adultos bajo tratamiento de Diabetes Mellitus:

5,85 6,17 6,09 7,70 3,17 3,83 5,17 4,31 3,09 5,24

(a) Calcular la media, mediana, varianza y desviación típica.

(b) Si el investigador se da cuenta de que el aparato utilizado para medir los niveles de SLP está defectuoso y ha medido sis-

temáticamente 2 unidades por debajo de su valor real, ¿tiene que volver a realizar las mediciones?. ¿Cuál es el valor de la

media y la desviación típica de los nuevos datos?

Nivel SLP xi ni Ni xi ·ni x2i ·ni 5,85 1 1 6 34 6,17 1 2 6 38 6,09 1 3 6 37 7,70 1 4 8 59 3,17 1 5 3 10 3,83 1 6 4 15 5,17 1 7 5 27 4,31 1 8 4 19 3,09 1 9 3 10 5,24 1 10 5 27 ∑ 10 50,62 275,70

x= ∑(xi·ni) n

= 50,6210 = 5,06

s2 = ∑(xi−x)·ni n

= ∑ ni·x2i n

− x2 = 275,7010 − 5,062 = 1,95

s= √ 1,95= 1,39

La mediana se encuentra en n2 = 10 2 = 5 que le correspondeMe = 3,17

Teorema. Si a cada observación de una distribución X se le suma una constante k (traslación), se tiene una nueva variable Y = X+ k con media igual a la de X más la constante k. Si se le suma una constante a una variable, la varianza de la nueva variable no cambia.

Por las anteriores propiedades de la media y la varianza, los nuevos estadísticos serán x= 7,06 y s2 = 1,95

Problema 1.16. Se ha realizado con 100 mujeres un estudio sobre la edad en la que comenzaron a utilizar anticonceptivos orales. Los datos, agrupados en clases, están en el siguiente cuadro:

Clases ni Ni fi 13-25 23 25-37 33 37-49 72 49-61 90 61-73 10

(a) Completar las columnas de frecuencias absolutas ni, frecuencias acumuladas Ni y frecuencias relativas fi.

(b) Calcular la media y desviación típica de la distribución de frecuencias. ¿Es la edad media un buen representante de los datos?

Manuel Angel Barea Gómez 19

CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

(c) Calcular la mediana y el percentil 70.

Clases xi ni Ni fi xi ·ni x2i ·ni 13-25 19 23 23 0,23 437 8303 25-37 31 33 56 0,33 1023 31713 37-49 43 16 72 0,16 688 29584 49-61 55 18 90 0,18 990 54450 61-73 67 10 100 0,10 670 44890

∑ 100 3808 168940

x= ∑(xi·ni) n

= 3808100 = 38,08

s2 = ∑(xi−x)·ni n

= ∑ ni·x2i n

− x2 = 168940100 − 38,082 = 239,31

s= √ 239,31= 15,47.

La media no es una buena representación de los datos ya queCV = s x = 15,4738,05 = 0,41 y no está próximo al cero.

El intervalo mediano n2 = 100 2 = 50 será [25− 37]

Me = Lin f + n·k 100−Ni−1

ni ·ai = 25+ 50−2333 ·12= 34,82

El percentil 70 k·n100 = 70·100 100 = 70 luego se encuentra en el intervalo [37− 49]

P70 = Lin f + n·k 100−Ni−1

ni ·ai = 37+ 70−5616 ·12= 47,5

Problema 1.17. Se ha realizado un estudio para valorar el efecto del alcohol sobre los niveles de colesterol en suero. Para ello, se ha recogido la cantidad de alcohol consumido por semana (en gr.) de 100 sujetos, obteniéndose la siguiente tabla de frecuencias

absolutas acumuladas:

Consumo [0,50) [50− 100) [100,150) [150,200) [200,250) Ni 25 60 90 98 100

(a) Calcular el porcentaje de sujetos que consumen entre 100 y 200 gr. de alcohol a la semana.

(b) Calcular el consumo medio.

(c) Calcular el número de sujetos que hay entre el percentil 15 y el cuartil tercero.

(d) Obtener la mediana de la distribución de frecuencias.

Clases xi ni Ni fi xi ·ni x2i ·ni [0,50) 25 25 25 0,25 625 15625

[50− 100) 75 35 60 0,35 2625 196875 [100,150) 125 30 90 0,30 3750 468750 [150,200) 175 8 98 0,08 1400 245000 [200,250) 225 2 100 0,02 450 101250

∑ 100 8850 1027500

El porcentaje de sujetos que consumen [100,200) = 0,30+ 0,08= 0,38

x= ∑(xi ·ni) n

= 8850100 = 88,5gr

Manuel Angel Barea Gómez 20

CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

Como tenemos que n= 100 Q3−P15 = 0,75− 0,15= 0,60 luego el número de individuos será 60. El intervalo mediano n2 =

100 2 = 50 será [50− 100]

Me = Lin f + n·k 100−Ni−1

ni ·ai = 50+ 50−2535 ·50= 85,71gr

Problema 1.18. Se ha medido la tasa de glucosa en sangre a un grupo de 350 individuos. Los datos agrupados en 7 intervalos de amplitud 10mg/100ml se presentan en la siguiente tabla:

Intervalos ni 65-75 14 75-85 42 85-95 63 95-105 84 105-115 70 115-125 125-135

(a) Calcular la desviación típica de los datos, sabiendo que la media es 101,6mg/100ml.

(b) ¿Qué valor de tasa de glucosa es superado por el 40% de los datos?

Clases xi ni Ni xi ·ni x2i ·ni 65-75 70 14 14 980 68600 75-85 80 42 56 3360 268800 85-95 90 63 119 5670 510300 95-105 100 84 203 8400 840000 105-115 110 70 273 7700 847000 115-125 120 56 329 6720 806400 125-135 130 21 350 2730 354900

∑ 350 35560 3696000

Llamamos a y b a los valores desconocidos ni de los intervalos [115− 125] y [125− 135] respectivamente. x = ∑(xi·ni)n = 101,6 y n= 350, por lo que podemos extraer un sistema de dos ecuaciones con dos incógnitas:

a+ b= 77 120 ·a+ 130 ·b= 9450

}

Resolviendo

{

a= 56 b= 21

s2 = ∑(xi−x)·ni n

= ∑ni·x2i

n − x2 = 3696000350 − 101,62 = 237,441

s= √ 237,44= 15,42mg/100ml.

Superan el 40% de los datos aquellos que están por encima del percentil 60. El percentil 60 k·n100 =

60·350 100 = 210 luego se encuentra en el intervalo [105− 115]

P60 = Lin f + n·k 100−Ni−1

ni ·ai = 105+ 210−20370 ·10= 106

Problema 1.19. Para realizar un estudio que pretende valorar el proceso de crecimiento en 250 niños de edad similar, se ha utilizado el índice de masa corporal (IMC) o índice de Quetelet (Peso en kg/m2 ). Los datos agrupados en 6 intervalos junto con la mayoría de sus frecuencias relativas ( fi ), se presentan en la siguiente tabla:

Manuel Angel Barea Gómez 21

CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

Peso Intervalos fi Bajo [15− 18) 0,04

Normal-Bajo [18− 20) 0,12 Normal [20− 25) 0,40

Normal-Alto [25− 27) Sobrepeso [27− 30) 0,16 Obesidad [30− 35] 0,12

(a) ¿Cuál es el IMC que superan el 50% de los niños de este estudio?

(b) ¿Qué% de niños tienen un IMC superior a 22 kg/m2 ?

Peso Intervalos ni Ni fi Fi Bajo [15− 18) 10 10 0,04 0,04

Normal-Bajo [18− 20) 30 40 0,12 0,16 Normal [20− 25) 100 140 0,40 0,56

Normal-Alto [25− 27) 40 180 0,16 0,72 Sobrepeso [27− 30) 40 220 0,16 0,82 Obesidad [30− 35] 30 250 0,12 1

Para hallar el IMC qu supera el 50% debemos hallar la mediana. El intervalo mediano n2 =

250 2 = 125 será [20− 25]

Me = Lin f + n·k 100−Ni−1

ni ·ai = 20+ 125−40100 ·5= 24,25 gr/dl

Para conocer el IMC superior a 22 kg/m2. Sabemos que el intervalo será [20− 25]

P= Lin f + n·k 100−Ni−1

ni ·ai = 20+

n·k 100−40 100 ·5= 22, despejando

n·k 100 =

(22−20)·100 5 + 40= 80 luego k =

80·100 250 = 0,32

Como lo que nos piden son los que están por encima de P32 = 1− 0,32= 0,68

Problema 1.20. Con el objetivo de determinar la presencia de anemia en mujeres embaraza- das, se midieron los valores de hemoglobina (gr/dl) al final del primer trimestre en un grupo de 200 embarazadas que no seguían ningún tratamiento paralelo. La siguiente tabla presenta los porcentajes de embarazadas que se incluyeron en cada una de las categorías:

Hemoglobina gr/dl fi [9,0−9,8) 10% [9,8−10,6) 40% [10,6−11,4) 30% [11,4−12,2) 15% [12,2−13,0) 5%

A partir de estos datos:

(a) El porcentaje de mujeres que presentaban anemia es decir, que tenían valores de hemoglobina por debajo de 11 gr/dl

(b) Determinar la media, la mediana y la desviación típica de los datos. ¿Es la media un buen representante de los datos?

Manuel Angel Barea Gómez 22

CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

Hemoglobina gr/dl xi ni Ni fi Fi xi ·ni x2i ·ni [9,0−9,8) 9,4 20 20 0,10 0,10 188 1767 [9,8−10,6) 80 80 100 0,40 0,50 816 8323 [10,6−11,4) 90 60 160 0,30 0,80 660 7260 [11,4−12,2) 100 30 190 0,15 0,95 354 4177 [12,2−13,0) 110 10 200 0,05 1,00 126 1588

∑ 200 2144 23115,20

Para conocer el porcentaje de mujeres con anemia es decir inferior a 11 gr/dl. Sabemos que el intervalo será [10,6− 11,4]

P= Lin f + n·k 100−Ni−1

ni ·ai = 10,6+

n·k 100−100

60 ·0,8= 11, despejando

n·k 100 =

(10,6−11)·60 0,8 + 100= 130 luego k =

130·100 200 = 0,65

x= ∑(xi·ni) n

= 2144200 = 10,72

s2 = ∑(xi−x)·ni n

= ∑ni·x2i

n − x2 = 23115,20200 − 10,722 = 0,66

s= √ 0,66= 0,81.

La media es una buena representación de los datos ya queCV = s x = 0,8110,72 = 0,08 y está próximo al cero.

El intervalo mediano n2 = 200 2 = 100 será [9,8− 10,6]

Me = 10,6 ya que coincide con el limite superior.

Problema 1.21. La siguiente tabla nos muestra (en miles) el número de embarazos registrados en España a lo largo del año 1996, según los diferentes grupos de edad:

Edad <20 [20−25) [25−30) [30−35) [35−40) [40−45) ni 12 34 84 92 37 8

(a) Calcular la edad media de los embarazos así como los cuartiles.

(b) ¿Que% quedó embarazada con más de 28 años de edad?

Edad xi ni Ni fi Fi xi ·ni x2i ·ni <20 17,5 12 12 0,04 0,04 210 3675

[20−25) 22,5 34 46 0,13 0,17 765 17213 [25−30) 27,5 84 130 0,31 0,49 2310 63525 [30−35) 32,5 92 222 0,34 0,83 2990 97175 [35−40) 37,5 37 259 0,14 0,97 1388 52031 [40−45) 42,5 8 267 0,03 1,00 340 14450

∑ 267 8002,50 248068,75

x= ∑(xi ·ni) n

= 8002,50267 = 29,97

Para hallar Q1 k·n 100 =

25·267 100 = 66,75 el intervalo que lo contiene es [25−30)

Q1 = Lin f + n·k 100−Ni−1

ni ·ai = 25+ 66,75−4684 ·5= 26,23

Para hallar Q3 k·n100 = 75·267 100 = 200,25 el intervalo que lo contiene es [30−35)

Manuel Angel Barea Gómez 23

CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

Q3 = Lin f + n·k 100−Ni−1

ni ·ai = 30+ 200,25−13092 ·5= 33,82

El intervalo mediano n2 = 267 2 = 133,5 será [30− 35]

Me = Lin f + n·k 100−Ni−1

ni ·ai = 30+ 133,5−13092 ·5= 30,19

Para conocer el porcentaje de mujeres mayores de 28 años que se quedaron embarazadas. Sabemos que el intervalo será [25− 30]

P= Lin f + n·k 100−Ni−1

ni ·ai = 25+

n·k 100−46 84 ·5= 28, despejando

n·k 100 =

(28−25)·92 5 + 46= 96 luego k =

96·100 267 = 36,10

Como lo que nos piden son los que están por encima de P28 = 1− 0,361= 0,6398

Problema 1.22. En un reconocimiento médico realizado a los 1000 trabajadores de una factoría industrial, se ha medido la tensión arterial sistólica (mm.Hg) obteniendo la siguiente distribución de frecuencias. Completar la tabla sabiendo que la mediana de los datos es 138mm.Hg

Categoría Intervalo ni Óptima [110− 120] Normal (120− 130] 120

Normal-Elevada (130− 140] 350 HTA-Leve (140− 160] 260

HTA-Moderada (160− 180] 120 HTA-Severa (180− 220]

Llamamos a y b a las incógnitas del primer y último intervalo y construimos nuestra tabla.

Categoría Intervalo ni Ni Óptima [110− 120] a a Normal (120− 130] 120 120+a

Normal-Elevada (130− 140] 350 470+a HTA-Leve (140− 160] 260 730+a

HTA-Moderada (160− 180] 120 850+a HTA-Severa (180− 220] b 850+a+b

Del enunciado 1000= a+ b+ 850→ 150= a+ b. De la mediana Me = Lin f +

n·k 100−Ni−1

ni ·ai = 130+ 500−(470+a)350 ·10= 138 luego 470+ a=−

[

(138−130)·350 10 − 500

]

→ a = 100 y susti- tuyendo en la primera ecuación b= 150− 100= 50

Problema 1.23. La siguiente tabla recoge la distribución de frecuencias de triglicéridos (en mg/dl) en el suero de un grupo de niños con 6 años. Completar la tabla sabiendo que el percentil 20 de esta distribución es 32mg/dl.

Nivel de triglicéridos 10-20 20-30 30-40 40-50 50-60 60-70 70-80 80-90 ni 10 15 24 18 12 4 2

Manuel Angel Barea Gómez 24

CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

Nivel de triglicéridos ni Ni 10-20 a a 20-30 10 10+a 30-40 15 25+a 40-50 24 49+a 50-60 18 67+a 60-70 12 79+a 70-80 4 83+a 80-90 2 85+a

∑ 85+a

P20 = Lin f + n·k 100−Ni−1

ni ·ai = 10+

n·k 100−(10+a)

10 ·10= 32, despejando

n·k 100 =

(32−10)·10 105 + 10+ a= 13+ a luego n=

(13+a)·100 20 = 85+ a resolviendo a= 5

Problema 1.24. Uno de los medicamentos antivirales que se utilizan para combatir el virus de la gripe es la Amantadina. En un estudio sobre este medicamento se han administrado por vía oral dosis únicas de 100mg a 60 individuos adultos sanos. La variable estudiada (Tmax ) es el tiempo requerido en minutos para alcanzar la concentración máxima de plasma. La siguiente tabla recoge

frecuencia relativas acumuladas (Fi ) de los datos del estudio:

Tmax Fi [100− 120] 0,25 [120− 140] 0,75 [140− 160] 0,90 [160− 180] 0,95 [180− 200]

(a) Determinar media, mediana y desviación típica de esta distribución.

(b) ¿Qué transformación lineal debemos realizar sobre estos datos para que los datos transformados tengan media 0 y desviación

típica 5?

Tmax xi ni Ni fi Fi xi ·ni x2i ·ni [100− 120] 110 15 15 0,25 0,25 1650 181500 [120− 140] 130 30 45 0,50 0,75 3900 507000 [140− 160] 150 9 54 0,15 0,90 1350 202500 [160− 180] 170 3 57 0,05 0,95 510 86700 [180− 200] 190 3 60 0,05 1,00 570 108300

∑ 60 7980 1086000

x= ∑(xi·ni) n

= 798060 = 133

s2 = ∑(xi−x)·ni n

= ∑ni·x2i

n − x2 = 108600060 − 1332 = 411

s= √ 411= 20,27.

El intervalo mediano n2 = 60 2 = 30 será [120− 140]

Me = Lin f + n·k 100−Ni−1

ni ·ai = 120+ 30−1530 ·20= 130

Manuel Angel Barea Gómez 25

Muy útil
no hay archivo
Esta solo es una vista previa
3 páginas mostradas de 154 páginas totales