Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Análisis Estadístico de Datos Reales: Ejercicios y Aplicaciones, Ejercicios de Bioestadística

Tarea con ejercicios resueltos en R sobre bioestadistica

Tipo: Ejercicios

2021/2022

Subido el 13/02/2023

vanessa-celis-4
vanessa-celis-4 🇨🇴

3 documentos

1 / 4

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Tarea 3
Vanessa Celis
2022-08-13
1. IMC de Miss América La tendencia de elegir ganadoras muy delgadas en el concurso
Miss América ha provocado que se le acuse de fomentar habitas dietéticos poco
saludables entre las mujeres jóvenes. A continuación, se presentan los índices de
masa corporal (IMC) de las ganadoras del concurso Miss américa en dos periodos
diferentes.
IMC (de la década de 1920 a la de 1930): 20.4, 21.9 ,22.1, 22.3, 20.3, 18.8 ,18.9, 19.4, 18.4,
19.1
IMC (de ganadoras recientes): 19.5, 20.3 ,19.6, 20.2, 17.8, 17.9, 19.1, 18.8, 17.6, 16.8 calcule
el coeficiente de variación y compare la variación.
d<-c(20.4, 21.9 ,22.1, 22.3, 20.3, 18.8 ,18.9, 19.4, 18.4, 19.1)
a<-c(19.5, 20.3 ,19.6, 20.2, 17.8, 17.9, 19.1, 18.8, 17.6, 16.8)
#Coeficiente de variación para d.
cvd<-sd(d)/mean(d)*100
cvd
## [1] 7.335756
El coeficiente de variación para d en la decada de los 20 y los 30 es de 7,335756%
cva<-sd(a)/mean(a)*100
cva
## [1] 6.323119
El coeficiente de variación para a en la actualidad es de 6,323119%
El indice de de variabilidad mas alto es el de la decada de los 20 y los 30.
2. El costo de las compras que realizaron los consumidores, como vivienda unifamiliar,
gasolina, servicios de Internet, declaración de impuestos y hospitalización fue
difundido en un artículo de The Wall Street Journal (2 de enero de 2007). Los datos
muéstrales típicos sobre el costo de la declaración de impuestos por servicios tales
como H&R Block se muestran en seguida. 120, 230, 110, 115, 160, 130, 150, 105,
195,155,105, 360, 120, 120, 140, 100, 115, 180, 235, 255
i<-c(120, 230, 110, 115, 160, 130, 150, 105, 195,155,105, 360, 120,
120, 140, 100, 115, 180, 235, 255)
a) Determine el primer y el tercer cuartil.
pf3
pf4

Vista previa parcial del texto

¡Descarga Análisis Estadístico de Datos Reales: Ejercicios y Aplicaciones y más Ejercicios en PDF de Bioestadística solo en Docsity!

Tarea 3

Vanessa Celis

1. IMC de Miss América La tendencia de elegir ganadoras muy delgadas en el concurso

Miss América ha provocado que se le acuse de fomentar habitas dietéticos poco

saludables entre las mujeres jóvenes. A continuación, se presentan los índices de

masa corporal (IMC) de las ganadoras del concurso Miss américa en dos periodos

diferentes.

IMC (de la década de 1920 a la de 1930): 20.4, 21.9 ,22.1, 22.3, 20.3, 18.8 ,18.9, 19.4, 18.4,

IMC (de ganadoras recientes): 19.5, 20.3 ,19.6, 20.2, 17.8, 17.9, 19.1, 18.8, 17.6, 16.8 calcule

el coeficiente de variación y compare la variación.

d<-c(20.4, 21.9 ,22.1, 22.3, 20.3, 18.8 ,18.9, 19.4, 18.4, 19.1) a<-c(19.5, 20.3 ,19.6, 20.2, 17.8, 17.9, 19.1, 18.8, 17.6, 16.8)

#Coeficiente de variación para d.

cvd<-sd(d)/mean(d)* 100 cvd

[1] 7.

El coeficiente de variación para d en la decada de los 20 y los 30 es de 7,335756%

cva<-sd(a)/mean(a)* 100 cva

[1] 6.

El coeficiente de variación para a en la actualidad es de 6,323119%

El indice de de variabilidad mas alto es el de la decada de los 20 y los 30.

2. El costo de las compras que realizaron los consumidores, como vivienda unifamiliar,

gasolina, servicios de Internet, declaración de impuestos y hospitalización fue

difundido en un artículo de The Wall Street Journal (2 de enero de 2007). Los datos

muéstrales típicos sobre el costo de la declaración de impuestos por servicios tales

como H&R Block se muestran en seguida. 120, 230, 110, 115, 160, 130, 150, 105,

i<-c( 120 , 230 , 110 , 115 , 160 , 130 , 150 , 105 , 195 , 155 , 105 , 360 , 120 , 120 , 140 , 100 , 115 , 180 , 235 , 255 )

a) Determine el primer y el tercer cuartil.

quantile(i)

0% 25% 50% 75% 100%

100.00 115.00 135.00 183.75 360.

El primer cuartil es 115 hasta donde se tiene el 25% de los datos. El tercer cuartil es 183,

hasta donde se tiene el 75% de los datos.

b) Calcule el interprete el percentil 90.

quantile(i,0.90)

90%

237

El percentil 90 es 237 y hasta ahí se tiene el 90% de los datos.

3. Utilizamos un conjunto de datos Aids2 de R que están en el

paquete MASS, este conjunto de datos es sobre pacientes diagnosticados con SIDA en Australia antes del 1 de julio de

  1. Las columnas son:

state : Estado de origen agrupado: “NSW” (Nueva Gales del Sur), incluye ACT (Territorio de

la capital australiana) y.” other” WA (Australia Occidental), SA (Australia Meridional), NT

(Territorio del Norte) y TAS (Tasmania).

sex : Sexo del paciente.

diag : Fecha de diagnóstico.

death : Fecha de muerte o finalización de la observación.

status : V.”(vivo) o “D”(muerto) al final de la observación.

T.categ : Categoría de transmisión notificada.

age : Edad (años) al momento del diagnóstico.

Fuente : Dr. PJ Solomon y el Centro Nacional Australiano de Epidemiología e Investigación

Clínica del VIH.

Referencias : Venables, WN y Ripley, BD (2002) Modern Applied Statistics con S. Cuarta

edición. Saltador.

a) Hallar un resumen de la edad (age) respecto al sexo (sex).

library(MASS) data("Aids2") View(Aids2) attach(Aids2) tapply(age, sex, summary)

## [1] 10.

El límite inferior es de 10.5; en el resumen encontramos que el dato mínimo es 0 años que

no corresponde al límite inferior, es decir que todas las edades por debajo de 10.5 años son

valores perdidos

El cuartil 1 es 30 años hasta ese valor se tiene el 25% de los datos. La mediana o cuartil 2 es

37 años, es decir hasta ese valor se tiene el 50% de los datos. El cuartil 3 es 43 años, es

decir hasta ese valor se tiene el 75% de los datos.

LIMITE SUPERIOR

Ls<- 43 +1.5* 13 Ls

[1] 62.

El límite superior es de 62.5; en el resumen encontramos que el valor máximo es de 82

años que no corresponde al límite superior, es decir que todas las edades superiores a 62.

son valores perdidos.

La gráfica se acerca a ser simétrica.

#Interpretación femenino

El límite inferior coincide con el dato mínimo en el resumen encontramos que este

corresponde a 0 años. El cuartil 1 es 26 años hasta ese valor se tiene el 25% de los datos. La

mediana o cuartil 33 es 37 años, es decir hasta ese valor se tiene el 50% de los datos. El

cuartil 3 es 50 años, es decir hasta ese valor se tiene el 75% de los datos.

El límite superior coincide con el dato máximo en el resumen encontramos que este

corresponde a 73 años. No hay valores perdidos. La gráfica es sesgada a la izquierda.