Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Ejercicios descriptiva. Estadística, Ejercicios de Estadística

Solución ejercicios descriptiva

Tipo: Ejercicios

2018/2019

Subido el 09/06/2019

Asusam
Asusam 🇪🇸

5

(1)

8 documentos

1 / 17

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
a) El experimento consiste en analizar los resultados obtenidos al plantar 5 semillas en
una serie de macetas
Los individuos que forman parte del estudio son una serie de macetas y se han medido dos
variables X = número de semillas que germinan cuantitativa discreta
Y = longitud del tallo brotado en mm cuantitativa continua
b) Tabla de datos para las semillas
de
semillas
ni
fi
Ni
Fi
0
17
0,06071429
17
0,06
1
53
0,18928571
70
0,25
2
94
0,33571429
164
0,58
3
79
0,28214286
243
0,86
4
33
0,11785714
276
0,98
5
4
0,01428571
280
1
280
Para obtener la amplitud intercuartil necesitamos los cuartiles. Q1 Fi = 0,25: (1+2)/2=1,5
Q3 Fi = 0,75: 3
AI = Q3-Q1 = 3-1,5 = 1,5: este el recorrido del 50% central de las macetas en lo que se refiere
al número de semillas. Es la diferencia entre el tercer y el primer cuartil
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff

Vista previa parcial del texto

¡Descarga Ejercicios descriptiva. Estadística y más Ejercicios en PDF de Estadística solo en Docsity!

a) El experimento consiste en analizar los resultados obtenidos al plantar 5 semillas en una serie de macetas

Los individuos que forman parte del estudio son una serie de macetas y se han medido dos variables X = número de semillas que germinan cuantitativa discreta

Y = longitud del tallo brotado en mm  cuantitativa continua

b) Tabla de datos para las semillas

nº de semillas

ni fi Ni Fi

0 17 0,06071429 17 0, 1 53 0,18928571 70 0, 2 94 0,33571429 164 0, 3 79 0,28214286 243 0, 4 33 0,11785714 276 0, 5 4 0,01428571 280 1 280

Para obtener la amplitud intercuartil necesitamos los cuartiles. Q1  Fi = 0,25: (1+2)/2=1,

Q3  Fi = 0,75: 3

AI = Q3-Q1 = 3-1,5 = 1,5: este el recorrido del 50% central de las macetas en lo que se refiere al número de semillas. Es la diferencia entre el tercer y el primer cuartil

c) El valor mínimo de semillas germinadas del 15% de macetas con más semillas germinadas corresponde con el P85  P85 = 3. d) La tendencia central de la longitud de los tallos viene descrita por la media: la longitud media es de 15,68 cm

Para analizar la dispersión en torno a la media se usa el Coeficiente de variación de Pearson (CV) que se define como el cociente entre la desviación típica y la media. Como es una cantidad relativa, ayuda a valorar la dispersión/representatividad de la media, en el sentido de establecer si es grande o pequeña. Cuanto menor sea el valor del CV, menor es la dispersión y por tanto mejor representa la media a los valores que toma la variable estadística La desviación típica es la raíz de la varianza y luego se calcula e interpreta el CV

e) Los valores que no son considerados datos atípicos son aquellos comprendidos entre el límite inferior y el límite superior del intervalo (Q1 −1.5 •AI, Q3 + 1.5 •AI). Las observaciones que caen fuera del intervalo se consideran datos atípicos (outliers). Q1 = 8 Q3=21 AI=21-8=13 límite inferior= 8-1,5x13= -11, Límite superior = 21+1,5x13 = 40, Como el mínimo de la variable es 3 y el máximo es 37, todos los valores se encuentran en el intervalo (Q1 −1.5 •AI, Q3 + 1.5 •AI) y no existen valores atípicos

f) Para analizar la representatividad de la media se usa el Coeficiente de variación de Pearson (CV) que se define como el cociente entre la desviación típica y la media. Como es una cantidad relativa, ayuda a valorar la dispersión/representatividad de la media. Cuanto menor sea el valor del CV, menor es la dispersión y por tanto mejor representa la media a los valores que toma la variable estadística Variable X = semillas germinadas media= sx= CV = Variable Y = longitud del tallo : media = sy = CV = El CV mayor indica qué variable tiene más dispersión en torno a la media

Para obtener la amplitud intercuartil necesitamos los cuartiles. AI = Q3-Q1 = 43-37 = 6: este el recorrido del 50% central de las moscas en lo que se refiere al número de cerdas. Es la diferencia entre el tercer y el primer cuartil

a) El experimento consiste en analizar una serie de hojas de encina recogidas en diferentes zonas y diferentes periodos y medir su longitud. Los individuos que forman parte de la muestra son una serie de hojas. Se han considerado tres variables:

X 1= zona de recogida de la hoja  cualitativa nominal

X2 = periodo de recogida  cualitativa ordinal

X3 = longitud de la hoja en cm  cuantitativa continua

ii)

periodo ni fi Ni Fi 1 8 0,5 8 0, 2 4 0,25 12 0, 3 4 0,25 16 1 16 Para representar los datos usamos un diagrama de barras

iii) hacemos la tabla de frecuencias para la longitud de las hojas

longitud ni Ni Fi 23,5 1 1 0, 24,5 1 2 0, 25,5 3 5 0, 26,5 3 8 0, 27,5 1 9 0, 30,5 3 12 0, 31,5 1 13 0, 34,5 3 16 1 16

Q1 = 25,5  el 25% de las hojas tienen a lo sumo 25,5 cm

Q3 = (30,5+31,5)/2=31  el 75% de las hojas tienen a lo sumo 31 cm

iv) de las 9 hojas de la zona B hay 6 que miden más de 26 cm: 6/9 = 0.67 67%

b) Para analizar la representatividad de la media se usa el Coeficiente de variación de Pearson (CV) que se define como el cociente entre la desviación típica y la media. Como es una cantidad relativa, ayuda a valorar la dispersión/representatividad de la media. Cuanto menor sea el valor del CV, menor es la dispersión y por tanto mejor representa la media a los valores que toma la variable estadística Variable X1 = longitud en la zona A media= sx= CV = Variable X2 = longitud en la zona B : media = sx = CV = El CV mayor indica qué variable tiene más dispersión en torno a la media

Para analizar la dispersión en torno a la media se usa el Coeficiente de variación de Pearson (CV) que se define como el cociente entre la desviación típica y la media. Como es una cantidad relativa, ayuda a valorar la dispersión/representatividad de la media, en el sentido de establecer si es grande o pequeña. Cuanto menor sea el valor del CV, menor es la dispersión y por tanto mejor representa la media a los valores que toma la variable estadística

Calculamos el CV de ambas variables y la de menor CV es la que tiene menor dispersión y la media más representativa

a) El experimento consiste en analizar el número de pozos por kilómetro cuadrado que se permite explotar en 50 estados de EEUU donde está permitida la extracción de gases y petróleo empleando la técnica fracking Muestra: Los 50 condados de EEUU donde está permitida la extracción de gases y petróleo empleando la técnica fracking

Variable: X = número de pozos por kilómetro cuadrado que se permite explotar. Se trata de una variable cuantitativa discreta

b) Completamos la tabla de frecuencias sabiendo que fi=ni/N donde N = 50 , que Ni es la frecuencia absoluta acumulada y que Fi = Ni/n

c) Los cuartiles de la variable son los tres valores que dividen al conjunto de las observaciones en cuatro partes de igual frecuencia Q1  Fi = 0,25  Q1 = 3 en el 25% de los estados analizados se permite la explotación de a lo sumo 3 pozos

Q2 = Me  Fi = 0,50  Q2 = (3+4)/2 = 3,5  en el 50% de los estados analizados se permite la explotación de a lo sumo 3,5 pozos

Q3  Fi = 0,75  Q3 =5 en el 75% de los estados analizados se permite la explotación de a lo sumo 5 pozos

d) Para analizar la representatividad de la media se usa el Coeficiente de variación de Pearson (CV) que se define como el cociente entre la desviación típica y la media. Como es una cantidad relativa, ayuda a valorar la dispersión/representatividad de la media, en el sentido de establecer si es grande o pequeña. Cuanto menor sea el valor del CV, menor es la dispersión y por tanto mejor representa la media a los valores que toma la variable estadística Variable X = nº de pozos: media= ; sx=  CV =

Variable Y = producción de gas: media = sy =  CV =

El CV de la variable ………… es mayor y por tanto su media representa peor a l conjunto de datos

nº pozos ni fi Ni Fi 1 5= Ni 5/50=0,1 5 0, 2 0,14x50=7 0,14 5+7=12 12/50=0, 3 50-resto= 13 13/50=0,26 12+13=25 25/50=0, 4 12 0,74x50=37 0, 5 44-37=7 7/50=0,14 44 44/50=0, 6 50-44=6 6/50=0,12 Total 50 siempre 1

Los cuartiles de la variable son los tres valores que dividen al conjunto de las observaciones en cuatro partes de igual frecuencia

Q1  Fi = 0,25  Q1 = 62 en el 25% de los días el crecimiento del virus fue de, a lo sumo, 62 UFP/μl

Q2 = Me  Fi = 0,50  Q2 = 95  en el 50% de los días el crecimiento del virus fue de, a lo sumo, 95 UFP/μl

Q3  Fi = 0,75  Q3 =140 en el 75% de los días el crecimiento del virus fue de, a lo sumo, 140 UFP/μl

c) Los valores que no son considerados datos atípicos son aquellos comprendidos entre el límite inferior y el límite superior del intervalo (Q1 −1.5 ·AI, Q3 + 1.5 ·AI). Las observaciones que caen fuera del intervalo se consideran datos atípicos (outliers). Calculamos en este caso el límite superior ya que 200 podría ser un valor atípico por encima de lo normal.

AI = Q3-Q1 = 140-62 =

Límite superior = 140+1,5x78 = 267. El valor 200 está por debajo de 267 y por tanto no puede ser considerado valor atípico.

d) Calculamos la media de la variable y obtenemos el valor 98,62. Hay 6 datos en la muestra por encima de ese valor y eso representa un 6/13= 0,46 46% e) Para analizar la dispersión en torno a la media se usa el Coeficiente de variación de Pearson (CV) que se define como el cociente entre la desviación típica y la media. Como es una cantidad relativa, ayuda a valorar la dispersión/representatividad de la media, en el sentido de establecer si es grande o pequeña. Cuanto menor sea el valor del CV, menor es la dispersión y por tanto mejor representa la media a los valores que toma la variable estadística Variable X = crecimiento: media= sx= CV =

Variable Y = tiempo en alcanzar la temperatura : media = sy = CV =

El CV mayor indica qué variable tiene más dispersión en torno a la media

*Para calcular la media de la variable Y consideramos las marcas de clase

Xi 2,5 10 17,5 22

ni 1 4 5 3

a) El experimento consiste en analizar la profundidad de una serie de prospecciones realizadas para encontrar agua subterránea Muestra: una serie de prospecciones realizadas para encontrar agua subterránea Variable: X = Profundidad en metros de las prospecciones realizadas con éxito. Se trata de una variable cuantitativa discreta.

b) Construimos la tabla de frecuencias de la variable

profundidad ni Ni Fi 20 1 1 0, 23 2 3 0, 24 4 7 0, 25 3 10 0, 26 2 12 0, 27 2 14 0, 29 1 15 0, 32 1 16 1

c) Calculamos la media de la variable y obtenemos el valor 25,25. Hay 6 datos en la muestra por encima de ese valor y eso representa un 6/13= 0,46  46% d) Para analizar la dispersión en torno a la media se usa el Coeficiente de variación de Pearson (CV) que se define como el cociente entre la desviación típica y la media. Como es una cantidad relativa, ayuda a valorar la dispersión media = desviación típica = CV =

e) Para determinar la profundidad mínima del 15% de las prospecciones más profundas debemos determinar el P85: Fi = 0,85  P85 = 27 : el 15% de las prospecciones más profundas tiene como mínimo 27 metros

Los valores que no son considerados datos atípicos son aquellos comprendidos entre el límite inferior y el límite superior del intervalo (Q1 −1.5 •AI, Q3 + 1.5 •AI). Las observaciones que caen fuera del intervalo se consideran datos atípicos (outliers). Calculamos Q1 y Q3. Q1: Fi=0,25  Q1 = 0,16 Q3: Fi=0,75  Q3 = (0,20+0,32)/2 = 0, AI = Q3-Q1 = 0,26 0,16 = 0, Límite inferior= Q1-1,5xAI = 0,16 1,5x0,10= 0,01  no hay valores inferiores a 0,1. No hay valores atípicos inferiores Límite superior = Q3 + 1,5xAI = 0,16 + 1,5x0,10=0,31: a partir de 0,31 se consideran valores atípicos

c) Para analizar la dispersión en torno a la media se usa el Coeficiente de variación de Pearson (CV) que se define como el cociente entre la desviación típica y la media. Como es una cantidad relativa, ayuda a valorar la dispersión/representatividad de la media, en el sentido de establecer si es grande o pequeña. Cuanto menor sea el valor del CV, menor es la dispersión y por tanto mejor representa la media a los valores que toma la variable estadística Variable X = altitud: media= sx= CV = Variable Y = tasa de crecimiento : media = sy = CV = El CV mayor indica qué variable tiene más dispersión en torno a la media

d) Los servales que se encuentran a más de 300m están a 400 ó a 550m. Sólo nos queremos calcular el P60 ya que queremos el valor mínimo del 40% de los mayores

tasa ni Ni Fi

total 8

El P60 es 0,2 el valor mínimo de la tasa de respiración del 40% de los servales que se encuentran a más de 300 m es 0,

a) El experimento consiste en analizar una serie de comprimidos y medir el tiempo de absorción Muestra: una serie de comprimidos del nuevo medicamento Variable: X = Tiempo de absorción en horas. Se trata de una variable cuantitativa continua.

b) Tabla de frecuencias

tiempo ni Ni Fi 2 1 1 0, 2,3 2 3 0, 2,4 4 7 0, 2,5 3 10 0, 2,6 2 12 0, 2,7 2 14 0, 2,9 1 15 0, 3,2 1 16 1 total 16

c) Calculamos la media: miramos el número de comprimidos cuyo tiempo de absorción es menor y luego se hace el porcentaje: nº/16 x100= …%

d) Para analizar la dispersión en torno a la media se usa el Coeficiente de variación de Pearson (CV) que se define como el cociente entre la desviación típica y la media. Como es una cantidad relativa, ayuda a valorar la dispersión media = desviación típica = CV =

e) Si la media es representativa se usa la media. Si no lo es se usa la mediana f) Si todos los valores aumentan un 10% la media también se incrementa en un 10%

c) Hacer la media y la desviación típica: El nivel medio de ácido úrico en el río A es …. μg/l con una desviación típica de …… μg/l. d) La mediana es el valor que deja igual número de observaciones con valores inferiores o iguales a él que superiores. Fi=0,5  Me = (7+9)/2 = 8. Si le sumamos 1 al valor mediano sale 9 μg/l y en la muestra hay 5 datos superiores a ese valor. En %: 5/40x100 = ….% e) Los valores que delimitan el 50% central de los datos son el Q1 y el Q Q1: Fi = 0,25  Q1 = 5 Q1: Fi = 0,75  Q3 = 9 El 50% central de los datos está comprendido entre 5 y 9 μg/l

f) Ir explicando todo lo que sale en la tabla g) Para analizar la dispersión en torno a la media se usa el Coeficiente de variación de Pearson (CV) que se define como el cociente entre la desviación típica y la media. Como es una cantidad relativa, ayuda a valorar la dispersión/representatividad de la media, en el sentido de establecer si es grande o pequeña. Cuanto menor sea el valor del CV, menor es la dispersión y por tanto mejor representa la media a los valores que toma la variable estadística Variable X = nivel de ácido úrico en el río A: media= sx= CV = Variable Y = nivel de ácido úrico en el río B : media = sy = CV =

a) Para analizar la dispersión en torno a la media se usa el Coeficiente de variación de Pearson (CV) que se define como el cociente entre la desviación típica y la media. Como es una cantidad relativa, ayuda a valorar la dispersión/representatividad de la media, en el sentido de establecer si es grande o pequeña. Cuanto menor sea el valor del CV, menor es la dispersión y por tanto mejor representa la media a los valores que toma la variable estadística

Variable X = peso del fruto media= sx= CV =

Variable Y = volumen del fruto media = sy = CV =

b) Los valores que no son considerados datos atípicos son aquellos comprendidos entre el límite inferior y el límite superior del intervalo (Q1 −1.5 •AI, Q3 + 1.5 •AI). Las observaciones que caen fuera del intervalo se consideran datos atípicos (outliers).

Para el peso: mínimo = 26,5 máximo = 192,

AI = 107,250-68,200= 39,05 l.inferior = 68,200 1,5*39,05 = 9,

l. superior = 107,25+1,5*39,05 = 165,

No hay ningún valor inferior a 9,625 pero sí superior a 165,825, al menos el máximo. Existen valores atípicos superiores para la variable peso del fruto

Se hace lo mismo con el volumen