Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Estadística Descriptiva: Análisis de Datos con Exercicios, Apuntes de Diseño Industrial

Documento que presenta ejercicios relacionados con la estadística descriptiva, incluyendo el cálculo de cuartiles, mediana, rang interquartil, diagrama de caixa y análisis de anomalías. Los ejercicios se refieren a datos de precios y avarias en una planta industrial.

Tipo: Apuntes

2016/2017

Subido el 08/01/2017

onarocamora
onarocamora 🇪🇸

2 documentos

1 / 11

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Estad´ıstica Descriptiva Probabilitat i Estad´ıstica.
Graus en Enginyeries Industrials.
1. Els preus de 21 pisos en venda en una determinada zona venen donats per les seg¨uents dades
(en milers d’euros): Preu= {213, 222, 240, 155, 261, 251, 221, 212, 235, 241, 253, 240, 279, 223,
231, 242, 234, 252, 235, 243, 248}
(a) Feu el diagrama de tija i fulles.
(b) Feu la seg¨uent la seg¨uent taula de freq¨u`encies (al vostre full).
Classe Freq. Abs. Freq. Rel. Freq. Rel. Ac.
Preu210
Preu(210,220]
Preu(220,230]
Preu(230,240]
Preu(240,250]
Preu(250,260]
Preu(260,270]
Preu(270,280]
Quin ´es el percentatge dels pisos arriba, com a molt, a un preu de 240.000 Euros?
(c) Indiqueu quins on els valors dels quartils Q1iQ3, la mediana, i el rang interquartil·lic.
(d) Feu el Diagrama de Caixa, i indiqueu quines dades poden ser considerades anomalies mo-
derades, o extremes.
(e) Feu servir la calculadora per determinar la mitjana ¯
Xi la desviaci´o ıpica Sn1.
2. A una sabateria de Barcelona s’ha fet un estudi sobre les vendes de sabates per senyors distri-
bu¨ıdes per talles durant el mes passat. Els resultats s’han recollit a una taula per`o s’han esborrat
accidentalment. Disposem per tant nom´es de les dades seg¨uents:
Talla (X) Freq¨u`encia Freq¨u`encia acumulada Freq¨u`encia relativa Freq¨u`encia relativa acumulada
37 0.01
38 25 0.015
39 70
40 234
41 366
42 229
43 0.97
44
45 0.01
(a) Completeu les dades que falten a la taula anterior indicant quins raonaments heu fet.
(b) Representeu el pol´ıgon de freq¨u`encies absolutes.
(c) Trobeu la mitjana, mediana i moda.
(d) Trobeu la desviaci´o ıpica, la variancia i el coeficient de variaci´o.
pf3
pf4
pf5
pf8
pf9
pfa

Vista previa parcial del texto

¡Descarga Estadística Descriptiva: Análisis de Datos con Exercicios y más Apuntes en PDF de Diseño Industrial solo en Docsity!

Estad´ıstica Descriptiva Probabilitat i Estad´ıstica.

Graus en Enginyeries Industrials.

  1. Els preus de 21 pisos en venda en una determinada zona venen donats per les seg¨uents dades (en milers d’euros): Preu= {213, 222, 240, 155, 261, 251, 221, 212, 235, 241, 253, 240, 279, 223, 231, 242, 234, 252, 235, 243, 248}

(a) Feu el diagrama de tija i fulles. (b) Feu la seg¨uent la seg¨uent taula de freq¨u`encies (al vostre full). Classe Freq. Abs. Freq. Rel. Freq. Rel. Ac. Preu≤ 210 Preu∈(210,220] Preu∈(220,230] Preu∈(230,240] Preu∈(240,250] Preu∈(250,260] Preu∈(260,270] Preu∈(270,280] Quin ´es el percentatge dels pisos arriba, com a molt, a un preu de 240.000 Euros? (c) Indiqueu quins s´on els valors dels quartils Q 1 i Q 3 , la mediana, i el rang interquartil·lic. (d) Feu el Diagrama de Caixa, i indiqueu quines dades poden ser considerades anomalies mo- derades, o extremes. (e) Feu servir la calculadora per determinar la mitjana X¯ i la desviaci´o t´ıpica Sn− 1.

  1. A una sabateria de Barcelona s’ha fet un estudi sobre les vendes de sabates per senyors distri- bu¨ıdes per talles durant el mes passat. Els resultats s’han recollit a una taula per`o s’han esborrat accidentalment. Disposem per tant nom´es de les dades seg¨uents:

Talla (X) Freq¨uencia Freq¨uencia acumulada Freq¨uencia relativa Freq¨uencia relativa acumulada 37 0. 38 25 0. 39 70 40 234 41 366 42 229 43 0. 44 45 0.

(a) Completeu les dades que falten a la taula anterior indicant quins raonaments heu fet. (b) Representeu el pol´ıgon de freq¨u`encies absolutes. (c) Trobeu la mitjana, mediana i moda. (d) Trobeu la desviaci´o t´ıpica, la variancia i el coeficient de variaci´o.

  1. Les dades referides al nombre d’alertes ambientals produ¨ıdes l’any 2003 a 20 pa¨ısos s´on:

{ 93 , 105 , 116 , 110 , 109 , 87 , 117 , 104 , 116 , 131 , 111 , 90 , 92 , 102 , 105 , 110 , 92 , 116 , 99 , 117 }.

(a) Constru¨ıu la taula de freq¨u`encies relatives acumulades, prenent classes de longitud 10, comen¸cant per 80 i acabant per 140. Quin percentatge de pa¨ısos superen les 110 alertes ambientals? (b) Feu l’histograma. (c) Feu el diagrama de tija i fulles. Indiqueu els quartils, la mediana, i el rang interquartil·lic. (d) Feu el Diagrama de Caixa, i indiqueu quines dades poden ser considerades anomalies mo- derades, o extremes. (e) Feu servir la calculadora per determinar la mitjana X¯ i la desviaci´o t´ıpica Sn− 1.

  1. En el grafic seg¨uent, cada BoxPlot correspon a les mesures diaries, preses al llarg d’un mes, de concentraci´o (en ppb) de SO 2 en l’atmosfera de la ciutat de Nova York des d’el novembre de 1969 fins l’octubre de 1972. (a) En quins mesos la concentraci´o de SO 2 ha estat m´es variable. (b) En quins mesos, m´es de la meitat dels dies s’ha mesurat una concentraci´o superior a 50 ppb? (c) Com s’explica que en els mesos de mar¸c i abril de 1971 es considerin dades anomales concentracions que als mesos de gener i febrer de 1970 s´on considerades del tot normals? (d) L’efecte de l’estacionalitat t´e una influencia important en la concentraci´o de S 02? (e) Quina conclusi´o podem extreure de la comparaci´o dels resultats de l’evoluci´o de la concen- traci´o de S 02?
  2. El seg¨uent diagrama de barres correspon a la representaci´o grafica de la taula de freq¨uencies de la variable que comptabilitza el n´umero d’avaries di`aries en una planta industrial comptabilitzades al llarg de n dies.

(b) El treballador A t´e un sou de 2000 euros a una empresa on la mitjana dels sous ´es de 1800 euros i la desviaci´o t´ıpica de 200 euros. El treballador B t´e un sou de 2400 euros a una empresa on la mitjana dels sous ´es de 2100 euros i la desviaci´o t´ıpica de 400 euros. Si els graus de responsabilitat dins de les empreses s´on similars, quin dels dos est`a m´es ben pagat? (c) A l’empresa TRD2 agafem una mostra de 400 empleats. La mitjana dels seus sous ´es de 1800 euros i la desviaci´o t´ıpica de 100 euros. Demostreu que m´es del 75% dels treballadors tenen un sou entre 1600 i 2000 euros.

  1. D’una determinada mostra sabem que la seva mitjana ´es ¯x = 40.5, i la seva desviaci´o t´ıpica ´es s = 3.1. Per quin dels seg¨uents valors del par`ametre δ podem afirmar que m´es del 80% de les observacions estan a l’interval [40. 5 − δ , 40 .5 + δ]: (A) δ = 2.236, (B) δ = 6.932, (C) δ = 2.48, (D) cap dels anteriors.
  2. Es vol construir tubs cilindrics per envasar un lot de N boles d’acer. S’ha calculat la mitjana i la varian¸ca de les longituds dels radis d’aquestes boles, que expressats en mil·limetres s´on: X¯ = 30 i S^2 = 9. Calculeu el radi m´ınim que han de tenir els tubs per tal que es puguin envasar el 75% de les boles.
  3. Durant 20 dies s’ha fet un estudi del promig de tares que contenen les peces de camiseria que produ¨ım, obtenint les dades seg¨uents:

{ 9. 6 , 7. 1 , 3. 5 , 4. 4 , 0. 5 , 1. 3 , 3. 1 , 4. 3 , 5. 5 , 6. 0 , 15. 0 , 8. 5 , 9. 6 , 6. 3 , 6. 1 , 4. 5 , 4. 4 , 5. 3 , 5. 6 , 5. 9 }.

a) Feu el diagrama de tija i fulles. Indiqueu els quartils, la mediana, i el rang interquartil.lic. b) Feu el Diagrama de Caixa, i indiqueu quines dades poden ser considerades anomalies mo- derades, o extremes.

Solucions

  1. (a)

(b)

Classe Freq. Abs. Freq. Rel. Freq. Rel. Ac. Preu≤ 210 1 0.0476 0. Preu∈(210,220] 2 0.0952 0. Preu∈(220,230] 3 0.1429 0. Preu∈(230,240] 6 0.2857 0. Preu∈(240,250] 4 0.1904 0. Preu∈(250,260] 3 0.1429 0. Preu∈(260,270] 1 0.0476 0. Preu∈(270,280] 1 0.0476 0.9999' 1

El percentatge de pisos els preus dels quals arriba, com a molt, a 240 ´es el 57.14%. (c)

f fac 15 5 1 1 16 0 1 17 0 1 18 0 1 19 0 1 20 0 1 21 3 2 2 3 22 2 1 3 3 6 23 5 1 4 5 4 10 24 0 1 0 2 3 8 6 16 25 1 3 2 3 19 26 1 1 20 27 9 1 21

Substituint ara aquesta expressi´o a la primera equaci´o tenim

X + 1. 5 X = 2. 5 X = 25 ⇒ X = 10, Y = 15 i N = 1000.

A partir d’aqu´ı la resta surt directament.

Talla (X) Freq¨uencia Freq¨uencia acumulada Freq¨uencia relativa Freq¨uencia relativa acumulada 37 10 10 0.01 0. 38 15 25 0.015 0. 39 45 70 0.045 0. 40 234 304 0.234 0. 41 366 670 0.366 0. 42 229 899 0.229 0. 43 71 970 0.071 0. 44 20 990 0.02 0. 45 10 1000 0.01 1 (b) Trivial. (c) La mediana s’obt´e de la seg¨uent manera:

M =

Pos 500 + Pos 501 2

Com que les dades v´enen agregades, tenim:

X¯ =

classes

xi fr(xi) = 37 · 0 .01 + 38 · 0 .015 + · · · + 45 · 0 .01 = 41. 062.

La moda ´es 41 (d) Com que les dades v´enen agregades tenim:

S n^2 − 1 =

classes

x^2 i fi

n − 1

n n − 1

X

On fi aqu´ı ´es freq¨u`encia absoluta. Per tant, ∑

classes

x^2 i fi = 37^2 · 10 + · · · 452 · 10 = 1687646.

Per tant:

S^2 n− 1 =

(41.062)^2 = 1. 559715 ⇒ Sn− 1 = 1. 248885503.

El CV = SnX ¯− 1 = 1.^24888550341. 062 = 0. 0304146 , el que indica que les dades presenten una variaci´o del 3% respecte de la mitjana.

  1. La filosofia ´es la mateixa que la de l’exercici 1. Fer el diagrama de tija i fulles i a partir d’aqu´ı, obtenir el boxplot.
  2. (a) Els quatre primers mesos de l’estudi, per exemple.

(b) Mireu en el grafic seg¨uent els mesos en els que la mediana supera 50ppb.

(c) Perque les anomal´ıes estad´ıstiques que detecta el Boxplot ho s´on nom´es respecte del seu propi grup de dades. (d) Si, observeu les petites oscil·lacions. (e) Hi ha una tendencia a una reducci´o i una menor dispersi´o.

  1. (a) n = 43.

(b) Directament del gr`afic de l’enunciat tenim

Avaries Freq. Freq. Relativa

Freq. Acumulada

Freq. Relativa Acumulada

Freq. Relativa Acumulada 100%

Total: 43

(c) El Q 1 ´es la mitjana de la posici´o 11 i 12 , la mediana est`a en la posici´o 22 i el Q 3 ´es la mitjana de la posici´o 32 i 33. Directament de la columna de freq¨uencia relativa acumulada tenim: Q 1 = 3, M = 6, Q 3 = 8.

(a2)

S Y^2 =

n − 1

∑^ n

i=

(yi− Y¯ )^2 =

n − 1

∑^ n

i=

(1. 1 xi− 1. 1 X¯)^2 = (1.1)^2

n − 1

∑^ n

i=

(xi− X¯)^2 = (1.1)^2 S X^2.

Per tant, S Y^2 = (1.1)^2 · 400 = 484. FALS. (a3) En cas que la moda existeixi, la nova moda ser`a l’anterior multiplicada per 1.1, per tant varia: FALS. (a4) Si augmentem els sous en 100, tenim: Y = X + 100, per tant

Y¯ =^1

n

∑^ n

i=

yi =

n

∑^ n

i=

(xi − 100) =

n

∑^ n

i=

xi +

n 100 n

= X¯ + 100.

Aleshores,

S Y^2 =

n − 1

∑^ n

i=

(yi − Y¯ )^2 =

n − 1

∑^ n

i=

(xi +100− X¯ −100)^2 =

n − 1

∑^ n

i=

(xi − X¯)^2 = S X^2.

Per tant, S^2 Y = 400 FALS. (a5) No varia, perque la mediana ´es la mitjana de les observacions 250 i 251 i per tant no es veu afectada. CERT. Recordeu que en general, si Y = aX + b aleshores Y¯ = a X¯ + b i S Y^2 = a^2 S X^2. (b) Fixem-nos que X¯A = 1800 SA = 200 ⇒ XA = 2000 = X¯A + SA X^ ¯B = 2100 SB = 400 ⇒ XB = 2400 < X¯B + SB En termes absoluts la resposta ´es obvia: 2400 euros ´es m´es que 2000 euros. Ara b´e, en termes relatius, ´es a dir el context de la seva propia empresa, el treballador A esta en una franja m´es alta respecte la mitjana que el segon. (c) La desigualtat de Txebixev garanteix que a [ X¯ −k S, X¯ +k S], hi ha m´es del (1− 1 /k^2 )·100% de les observacions. Per k = 2 tenim doncs un 75% de les observacions. Si X¯ = 1800 i S = 100 tenim que a [ X¯ − 2 S, X¯ + 2 S] = [1600, 2000], hi ha, efectivament un 75% de les observacions.

  1. La desigualtat de Txebixev ens garanteix que l’interval [x − k sx , x + k sx] cont´e com a m´ınim el (1 − (^) k^12 ) per cent de les dades de la mostra. Imposant 1 − (^) k^12 = 0.8 obtenim k =

5, i per tant δ = k sx =

Per tant l’opci´o correcta ´es (B).

  1. Aplicarem la desigualtat de Txebixev segons la qual a l’interval [ X¯ − k S, X¯ + k S], hi ha m´es del (1 − 1 /k^2 ) · 100% de les observacions. Si trobem k de manera que m´es del 75% de les dades estiguin a [ X¯ −k S, X¯ +k S], podrem agafar com a radi X¯ + k S. Imposant 1 − 1 /k^2 = 0. 75 ⇒ k = 2. Per tant, X¯ + 2 S = 30 + 2 · 3 = 36.
  1. La filosofia ´es la mateixa que la de l’exercici 1. Fer el diagrama de tija i fulles i a partir d’aqu´ı, obtenir el boxplot. Algunes dades per obtenir el Boxplot s´on: El Q 1 ´es la mitjana de la posici´o 5 i 6 , la mediana ´es la mitjana de la posici´o 10 i 11 i el Q 3 ´es la mitjana de la posici´o 15 i 16: Q 1 = 4.35, M = 5.55, Q 3 = 6.7. Donat que el RIQ = Q 3 − Q 1 = 2.35 les fronteres de la zona de normalitat v´enen donandes per

f 1 = Q 1 − 1. 5 RIQ = 0. 825 f 3 = Q 3 + 1. 5 RIQ = 10. 225 F 1 = Q 1 − 3 RIQ = − 2. 7 F 3 = Q 3 + 3RIQ = 13. 75

adj 1 = m´ınima obs. a [f 1 , Q 1 ] = 1. 3 adj 3 = m`axima obs. a [Q 3 , f 3 ] = 9. 6 Hi ha una anomalia moderada a 0.5 i una d’extrema a 15.