¡Descarga estadistica aplicada y más Apuntes en PDF de Estadística solo en Docsity!
ANÀLISI ESTADÍSTICA EXPLORATÒRIA UNIVARIANT
1. Indiqueu la tipologia de les següents variables:
a. Nombre de fills d'una camada.
Quantitativa discreta
b. Temperatura enregistrada cada mitja hora en un observatori.
Quantitativa contínua
c. Color dels ulls dels animals d'una determinada espècie.
Qualitativa nominal
d. Extensió - gran, mitjana o petita - del territori contaminat a les comarques de Catalunya.
Qualitativa ordinal
e. Extensió, en Km^2 , del territori contaminat a les comarques de Catalunya.
Quantitativa contínua
f. Nombre d’exemplars de les diferents espècies d’arbres de Catalunya.
Quantitativa discreta (si els efectius de cada espècie són molt nombrosos es pot tractar com a contínua)
g. Temps de supervivència dels malalts de càncer de pulmó des de que són diagnosticats d’aquesta
malaltia.
Quantitativa contínua
2. Amb una mostra de 50 persones s’ha observat el color del cabell i dels ulls, d’acord a la següent taula:
Color ulls Color cabell Color ulls Color cabell Color ulls Color cabell
blaus pèl-roig blaus pèl-roig blaus pèl-roig
verds castany verds ros blaus ros
blaus pèl-roig blaus pèl-roig blaus ros
blaus castany blaus castany marrons ros
verds ros verds ros blaus castany
blaus ros blaus pèl-roig marrons castany
marrons ros blaus pèl-roig blaus ros
blaus pèl-roig blaus ros blaus castany
blaus ros blaus ros marrons castany
verds pèl-roig verds castany blaus pèl-roig
blaus pèl-roig blaus ros blaus pèl-roig
blaus ros blaus ros blaus castany
blaus ros blaus ros blaus ros
blaus ros blaus pèl-roig blaus ros
marrons castany blaus pèl-roig verds ros
verds pèl-roig blaus ros verds castany
marrons castany verds ros
a. Calculeu les freqüències absolutes i relatives de la variable color dels ulls.
Color dels Ulls Count Percent Graus blaus 34 68.00 244. marrons 6 12.00 43. verds 10 20.00 72. N= 50
b. Dibuixeu un diagrama de barres i un diagrama de sectors de la variable color dels ulls.
blaus marrons verds
35
30
25
20
15
10
5
0 Ulls
Count
Chart of Ulls
blaus marrons v erds
C ategory verds 10; 20,0%
marrons 6; 12,0%
blaus 34; 68,0%
Pie Chart of Ulls
Calculeu les freqüències absolutes i relatives de la variable color del cabell.
Color del Cabell Count Percent Graus castany 12 24.00 86. pèl roig 15 30.00 108. ros 23 46.00 165. N= 50
c. Dibuixeu un diagrama de barres i un diagrama de sectors de la variable color del cabell.
3. S’ha observat la raça de 25 gossos que passejaven per la llera del riu Onyar a la ciutat de Girona (L =
Labrador, P = Pastor alemany, S = Setter, B = Boxer):
L, L, S, L, L, L, P, L, L, L, S, P, L, S, S, L, L, L, L, L, S, B, L, L, L.
a) Calculeu les freqüències absolutes i relatives d’aquesta variable.
Raça Freqüència Absoluta Freqüència Relativa Freqüència Percentual
Boxer 1 1/25 = 0.04 1*100/25 = 4
Labrador 17 17/25 = 0.68 17*100/25 = 68
Pastor Alemany 2 2/25 = 0.08 2*100/25 = 8
Setter 5 5/25 = 0.20 5*100/25 = 20
b) Dibuixeu un diagrama de barres i un diagrama de sectors d’aquesta variable.
Els graus dels angles els trobem multiplicant la freqüència relativa per 360º, que són els angles
de la circumferència:
Boxer = 0.04 * 360º = 14.4º Labrador = 0.68 * 360º = 244.8º
Pastor Alemany = 0.08 * 360º = 28.8º Setter = 0.2 * 360º = 72º
Boxer Labrador Pastor A lemà Setter
C ategory
5; 20,0%Setter
Pastor Alemà 2; 8,0%
Labrador 17; 68,0%
Boxer1; 4,0%
Pie Chart of Raça
Boxer Labrador Pastor Alemà Setter
18 16 14 12 10 8 6 4 2 0 Raça
Count
Chart of Raça
4. Les qualificacions d’una assignatura de la Facultat el curs 2014-15 van ser les següents:
Excelꞏlent Notable Aprovat Suspès No presentat
a. Calculeu les freqüències relatives d’aquesta variable.
Excelꞏlent Notable Aprovat Suspès No presentat
b. Dibuixeu un diagrama de barres i un diagrama de sectors d’aquesta variable.
Graus
Excelꞏlent Notable Aprovat Suspès No presentat
Excel.lent Notable Aprovat Suspès No presentat
0
20
40
60
80
100
120
Excel.lent
Notable
Aprovat
Suspès
No presentat
Evidentment també es pot agrupar les dades en intervals:
Nombre d’intervals:
Criteri 1: k = N N = 100; k = 10
Criteri 2: 50 N 100 6 k 10
Per tant k ha d’estar entre 6 i 10 classes. En aquest exemple n’agafem 6 per raons
didàctiques. Si féssim n histograma amb 10 classes segurament seria molt semblant al de
12 que hem fet abans.
Amplitud de l’interval: 11/6 = 1.833 h = 2 Se sobrepassa amb 1 l’amplitud 2*6 = 12
Intervals
de classe
Marca de
classe
Freqüència
Absoluta
Freqüència
relativa
Fr Abs
Acumulada
Fr relativa
Acumulada
(4.5,6.5] 5.5 13 13/100=0.13 13 13/100=0.
(6.5,8.5] 7.5 22 22/100=0.22 13+22=35 35/100=0.
(8.5,10.5] 9.5 23 23/100=0.23 35+23=58 58/100=0.
(10.5,12.5] 11.5 21 21/100=0.21 58+21=79 79/100=0.
(12.5,14.5] 13.5 14 14/100=0.14 79+14=93 93/100=0.
(14.5,16.5] 15.5 7 7/100=0.07 93+7=100 100/100=1.
5,5 7,5 9,5 11,5 13,5 15,
25
20
15
10
5
0 C
Frequency
Histogram of C
C)
Mitjana =
ൌ 10dies
La mediana és el valor que està al mig, quan les dades estan ordenades. A l’exemple
tenim un nombre parell de dades i per tant la mediana serà la mitjana de les dues dades
centrals.
Mediana =
ൌ 10dies
Desviació estàndard o tipus = ට
ሺହିଵ ሻ మ^ ାሺହିଵ ሻ మ^ ା⋯ାሺଵିଵ ሻమ
ൌ 2.871dies
Coeficient de variació =
ሺ∗ 100ሻ ൌ28.71%. Podem considerar que no hi ha massa
variabilitat
d)
Per calcular els quartils utilitzarem la fórmula: 1+[q*(N-1)/100]
Q1: 1+(2599/100)=25.75 Q1 = x25.75 = x 25 +( x 26 -x 25 )0.75 =
= 8+(8-8)*0.75 = 8dies
Q3: 1+(7599/100)=75.25 Q3 = x75.25 = x 75 +( x 76 -x 75 )0.25 =
= 11+(12-11)*0.25 = 11.25dies
L’amplada intercuartílica és la diferència de quartils,
AIQ = Q3-Q1 = 11.25 – 8 = 3.25dies
Dades atípiques: Són dades atípiques aquelles menors que Q1 - 1.5 AIQ i aquelles majors
que Q3 + 1.5 AIQ
1.5 AIQ = 4.875; Q1 - 1.5 AIQ = 3.125 ; Q3 + 1.5 AIQ = 16.
No hi ha dades atípiques
5,0 7,5 10,0 12,5 15,0 17, C
Boxplot of C
Descriptive Statistics: C
Mitjana =
La mediana és el valor que està al mig, quan les dades estan ordenades. A l’exemple
tenim un nombre parell de dades i per tant la mediana serà la mitjana de les dues dades
centrals.
Mediana =
Desviació estàndard o tipus = ට
ሺଷ.ହ଼ିସ.ହସ ሻ మ^ ାሺଷ.଼ିସ.ହସ ሻ మ^ ା⋯ାሺହ.ସ଼ିସ.ହସ ሻమ
Coeficient de variació =
ሺ∗ 100ሻ ൌ 8.17%. Podem considerar que hi ha molt poca
variabilitat
Dada Mínima = 3.
Dada Màxima = 5.
Amplada = 1.
Quartils
Per calcular els quartils utilitzarem la fórmula: 1+[q*(N-1)/100]
Q1: 1+(2549/100)=13.25 Q1 = x13.25 = x 13 +( x 14 -x 13 )0.25 =
Q3: 1+(7549/100)=37.75 Q3 = x37.75 = x 37 +( x 38 -x 37 )0.75 =
Dades atípiques: Són dades atípiques aquelles menors que Q1 - 1.5 AIQ i aquelles majors
que Q3 + 1.5 AIQ
1.5 AIQ = 0.57; Q1 - 1.5 AIQ = 3.78 ; Q3 + 1.5 AIQ = 5.26. La dada 3.58 és atípica per
l’esquerra i les dades 5.41 i 5.48 són atípiques per la dreta.
Diagrama de caixa:
4.0 4.5 5.0 5.
7. La següent taula presenta els resultats de 50 concentracions d’ió nitrat (en μg ml-1). Feu un
estudi gràfic i numèric de la mostra.
Valor Count CumCnt Percent CumPct 0.46 1 1 2.00 2. 0.47 3 4 6.00 8. 0.48 5 9 10.00 18. 0.49 10 19 20.00 38. 0.50 11 30 22.00 60. 0.51 12 42 24.00 84. 0.52 5 47 10.00 94. 0.53 3 50 6.00 100. N= 50
Només hi ha 8 valors. Per tant 8 classes
0,46 0,47 0,48 0,49 0,50 0,51 0,52 0,
12
10
8
6
4
2
0 C
Frequency
Histogram of C
Descriptive Statistics: C
Variable Mean StDev CoefVar Minimum Q1 Median Q3 Max IQR Mode C1 0.49960 0.01641 3.28 0.46 0.49 0.50 0.51 0.53 0.02 0.
1+[q(N-1)/100] 1+(2549/100)=13.25 Q1 = x 13.25 = x 13 +( x 14-x 13 )0.25 = 0.49+(0.49-0.49)0.25 = 0.
1+[q(N-1)/100] 1+(7549/100)=37.75 Q3 = x 37.75 = x 37 +( x 38-x 37 )0.75 = 0.51+(0.51-0.51)0.75 = 0.
1.5 AIQ = 0.03; Q1 - 1.5 AIQ = 0.46 ; Q3 + 1.5 AIQ = 0.
0.46 0.47 0.48 0.49 0.50 0.51 0.52 0.53 , rep(7,2), rep(8,19, rep(9,1))
9. En el procés de control de qualitat d'una fàbrica on es comercialitzen bosses de patates fregides,
s'han controlat els pesos de 40 bosses que han estat escollides a l'atzar de la producció total
del dia. Els pesos obtinguts, expressats en grams, han estat els següents:
a. Tabuleu aquestes dades, dibuixeu el corresponent histograma i comenteu-ne els trets més
característics.
b. Calculeu la mitjana, la mediana, la variància i la desviació tipus a partir de les dades originals no
agrupades. Compareu la mitjana amb la mediana, i relacioneu-ho amb la forma de l'histograma.
c. Calculeu els quartils Q 1 , Q 3 i l’AIQ. Dibuixeu el corresponent diagrama de caixa i comenteu-ne els
trets més característics.
d. Calculeu el valor aproximat dels percentils P 10 i P 90.
e. Quin percentil correspon a una bossa de patates que pesa 455 grams?
a) Tabuleu aquestes dades, dibuixeu el corresponent histograma i comenteu-ne els trets més
característics
En primer lloc ordenem les dades:
Nombre d’intervals:
Criteri 1: k = N N = 40; k = 6
Criteri 2: N 50 5 k 7
Amplitud de l’interval: 45/6 = 7.5 h = 7.5. Divisió perfecta. No se sobrepassa l’amplitud hem
de tancar un interval per un costat o afegir-ne un altre.
Intervals
de classe
Marca de
classe
Freqüència
Absoluta
Freqüència
relativa
Fr Abs
Acumulada
Fr relativa
Acumulada
[427,434.5] 430.75 4 4/40 = 0.1 4 4/40 = 0.
(434.5,442] 438.25 8 8/40 = 0.2 4+8 = 12 12/40 = 0.
(442,449.5] 445.75 7 7/40 = 0.175 12+7 = 19 19/40 = 0.
(449.5,457] 453.25 9 9/40 = 0.225 19+9 = 28 28/40 = 0.
(457,464.5] 460.75 4 4/40 = 0.1 28+4 = 32 32/40 = 0.
(464.5,472] 468.25 8 8/40 = 0.2 32+8 = 40 40/40 = 1.
L’histograma és bastant simètric i uniforme, amb un lleuger biaix a la dreta.
Una altra opció: h = 8. Se sobrepassa amb 3 l’amplitud 6*8 = 48. Podem decidir deixar-ne 2 a
un costat i un a l’altre o 1.5 i 1.5 a cada costat (donen el mateix perfil d’histograma)
Intervals
de classe
Marca de
classe
Freqüència
Absoluta
Freqüència
relativa
Fr Abs
Acumulada
Fr relativa
Acumulada
(426,434] 430 4 0.1 4 0.
(434,442] 438 8 0.2 12 0.
(442,450] 446 9 0.225 21 0.
(450,458] 454 7 0.175 28 0.
(458,466] 462 5 0.125 33 0.
(466,474] 470 7 0.175 40 1.
Finalment, si haguéssim fet 6 classes fent-les coincidir amb les desenes:
Intervals
de classe
Marca de
classe
Freqüència
Absoluta
Freqüència
relativa
Fr Abs
Acumulada
Fr relativa
Acumulada
(420,430] 425 2 0.05 2 0.
(430,440] 435 5 0.125 7 0.
(440,450] 445 14 0.35 21 0.
(450,460] 455 9 0.225 30 0.
(460,470] 465 9 0.225 39 0.
(470,480] 475 1 0.025 40 1.
frequency
430 440 450 460 470
0
2
4
6
8
Histogram of t
Frequency
420 430 440 450 460 470 480
0
2
4
6
8
10
12
14
d) Calculeu el valor aproximat dels percentils P10 i P90.
P10: 1+[q(N-1)/100] 1+(1039/100)=4.9 P 10 = x4.9 = x 4 +( x 5 -x 4 )*0.9 = 432+(436-
432)*0.9 = 435.6g
P90: 1+[q(N-1)/100] 1+(9039/100)=36.1 P 90 = x36.1 = x 36 +( x 37 -x 36 )*0.1 = 469+(470-
469)*0.1 = 469.1g
e) Quin percentil correspon a una bossa de patates que pesa 455 grams?
455= x(28) Pq
q=(i-1)100/(N-1) q=(27100/39)=69.
455= x(28) correspon al percentil P 69.
10. En un article de Quality Engineering es presenten dades de viscositat en un procés químic:
Feu un estiu complet d’aquest conjunt de dades.
Intervals
de classe Marca de classe Freqüència Absoluta Freqüència relativa Fr Abs Acumulada Fr relativa
- 13.3 14.9 15.8 16.0 14.5 13.7 13.7 14.9 15.3 15. - 15.1 13.6 15.3 14.5 13.4 15.3 14.3 15.3 14.1 14. - 14.8 15.6 14.8 15.6 15.2 15.8 14.3 16.1 14.5 13. - 14.3 13.9 14.6 14.1 16.4 15.2 14.1 15.4 16.9 14. - 14.3 15.2 14.2 14.0 16.1 15.2 16.9 14.4 13.1 15. - 14.9 13.7 15.5 16.5 15.2 13.8 12.6 14.8 14.4 15. - 14.6 15.1 15.2 14.5 14.3 17.0 14.6 12.8 15.4 14. - 16.4 16.1 15.2 14.8 14.2 16.6 16.8 14.0 15.7 15. - 12.6 1 1 1.25 1. Valor Count CumCnt Percent CumPct - 12.8 1 2 1.25 2. - 13.1 1 3 1.25 3. - 13.3 2 5 2.50 6. - 13.4 1 6 1.25 7. - 13.6 1 7 1.25 8. - 13.7 3 10 3.75 12. - 13.8 1 11 1.25 13. - 13.9 1 12 1.25 15. - 14.0 2 14 2.50 17. - 14.1 3 17 3.75 21. - 14.2 2 19 2.50 23. - 14.3 6 25 7.50 31. - 14.4 3 28 3.75 35. - 14.5 4 32 5.00 40. - 14.6 3 35 3.75 43. - 14.8 4 39 5.00 48. - 14.9 4 43 5.00 53. - 15.1 2 45 2.50 56. - 15.2 8 53 10.00 66. - 15.3 4 57 5.00 71. - 15.4 2 59 2.50 73. - 15.5 1 60 1.25 75. - 15.6 4 64 5.00 80. - 15.7 1 65 1.25 81. - 15.8 2 67 2.50 83. - 15.9 1 68 1.25 85. - 16.0 1 69 1.25 86. - 16.1 3 72 3.75 90. - 16.4 2 74 2.50 92. - 16.5 1 75 1.25 93. - 16.6 1 76 1.25 95. - 16.8 1 77 1.25 96. - 16.9 2 79 2.50 98. - 17.0 1 80 1.25 100. - N=
- Criteri 1: k = N N = 80; k =
- Criteri 2: 50 N 100 6 k - Se sobrepassa amb 0.1 l’amplitud 0.5*9 = 4. Amplitud de l’interval: 4,4/9 = 0.4888 h = 0.5.
- (12.5,13] 12.75 2 0.025 2 0. Acumulada
- (13,13.5] 13.25 4 0.05 6 0.
- (13.5,14] 13.75 8 0.1 14 0.
- (14,14.5] 14.25 18 0.225 32 0.
- (14.5,15] 14.75 11 0.1375 43 0.
- (15,15.5] 15.25 17 0.2125 60 0.
- (15.5,16] 15.75 9 0.1125 69 0.
- (16,16.5] 16.25 6 0.075 75 0.
- (16.5,17] 16.75 5 0.0625 80 1.