Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Ejercicis practics estadistica RStudio, Ejercicios de Estadística

Ejercicis practics estadistica RStudio

Tipo: Ejercicios

2025/2026

Subido el 29/01/2026

---..---
---..--- 🇪🇸

6 documentos

1 / 22

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
ESTADISTICA
Quina és la tipologia de cada variable?
• tipus Tipus de cotxe (D=Diesel; ND=No Diesel) Categòrica BInària
• cili Cilindrada (en cc) Numèrica Discreta
• pote Potència (en cavalls) Numèrica contínua
• rpmmax Nombre màxim de revolucions per minut Numérica Discreta
• ncil Nombre de cilindres Numérica discreta
• long Longitud (en cm) Numérica continua
• ampl Amplada (en cm) Numérica continua
• altu Alçada (en cm) Numérica continua
• male Capacitat del maleter (en litres) Numérica continua
• pes Pes (en kg) Numérica continua
• npla Nombre de places Numérica discreta
• vmax Velocitat màxima (en km/h) Numérica continua
• acce Acceleració: temps (en segons) de 0 a 100 km/h Numérica continua
• conpon Consum ponderat: litres combustible en 100 km Numérica continua
• costkm Cost mitjà (en ptes) per quilòmetre recorregut Numérica continua
• preu Preu (en milers de ptes) Numérica continua
• mida Segment de mida (Petita, Mitjana, Gran) Categòrica Ordinal
Conjunt global de variables és multivariant i heterogeni.
• Quantes dades corresponen a la categoria ‘dièsel D’? 52 . Quin percentatge representen?
10.61%.
• Quin percentatge de cotxes de gasolina (No Diesel) tenim? 89.388%. Quina és la seva
freqüència absoluta?438
• Quina de les dues categories és la modal? ND. S’anomena categoria modal o moda al
valor que la variable pren amb major freqüència. Si només hi ha una categoria de major
freqüència, la distribució s’anomena distribució unimodal.
• Quines són les característiques principals del diagrama de sectors? L’angle dels sectors és
proporcional a la freqüència de la categoria. No adequat per variables amb moltes
categories o nominals
• Quines són les característiques principals del diagrama de barres? L’alçada de les barres
és proporcional a la freqüència de la categoria, recomanat per variables ordinals.
• Quina és la causa més freqüent? Tornejat. Quina freqüència absoluta té? 76.
• Si solucionem les tres causes més freqüents, quin percentatge d’errors haurem
solucionat? 76%.
• Quantes causes no arriben al 5%? 3. Quines són? Muntatge, Zincat i Acabat
• Quina és la problemàtica d’un gràfic de pastís o de barres per a una variable contínua? Hi
ha massa valors que pot prendre una variable. Té molt poca repetició de valors, i per tant
moltes categories.
• Quina podria ser una solució? Agrupar valors similars i categoritzar la variable en unes
poques categories..
• Quants intervals de classe ens ha fet? 8.
• Quins són els límits del primer interval de classe? [4,6].
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16

Vista previa parcial del texto

¡Descarga Ejercicis practics estadistica RStudio y más Ejercicios en PDF de Estadística solo en Docsity!

ESTADISTICA

Quina és la tipologia de cada variable?

  • tipus Tipus de cotxe (D=Diesel; ND=No Diesel) Categòrica BInària
  • cili Cilindrada (en cc) Numèrica Discreta
  • pote Potència (en cavalls) Numèrica contínua
  • rpmmax Nombre màxim de revolucions per minut Numérica Discreta
  • ncil Nombre de cilindres Numérica discreta
  • long Longitud (en cm) Numérica continua
  • ampl Amplada (en cm) Numérica continua
  • altu Alçada (en cm) Numérica continua
  • male Capacitat del maleter (en litres) Numérica continua
  • pes Pes (en kg) Numérica continua
  • npla Nombre de places Numérica discreta
  • vmax Velocitat màxima (en km/h) Numérica continua
  • acce Acceleració: temps (en segons) de 0 a 100 km/h Numérica continua
  • conpon Consum ponderat: litres combustible en 100 km Numérica continua
  • costkm Cost mitjà (en ptes) per quilòmetre recorregut Numérica continua
  • preu Preu (en milers de ptes) Numérica continua
  • mida Segment de mida (Petita, Mitjana, Gran) Categòrica Ordinal Conjunt global de variables és multivariant i heterogeni.
  • Quantes dades corresponen a la categoria ‘dièsel D’? 52. Quin percentatge representen? 10.61%.
  • Quin percentatge de cotxes de gasolina (No Diesel) tenim? 89.388%. Quina és la seva freqüència absoluta? 438
  • Quina de les dues categories és la modal? ND. S’anomena categoria modal o moda al valor que la variable pren amb major freqüència. Si només hi ha una categoria de major freqüència, la distribució s’anomena distribució unimodal.
  • Quines són les característiques principals del diagrama de sectors? L’angle dels sectors és proporcional a la freqüència de la categoria. No adequat per variables amb moltes categories o nominals
  • Quines són les característiques principals del diagrama de barres? L’alçada de les barres és proporcional a la freqüència de la categoria, recomanat per variables ordinals.
  • Quina és la causa més freqüent? Tornejat. Quina freqüència absoluta té? 76.
  • Si solucionem les tres causes més freqüents, quin percentatge d’errors haurem solucionat? 76%.
  • Quantes causes no arriben al 5%? 3. Quines són? Muntatge, Zincat i Acabat
  • Quina és la problemàtica d’un gràfic de pastís o de barres per a una variable contínua? Hi ha massa valors que pot prendre una variable. Té molt poca repetició de valors, i per tant moltes categories.
  • Quina podria ser una solució? Agrupar valors similars i categoritzar la variable en unes poques categories..
  • Quants intervals de classe ens ha fet? 8.
  • Quins són els límits del primer interval de classe? [4,6].
  • Quin és l’interval de classe modal? El [8,10], amb una freqüència absoluta de 189.
  • Creieu que es pot considerar una distribució de freqüències ‘simètrica’? No, ja que hi ha molta més densitat de freqüència a l’esquerra. Cap a on té el biaix? Cap a la dreta.
  • És una distribució unimodal? Si, només puja i baixa una vegada.
  • Hi observeu valors atípics? El darrer interval [18,20] sembla força allunyat del modal [8,10] Quins? Són dos valors que estan en l’interval [18,20]. Si executem which(cotxes$conpon>18), trobem les files 92 i 94 i si executem cotxes$conpon[which(cotxes$conpon>18)], obtenim que són els valors 19.6 i 18.4 de “conpon”
  • Indiqueu el valor de la mitjana 5.7 i de la mediana 5.5.
  • Hi ha diferències o són semblants la mitjana i la mediana anteriors? Són valors molt propers, caldrà analitzar la variabilitat de les dades.
  • Indiqueu quantes dades tenim (n) 490, i si n’hi ha de mancants (missing o NA) no hi ha.
  • Indiqueu el valor de la dada mínima (0%) 4.7, la dada màxima (100%) 19.6 i l’amplitiud de dades 14.9.
  • Indiqueu el valor de la mitjana (mean) 9.45 i la mediana (50%) 8.9. Observeu que la mitjana és superior a la mediana. Per què? A causa de la lleugera asimetria a la dreta
  • Indiqueu el valor de la desviació tipus (sd)2.521063.
  • Indiqueu el valor del 1r quartil (25%) 7.9, el 3r quartil (75% 10.6 i l’amplitud interquartílica (AIQ o IQR) 2.7.
  • Hi observeu alguna dada atípica? Si, hi ha varies dades atípiques.
  • A la vista d’aquest gràfic, creieu que la distribució es pot considerar simètrica? No. Cap a on té el biaix? Cap a la dreta.
  1. Feu un estudi descriptiu complet (numèric i gràfic) de la variable rpmmax. Especifiqueu els estadístics principals (posició, dispersió) i les característiques més notables de la distribució (simetria, dades atípiques, unimodalitat, etc.).

Mitjana:5507. Mediana: 5600 Mínim: 3900 Màxim: 7200 Variança: 407301. Desviació típica: 638. No hi ha cap valor atipic

  • Coincideixen aquests percentatges?No. Per què? Perquè hi ha més vehicles no diesel que diesel.
  • Quin percentatge de vehicles no dièsel són de mida mitjana? 81,96%.
  • Depèn el percentatge de vehicles de mida mitjana del fet de ser dièsel o no dièsel? No. Per què? Amb ambdós casos és el tipus majoritari.
  • Els perfils dels tres grups de barres són iguals? Si, son molt pareguts.Per què? en general els cotxes mitjans són els més comuns.
  • Quants ítems MDef s’han realment fabricat del model B? 35.
  • Quants ítems MDef fabricats del model B hom esperaria trobar en el supòsit d’independència de les dues variables categòriques? 29.
  • Com s’obté aquesta freqüència esperada a partir de les freqüències marginals? producte dels percentatges filera i columna sobre el nombre total de dades (n).
  • Quina és, doncs, la conclusió final d’aquest contrast d’independència? Són independents

Suposem ara que, en relació al contrast d’independència, els materials fabricats del model A en realitat han estat: 1150 Sat, 150 Pan, 25 Def i 10 MDef. Realitzem novament l’estudi d’independència.

  • Quina seria ara la conclusió final? La conclusió seria que són dependents.
  • D’acord amb la forma que ha estat dissenyat l’experiment, es tracta de dades observacionals o bé de dades experimentals? experimentals.
  • D’acord amb l’objectiu que persegueix l’investigador, quina és la variable resposta i quina la variable explicativa? Resposta és la conductivitat, el tipus de recobriment és l’expectativa.
  • Quina és la tipologia de cadascuna de les dues variables? Conductivitat és numérica continua, recobriment es categórica ordinal.
  • Quins són els nivells ( tractaments) de la variable explicativa? 5.
  • Quina és la mitjana de la conductivitat per a les peces amb recobriment tipus 1? 145. I la de les de tipus 2? 147. Quin tipus de recobriment sembla que té una conductivitats més baixa en mitjana? La 4.
  • Quina és la mediana de la conductivitat de les peces de tipus 4? 129. És la més baixa? si.
  • Quin tipus de recobriment ens dóna una desviació estàndard més gran? 2.
  • De forma totalment intuïtiva, creieu que la mitjana poblacional de la variable conductivitat és la mateixa pels 5 tipus de recobriment? No.
  • De forma totalment intuïtiva, diríeu que la variància de la variable conductivitat és aproximadament la mateixa per a cada tipus de recobriment? No.
  • A la vista dels cinc diagrames de caixa anteriors podríeu suposar que la conductivitat es diferencia en funció del tipus de recobriment? Si. Per què? En el diagrama es pot veure que tant la mitjana, els valors mínims, màxims i variança són diferents segons el tipus de recobriment.
  • Els cinc diagrames de caixa tenen el mateix perfil? No. Què els diferencia? la variança.
  • Gràficament, quina és aproximadament la mediana de la conductivitat del recobriment de tipus 1? 144. I la de tipus 5? 145.
  • És convenient estudiar la conductivitat per separat en funció del tipus de recobriment? Si. Per què? Hi ha molta dispersió de les dades.
  • Quin valor hem obtingut? 0.9312873. Aquest valor confirma l’existència d’una correlació lineal prou bona i positiva entre les variables pote i vmax? Si.
  • Representeu gràficament el diagrama de dispersió d’aquestes dues variables.
  • Diries que el patró de variació conjunta d’aquestes dues variables és lineal? Si.
  • Calcula i comenta el coeficient de correlació r -0.
  • Et sembla lògic el signe de la correlació entre aquestes dues variables? Sí, ja que potència és inversament proporcional a acce.
  • Comenta gràficament i numèrica la correlació entre les variables log.pote i vmax.0.
  • Creus que la transformació logarítmica de la variable pote ha ajudat a calcular millor la seva correlació amb la variable vmax? si.
  • Les variables pote i male, estan correlacionades? Feu una anàlisi gràfica i numèrica semblant a les anteriors (no cal que apliqueu cap tipus de transformació) i expliqueu les

preu= 94.44vmax-14113.

  1. Quina seria la variable que en principi ens explicaria millor gràficament el preu d’un vehicle (analitza-ho fent diagrames de dispersió per parelles de variables quantitatives del conjunt de dades cotxes).

La cilindrada

  • Fixeu-vos en el gràfic de la funció de densitat binomial de la B(10, 0.7). És simètrica? No. Per què? Perquè només és simètrica quan p=0.5.
  • Quina és la moda d’aquestes dades? 7. Per què? És el que té més probabilitat.
  • A partir del gràfic, quina és la probabilitat aproximada de tenir 5 èxits? Coincideix aproximadament amb el valor P[X = 5] exacte? 0.11, coincideix aproximadament.
  • Fixeu-vos en el gràfic de la funció de distribució binomial B(10, 0.7). Quina forma té? Té forma esglaonada. És coherent el gràfic amb el fet de ser una distribució discreta? si. Per què? la funció creix a salts ja que la probabilitat només es troba en els valors enters.
  • Quina és la probabilitat aproximada de tenir fins a 5 èxits? P[X ≤ 5] = 0.2.
  • Aproximadament a quants èxits hem acumulat una probabilitat del 15%? P[X ≤ 4] = 0.15.
  • Calculeu la probabilitat de tenir exactament una longitud de 13mm: 0.
  • Fixeu-vos en el gràfic de la funció de densitat de la N(10, 3). És simètrica? Si. Per què? Perquè la normal és simètrica respecte la mitjana.
  • Quina és la probabilitat de tenir longituds inferiors a 10? P[X < 10] = 50%.
  • Quina és la moda d’aquestes dades? 10. Per què? Per què en la normal la moda coincideix amb la mitjana.
  • Fixeu-vos en el gràfic de la funció de distribució. Quina forma té? Té forma de s. És diferent el gràfic del d’una distribució discreta? Si. Per què? perquè és discreta.
  • Quina és la probabilitat aproximada de tenir longituds fins a 5mm? P[X ≤ 5] = 0.05. • Aproximadament a quin valor tindríem acumulades el 80% de les longituds? P[X ≤ 15] = 0.80.
  • Observem el perfil de l’histograma. Creieu que es pot considerar simètric? No. Cap a on té el biaix? dreta.
  • Observem el perfil de l’histograma de la variable nova. Creieu que es pot considerar simètric? Si. Cap a on té el biaix? No té
  • Indiqueu el valor de la mitjana (mean) 2.995163. És igual o s‘aproxima a algun dels valor que li havíem proporcionat al generar una mostra de dades lognormals? si. A quin? meanlog. Per què? La mitjana no canvia encara que s’apliqui logaritme.
  • Indiqueu el valor de la desviació típica (sd) 0.989605. És igual o s‘aproxima a algun dels valor que li havíem proporcionat al generar una mostra de dades lognormals?Si. A quin? sd. Per què? La desviació típica no canvia encara que s’apliqui logaritme.
  • És simètric el gràfic? No. Per què? Té baix cap a la dreta.
  • Quina semblança tenen els dos gràfics? Té baix cap a la dreta.
  • Quina relació podem establir entre les distribucions Poisson i binomial quan la llei binomial té una n molt gran i una probabilitat p petita? λ=n⋅p
  • Valoreu l’ajust de les dades per la llei Xi-quadrat: S’ajusta bé per les dades de valors grans i mitjans, però no per les dades de valors petits.

Feu una anàlisi descriptiva i gràfica de la variable obs del ´data.frame´ fiabilitat:

  • Mitjana: 98.62685 Mediana: 76.70177 Desviació estàndard: 119.4558 Quantils: 0% 25% 50% 75% 100% 0.4161402 19.7898032 76.7017683 99.8323206 450.4753221.
  • Histograma. Comenteu-ne la forma:Té un baix important cap a la dreta.
    • Quin model penseu que es pot ajustar a les dades? El model exponencial.
  • Quant val l’estimació de λ? 0.01013923.
  • Raoneu si es pot acceptar que el temps de vida segueix aquest model exponencial? Si, ja que la majoria de valors s’ajusten al model i només uns pocs es surten lleugerament.
  • Calculem la proporció esperada de components electrònics que viuran més de 200 unitats de temps:0.1316188.

1.2. Comproveu que la mitjana de norm3 és aproximadament 30 i la desviació tipus aproximadament 5. mitjana=29,95746, sd=5.

  1. Resteu les variables norm1 i norm2, guardeu els resultats a la variable norm4 : 2.1. Comproveu amb un histograma que els valors de la variable norm4 segueixen una llei normal. Segueix la distribució normal

2.2. Comproveu que la mitjana de norm4 és aproximadament 10 i la desviació tipus aproximadament 5. mitjana=9.953827, sd=4.

  1. Multipliqueu la variable norm1 per 2, guardeu els resultats a la variable norm5 : 3.1. Comproveu amb un histograma que els valors de la variable norm5 segueixen una llei normal.

3.2. Comproveu que la mitjana de norm5 és aproximadament 40 i la desviació tipus aproximadament 8 mitjana= 199.6177, sd=73.

  1. Resoleu el següent problema fent servir RStudio: un professor d’Història d’un institut de batxillerat fa classe cada dilluns, a les 9h del matí. El professor surt de casa seva a les 8h 50 min; la duració del trajecte és una v.a. normal de mitjana 10 min i σ = 7 min. 4.1. Representeu gràficament la funció de densitat i la funció de distribució del temps del trajecte.

4.2. Calculeu la probabilitat que la classe comenci abans de les 9h 5min. [0.7625]

4.3. Són les 9h 5min i el professor no ha arribat. Quina és la probabilitat que arribi en els pròxims 3 minuts? [0.4672] 0.

  1. Escolliu una distribució de probabilitat difierent de la normal i de la exponencial. Amb aquesta distribucio que heu escollit, repetiu el procés fet amb la distribució exponencial per demostrar que el Teorema del Límit Central es compleix amb qualsevol distribució. 6. Deu anàlisis repetides de la concentració de mercuri en una mostra de condensat de gas comercial van proporcionar els següents resultats (en ng ml−1 ): 23.3, 22.5, 21.9, 21.5, 19.9, 21.3, 21.7, 23.8, 22.6, 24.7. Analitzeu si aquestes dades es poden ajustar raonablement bé per una llei normal.
  • Quant val el valor de la línia central? CL = 79.99937. Com es calcula? És la mitjana de les mitjanes de cada mostra.
  • Quant valen els valors dels dos límits de control del gràfic? LCL = 79,85668 i UCL = 80,14205. Com es calculen? a LCL es resta A2, a UCL es suma A2 de la mitjana de mitjanes, A2 prové d’una taula i depèn de la mida de la mostra.
  • Està el procés controlat o fora de control? Està controlat. Per què? Cap mitjana està fora de UCL o LCL. NI compleix cap de les regles que indica que està fora de control.
  • Quins són el límits de control? LCL=79,85668, UCL= 80,14205.
  • Està el procés fora de control? No. Per què? Hi ha una mitjana que es surt dels límits.
  • A la vista de l’evolució global del gràfic, creieu que el descontrol del procés va ser degut a una causa fortuïta o a una causa sistemàtica? Raoneu la vostra resposta: A una causa fortuita, ja que és un error puntual.

Quant val el valor de la línia central? CL = 0,1017448. Com es calcula? Mitjana de les desviacions típiques de cada mostra.

  • Quant valen els valors dels dos límits de control del gràfic? LCL = 0 i UCL = 0,212544. Com es calculen?UCL = B4𝑠̅ i LCL = B3𝑠̅. El valor de B4 i B3 ve donat en una taula i el valor que prengui dependrà de la mida de la mostra. En aquest cas la mostra té mida 5, en aquest cas B4= 2.089 i B3= 0.
  • Quina és la mitjana de la variable len i la desviació estàndard? x¯ = 950.0157. s = 0.2674321.
  • A la vista de la informació numèrica anterior, diríeu intuïtivament que la longitud mitjana és de 950mm? Si. També podeu representar de forma gràfica la variable, per exemple podeu crear l’histograma o el diagrama de caixa de la variable len.

Presenta dades atípiques aquesta variable? Si, hi ha dos casos atípics. Aquests casos corresponen als valors 949.2128 i 949.3038.

  • Quant val el valor de l’estadístic de contrast (t) d’aquest test? 0.6433.
  • Com el calcularies “manualment”? Usant l’estadístic de contrast d’una mitjana (formula)
  • Quant val el valor p ( p-value) d’aquest contrast? 0.5213.
  • Fixeu-vos que per a calcular aquest valor p necessitem conèixer la hipòtesi alternativa que ens diu a la següent línia. alternative hypothesis: true mean is not equal to 950
  • Si haguessis de calcular manualment aquest valor p amb ajuda de taules estadístiques, com el calcularies? Es busca a la taula de la t - Student. En la columna dels graus de llibertat es busca el valor 119 o proper, en aquest cas escollim la fila del 120 graus de llibertat. En aquesta fila, es busca el valor de tobs=0.6433 o més propers. En aquest cas el més proper és el valor t=1.289 de la primera columna, que correspon a una àrea de 0.1 en la cua a la dreta. Aleshores, el nostre valor p, d’un constrast bilateral, serà major que 2 ⋅0.1=0.
  • A la vista d’aquesta informació, quina és la decisió que prens? No tenim motius per rebutjar la hipòtesi nul·la i acceptem que en mitjana la longitud és 950.
  • Amb aquesta decisió, quin tipus d’error (I o II) pots cometre? Cometem un error de tipus II, ja que estem acceptant la hipòtesi nul·la que podria ser falsa. Si l’error és de tipus I, quina probabilitat tens de cometre’l? L’error màxim que puc cometre dependrà del nivell de significació que s’hagi decidit al principi del contrast, en aquest cas el nivell de significació considerat és de 0.05. Encara que si decidim Rebutjar la hipòtesi nul·la, la probabilitat de cometre l’error és 0.5213.

Realitzem de nou el contrast canviant la hipòtesi alternativa, primer per menor que i després per major que

  • Quines diferències observes en els resultats? El p valor és major amb la hipótesis alternativa de ‘menor que’ i menor en ‘major que’.
  • Quines relacions tenen els 3 valors p? La relació existent entre els p-valors dels contrastos unilaterals és que un és el complementari de l’altre. En el cas del contrast bilateral, com que el p-valor es reparteix entre les dues cues, p / 2 = 0.2606 que coincideix amb el p - valor del contrast unilateral per la dreta. Per què? Com la probabilitat de tenir estimadors més extrems que l’obtingut amb la meva mostra, d’acord amb la hipòtesi alternativa H i en ser les hipòtesis complementàries, els p-valors es complementen en el cas de contrastos unilaterals. Al bilateral cal tenir en compte que el p-valor es reparteix entre les cues.
  • Quina és la mida de la mostra utilitzada per fer l’estimació? 120.
  • Calcula l’error estàndard (s/√ n) de la mitjana mostral. 0.2674321/√120=0.0244.
  • Quin és ara el nou interval de confiança? ( 949.9518, 950.0796).
  • Per què aquest interval és més llarg que l’anterior? L’interval de confiança augmenta quan augmenta la variància de la mostra o el nivell de confiança i disminueix quan la mida de la mostra augmenta. Si augmenta el nivell de confiança, disminueix α , i aquest fet fa que s’hagin valors més extrems del quantil de la distribució t-Student i obtenim intervals més llargs.
  • Quantes peces defectuoses hi ha a la mostra? 4.
  • Quina és la proporció de peces defectuoses? 0.03333333.
  • Quant val el valor p d’aquest contrast? 0.2011.
  • A la vista d’aquest valor p, què suggereixen les dades sobre la pregunta inicial?. No podem rebutjar Ho
  • Quin tipus d’error (I o II) pots cometre amb aquesta decisió? Error tipus II.
  • Tens possibilitat de saber quina probabilitat tens d’equivocar-te amb la teva decisió? Fixat el nivell de significació α, la β=P(error de tipus II) depèn del vertader valor del paràmetre θ.
  • Si decidissis rebutjar la H0 : π ≥ 0.05, quin tipus d’error (I o II) podries cometre? error tipus I.
  • Si decidissis rebutjar la H0 : π ≥ 0.05, quina probabilitat tens d’equivocar-te amb la teva decisió? L’error màxim que puc cometre dependrà del nivell de significació que s’hagi decidit a el principi del contrast, en aquest cas el nivell de significació considerat és de 0.05. Encara que, en aquest cas, si decidim Rebutjar la probabilitat de cometre l’error és 0.2011.
  • Quina és l’estimació puntual del valor de π (proporció de cordes defectuoses)? 0.03333333.
  • Quina és l’estimació de interval, a un nivell de confiança del 95%, del valor de π? ( 0.01303755 , 0.08258034).
  • Quant val el valor de l’estadístic de contrast (Xi) d’aquest test? 212.77. • Com el calcularies “manualment”? (n-1)s^2/o^2.
    • Quant val el valor p (p-value) d’aquest contrast? 2.824e-07.

La mitjana es troba fora de control

  1. L’arxiu materials.rda conté dades sobre maons de 29 x 14 x 5.2 cm que estem produint. Les variables que conté aquest arxiu són: • llarg Longitud dels maons (cm) • traves Amplada dels maons (cm) • gruix Gruix dels maons (cm) • fabrica Fabricant dels maons (A o B) • resist1 Resistència d’un maó calculada pel mètode tradicional (kp/cm2 ) • resist Resistència del mateix maó calculada per un nou mètode (kp/cm2 ) 4.1. Contrasteu la hipòtesi nul·la H0 de que la longitud dels maons és igual a 29. Estudieu les diferents hipòtesis alternatives. two sided : p-value = 0. less: p-value = 0. greater: p-value = 0. 4.2. Calculeu un interval de confiança al 99% de la variància del gruix. two sided : p-value = 1.654e- less: p-value = 8.272e- greater: p-value = 1
  • Comenta raonant perquè aquestes dades corresponen a un disseny de dades aparellades i no a dues mostres independents. Perquè els valors de la segona recol·lecció de dades estan influenciats per la primera.
  • Quant val la mitjana de la freqüència cardíaca inicial? 75.
  • Quant val la mitjana de la freqüència cardíaca final? 72.5.
  • Comenta el que observes al diagrama de caixa múltiple.Mitjana i variança han disminuït.
    • Creus intuïtivament que el programa d’entrenament fa disminuir la freqüència cardíaca en repòs? si.
  • Quant val el valor de l’estadístic de contrast (t) d’aquest test? -3.0234.
  • Quant val el valor p (p-value) d’aquest contrast? 0.003495.
  • Quants graus de llibertat té la distribució t-Student emprada? 19.
  • A la vista d’aquesta informació, quina és la decisió que prens?Rebutjar Ho i acceptem hipòtesi alternativa.
  • Amb aquesta decisió, quin tipus d’error (I o II) pots cometre? Error tipus I.
  • Si l’error és de tipus I, quina probabilitat tens de cometre’l? 0.003495.
  • Què canvia en la distribució tenint en compte que les dades són o no són aparellades? En mostres aparellades treballem amb la variància de la diferència, en mostres independents treballem amb dues variàncies i hem de preguntar-nos sobre si les variàncies poblacionals podem suposar-les o no iguals. També varien els graus de llibertat i la manera de calcular els

estadístics, per dades aparellades els graus de llibertat són n−1 i en mostres independents són

n 1 +n 2 −2 o inferiors..

  • Quant val l’estimació, a un nivell de confiança del 95%, de la diferència μaf ter − μbefore de mitjanes poblacionals? ( -3.7229877, -0.6770123 ).
  • Quant val l’estimació, a un nivell de confiança del 99%, de la diferència μaf ter − μbefore de mitjanes poblacionals? ( -4.2817574, -0.1182426 ).
  • Quants ítems MDef s’han fabricat realment del model B? 35.
  • Quants ítems MDef fabricats del model B hom esperaria trobar en el supòsit d’independència de les dues variables categòriques? 38.47853.
  • Com s’obté aquesta freqüència esperada a partir de les freqüències marginals? Per

calcular la freqüència esperada de la casella ij es multiplica la marginal de la fila i per la marginal

de la fila j dividit pel total d’individus..

  • Quant val l’estadístic χ 2 d’aquest contrast? 1.6316.
  • Quants graus de llibertat té la distribució χ 2 que s’utilitza per calcular el valor p d’aquest contrast? 6. Justifica’l:El graus de llibertat es corresponen al nombre de cel·les de la taula que poden prendre un valor “lliure”. En aquest cas, com que és una taula de doble entrada o taula de contingència, per a cada filera, la cel·la de la darrera columna dependrà de les altres, ja que coneixem les marginals, i el mateix per a cada columna, la cel·la de la darrera filera també serà depenent. Són dependents totes les cel·les de la darrera columna i totes les de la darrera filera. Es poden calcular els graus de llibertat, les cel·les no dependents, amb la fórmula

(nombre de files de la taula−1)(nombre de columnes de la taula−1). Es a dir,

  • Quant val el valor p d’aquest contrast? 0.9503.
  • Quina és, doncs, la conclusió final d’aquest contrast d’independència? El valor p és molt gran, no tenim prous motius per rebutjar hipòtesi nul·la. Assumim que són independents.
  • Quant val la longitud mitjana i la desviació estàndard de les mostres de E1? x¯E1 = 949.9756 sE1 = 0.2710518.
  • Quant val la longitud mitjana i la desviació estàndard de les mostres de E6? x¯E6 = 949.9997 sE6 = 0.2194606.
  • Creieu que les dues desviacions estàndard mostrals són prou semblants com per que puguem considerar que les variàncies poblacionals són iguals? Si
  • A la vista de la informació numèrica i gràfica anterior, diríeu intuïtivament que hi ha diferència significativa entre la longitud dels dos tipus de cordes? No. Ara que ja tenim una idea intuïtiva de les dades anem a realitzar formalment el contrast d’igualtat de mitjanes que havíem previst. A la vista de la manera com s’han recollit les
  • I les variabilitats? Hi ha diferència entre els distints tipus de cordes.
  • Creieu que hi ha homogeneïtat de variàncies? En la gràfica valors residuals vs valors ajustats, Residuals vs Fitted, podem veure com el valor central no varia molt respecte al valor 0 i podem assumir homogeneïtat de variàncies..
  • Es compleix l’assumpció de normalitat dels residus? Si.

Quina és la hipòtesis nul·la i alternativa d’aquest contrast? Ho= hi ha homogeneïtat, H1=no hi ha homogeneïtat.

  • Segons el contrast es compleix el supòsit d’homogeneïtat de variàncies? si. Per què? P valor no és prou petit com per rebutjar Ho.
  • Segons el contrast es compleix el supòsit de normalitat? Si. Per què? p no és prou petit per rebutjar Ho.
  • Quina és la hipòtesis nul·la del contrast ANOVA realitzat? Ho= totes les mitjanes són iguals.
  • Amb els resultats obtinguts rebutgem o acceptem la hipòtesis nul·la? L'acceptem, ja que el valor p no és prou petit com per rebutjar-la. I això què implica per la longitud dels diferents tipus de cordes? Assumim que tenen la mateixa mitjana.
  • Quants tipus de corda es pot considerar que tenen un valor de power significativament diferent? Set comparacions detecten diferències significatives (valors p <α=0. ). N’hi ha algun que mès difereixi dels altres?. Quin? Tal com hem observat gràficament, la corda D4 és significativament diferent a les altres. La hipòtesi es confirma amb els valors p de les diferents cordes respecte la corda D4 i algunes (A5, B2 i E1) també amb G ..
    • Com interpretes el codi de lletres final? En les comparacions múltiples, com tenim molts valors p que et diuen dos a dos si són iguals els teus grups, el que fem és agafar dos grups inicials, diem-ne Grup1 i Grup2, i si no són significativament diferents els hi atorgues la lletra A als dos. A continuació agafem un tercer grup Grup3 i si és igual que tots dos també serà del grup A. Si Grup3 és igual que Grup1 però diferent de Grup2, agafem una nova lletra i Grup1 i Grup3 seran del grup B. Llavors tenim que Grup1 és AB, Grup2 és A i Grup3 és B. Agafes un quart grup i així anar fent. En l’anàlisi dels nostres grups tenim les següents assignacions de cordes a grups: A5 -> C, B2 -> C, D4 -> A, E1 -> C, E6 -> BC, G3 -> AB. Vol dir que A5, B2, E1 i E6 són iguals (no són significativament diferents) entre ells (tenen la lletra C), D4 és només igual a G3, i G3 també és igual que E6 (però E6 no és igual a D4, sinó amb una sola lletra passaríem). Els que tenen dues lletres és com si fossin de la intersecció entre dos grups ..
  1. Feu un contrast d’Anderson-Darling (A-D) de normalitat de la variable power, que es diferencia del Shapiro-Wilk per donar un pes més important a les cues. A = 0.72164, p-value = 0.
  2. L’arxiu materials.rda conté dades sobre maons de 29 x 14 x 5.2 cm que estem produint. Les variables són • llarg Longitud dels maons (cm) • traves Amplada dels maons (cm) • gruix Gruix dels maons (cm) • fabrica Fabricant dels maons (A o B) • resist1 Resistència d’un maó calculada pel mètode tradicional (kp/cm2 ) • resist2 Resistència del mateix maó calculada per un nou mètode (kp/cm2 )

2.1. Estudieu si hi ha diferència significativa o no entre el gruix de maons segons el fabricant. Assumiu igualtat o no de variàncies segons el contrast adient. F test to compare two variances

data: gruix by fabrica F = 1.9664, num df = 34, denom df = 29, p-value = 0. alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.9535114 3. sample estimates: ratio of variances

No podem rebutjar Ho, igualtat variançes. 2.2. Contrasteu la hipòtesi nul·la segons la qual la mitjana de la resistència és igual pels dos mètodes de càlcul. Two Sample t-test

data: gruix by fabrica t = -2.8358, df = 63, p-value = 0. alternative hypothesis: true difference in means between group A and group B is not equal to 0 95 percent confidence interval: -0.49338130 -0. sample estimates: mean in group A mean in group B 5.152571 5. Podem rebutjar Ho i acceptar H1, hi ha diferència significativa.

2.3. Treballeu la variable llarg a fi i a efecte d’ajustar-li una distribució de probabilitat. Confirmeu el resultat sobre la bondat d’ajust a través del contrast χ 2.

  • A la vista dels resultats, es compleix el supòsit normalitat? No. Per què?Moltes dades es surten al diagrama Q-Q, i el p valor és prou petit per rebutjar Ho.
  • Quin tipus de biaix té? A la dreta.
  • Quina transformació podem aplicar sobre SO2 per tal de millorar la seva normalitat? logaritme.
  • Comenta gràficament i numèrica la normalitat de la variable ln.SO2. Shapiro-Wilk normality test

data: dades.sokal$ln.SO W = 0.95399, p-value = 0.