Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


estadística aplicada, Apuntes de Estadística

exercicis d'estadistica aplicada

Tipo: Apuntes

2020/2021

Subido el 26/05/2021

ELISAAAA____
ELISAAAA____ 🇪🇸

5

(10)

31 documentos

1 / 8

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
ESTADÍSTICA APLICADA divendres 26 d’abril de 2019 MODEL A
Nom: ________________________ Cognoms:__________________________________________________
Número estudiant:_____________________________ GRAU: BIO/BIOTEC/CA/QUIM/BIO+BIOTEC/BIO+CA
(encercla el grau en que estàs matriculat)
ESCRIVIU A LA TAULA LA RESPOSTA QUE CONSIDEREU CORRECTE
Només és certa una de les quatre respostes.
Cada resposta correcta A LA TAULA val 0.3 punts; en blanc 0 punts; resposta incorrecta -0.1 punts.
Pregunta T1 T2 T3 T4 T5 T6 T7 T8 T9 T10
Resposta C C B D A B B D C A
TEST (3 punts)
T1. Quina de les següents afirmacions és CERTA:
a) La mitjana, la desviació i l’amplitud són estadístics robustos.
b) El coeficient de variació expressa la mitjana com a tant per cent de la desviació estàndard.
c) La variància d’x té unitats de x2.
d) L’amplitud interquartíl·lica canvia molt quan hi ha dades atípiques.
T2. El diagrama següent mostra els valors d’acidesa (pH) de l’aigua de pluja i neu mesurats durant un any a
Pennsilvània, USA. Quina de les següents afirmacions és FALSA.
a) El diagrama de caixa mostra que hi ha una
dada atípica.
b) La distribució del pH té un biaix a la dreta.
c) La mitjana del pH és menor que la mediana.
d) L’amplitud interquartíl·lica del pH val 0.6.
T3. Només el 24.7% dels caucàsics tenen els ulls blaus. A la sèrie de televisió Mr. Sunshine, els 5 actors
principals són caucàsics amb els ulls blaus. Suposant que la tria dels actors caucàsics ha estat totalment a
l’atzar d’entre la seva població, quina és la probabilitat que de cinc caucàsics, tots tinguin els ulls blaus?
a) 0.5595
c) 0.2421
b) 0.0009
d) 0.014
T4. La taula següent resumeix les dades de descàrrega d’una App d’entrenament personal. Per cada descàrrega
es coneix el gènere de l’usuari i els dies que l’ha fet servir. Quina de les següents afirmacions és CERTA:
Cap
<1 setmana
1
-
2 setmanes
>3 setmanes
Gènere
Dona
613
552
183
425
Home
477
293
79
205
Altre
16
12
8
7
a) La proporció d’homes i dones que han fet servir l’App és la mateixa.
b) L’11.5% dels homes ha fet servir l’App >3 setmanes.
c) El percentatge d’usuaris «Altre» és 2%.
d) El percentatge d’usuaris de la categoria «<1 setmana» és menor que els de la categoria «Cap».
pf3
pf4
pf5
pf8

Vista previa parcial del texto

¡Descarga estadística aplicada y más Apuntes en PDF de Estadística solo en Docsity!

ESTADÍSTICA APLICADA divendres 26 d’abril de 2019 MODEL A Nom: ________________________ Cognoms:__________________________________________________ Número estudiant:_____________________________ GRAU: BIO/BIOTEC/CA/QUIM/BIO+BIOTEC/BIO+CA (encercla el grau en que estàs matriculat) ESCRIVIU A LA TAULA LA RESPOSTA QUE CONSIDEREU CORRECTE Només és certa una de les quatre respostes. Cada resposta correcta A LA TAULA val 0.3 punts; en blanc 0 punts; resposta incorrecta -0.1 punts.

Pregunta T1 T2 T3 T4 T5 T6 T7 T8 T9 T

Resposta C C B D A B B D C A

TEST (3 punts) T1. Quina de les següents afirmacions és CERTA: a) La mitjana, la desviació i l’amplitud són estadístics robustos. b) El coeficient de variació expressa la mitjana com a tant per cent de la desviació estàndard. c) La variància d’x té unitats de x^2. d) L’amplitud interquartíl·lica canvia molt quan hi ha dades atípiques. T2. El diagrama següent mostra els valors d’acidesa (pH) de l’aigua de pluja i neu mesurats durant un any a Pennsilvània, USA. Quina de les següents afirmacions és FALSA. a) El diagrama de caixa mostra que hi ha una dada atípica. b) La distribució del pH té un biaix a la dreta. c) La mitjana del pH és menor que la mediana. d) L’amplitud interquartíl·lica del pH val 0.6. T3. Només el 24.7% dels caucàsics tenen els ulls blaus. A la sèrie de televisió Mr. Sunshine, els 5 actors principals són caucàsics amb els ulls blaus. Suposant que la tria dels actors caucàsics ha estat totalment a l’atzar d’entre la seva població, quina és la probabilitat que de cinc caucàsics, tots tinguin els ulls blaus? a) 0.5595 c) 0. b) 0.0009 d) 0. T4. La taula següent resumeix les dades de descàrrega d’una App d’entrenament personal. Per cada descàrrega es coneix el gènere de l’usuari i els dies que l’ha fet servir. Quina de les següents afirmacions és CERTA: Cap <1 setmana 1 - 2 setmanes >3 setmanes Gènere Dona 613 552 183 425 Home 477 293 79 205 Altre 16 12 8 7 a) La proporció d’homes i dones que han fet servir l’App és la mateixa. b) L’11.5% dels homes ha fet servir l’App >3 setmanes. c) El percentatge d’usuaris «Altre» és 2%. d) El percentatge d’usuaris de la categoria «<1 setmana» és menor que els de la categoria «Cap».

T5. Si el coeficient de correlació lineal de Pearson entre dues variables és -0,8. Quina de les següents afirmacions és CERTA: a) La covariància és negativa. b) Hi ha poca relació lineal entre les variables. c) Hi ha un error de càlcul. d) La relació entre les variables és directa. T6. Quina de les següents afirmacions és FALSA: a) El valor p és la probabilitat d’equivocar-te si acceptes la Hipòtesis alternativa. b) El valor p és la probabilitat d’equivocar-te si no rebutges la Hipòtesis nul·la. c) El valor p és la probabilitat d’equivocar-te si rebutges la Hipòtesis nul·la. d) El valor p és la probabilitat d’obtenir valors tant o més extrems que l’estadístic de contrast. T7. Si la probabilitat de tenir la malaltia A és del 50%, la de tenir la malaltia B és del 30% i la de tenir com a mínim una de les dues és del 65%. a) La probabilitat de tenir les dues malalties és l’25%. b) Tenir la malaltia A i tenir la malaltia B són dos esdeveniments independents. c) La probabilitat de tenir les dues malalties és el 35%. d) La probabilitat de tenir les dues malalties és el 20%. T8. Quina d’aquestes sortides gràfiques no serveix per identificar si unes dades s’ajusten a un model Normal. a) b) c) d) T9. Una de les següents afirmacions no es refereix a la distribució Normal. a) És simètrica respecte a la seva mitjana. b) Queda definida per la mitjana i la desviació estàndard. c) És una distribució de probabilitat de variable discreta. d) La Mitjana, Moda i Mediana coincideixen. T10. Quina de les següents propietats no es refereix a un model de Poisson. a) La mitjana és igual a la desviació estàndard. b) La mitjana és igual a la variància. c) El paràmetre  és igual a . d)  augmenta proporcionalment a l’augment de l’interval. 80 90 100 120 obs sample -2 -1 0 1 2 80 90 100 110 120 norm quantiles obs sample sample obs frequency 80 90 100 110 120 130 0 5 10 15 20 60 80 100 120 140 50 100 150 200 pit_circ pes

T6. La taula següent resumeix les dades de descàrrega d’una App d’entrenament personal. Per cada descàrrega es coneix el gènere de l’usuari i els dies que l’ha fet servir. Quina de les següents afirmacions és CERTA: Cap <1 setmana 1 - 2 setmanes >3 setmanes Gènere Dona 613 552 183 425 Home 477 293 79 205 Altre 16 12 8 7 a) L’11.5% dels homes ha fet servir l’App >3 setmanes. b) La proporció d’homes i dones que han fet servir l’App és la mateixa. c) El percentatge d’usuaris de la categoria «<1 setmana» és menor que els de la categoria «Cap». d) El percentatge d’usuaris «Altre» és 2%. T7. Quina de les següents propietats no es refereix a un model de Poisson. e)  augmenta proporcionalment a l’augment de l’interval. f) El paràmetre  és igual a . g) La mitjana és igual a la variància. h) La mitjana és igual a la desviació estàndard. T8. El diagrama següent mostra els valors d’acidesa (pH) de l’aigua de pluja i neu mesurats durant un any a Pennsilvània, USA. Quina de les següents afirmacions és FALSA. a) La mitjana del pH és menor que la mediana. b) El diagrama de caixa mostra que hi ha una dada atípica. c) L’amplitud interquartíl·lica del pH val 0.6. d) La distribució del pH té un biaix a la dreta. T9. Quina de les següents afirmacions és CERTA: a) La mitjana, la desviació i l’amplitud són estadístics robustos. b) La variància d’x té unitats de x^2. c) L’amplitud interquartíl·lica canvia molt quan hi ha dades atípiques. d) El coeficient de variació expressa la mitjana com a tant per cent de la desviació estàndard. T10. Només el 24.7% dels caucàsics tenen els ulls blaus. A la sèrie de televisió Mr. Sunshine, els 5 actors principals són caucàsics amb els ulls blaus. Suposant que la tria dels actors caucàsics ha estat totalment a l’atzar d’entre la seva població, quina és la probabilitat que de cinc caucàsics, tots tinguin els ulls blaus? a) 0.0009 c) 0. b) 0.5595 d) 0.

PROBLEMES (7 punts) P1. (1.5 punts) La taula de dades següent mostra els resultats d’un estudi fictici en el que s’analitzen de 15 individus el gènere (“Gender”; 1=dona, 2=home), el pes (“Weight” en lliures) i la puntuació en fitness (“Score”; valor de 0 a 100). A més a més s’inclou la variable “Ranking” que ordena els participants per puntuació de fitness. Mirant les següents sortides d’R respon les preguntes. a. (0.3p) De quin tipus és la variable gènere (“Gender”)? Què ens indica el valor de mean de la variable “Gender” amb un valor de 1.6? Gender és de tipus categòric. 0.1p El valor de la mitjana de 1.6 indica que n’hi ha més de la categoria 2 (home) que de la categoria 1 (dona). (0.2p) b. (0.3p) Té biaix la variable pes (“Weight”)? Justifica la resposta. La variable té una mitjana (144.73) més gran que la mediana (130) per tant té baix cap als valors grans. (0.3p) c. (0.3p) Té dades atípiques la variable pes (“Weight”)? Justifica la resposta. Per saber si té dades atípiques hem de mirar si tenim dades que x < Q1 - 1.5 AIQ o bé x > Q3 + 1.5 AIQ. (0.15p) En el nostre cas, x<108-1.567=7.5 o x > 175 + 1.567=275.5, (0.15p) com que el mínim és major que 7.5 i el màxim menor que 275.5, no tenim dades atípiques (0.15p) d. (0.3p) Quin gràfic seria adient per veure si el pes dels homes és diferent al de les dones? Com que tenim una variable numèrica i una altra variable categòrica, el gràfic més adequat seria un gràfic de caixa múltiple (0.3p). e. (0.3p) Creus que hi ha algun tipus de relació entre el pes (“Weight”) i la puntuació en fitness (“Score”)? Justifica la resposta en base a l’anàlisi gràfica i numèrica. En base a l’anàlisi gràfica no es veu cap patró de relació entre les dues variables. (0.15p) En base a l’anàlisi numèrica, hem de valorar el coeficient de correlació lineal. Aquest val 0.05615805 que és un valor molt proper a 0, per tant ens indica que no hi ha cap relació lineal entre les variables (0.15p)

e. (0.5p) Calculeu la probabilitat que el temps de vida total de 25 bombones sigui com a mínim de 5200 hores. T25 = {El temps de vida total de 25 bombones} serà la suma dels 25 temps de vida. Com que són Normals, la nova esperança és suma d’esperances i la nova variància és suma de variàncies. T25 es distribuirà com una N(μ=25200h, σ^2 =2520^2 ) o el que és el mateix una N(μ=5000h, σ=100h), per tant, com que N5000,100,0.0228=5200, llavors P( T25>5200) = 0. (paràmetres de la nova distribució N (0.3p) , càlcul probabilitat Normal (0.2p)) P4. (1.5 punts) A Andalusia, la distribució del grup sanguini és, per als grups A, B, AB i 0, respectivament 35%,10%, 6% i 49%. A Màlaga es va estudiar una mostra aleatòria de 200 persones i d’aquestes el 42%, 30%, 18% i 10% van ser respectivament dels grups A, B, AB i 0. Podem dir que la distribució del grup sanguini a Màlaga segueix el patró d’Andalusia? Utilitza α=0.05. a. (0.4p) Quina és la H 0 i la H 1 del contrast? La H 0 és que la mostra s’ajusta al model de probabilitats d’Andalusia (0.2p) La H 1 és que no s’ajusta a aquest model (0.2p) b. (0.7p) Quin és l’estadístic de contrast i la regió d’acceptació (indica quin nivell de significació agafes)? Podem fer servir dos estadístics de contrast possibles el G i el X^2. Tots dos es distribueixen segons una 2  amb 4-1=3 graus de llibertat, ja que tenim 4 classes. Aquests són: 2 1 1

  k

k i (^) i i i

E

O

G Oln ~ 

2 1 1 2 2  

 k

k i (^) i i i

E

O E

X ~ 

Per al seu càlcul: Observats 20042=84 20030=60 20018=36 20010= Esperats 20035=70 200=10=20 2006=12 20049=98 Suma (o-e)^2 /e 142 /70 402 /20 242 /12 782 /98 X=192. oln(o/e) 84ln(84/70) 60ln(60/20) 36ln(36/12) 20ln(20/98) 88. G=2*88.9971=177. Com que 𝜒ଷ^ ଶ,^ ଴.ହ= 2.366, la regió d’acceptació serà [0, 2.366]. (Estadístic (0.1p), graus de llibertat (0.1p), càlcul EC (0.3p), regió d’acceptació (0.2p)) c. (0.4p) Justifica la conclusió que treus. Com que l’estadístic de contrast en ambdós casos està fora la regió d’acceptació, tinc prou motius per refusar la H 0 i acceptar H 1 , i per tant decidir que la mostra de Màlaga NO segueix les proporcions d’Andalusia ( comparació EC amb RA (0.2p), decisió correcta (0.2p))

Formulari

ESTADÍSTICA DESCRIPTIVA

Freq. absoluta: ni Freq. relativa: ni/n 𝒙ഥ = ∑ 𝒏 𝒊స𝟏𝒙𝒊 𝒏

𝒔𝟐^ =

∑ 𝒏 𝒊స𝟏(𝒙𝒊ି 𝒙ഥ)𝟐 𝒏ି 𝟏

CV =

ୱ ୶ത

Pq = xቀଵା౧(౤షభ) భబబ ቁ^ xi = P(i-1)100/(n-1) Una dada x es considera atípica si x < Q 1 - 1.5 AIQ o bé si x > Q 3 + 1.5 AIQ 𝑠௫௬ = ∑ ೙ ೔సభ(௫೔ି ௫ ̅)(௬೔ି ௬ ത) ௡ିଵ

௦ೣ೤ ௦ೣ ௦೤ PROBABILITAT P(A|B)=P(A  B)/P(B) P(AB)=P(A)+P(B)- P(AB) P(no A) = 1 – P(A) MODELS DE PROBABILITAT N200,20,0.9772=160 N200,20,0.8423= N200,20,0.2=216.832 N200,20,0.1587= N5000,100,0.0228=5200 N5000,500,0.3446=5200 N5000,10000,0.492= 𝜒ସ^ ଶ,^ ଴.ଽ଻ହ= 0.4844 𝜒ସ^ ଶ,^ ଴.ଽହ= 0.7107 𝜒ସ^ ଶ,^ ଴.ହ= 3. 𝜒ସ^ ଶ,^ ଴.଴ହ= 9.4877 𝜒ସ^ ଶ,^ ଴.଴ଶହ= 11.1433 𝜒ସ^ ଶ,^ ଴.଴ଵ= 13. 𝜒ଷ^ ଶ,^ ଴.ଽ଻ହ= 0.2175 𝜒ଷ^ ଶ,^ ଴.ଽହ= 0.3518 𝜒ଷ^ ଶ,^ ଴.ହ= 2. 𝜒ଷ^ ଶ,^ ଴.଴ହ= 7.8147 𝜒ଷ^ ଶ,^ ଴.଴ଶହ= 9.3485 𝜒ଷ^ ଶ,^ ଴.଴ଵ= 11. 𝜒ଵ଴଴^ ଶ^ ,଴.ଽ଻ହ= 74.2219 𝜒ଵ଴଴^ ଶ^ ,଴.ଽହ= 77.9295 𝜒ଵ଴଴^ ଶ^ ,଴.ହ= 99. 𝜒ଵ଴଴^ ଶ^ ,଴.଴ହ= 124.342 𝜒ଵ଴଴^ ଶ^ ,଴.଴ଶହ= 129.561 𝜒ଵ଴଴^ ଶ^ ,଴.଴ଵ= 135. 𝜒ଽଽ^ ଶ^ ,଴.ଽ଻ହ= 73.3611 𝜒ଽଽ^ ଶ^ ,଴.ଽହ= 77.0463 𝜒ଽଽ^ ଶ^ ,଴.ହ= 98. 𝜒ଽଽ^ ଶ^ ,଴.଴ହ= 123.225 𝜒ଽଽ^ ଶ^ ,଴.଴ଶହ= 128.422 𝜒ଽଽ^ ଶ^ ,଴.଴ଵ= 134. ESTADÍSTICS DE CONTRAST 2 1 1

  k

k i (^) i i i

E

O

G Oln ~ 

2 1 1 2 2  

 k

k i (^) i i i

E

O E

X ~ 

ቁ 𝜋௞( 1 − 𝜋)௡ି^ ௞

k n k

n

k

n

^ 

  (^)  

  e

k

P X k

K